AI Engineer

Roadmap lengkap untuk menjadi AI Engineer. Pelajari dasar machine learning, deep learning, generative AI, LLM, RAG, AI agents, dan deployment ke production.

Phases

Topics

Required

Resources

Loading progress...

Fundamental AI & Programming

Fondasi yang wajib dikuasai sebelum masuk ke AI/ML

Python untuk Data Science

required

Bahasa utama untuk seluruh AI/ML ecosystem. Kuasai syntax, OOP, dan library inti (NumPy, Pandas, Matplotlib)

Linear Algebra

required

Vektor, matriks, transformasi. Fondasi untuk paham cara kerja neural network dan embeddings

Probability & Statistics

required

Distribusi, hipotesis, randomness. Dipake buat evaluasi model dan paham distribusi data

Calculus & Optimization

recommended

Gradien, turunan parsial, chain rule. Inti dari cara neural network belajar (backpropagation)

Git & Data Handling

required

Version control, data cleaning, dan pengelolaan dataset. Skill dasar yang sering disepelekan

Resources:

Git Cheat Sheet Git untuk Pemula

Machine Learning Core

Algoritma klasik dan supervised/unsupervised learning

Supervised Learning

required

Linear regression, logistic regression, decision tree, random forest, gradient boosting. Inti dari ML klasik

Unsupervised Learning

recommended

Clustering (K-Means, hierarchical), dimensionality reduction (PCA). Untuk data tanpa label

Model Evaluation & Metrics

required

Accuracy, precision, recall, F1-score, ROC-AUC, confusion matrix. Paham kapan pakai metric yang mana

Scikit-learn

required

Library Python utama untuk ML klasik. Dari preprocessing sampai model training dan evaluation

Feature Engineering

recommended

Feature selection, scaling, normalization. Skill yang membedakan model biasa sama model bagus

Deep Learning & Neural Networks

Neural network, CNN, RNN, dan arsitektur modern

Neural Network Fundamentals

required

Perceptron, MLP, forward/backward propagation, activation function (ReLU, sigmoid, softmax)

Convolutional Neural Networks (CNN)

recommended

Untuk image classification, object detection, dan computer vision. Convolution, pooling, padding

RNN, LSTM & GRU

optional

Untuk data sekuensial dan time series. Fondasi sebelum masuk ke NLP modern

Transformers & Attention

required

Self-attention, multi-head attention. Arsitektur di balik GPT, Claude, Gemini, dan semua LLM modern

PyTorch atau TensorFlow

required

Framework deep learning utama. PyTorch lebih fleksibel untuk riset, TensorFlow untuk production pipeline

Transfer Learning

recommended

Pakai pre-trained model dan adaptasi ke task baru. Hemat waktu, compute, dan data

Generative AI & LLMs

Bekerja dengan large language models, prompt engineering, dan API integration

LLM Fundamentals

required

Cara kerja LLM, tokenization, context window, temperature, top-p. Paham capabilities dan limitations

Resources:

AI Engineering Cheat Sheet

Prompt Engineering

required

Zero-shot, few-shot, chain-of-thought, system prompt, role-playing. Skill yang nentuin output bagus atau jelek

Resources:

AI Engineering Cheat Sheet

OpenAI API & Provider Lain

required

Chat completions, function calling, streaming. Juga Anthropic, Google Gemini, Mistral, DeepSeek API

Resources:

AI Engineering Cheat Sheet

Hugging Face Ecosystem

required

Model Hub dengan 1 juta+ model, Transformers library, Datasets, Spaces. Open source AI terbesar

Embeddings & Semantic Search

required

Representasi numerik teks yang nangkap makna. Fondasi untuk RAG dan semantic search

Structured Output

required

JSON mode, function calling, tool use buat pastikan LLM output format yang terstruktur dan reliable

Multimodal AI

recommended

Vision-language models (GPT-4V, Claude Vision), image generation (DALL-E, Stable Diffusion), TTS/STT

AI Ethics & Safety

recommended

Bias, fairness, hallucination mitigation, privacy, regulasi (EU AI Act). Tanggung jawab yang nggak bisa di-skip

RAG & Vector Databases

Bangun aplikasi AI yang bisa akses data kamu sendiri

Retrieval-Augmented Generation (RAG)

required

Ambil data relevan dari sumber eksternal, inject ke prompt. Bikin LLM bisa jawab soal data spesifik kamu

Vector Databases

required

Pinecone, Weaviate, Qdrant, Chroma, pgvector. Simpan dan search embeddings dalam skala besar

Resources:

PostgreSQL Cheat Sheet PostgreSQL untuk Pemula Vector Databases untuk AI

LangChain

required

Framework Python/JS buat bangun aplikasi LLM. Chains, prompts, memory, document loaders, retrievers

LlamaIndex

recommended

Framework spesialis RAG. Fokus pada data ingestion, indexing, dan query engine

Chunking & Indexing Strategy

recommended

Cara motong dokumen jadi chunk yang optimal. Fixed-size, recursive, semantic chunking. Krusial buat RAG quality

AI Agents & Tooling

Sistem AI yang bisa ambil aksi, bukan cuma generate teks

Function Calling & Tool Use

required

Kasih kemampuan ke LLM buat panggil function, akses API, dan interact dengan sistem eksternal

Agent Frameworks

required

LangGraph, CrewAI, AutoGPT, OpenAI Swarm. Bangun agent yang bisa reason, plan, dan eksekusi multi-step task

Model Context Protocol (MCP)

recommended

Standard protocol dari Anthropic buat koneksikan AI model dengan data source dan tool eksternal secara universal

Resources:

MCP Model Context Protocol

Guardrails & AI Safety

recommended

Input/output filtering, content moderation, prompt injection defense, NeMo Guardrails, Llama Guard

AI Coding Tools

optional

GitHub Copilot, Cursor, Claude Code, Codex. Tools yang ubah cara developer nulis kode. Paham cara pakai efektif

Vercel AI SDK

recommended

TypeScript SDK buat bangun AI app di React/Next.js. Streaming, multi-model, tool calling, 100+ provider support

Resources:

Memulai dengan Next.js 16

AI Production & MLOps

Deploy, monitor, dan maintain sistem AI di production

Fine-Tuning (LoRA & QLoRA)

recommended

Parameter-efficient fine-tuning. Adaptasi pre-trained model ke task spesifik tanpa retrain dari nol

Model Serving & API

required

FastAPI buat serve model, vLLM buat high-throughput LLM serving, dan edge deployment dengan Ollama/llama.cpp

Resources:

REST API Best Practices

Local LLM Deployment

recommended

Ollama, llama.cpp, LM Studio untuk run LLM di local machine atau edge device. Privacy-first, no API costs

MLOps & Experiment Tracking

recommended

MLflow buat track eksperimen, Docker buat containerization, CI/CD buat automated deployment

Resources:

Docker untuk Developer Docker Compose Advanced Docker Compose Cheat Sheet GitHub Actions untuk Pemula

AI Evaluation & Hallucination Detection

required

RAGAS, DeepEval, LLM-as-judge. Cara ukur kualitas output LLM dan detect hallucination secara sistematis

Monitoring & Observability

recommended

Model drift detection, latency monitoring, output quality tracking. LangSmith, W&B, Arize buat LLM observability

Resources:

OpenTelemetry Cheat Sheet

Cost & Token Optimization

optional

Cache strategy, model selection (murah buat simple task, mahal buat complex), batch processing, prompt compression

Udah siap buat mulai?

Roadmap ini bakal nemenin kamu dari basic sampai jago jadi AI Engineer. Pelajari tiap topik step by step, terus langsung praktik dengan bikin project.

Baca Artikel Lihat Cheat Sheets

Kembali ke Roadmaps

AI Engineer

Roadmap lengkap untuk menjadi AI Engineer. Pelajari dasar machine learning, deep learning, generative AI, LLM, RAG, AI agents, dan deployment ke production.

Phases

Topics

Required

Resources

Loading progress...

Fundamental AI & Programming

Fondasi yang wajib dikuasai sebelum masuk ke AI/ML

Python untuk Data Science

required

Bahasa utama untuk seluruh AI/ML ecosystem. Kuasai syntax, OOP, dan library inti (NumPy, Pandas, Matplotlib)

Linear Algebra

required

Vektor, matriks, transformasi. Fondasi untuk paham cara kerja neural network dan embeddings

Probability & Statistics

required

Distribusi, hipotesis, randomness. Dipake buat evaluasi model dan paham distribusi data

Calculus & Optimization

recommended

Gradien, turunan parsial, chain rule. Inti dari cara neural network belajar (backpropagation)

Git & Data Handling

required

Version control, data cleaning, dan pengelolaan dataset. Skill dasar yang sering disepelekan

Resources:

Git Cheat Sheet Git untuk Pemula

Machine Learning Core

Algoritma klasik dan supervised/unsupervised learning

Supervised Learning

required

Linear regression, logistic regression, decision tree, random forest, gradient boosting. Inti dari ML klasik

Unsupervised Learning

recommended

Clustering (K-Means, hierarchical), dimensionality reduction (PCA). Untuk data tanpa label

Model Evaluation & Metrics

required

Accuracy, precision, recall, F1-score, ROC-AUC, confusion matrix. Paham kapan pakai metric yang mana

Scikit-learn

required

Library Python utama untuk ML klasik. Dari preprocessing sampai model training dan evaluation

Feature Engineering

recommended

Feature selection, scaling, normalization. Skill yang membedakan model biasa sama model bagus

Deep Learning & Neural Networks

Neural network, CNN, RNN, dan arsitektur modern

Neural Network Fundamentals

required

Perceptron, MLP, forward/backward propagation, activation function (ReLU, sigmoid, softmax)

Convolutional Neural Networks (CNN)

recommended

Untuk image classification, object detection, dan computer vision. Convolution, pooling, padding

RNN, LSTM & GRU

optional

Untuk data sekuensial dan time series. Fondasi sebelum masuk ke NLP modern

Transformers & Attention

required

Self-attention, multi-head attention. Arsitektur di balik GPT, Claude, Gemini, dan semua LLM modern

PyTorch atau TensorFlow

required

Framework deep learning utama. PyTorch lebih fleksibel untuk riset, TensorFlow untuk production pipeline

Transfer Learning

recommended

Pakai pre-trained model dan adaptasi ke task baru. Hemat waktu, compute, dan data

Generative AI & LLMs

Bekerja dengan large language models, prompt engineering, dan API integration

LLM Fundamentals

required

Cara kerja LLM, tokenization, context window, temperature, top-p. Paham capabilities dan limitations

Resources:

AI Engineering Cheat Sheet

Prompt Engineering

required

Zero-shot, few-shot, chain-of-thought, system prompt, role-playing. Skill yang nentuin output bagus atau jelek

Resources:

AI Engineering Cheat Sheet

OpenAI API & Provider Lain

required

Chat completions, function calling, streaming. Juga Anthropic, Google Gemini, Mistral, DeepSeek API

Resources:

AI Engineering Cheat Sheet

Hugging Face Ecosystem

required

Model Hub dengan 1 juta+ model, Transformers library, Datasets, Spaces. Open source AI terbesar

Embeddings & Semantic Search

required

Representasi numerik teks yang nangkap makna. Fondasi untuk RAG dan semantic search

Structured Output

required

JSON mode, function calling, tool use buat pastikan LLM output format yang terstruktur dan reliable

Multimodal AI

recommended

Vision-language models (GPT-4V, Claude Vision), image generation (DALL-E, Stable Diffusion), TTS/STT

AI Ethics & Safety

recommended

Bias, fairness, hallucination mitigation, privacy, regulasi (EU AI Act). Tanggung jawab yang nggak bisa di-skip

RAG & Vector Databases

Bangun aplikasi AI yang bisa akses data kamu sendiri

Retrieval-Augmented Generation (RAG)

required

Ambil data relevan dari sumber eksternal, inject ke prompt. Bikin LLM bisa jawab soal data spesifik kamu

Vector Databases

required

Pinecone, Weaviate, Qdrant, Chroma, pgvector. Simpan dan search embeddings dalam skala besar

Resources:

PostgreSQL Cheat Sheet PostgreSQL untuk Pemula Vector Databases untuk AI

LangChain

required

Framework Python/JS buat bangun aplikasi LLM. Chains, prompts, memory, document loaders, retrievers

LlamaIndex

recommended

Framework spesialis RAG. Fokus pada data ingestion, indexing, dan query engine

Chunking & Indexing Strategy

recommended

Cara motong dokumen jadi chunk yang optimal. Fixed-size, recursive, semantic chunking. Krusial buat RAG quality

AI Agents & Tooling

Sistem AI yang bisa ambil aksi, bukan cuma generate teks

Function Calling & Tool Use

required

Kasih kemampuan ke LLM buat panggil function, akses API, dan interact dengan sistem eksternal

Agent Frameworks

required

LangGraph, CrewAI, AutoGPT, OpenAI Swarm. Bangun agent yang bisa reason, plan, dan eksekusi multi-step task

Model Context Protocol (MCP)

recommended

Standard protocol dari Anthropic buat koneksikan AI model dengan data source dan tool eksternal secara universal

Resources:

MCP Model Context Protocol

Guardrails & AI Safety

recommended

Input/output filtering, content moderation, prompt injection defense, NeMo Guardrails, Llama Guard

AI Coding Tools

optional

GitHub Copilot, Cursor, Claude Code, Codex. Tools yang ubah cara developer nulis kode. Paham cara pakai efektif

Vercel AI SDK

recommended

TypeScript SDK buat bangun AI app di React/Next.js. Streaming, multi-model, tool calling, 100+ provider support

Resources:

Memulai dengan Next.js 16

AI Production & MLOps

Deploy, monitor, dan maintain sistem AI di production

Fine-Tuning (LoRA & QLoRA)

recommended

Parameter-efficient fine-tuning. Adaptasi pre-trained model ke task spesifik tanpa retrain dari nol

Model Serving & API

required

FastAPI buat serve model, vLLM buat high-throughput LLM serving, dan edge deployment dengan Ollama/llama.cpp

Resources:

REST API Best Practices

Local LLM Deployment

recommended

Ollama, llama.cpp, LM Studio untuk run LLM di local machine atau edge device. Privacy-first, no API costs

MLOps & Experiment Tracking

recommended

MLflow buat track eksperimen, Docker buat containerization, CI/CD buat automated deployment

Resources:

Docker untuk Developer Docker Compose Advanced Docker Compose Cheat Sheet GitHub Actions untuk Pemula

AI Evaluation & Hallucination Detection

required

RAGAS, DeepEval, LLM-as-judge. Cara ukur kualitas output LLM dan detect hallucination secara sistematis

Monitoring & Observability

recommended

Model drift detection, latency monitoring, output quality tracking. LangSmith, W&B, Arize buat LLM observability

Resources:

OpenTelemetry Cheat Sheet

Cost & Token Optimization

optional

Cache strategy, model selection (murah buat simple task, mahal buat complex), batch processing, prompt compression

Udah siap buat mulai?

Roadmap ini bakal nemenin kamu dari basic sampai jago jadi AI Engineer. Pelajari tiap topik step by step, terus langsung praktik dengan bikin project.

Baca Artikel Lihat Cheat Sheets