Roadmap lengkap untuk menjadi AI Engineer. Pelajari dasar machine learning, deep learning, generative AI, LLM, RAG, AI agents, dan deployment ke production.
Fondasi yang wajib dikuasai sebelum masuk ke AI/ML
Bahasa utama untuk seluruh AI/ML ecosystem. Kuasai syntax, OOP, dan library inti (NumPy, Pandas, Matplotlib)
Vektor, matriks, transformasi. Fondasi untuk paham cara kerja neural network dan embeddings
Distribusi, hipotesis, randomness. Dipake buat evaluasi model dan paham distribusi data
Gradien, turunan parsial, chain rule. Inti dari cara neural network belajar (backpropagation)
Version control, data cleaning, dan pengelolaan dataset. Skill dasar yang sering disepelekan
Algoritma klasik dan supervised/unsupervised learning
Linear regression, logistic regression, decision tree, random forest, gradient boosting. Inti dari ML klasik
Clustering (K-Means, hierarchical), dimensionality reduction (PCA). Untuk data tanpa label
Accuracy, precision, recall, F1-score, ROC-AUC, confusion matrix. Paham kapan pakai metric yang mana
Library Python utama untuk ML klasik. Dari preprocessing sampai model training dan evaluation
Feature selection, scaling, normalization. Skill yang membedakan model biasa sama model bagus
Neural network, CNN, RNN, dan arsitektur modern
Perceptron, MLP, forward/backward propagation, activation function (ReLU, sigmoid, softmax)
Untuk image classification, object detection, dan computer vision. Convolution, pooling, padding
Untuk data sekuensial dan time series. Fondasi sebelum masuk ke NLP modern
Self-attention, multi-head attention. Arsitektur di balik GPT, Claude, Gemini, dan semua LLM modern
Framework deep learning utama. PyTorch lebih fleksibel untuk riset, TensorFlow untuk production pipeline
Pakai pre-trained model dan adaptasi ke task baru. Hemat waktu, compute, dan data
Bekerja dengan large language models, prompt engineering, dan API integration
Cara kerja LLM, tokenization, context window, temperature, top-p. Paham capabilities dan limitations
Zero-shot, few-shot, chain-of-thought, system prompt, role-playing. Skill yang nentuin output bagus atau jelek
Chat completions, function calling, streaming. Juga Anthropic, Google Gemini, Mistral, DeepSeek API
Model Hub dengan 1 juta+ model, Transformers library, Datasets, Spaces. Open source AI terbesar
Representasi numerik teks yang nangkap makna. Fondasi untuk RAG dan semantic search
JSON mode, function calling, tool use buat pastikan LLM output format yang terstruktur dan reliable
Vision-language models (GPT-4V, Claude Vision), image generation (DALL-E, Stable Diffusion), TTS/STT
Bias, fairness, hallucination mitigation, privacy, regulasi (EU AI Act). Tanggung jawab yang nggak bisa di-skip
Bangun aplikasi AI yang bisa akses data kamu sendiri
Ambil data relevan dari sumber eksternal, inject ke prompt. Bikin LLM bisa jawab soal data spesifik kamu
Pinecone, Weaviate, Qdrant, Chroma, pgvector. Simpan dan search embeddings dalam skala besar
Framework Python/JS buat bangun aplikasi LLM. Chains, prompts, memory, document loaders, retrievers
Framework spesialis RAG. Fokus pada data ingestion, indexing, dan query engine
Cara motong dokumen jadi chunk yang optimal. Fixed-size, recursive, semantic chunking. Krusial buat RAG quality
Sistem AI yang bisa ambil aksi, bukan cuma generate teks
Kasih kemampuan ke LLM buat panggil function, akses API, dan interact dengan sistem eksternal
LangGraph, CrewAI, AutoGPT, OpenAI Swarm. Bangun agent yang bisa reason, plan, dan eksekusi multi-step task
Standard protocol dari Anthropic buat koneksikan AI model dengan data source dan tool eksternal secara universal
Input/output filtering, content moderation, prompt injection defense, NeMo Guardrails, Llama Guard
GitHub Copilot, Cursor, Claude Code, Codex. Tools yang ubah cara developer nulis kode. Paham cara pakai efektif
TypeScript SDK buat bangun AI app di React/Next.js. Streaming, multi-model, tool calling, 100+ provider support
Deploy, monitor, dan maintain sistem AI di production
Parameter-efficient fine-tuning. Adaptasi pre-trained model ke task spesifik tanpa retrain dari nol
FastAPI buat serve model, vLLM buat high-throughput LLM serving, dan edge deployment dengan Ollama/llama.cpp
Ollama, llama.cpp, LM Studio untuk run LLM di local machine atau edge device. Privacy-first, no API costs
MLflow buat track eksperimen, Docker buat containerization, CI/CD buat automated deployment
RAGAS, DeepEval, LLM-as-judge. Cara ukur kualitas output LLM dan detect hallucination secara sistematis
Model drift detection, latency monitoring, output quality tracking. LangSmith, W&B, Arize buat LLM observability
Cache strategy, model selection (murah buat simple task, mahal buat complex), batch processing, prompt compression
Roadmap ini bakal nemenin kamu dari basic sampai jago jadi AI Engineer. Pelajari tiap topik step by step, terus langsung praktik dengan bikin project.