AI Agent Engineer Roadmap

Что такое AI Агент?

Понять архитектуру — значит уметь её строить

AI-агент — это программа, в которой языковая модель не просто отвечает на вопросы, а самостоятельно принимает решения и совершает действия для достижения заданной цели.

Обычный чат-бот работает в одну сторону: получил вопрос — сгенерировал ответ — завершил работу. Агент устроен иначе. Он действует в цикле: получает задачу, рассуждает, выбирает инструмент, смотрит на результат, снова рассуждает — и так до тех пор, пока цель не достигнута или не определено, что она недостижима. LLM здесь выполняет роль «мозга»: читает контекст, решает что делать следующим шагом, интерпретирует результаты.

Принципиальное отличие от pipeline'а — нелинейность и адаптивность. В жёстком пайплайне шаги зафиксированы заранее: шаг 1 → шаг 2 → шаг 3. Агент сам решает, какой шаг сделать и нужен ли он вообще. Если первый инструмент вернул ошибку — агент пробует другой. Если промежуточный результат изменил картину — агент пересматривает план. Это делает агентов мощным инструментом для задач с заранее неизвестным количеством шагов.

На практике агент работает с реальными системами: читает и пишет файлы, выполняет SQL-запросы, вызывает REST API, управляет браузером, запускает код. Всё это через инструменты (tools) — функции, которые агент может вызвать. LLM не выполняет действия сам: он генерирует структурированный запрос на вызов функции, среда выполняет функцию, результат возвращается обратно в контекст модели.

Ещё одна ключевая составляющая — память. Краткосрочная память — это окно контекста: всё, что произошло в текущей сессии. Долгосрочная — внешние хранилища: векторные базы для семантического поиска, обычные БД для фактов, файлы для структурированных данных. Без памяти агент каждый раз начинает с нуля; с памятью — накапливает знания о задаче и о пользователе между сессиями.

Практические примеры: агент-аналитик, который сам пишет SQL-запросы, интерпретирует результаты и формирует отчёт; агент-разработчик, который читает баг-репорт, находит нужный файл в репозитории, пишет фикс и создаёт PR; агент поддержки, который ищет ответ в документации, при необходимости заводит тикет и отслеживает его статус. Во всех случаях человек ставит цель — агент выбирает путь.

🧠

LLM как мозг

Языковая модель принимает решения: что сделать дальше, какой инструмент вызвать, достигнута ли цель.

🔧

Инструменты (Tools)

Агент вызывает функции: поиск в интернете, выполнение кода, запросы к API, работа с файлами и БД.

💾

Память (Memory)

Краткосрочная — контекст текущей сессии. Долгосрочная — векторные БД и персистентное хранилище.

🔄

Цикл Reason→Act

Паттерн ReAct: агент рассуждает, действует, наблюдает результат и повторяет до достижения цели.

Карта обучения

От нуля до senior AI Agent Engineer

2 недели

Фундамент

Python, LLM API, Prompt Engineering

2 недели

Ядро агентов

Tool calling, MCP, ReAct, Plan-and-Execute

3 недели

LangGraph

State machines, графы, checkpointing

2 недели

RAG и память

Chunking, Embeddings, Reranking, векторные БД, Agentic RAG

3 недели

Мультиагентные системы

AutoGen, CrewAI, паттерны координации

2 недели

Production

Observability, тестирование, деплой

4 недели

Реальные проекты

7 production-ready агентов в портфолио

Модули курса

Нажмите на модуль, чтобы развернуть содержание

Фундамент AI Engineer

Python · LLM API · Prompt Engineering · Токены и контекст

2 недели +

Python для AI Engineers

Основы LLM

Prompt Engineering

Проект модуля: CLI-чат с несколькими LLM-провайдерами и переключением между ними

Ядро AI Агентов

Архитектура агентов · Tool Calling · MCP · ReAct · Память · Agent Cards

2 недели +

Архитектура AI-агентов и обзор фреймворков

Tool Calling (Function Calling)

Архитектурные паттерны

Память агентов

Краткосрочная память: in-context, история сообщений, суммаризация
Долгосрочная память: векторные хранилища, semantic search, retrieval
Scratchpad: рабочая память для рассуждений (chain-of-thought)
Entity Memory: отслеживание сущностей в разговоре
Планирование: как агент строит и пересматривает планы
Практика: агент с долгосрочной памятью через файл/БД

MCP (Model Context Protocol)

Описание агентов (Agent Cards)

Проект модуля: Research-агент с инструментами поиска и суммаризации веб-страниц (чистый Python, без фреймворков)

LangGraph — Агенты как графы состояний

State Machines · Граф потоков · Checkpointing · Human-in-the-loop

Core 3 недели +

Основы LangGraph

Продвинутые возможности

Human-in-the-loop

Паттерны агентов в LangGraph

Проект модуля: Агент для генерации и ревью кода: планирует → пишет → проверяет тестами → исправляет (с human approval)

RAG и системы памяти

Chunking · Embeddings · Reranking · Vector DB · Agentic RAG

2 недели +

Доступ к знаниям: загрузка и парсинг документов

Chunking стратегии

Embeddings и семантический поиск

Что такое embedding: векторное представление текста
Модели embeddings: text-embedding-3-small, nomic-embed, BGE, E5
Similarity метрики: cosine similarity, dot product, euclidean distance
Практика: поиск по документам с нуля

Векторные базы данных

Retrieval: поиск и ранжирование

RAG Pipeline сборка

Agentic RAG

Проект модуля: DocMind: Q&A-агент по корпоративной документации — загрузка PDF/Notion → индексация → Self-RAG → Graph RAG → ответы с цитатами

Мультиагентные системы

AutoGen · CrewAI · A2A Protocol · Skills · Паттерны координации

Advanced 3 недели +

Зачем нужны мультиагентные системы

AutoGen (Microsoft)

CrewAI

Паттерны координации

Протоколы взаимодействия между агентами

Проект модуля: Автоматический исследовательский пайплайн: поиск → анализ → написание отчёта → ревью (4 специализированных агента)

Production-ready агенты

Observability · Оценка качества · Тестирование · Оптимизация · Деплой

2 недели +

Observability и мониторинг

Оценка качества LLM-систем

Тестирование агентов

Надёжность и обработка ошибок

Оптимизация и деплой

Проект модуля: Задеплоить агента из модуля 3 с полным мониторингом, тестами и CI/CD пайплайном

Финальные проекты (Портфолио)

7 реальных агентов · GitHub · Демо · CV-ready

Portfolio 4 недели +

🔍

Deep Research Agent

Агент ищет информацию из нескольких источников, анализирует и создаёт подробный отчёт

LangGraph · Tavily · GPT-4o

💻

Code Review Bot

Анализирует PR, находит баги, проблемы безопасности, предлагает улучшения

GitHub API · Claude · LangGraph

📊

Data Analysis Agent

Получает CSV/Excel, пишет и выполняет Python-код для анализа, строит графики

Code Interpreter · Pandas · Matplotlib

🎧

Customer Support Agent

Отвечает на вопросы по документации, эскалирует сложные случаи, запоминает контекст

RAG · CrewAI · FastAPI

📝

Content Creation Pipeline

Исследует тему → пишет черновик → редактирует → оптимизирует SEO → публикует

AutoGen · Web Search · WordPress API

🗃️

SQL Agent

Отвечает на вопросы о данных на естественном языке, генерирует и исполняет SQL

LangGraph · PostgreSQL · Streamlit

🤖

Personal AI Assistant

Управляет задачами, читает email, пишет письма, работает с календарём

Google API · LangGraph · Memory

Инструментарий

Фреймворки и инструменты AI Agent Engineer'а

🔷

LangGraph

Рекомендован

Граф состояний для сложных агентов. Идеален для production-агентов с ветвлением, checkpointing и human-in-the-loop.

Плюсы: максимальная гибкость, встроенный persistence, отличная observability через LangSmith

Минусы: крутая кривая обучения, verbose код

Когда: сложные production агенты с нетривиальной логикой

👥

CrewAI

Beginner-friendly

Role-based мультиагентные системы. Интуитивный YAML-конфиг, метафора команды специалистов.

Плюсы: быстрый старт, читаемый код, встроенная память

Минусы: меньше контроля над потоком, магия под капотом

Когда: быстрые прототипы, роль-ориентированные пайплайны

💬

AutoGen

Microsoft

Conversational мультиагенты. Агенты общаются через сообщения, event-driven архитектура.

Плюсы: async-first, сильная поддержка Microsoft, code execution из коробки

Минусы: нестабильный API, крутой рефактор в v0.4

Когда: агенты с активным code execution, review-итерации

🤖

OpenAI Agents SDK

OpenAI

Официальный SDK для агентов OpenAI. Handoffs, built-in tools, tracing.

Плюсы: простой API, глубокая интеграция с OpenAI, built-in tracing

Минусы: привязка к OpenAI-провайдеру

Когда: проекты на базе GPT, быстрые прототипы

🦙

LlamaIndex

RAG-first

Специализирован на работе с данными и документами. Лучший RAG-фреймворк.

Плюсы: лучший для document-heavy агентов, богатая экосистема коннекторов

Минусы: менее удобен для агентов без RAG

Когда: агенты по документам, корпоративные knowledge bases

🔶

Claude Agent SDK

Anthropic

Официальный Anthropic SDK для создания агентов. Оптимизирован под Claude-модели.

Плюсы: нативная поддержка extended thinking, computer use

Минусы: привязка к Anthropic API

Когда: агенты для работы с компьютером, сложное рассуждение

🟢

Claude 3.5/3.7 Sonnet

Лучший для агентов

Anthropic. Лучшее следование инструкциям, отличный tool calling, extended thinking для сложных задач.

claude-sonnet-4-5, claude-opus-4-5

🔵

GPT-4o / o1 / o3

OpenAI

Сильные coding способности, structured outputs, vision. o1/o3 — для сложных рассуждений.

gpt-4o, o3-mini для баланса цена/качество

🟡

Gemini 2.0 Flash

Google

Очень быстрый и дешёвый, огромный контекст (1M токенов), хорош для аналитики.

🟠

Llama 3.3 / Mistral

Open Source

Self-hosted через Ollama, vLLM. Конфиденциальность данных, нет per-token cost.

⚡

Groq

Ultra-fast

LPU-инфраструктура для Llama/Mistral. Скорость 500+ tok/s — для latency-sensitive агентов.

🟣

Chroma

Dev-first

Локальная векторная БД, идеальна для разработки и прототипирования. pip install chromadb и готово.

🔺

Pinecone

Production

Managed векторная БД. Просто масштабируется, serverless tier. Стандарт для production RAG.

🐘

pgvector

PostgreSQL

Расширение PostgreSQL. Если уже есть Postgres — не нужна отдельная инфра.

🔷

Weaviate

Hybrid Search

Hybrid search (vector + BM25), мощная фильтрация, self-hosted или cloud.

⚡

Qdrant

High Performance

Rust-based, очень быстрый. Отличная фильтрация, sparse+dense векторы (hybrid).

🔗

LangSmith

Рекомендован

Трейсинг, дебаг, оценка качества. Нативная интеграция с LangGraph. Визуализация шагов агента.

🌸

Langfuse

Open Source

Open-source альтернатива LangSmith. Self-hosted, GDPR-compliant. Evaluation + experiments.

📊

Arize Phoenix

ML-focused

Open-source observability. Сильный eval-фреймворк, trace visualization, активное сообщество.

🔭

OpenTelemetry

Standard

Стандарт для distributed tracing. Интегрируется с любой observability платформой (Datadog, Grafana).