Карта профессии · 2026

AI Agent
Engineer
Roadmap

Полный путь от основ до создания production-ready AI-агентов.
LangGraph · AutoGen · CrewAI · RAG · Мультиагентные системы

7 модулей
18 недель
40+ тем
7 проектов

Что такое AI Агент?

Понять архитектуру — значит уметь её строить

AI-агент — это программа, в которой языковая модель не просто отвечает на вопросы, а самостоятельно принимает решения и совершает действия для достижения заданной цели.

Обычный чат-бот работает в одну сторону: получил вопрос — сгенерировал ответ — завершил работу. Агент устроен иначе. Он действует в цикле: получает задачу, рассуждает, выбирает инструмент, смотрит на результат, снова рассуждает — и так до тех пор, пока цель не достигнута или не определено, что она недостижима. LLM здесь выполняет роль «мозга»: читает контекст, решает что делать следующим шагом, интерпретирует результаты.

Принципиальное отличие от pipeline'а — нелинейность и адаптивность. В жёстком пайплайне шаги зафиксированы заранее: шаг 1 → шаг 2 → шаг 3. Агент сам решает, какой шаг сделать и нужен ли он вообще. Если первый инструмент вернул ошибку — агент пробует другой. Если промежуточный результат изменил картину — агент пересматривает план. Это делает агентов мощным инструментом для задач с заранее неизвестным количеством шагов.

На практике агент работает с реальными системами: читает и пишет файлы, выполняет SQL-запросы, вызывает REST API, управляет браузером, запускает код. Всё это через инструменты (tools) — функции, которые агент может вызвать. LLM не выполняет действия сам: он генерирует структурированный запрос на вызов функции, среда выполняет функцию, результат возвращается обратно в контекст модели.

Ещё одна ключевая составляющая — память. Краткосрочная память — это окно контекста: всё, что произошло в текущей сессии. Долгосрочная — внешние хранилища: векторные базы для семантического поиска, обычные БД для фактов, файлы для структурированных данных. Без памяти агент каждый раз начинает с нуля; с памятью — накапливает знания о задаче и о пользователе между сессиями.

Практические примеры: агент-аналитик, который сам пишет SQL-запросы, интерпретирует результаты и формирует отчёт; агент-разработчик, который читает баг-репорт, находит нужный файл в репозитории, пишет фикс и создаёт PR; агент поддержки, который ищет ответ в документации, при необходимости заводит тикет и отслеживает его статус. Во всех случаях человек ставит цель — агент выбирает путь.

🧠

LLM как мозг

Языковая модель принимает решения: что сделать дальше, какой инструмент вызвать, достигнута ли цель.

🔧

Инструменты (Tools)

Агент вызывает функции: поиск в интернете, выполнение кода, запросы к API, работа с файлами и БД.

💾

Память (Memory)

Краткосрочная — контекст текущей сессии. Долгосрочная — векторные БД и персистентное хранилище.

🔄

Цикл Reason→Act

Паттерн ReAct: агент рассуждает, действует, наблюдает результат и повторяет до достижения цели.

Карта обучения

От нуля до senior AI Agent Engineer

2 недели

Фундамент

Python, LLM API, Prompt Engineering

02
2 недели

Ядро агентов

Tool calling, MCP, ReAct, Plan-and-Execute

3 недели

LangGraph

State machines, графы, checkpointing

04
2 недели

RAG и память

Chunking, Embeddings, Reranking, векторные БД, Agentic RAG

3 недели

Мультиагентные системы

AutoGen, CrewAI, паттерны координации

06
2 недели

Production

Observability, тестирование, деплой

4 недели

Реальные проекты

7 production-ready агентов в портфолио

Модули курса

Нажмите на модуль, чтобы развернуть содержание

01

Фундамент AI Engineer

Python · LLM API · Prompt Engineering · Токены и контекст

2 недели +
02

Ядро AI Агентов

Архитектура агентов · Tool Calling · MCP · ReAct · Память · Agent Cards

2 недели +
04

RAG и системы памяти

Chunking · Embeddings · Reranking · Vector DB · Agentic RAG

2 недели +
06

Production-ready агенты

Observability · Оценка качества · Тестирование · Оптимизация · Деплой

2 недели +

Observability и мониторинг

  • LangSmith: трейсинг, дебаг, оценка качества
  • Langfuse: open-source альтернатива, self-hosted
  • OpenTelemetry для агентских систем
  • Логирование: что логировать, structured logs
  • Дашборды: latency, cost, error rate, quality scores

Оценка качества LLM-систем

  • Offline-метрики: task completion rate, RAGAS, custom scorers по критериям
  • Human evaluation: процесс разметки, inter-rater agreement, избегание предвзятости
  • LLM-as-judge: настройка судьи-модели, критерии оценки, calibration
  • A/B тестирование промптов: постановка эксперимента, стат. значимость, rollout
  • Regression testing: golden datasets, предотвращение деградации при изменении промпта

Тестирование агентов

  • Unit tests для инструментов и компонентов
  • Integration tests: тестирование полных пайплайнов
  • Evaluation datasets: синтетические и ручные тест-кейсы
  • Trajectory evaluation: оценка последовательности действий агента

Надёжность и обработка ошибок

  • Retry логика с exponential backoff
  • Fallback стратегии при отказе провайдера
  • Rate limiting и управление квотами
  • Timeout management для долгих задач
  • Graceful degradation: агент при частичных отказах

Оптимизация и деплой

  • Context engineering: стратегическое управление контекстным окном агента
  • Prompt caching (Anthropic, OpenAI) — экономия до 90%
  • FastAPI для агентских API: streaming, background tasks, WebSocket
  • Оптимизация: latency, стоимость, пропускная способность
  • Деплой: Docker, Railway, Modal, AWS Lambda
Проект модуля: Задеплоить агента из модуля 3 с полным мониторингом, тестами и CI/CD пайплайном
07

Финальные проекты (Портфолио)

7 реальных агентов · GitHub · Демо · CV-ready

Portfolio 4 недели +
🔍

Deep Research Agent

Агент ищет информацию из нескольких источников, анализирует и создаёт подробный отчёт

LangGraph · Tavily · GPT-4o
💻

Code Review Bot

Анализирует PR, находит баги, проблемы безопасности, предлагает улучшения

GitHub API · Claude · LangGraph
📊

Data Analysis Agent

Получает CSV/Excel, пишет и выполняет Python-код для анализа, строит графики

Code Interpreter · Pandas · Matplotlib
🎧

Customer Support Agent

Отвечает на вопросы по документации, эскалирует сложные случаи, запоминает контекст

RAG · CrewAI · FastAPI
📝

Content Creation Pipeline

Исследует тему → пишет черновик → редактирует → оптимизирует SEO → публикует

AutoGen · Web Search · WordPress API
🗃️

SQL Agent

Отвечает на вопросы о данных на естественном языке, генерирует и исполняет SQL

LangGraph · PostgreSQL · Streamlit
🤖

Personal AI Assistant

Управляет задачами, читает email, пишет письма, работает с календарём

Google API · LangGraph · Memory

Инструментарий

Фреймворки и инструменты AI Agent Engineer'а

🔷

LangGraph

Рекомендован

Граф состояний для сложных агентов. Идеален для production-агентов с ветвлением, checkpointing и human-in-the-loop.

Плюсы: максимальная гибкость, встроенный persistence, отличная observability через LangSmith
Минусы: крутая кривая обучения, verbose код
Когда: сложные production агенты с нетривиальной логикой
👥

CrewAI

Beginner-friendly

Role-based мультиагентные системы. Интуитивный YAML-конфиг, метафора команды специалистов.

Плюсы: быстрый старт, читаемый код, встроенная память
Минусы: меньше контроля над потоком, магия под капотом
Когда: быстрые прототипы, роль-ориентированные пайплайны
💬

AutoGen

Microsoft

Conversational мультиагенты. Агенты общаются через сообщения, event-driven архитектура.

Плюсы: async-first, сильная поддержка Microsoft, code execution из коробки
Минусы: нестабильный API, крутой рефактор в v0.4
Когда: агенты с активным code execution, review-итерации
🤖

OpenAI Agents SDK

OpenAI

Официальный SDK для агентов OpenAI. Handoffs, built-in tools, tracing.

Плюсы: простой API, глубокая интеграция с OpenAI, built-in tracing
Минусы: привязка к OpenAI-провайдеру
Когда: проекты на базе GPT, быстрые прототипы
🦙

LlamaIndex

RAG-first

Специализирован на работе с данными и документами. Лучший RAG-фреймворк.

Плюсы: лучший для document-heavy агентов, богатая экосистема коннекторов
Минусы: менее удобен для агентов без RAG
Когда: агенты по документам, корпоративные knowledge bases
🔶

Claude Agent SDK

Anthropic

Официальный Anthropic SDK для создания агентов. Оптимизирован под Claude-модели.

Плюсы: нативная поддержка extended thinking, computer use
Минусы: привязка к Anthropic API
Когда: агенты для работы с компьютером, сложное рассуждение
🟢

Claude 3.5/3.7 Sonnet

Лучший для агентов

Anthropic. Лучшее следование инструкциям, отличный tool calling, extended thinking для сложных задач.

claude-sonnet-4-5, claude-opus-4-5
🔵

GPT-4o / o1 / o3

OpenAI

Сильные coding способности, structured outputs, vision. o1/o3 — для сложных рассуждений.

gpt-4o, o3-mini для баланса цена/качество
🟡

Gemini 2.0 Flash

Google

Очень быстрый и дешёвый, огромный контекст (1M токенов), хорош для аналитики.

🟠

Llama 3.3 / Mistral

Open Source

Self-hosted через Ollama, vLLM. Конфиденциальность данных, нет per-token cost.

Groq

Ultra-fast

LPU-инфраструктура для Llama/Mistral. Скорость 500+ tok/s — для latency-sensitive агентов.

🟣

Chroma

Dev-first

Локальная векторная БД, идеальна для разработки и прототипирования. pip install chromadb и готово.

🔺

Pinecone

Production

Managed векторная БД. Просто масштабируется, serverless tier. Стандарт для production RAG.

🐘

pgvector

PostgreSQL

Расширение PostgreSQL. Если уже есть Postgres — не нужна отдельная инфра.

🔷

Weaviate

Hybrid Search

Hybrid search (vector + BM25), мощная фильтрация, self-hosted или cloud.

Qdrant

High Performance

Rust-based, очень быстрый. Отличная фильтрация, sparse+dense векторы (hybrid).

🔗

LangSmith

Рекомендован

Трейсинг, дебаг, оценка качества. Нативная интеграция с LangGraph. Визуализация шагов агента.

🌸

Langfuse

Open Source

Open-source альтернатива LangSmith. Self-hosted, GDPR-compliant. Evaluation + experiments.

📊

Arize Phoenix

ML-focused

Open-source observability. Сильный eval-фреймворк, trace visualization, активное сообщество.

🔭

OpenTelemetry

Standard

Стандарт для distributed tracing. Интегрируется с любой observability платформой (Datadog, Grafana).

Архитектурные паттерны

Выбирайте паттерн под задачу, не по моде

ReAct
Reason + Act
Думает Действует Наблюдает Повторяет

Итеративный цикл: агент рассуждает, выбирает инструмент, исполняет, видит результат и продолжает. Универсальный паттерн для большинства задач.

Когда: задача требует нескольких шагов, путь решения неизвестен заранее
Plan & Execute
Plan → Execute → Replan
Планирует Исполняет Перепланирует

Агент сначала составляет полный план, затем выполняет шаги. Если что-то пошло не так — перепланирует. Хорош для долгих задач.

Когда: длинные задачи, нужна предсказуемость, дорогие действия нельзя отменить
Reflection
Generate → Critique → Revise
Генерирует Критикует Улучшает

Агент создаёт черновик, затем критически оценивает его и улучшает. Часто используют два агента: генератор и критик.

Когда: высокое качество важнее скорости: код, тексты, анализ
Supervisor
Orchestrator + Workers
Оркестратор Агент 1 · Агент 2

Центральный агент-супервайзер разбивает задачу и делегирует подагентам-специалистам. Результаты собираются обратно.

Когда: задачи требуют разных специализаций, параллельное выполнение

7 проектов в портфолио

Реальные агенты, которые можно показать работодателю

1

CLI Multi-LLM Чат

Консольный чат с переключением между OpenAI, Anthropic, Mistral + история сообщений

Python · Pydantic · Async
2

Research Agent (чистый Python)

Агент ищет информацию в вебе, суммаризирует страницы, собирает отчёт — без фреймворков

Tool Calling · ReAct · Memory
3

Code Generation Agent (LangGraph)

Граф: планирование → написание кода → запуск тестов → исправление → human approval

LangGraph · LangSmith · Human-in-the-loop
4

Document Q&A Agent

Загрузка PDF/Notion, индексация, умный поиск по документам с цитатами источников

RAG · Chroma · LangGraph
5

Research Pipeline (Multi-agent)

4 агента: поиск → анализ → написание → ревью. Параллельная обработка источников

AutoGen / CrewAI · Supervisor pattern
6

Data Analysis Agent

Принимает CSV, пишет и выполняет Python-код для анализа данных, строит визуализации

Code Interpreter · Pandas · Streamlit
7

Production-ready AI Assistant

FastAPI-сервис с агентом, мониторингом (Langfuse), CI/CD, Docker деплоем

FastAPI · Docker · Langfuse · GitHub Actions

Материалы для изучения

Документация, курсы и статьи, отобранные для роадмапа

Официальная документация

Курсы

Статьи и репозитории

Готов начать путь AI Agent Engineer?

Посмотри CV автора или начни обучение прямо сейчас

Присоединяйтесь к сообществу Data Engineering —  вступить в Telegram-группу →