Полный путь от основ до создания production-ready AI-агентов.
LangGraph · AutoGen · CrewAI · RAG · Мультиагентные системы
Понять архитектуру — значит уметь её строить
AI-агент — это программа, в которой языковая модель не просто отвечает на вопросы, а самостоятельно принимает решения и совершает действия для достижения заданной цели.
Обычный чат-бот работает в одну сторону: получил вопрос — сгенерировал ответ — завершил работу. Агент устроен иначе. Он действует в цикле: получает задачу, рассуждает, выбирает инструмент, смотрит на результат, снова рассуждает — и так до тех пор, пока цель не достигнута или не определено, что она недостижима. LLM здесь выполняет роль «мозга»: читает контекст, решает что делать следующим шагом, интерпретирует результаты.
Принципиальное отличие от pipeline'а — нелинейность и адаптивность. В жёстком пайплайне шаги зафиксированы заранее: шаг 1 → шаг 2 → шаг 3. Агент сам решает, какой шаг сделать и нужен ли он вообще. Если первый инструмент вернул ошибку — агент пробует другой. Если промежуточный результат изменил картину — агент пересматривает план. Это делает агентов мощным инструментом для задач с заранее неизвестным количеством шагов.
На практике агент работает с реальными системами: читает и пишет файлы, выполняет SQL-запросы, вызывает REST API, управляет браузером, запускает код. Всё это через инструменты (tools) — функции, которые агент может вызвать. LLM не выполняет действия сам: он генерирует структурированный запрос на вызов функции, среда выполняет функцию, результат возвращается обратно в контекст модели.
Ещё одна ключевая составляющая — память. Краткосрочная память — это окно контекста: всё, что произошло в текущей сессии. Долгосрочная — внешние хранилища: векторные базы для семантического поиска, обычные БД для фактов, файлы для структурированных данных. Без памяти агент каждый раз начинает с нуля; с памятью — накапливает знания о задаче и о пользователе между сессиями.
Практические примеры: агент-аналитик, который сам пишет SQL-запросы, интерпретирует результаты и формирует отчёт; агент-разработчик, который читает баг-репорт, находит нужный файл в репозитории, пишет фикс и создаёт PR; агент поддержки, который ищет ответ в документации, при необходимости заводит тикет и отслеживает его статус. Во всех случаях человек ставит цель — агент выбирает путь.
Языковая модель принимает решения: что сделать дальше, какой инструмент вызвать, достигнута ли цель.
Агент вызывает функции: поиск в интернете, выполнение кода, запросы к API, работа с файлами и БД.
Краткосрочная — контекст текущей сессии. Долгосрочная — векторные БД и персистентное хранилище.
Паттерн ReAct: агент рассуждает, действует, наблюдает результат и повторяет до достижения цели.
От нуля до senior AI Agent Engineer
Python, LLM API, Prompt Engineering
Tool calling, MCP, ReAct, Plan-and-Execute
State machines, графы, checkpointing
Chunking, Embeddings, Reranking, векторные БД, Agentic RAG
AutoGen, CrewAI, паттерны координации
Observability, тестирование, деплой
7 production-ready агентов в портфолио
Нажмите на модуль, чтобы развернуть содержание
Агент ищет информацию из нескольких источников, анализирует и создаёт подробный отчёт
Анализирует PR, находит баги, проблемы безопасности, предлагает улучшения
Получает CSV/Excel, пишет и выполняет Python-код для анализа, строит графики
Отвечает на вопросы по документации, эскалирует сложные случаи, запоминает контекст
Исследует тему → пишет черновик → редактирует → оптимизирует SEO → публикует
Отвечает на вопросы о данных на естественном языке, генерирует и исполняет SQL
Управляет задачами, читает email, пишет письма, работает с календарём
Фреймворки и инструменты AI Agent Engineer'а
Граф состояний для сложных агентов. Идеален для production-агентов с ветвлением, checkpointing и human-in-the-loop.
Role-based мультиагентные системы. Интуитивный YAML-конфиг, метафора команды специалистов.
Conversational мультиагенты. Агенты общаются через сообщения, event-driven архитектура.
Официальный SDK для агентов OpenAI. Handoffs, built-in tools, tracing.
Специализирован на работе с данными и документами. Лучший RAG-фреймворк.
Официальный Anthropic SDK для создания агентов. Оптимизирован под Claude-модели.
Anthropic. Лучшее следование инструкциям, отличный tool calling, extended thinking для сложных задач.
Сильные coding способности, structured outputs, vision. o1/o3 — для сложных рассуждений.
Очень быстрый и дешёвый, огромный контекст (1M токенов), хорош для аналитики.
Self-hosted через Ollama, vLLM. Конфиденциальность данных, нет per-token cost.
LPU-инфраструктура для Llama/Mistral. Скорость 500+ tok/s — для latency-sensitive агентов.
Локальная векторная БД, идеальна для разработки и прототипирования. pip install chromadb и готово.
Managed векторная БД. Просто масштабируется, serverless tier. Стандарт для production RAG.
Расширение PostgreSQL. Если уже есть Postgres — не нужна отдельная инфра.
Hybrid search (vector + BM25), мощная фильтрация, self-hosted или cloud.
Rust-based, очень быстрый. Отличная фильтрация, sparse+dense векторы (hybrid).
Трейсинг, дебаг, оценка качества. Нативная интеграция с LangGraph. Визуализация шагов агента.
Open-source альтернатива LangSmith. Self-hosted, GDPR-compliant. Evaluation + experiments.
Open-source observability. Сильный eval-фреймворк, trace visualization, активное сообщество.
Стандарт для distributed tracing. Интегрируется с любой observability платформой (Datadog, Grafana).
Выбирайте паттерн под задачу, не по моде
Итеративный цикл: агент рассуждает, выбирает инструмент, исполняет, видит результат и продолжает. Универсальный паттерн для большинства задач.
Агент сначала составляет полный план, затем выполняет шаги. Если что-то пошло не так — перепланирует. Хорош для долгих задач.
Агент создаёт черновик, затем критически оценивает его и улучшает. Часто используют два агента: генератор и критик.
Центральный агент-супервайзер разбивает задачу и делегирует подагентам-специалистам. Результаты собираются обратно.
Реальные агенты, которые можно показать работодателю
Консольный чат с переключением между OpenAI, Anthropic, Mistral + история сообщений
Агент ищет информацию в вебе, суммаризирует страницы, собирает отчёт — без фреймворков
Граф: планирование → написание кода → запуск тестов → исправление → human approval
Загрузка PDF/Notion, индексация, умный поиск по документам с цитатами источников
4 агента: поиск → анализ → написание → ревью. Параллельная обработка источников
Принимает CSV, пишет и выполняет Python-код для анализа данных, строит визуализации
FastAPI-сервис с агентом, мониторингом (Langfuse), CI/CD, Docker деплоем
Документация, курсы и статьи, отобранные для роадмапа
Посмотри CV автора или начни обучение прямо сейчас