Blog - DataTalks.RU. Data Engineering / DWH / Data Pipeline

Context engineering = data governance + data engineering + data science

Подготовка к собеседованию Python

Pytest Tutorial: тесты, fixture, mark, parametrize

Best Practices — Airflow 3 Документация

Python — Многозадачность, конкурентность и асинхронность

PySpark Interview — Вопросы и ответы

Системный дизайн. Интервью по System Design

Apache Kafka Tutorial 101: Архитектура, Consumer, Producer, Topic

Построение архитектуры Medallion для данных Bluesky в формате JSON с помощью ClickHouse

Глава 5. Кодирование и Эволюция (Encoding and Evolution)

Глава 4. Хранение и извлечение

Глава 3. Модели данных и языки запросов

Глава 2. Определение нефункциональных требований

Глава 1. Компромиссы в архитектуре систем данных

Airflow Best Practices Перевод 3 главы «Компоненты Airflow»

Apache Airflow Best Practices — Глава 2 «Core Concepts»

Apache Airflow Best Practices — Глава 1 «Начало работы с Airflow 2.0»

Введение в Структуры данных (Data Structures) и алгоритмы

Перевод 7 Главы — Dimensional Modeling (Data Vault 2.0)

Перевод 6 Главы — Продвинутое моделирование Data Vault 2.0 — Advanced Data Vault Modeling