Главная
Blog
Категории
Data Engineering
dbt (Data Build Tool)
Data Architecture / Data Modeling
Apache Spark
Big Data
ClickHouse
DWH
Data Vault 2.0
General IT
Apache Airflow Best Practices
gRPC and .proto
Python
LLM / AI and Data Engineering
Apache Kafka
💬 Подпишись на Telegram
⚙ Data Engineer RoadMap
Best Practices — Airflow 3 Документация
Python — Многозадачность, конкурентность и асинхронность
PySpark Interview — Вопросы и ответы
Системный дизайн. Интервью по System Design
Apache Kafka Tutorial 101: Архитектура, Consumer, Producer, Topic
Построение архитектуры Medallion для данных Bluesky в формате JSON с помощью ClickHouse
Глава 5. Кодирование и Эволюция (Encoding and Evolution)
Глава 4. Хранение и извлечение
Глава 3. Модели данных и языки запросов
Глава 2. Определение нефункциональных требований
Глава 1. Компромиссы в архитектуре систем данных
Airflow Best Practices Перевод 3 главы «Компоненты Airflow»
Apache Airflow Best Practices — Глава 2 «Core Concepts»
Apache Airflow Best Practices — Глава 1 «Начало работы с Airflow 2.0»
Введение в Структуры данных (Data Structures) и алгоритмы
Перевод 7 Главы — Dimensional Modeling (Data Vault 2.0)
Перевод 6 Главы — Продвинутое моделирование Data Vault 2.0 — Advanced Data Vault Modeling
Перевод 5 Главы — Intermediate Моделирование Data Vault
Процессы сериализации и десериализации данных. Форматы сериализации
Введение в gRPC: Python, proto Protocol Buffers, client и server
1
2