Skip to content

Книги

Junior level

📘 Основы инженерии данных

Автор: Джо Рис, Мэтт Хоусли

Базовая книга по инженерии данных. Рассмотрены все аспекты проектирования и эксплуатации различных архитектур данных, а также полный жизненный цикл работы с данными: подготовка, поглощение, преобразование, очистка, сочетание, оркестрация, конвейеризация.

Открыть PDF
📘 Apache Airflow и конвейеры обработки данных

Автор: Бас Харенслак, Джулиан де Руйтер

Те, кто мало знаком с Airflow, получат базовое представление о принципах работы этой платформы в I части книги. Далее обсуждаются такие темы, как создание собственных компонентов, тестирование, передовые практики и развертывание, – эти главы можно читать в произвольном порядке в зависимости от конкретных потребностей читателя.

Открыть PDF

Middle+ / Senior level (ru)

📘 ИНСТРУМЕНТАРИЙ ХРАНЕНИЯ И АНАЛИЗА ДАННЫХ

Автор: Ральф Кимбалл, Марджи Росс

ПОЛНОЕ РУКОВОДСТВО ПО РАЗМЕРНОМУ МОДЕЛИРОВАНИЮ. Благодаря этой книге вы освоите все необходимые инструменты для хранения и анализа большого количества данных, научитесь правильно управлять ими и извлекать полезную информацию для развития бизнеса.

Открыть PDF
📘 Spark в действии

Автор: Перрен Жан

Эта книга научит вас создавать полноценные и завершенные аналитические приложения. В качестве примера используется полный конвейер обработки данных, поступающих со спутников NASA. Для чтения этой книги не требуется какой-либо предварительный опыт работы со Spark, Scala или Hadoop.

Открыть PDF
📘 Высоконагруженные приложения. Программирование, масштабирование, поддержка.

Автор: Мартин Клеппман

В этой книге вы найдете ключевые принципы, алгоритмы и компромиссы, без которых не обойтись при разработке высоконагруженных систем для работы с данными. Материал рассматривается на примере внутреннего устройства популярных программных пакетов и фреймворков. В книге три основные части, посвященные, прежде всего, теоретическим аспектам работы с распределенными системами и базами данных. От читателя требуются базовые знания SQL и принципов работы баз данных.

Открыть PDF

Middle+ / Senior level (en)

📘 97 Things Every Data Engineer Should Know: Collective Wisdom from the Experts

Автор: by Tobias Macey

The book is a collection of 97 concise and practical tips covering various aspects of data engineering. Authors from companies such as Twitter, Google, Stitch Fix, Microsoft, Capital One, and LinkedIn share their experiences and lessons learned in tackling diverse data processing challenges.

Открыть PDF
📘 Data Engineering with Scala and Spark. 2024

Автор: Eric Tome, Rupam Bhattacharjee, David Radford

Build streaming and batch pipelines that process massive amounts of data using Scala

Открыть PDF