👨‍💻DEV [BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

[BigData Тeam] Практический курс по Big Data. Част_0.png


[BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)



Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

В этом модуле вы изучите:

* подходы к Realtime-обработке;

* гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";

* Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;

* архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;

* семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.

* отличия Key-Value хранилищ от реляционных БД;

* компактификация и её виды, CQLSH;

* архитектура Cassandra;

* обеспечение надёжности и высокодоступности в Key-Value хранилищах;

* интеграция Spark с Cassandra.

* как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;

* trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;

* форматы данных в Big Data: ORC vs Parquet, Avro, ...



—————————————————————————

🔗 Продажник:
Доступно пользователям: Зарегистрированный


📥 СКАЧАТЬ КУРС:
🔐 Хотите получить доступ?

Чтобы увидеть скрытые ссылки и ставить лайки, активируйте VIP-статус.

💎 ПОЛУЧИТЬ ДОСТУП Наш Telegram канал
 

Похожие курсы

Назад
Верх