Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Занятие 8: Потоковая обработка данных. Spark Streaming

Занятие 9: Обзор задач и инструментария инжиниринга данных

Итоговое задание

Блок кода
Варианты:
1. Найти страны с наибольшей смертностью за 2022 г. среди 10 с наибольшим процентом вакцинированных
2. Найти страны с наибольшей смертностью за 2022 г. среди 50 с наименьшим процентом вакцинированных
3. Найти наиболее эффективные вакцины (наименьший процент заболевших во время вакцинации пропорционально количеству вакцинированных)
4. Найти наименее эффективные вакцины (наибольший процент заболевших во время вакцинации пропорционально количеству вакцинированных)

Для своего варианта реализовать задачу:
1. На Hive SQL
2. На Spark (RDD, Dataframe/Dataset)
3. Опционально на Spark SQL

...