5. Материализованные представления в Oracle, партиционирование данных.
6. Визуализация данных в системах Data Warehouse. Tableau Desktop.
7. Оптимизация запросов в Oracle. План выполнения, Индексы.
8. Репликация в распределенных базах и хранилищах данных
9. Реализация репликации данных в Oracle Golden Gate.
10. Обзор NoSQL решений для обработки больших данных
11. Платформа Apache Hadoop: MapReduce, файловая система HDFS и планировщик задач YARN. Пример и практикум по HDFS, MapReduce.
12. Дистрибутив Cloudera Hadoop: Hive, Impala, Spark, Pig, HBase, Oozie. Cloudera Manager. Практикум на Hive, HBase и Oozie.
13. Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.
14. Apache Spark: RDD, DataFrame/DataSet. Практикум.
15. Решения для полнотекстового поиска на базе Apache Lucene. Практикум на Elastic Search.
16. Обзор технологии Blockchain. Пример "умного контракта" на Ethereum.
Материалы
Исходные коды с примерами: https://bitbucket.org/eugav/hadoop-test/src