Хранение и обработка больших объемов данных [2016]

5. Материализованные представления в Oracle, партиционирование данных.

6. Визуализация данных в системах Data Warehouse. Tableau Desktop.

7. Оптимизация запросов в Oracle. План выполнения, Индексы.

8. Репликация в распределенных базах и хранилищах данных

9. Реализация репликации данных в Oracle Golden Gate.

10. Обзор NoSQL решений для обработки больших данных

11. Платформа Apache Hadoop: MapReduce, файловая система HDFS и планировщик задач YARN. Пример и практикум по HDFS, MapReduce.

12. Дистрибутив Cloudera Hadoop: Hive, Impala, Spark, Pig, HBase, Oozie. Cloudera Manager. Практикум на Hive, HBase и Oozie.

13. Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.

14. Apache Spark: RDD, DataFrame/DataSet. Практикум.

15. Решения для полнотекстового поиска на базе Apache Lucene. Практикум на Elastic Search.

16. Обзор технологии Blockchain. Пример "умного контракта" на Ethereum.

Исходные коды с примерами: https://bitbucket.org/eugav/hadoop-test/src

Быстрые ссылки