Отображение дочерних |
---|
5. Материализованные представления в Oracle, партиционирование данных. Обновление материализованных представлений.
6. Визуализация данных в системах Data Warehouse. Tableau Desktop.
7. Оптимизация запросов в Oracle. План выполнения, Индексы.
8. Репликация в распределенных базах и хранилищах данных
9. Реализация репликации данных в Oracle Golden Gate. 10. Обзор NoSQL решений для обработки больших данных
8. Знакомство с платформой Hadoop, на примере дистрибутива Cloudera.
911. Платформа Apache Hadoop: MapReduce, файловая система HDFS, Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.
10. MapReduce и планировщик задач YARN. Пример и практикум по HDFS, Паттерны обработки данных в MapReduce.
1211. Дистрибутив Cloudera Hadoop: Hive, Impala, Spark, Pig, HBase, Oozie. Cloudera Manager. Практикум на Hive, HBase и Oozie.
13. Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.14. Apache Spark: RDD, DataFrame/DataSet. Практикум.15. Решения для полнотекстового поиска на базе Apache Lucene. Практикум на Elastic Search.
1614. Обзор технологии Blockchain. Пример "умного контракта" на Ethereum.
Материалы
Информация |
---|
Исходные коды с примерами: https://bitbucket.org/eugav/hadoop-test/src |