История страницы

Отображение дочерних

5. Материализованные представления в Oracle, партиционирование данных. Обновление материализованных представлений.

6. Визуализация данных в системах Data Warehouse. Tableau Desktop.

7. Оптимизация запросов в Oracle. План выполнения, Индексы.

8. Репликация в распределенных базах и хранилищах данных

9. Реализация репликации данных в Oracle Golden Gate. 10. Обзор NoSQL решений для обработки больших данных

8. Знакомство с платформой Hadoop, на примере дистрибутива Cloudera.

911. Платформа Apache Hadoop: MapReduce, файловая система HDFS, Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.

10. MapReduce и планировщик задач YARN. Пример и практикум по HDFS, Паттерны обработки данных в MapReduce.

1211. Дистрибутив Cloudera Hadoop: Hive, Impala, Spark, Pig, HBase, Oozie. Cloudera Manager. Практикум на Hive, HBase и Oozie.

13. Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.14. Apache Spark: RDD, DataFrame/DataSet. Практикум.15. Решения для полнотекстового поиска на базе Apache Lucene. Практикум на Elastic Search.

1614. Обзор технологии Blockchain. Пример "умного контракта" на Ethereum.

Материалы

Информация
Исходные коды с примерами: https://bitbucket.org/eugav/hadoop-test/src

Быстрые ссылки

Дерево страниц

Сравнение версий

Старая версия 8

Новая версия 9

Ключ

Материалы