Проект на 2-3 человек
Требуется реализовать прототип распределенной платформы для микроблогов
В качестве основной базы данных предлагается использовать MongoDB:
- сохранения сообщений
- сохранения и обновления аккаунтов пользователей (авторов сообщений)
Для отображения ленты и поиска сообщений предлагается использовать ElasticSearch:
- полнотекстовый поиск сообщений
- отображение сообщений за последний час/день
Для быстрого отображения информации о пользователях (логин/имя пользователя/...) предлагается использовать распределенный кэш Hazelcast
При редактировании аккаунта пользователя, блокировать его в Hazelcast для предотвращения конфликта.
Данные аккаунтов и сообщения можно взять из дампа stackoverflow (или выкачать из твиттера).
За основу взять шаблон приложения на Spring Boot.
Предлагаемый план работ:
- Обсудить и согласовать модель данных предметной области (UserAccount, Message)
- Реализация
- Класс - сервис для работы с MongoDB для Message (сохранение, получение по ID)
- Класс - сервис для работы с ElasticSearch (индексация, поиск по тексту, поиск по периоду)
- Класс - сервис для работы с MongoDB для UserAccount (сохранение, получение по ID
- Реализация кэширования и блокировки UserAccount в Hazelcast
- Реализация загрузки данных из stackoverflow в систему с использованием реализованных сервисов (например, используя Apache Spark)
- Реализация REST API для классов из a,c
- Реализация REST API для классов из b (полнотекстового поиска)
- Интеграция
- Загрузка полного объема данных в кластер (не менее нескольких миллионов сообщений)
- Функциональное тестирование и исправление ошибок
- Тест на отключение отдельных узлов и восстановление связи с узлом