Ну что ж, друзья! Встречайте долгожданный 10-й, можно сказать юбилейный, выпуск SDCast’а! На этот раз речь пойдет о хранилищах данных и BigData. У меня в гостях, Алексей Константинов, архитектор в компании EasyData в настоящее время, и один из ведущих архитекторов хранилища данных в компании Yota в прошлом. В этом выпуске освещаются интереснейшие вопросы устройства, внутренней архитектуры и проблемы построения хранилищ данных в общем и хранилищ на базе HP Vertica в частности.
Затрагиваются такие темы как:
- Источники данных, вопросы их сбора и агрегации
- Проектирование хранилищ данных
- Проблемы масштабирования и способы их решения
- Отказоустойчивость
- Кластеризация и шардинг
- История возникновения и развития HP Vertica
- ETL процесс
- и многое другое!
Ссылки на инструменты и прочие штуки, так или иначе упомянутые в подкасте:
- HP Vertica. Зарегистрировавшись, можно скачать бесплатную community редакцию.
- Online-документация по Vertica.
- Описание Vertica на русском языке.
- Groovy ETL (gETL). Инструмент для настройки загрузки данных в вертику.
- Статья про Вертику в банке «Открытие».
- Статья про Вертику в Йоте.
- Заметка про Вертику на хабре.