SDCast #36: в гостях Дмитрий Павлов, администратор хранилищ данных банка Тинькофф

sd-podcast-logo Рад представить вам первый выпуск 2016 года, за номером 36. У меня в гостях Дмитрий Павлов, администратор хранилищ данных банка Тинькофф. В этом выпуске речь идет про хранилища данных, чем они отличаются от просто баз данных, какими отличительными возможностями они обладают, для какой нагрузки они предназначены по сравнению с RDBMS.

Дмитрий рассказал про архитектуру хранилища данных, построенную в банке Тинькофф, на чем она построена, из каких компонент состоит, как происходит загрузка данных из online-систем, как устроен ETL-процесс, что используется для расчетов, какие есть интеграции с внешними системами и как они устроены. Не обошли мы стороной и вопрос мониторинга всей системы. Дмитрий рассказал, какие метрики для хранилищ данных важны, что имеет значение, как их собирать и как за ними следить, и какие инстументы мониторинга они используют у себя.

Хранилище данных базируется на БД GreenPlum, которая, в свою очередь, базируется на PostgreSQL, из которых построено несколько кластеров, так же GreenPlum интегрирован с Hadoop и Informatica BDE, в которых производятся расчеты, а мониторится это все с помощью Graphite/Grafana/Cabot.

Читать далее

Software Development podCAST #2

sd-podcast-logoПервый выпуск подкаста в 2014 году посвящен администрированию серверов и сервисов. В гостях Константин @melazyk Никифоров, руководитель группы системных администраторов @Mail.ru group.
Говорим о эксплуатации большого парка серверов, как развертывать новые инстансы, как это все администрировать и управлять конфигурацией с помощью Puppet. Обсуждаем процессы выкатывания новых релизов и откатывания изменений в экстренных случаях. Одна из интересных тем – использование lua в высоконагруженных проектах и применение связки Nginx + LUA. Кстати, для тех, кто хочет попробовать у себя такую связку, есть такой проект как openresty, который включает в себя nginx и набор дополнительных модулей, таких как LuaNginxModule, DrizzleNginxModule, LuaJIT, Redis2NginxModule и много еще других. Так же пара слов о использовании связки Nginx + uWSGI для Python и RoR.
Обсуждаем вопросы мониторинга работоспособности сервисов и применение таких инструментов как Graphite, Tarantool и прочих.

Читать далее