Извините, регистрация закрыта. Программа уже идетПодробности Вы можете узнать у организаторов события.
6 недель с ETL и пайплайнами. Первая в России программа Data Engineer, предназначенная для data scientist’ов и data-менеджеров, желающих углубиться непосредственно в добычу и обработку данных, построение стабильных пайплайнов, делающих данные доступными для всех пользователей внутри компании. Цель программы научить вас создавать стабильные пайплайны обработки данных от сбора до их визуализации. Преподаватели программы действующие Data Engineerы, ежедневно работающие с данными.
За любым продуктом, сервисом — будь то рекомендательная система на сайте, рассылка персонализированных предложений, кампания по удержанию клиентов — стоят данные. От качества этих данных зависит и качество решений, ведь garbage in — garbage out. Данные должны быть свежими, корректными, предобработанными, чтобы аналитики и data scientistы могли делать свою работу максимально эффективно. За доставку этих данных из разных источников (например, сайт компании, CRM, соц. сети) отвечает data engineer.
Learning by building. Обучение длится 6 недель, в течение которых вы выполняете один большой сквозной проект. Его суть заключается в том, чтобы собирать кликстрим с выданного вам сайта и направлять эти данные в два пайплайна:
На протяжении всей программы каждый участник работает на своем облачном кластере, конфигурируя все необходимые инструменты для обработки данных. В рамках программы вы будете изучать и оттачивать навыки работы со следующими инструментами: Divolte, Kafka, ELK, Spark, Luigi, Sqoop, Druid, ClickHouse, Superset, Storm, что позволит в дальнейшем осваивать другие инструменты и настраивать любые пайплайны.