‹ Все вакансииПорекомендовать кандидата Узнать о программе рекомендаций
Яндекс Доставка быстро растёт. За несколько лет наша команда запустила удобную доставку в нескольких сотнях городов России и СНГ. Наша цель — стать сервисом доставки по умолчанию для любых задач.
Мы ищем инженера данных, который вместе с аналитиками будет заниматься самыми тяжёлыми расчётами, прорабатывать самые сложные алгоритмы и готовить инструментарий для сотен бизнес-пользователей. У нас вы сможете напрямую влиять на качество «логистических» продуктов, которыми пользуетесь вы и ваши друзья: от Яндекс Маркета до Яндекс Еды.
Что нужно делать:
- создавать и оптимизировать нетривиальные ETL-процессы обработки данных;
- выжимать из сырых данных ценную информацию и аккуратно раскладывать её в удобные для анализа объекты;
- работать с данными на всех этапах: от появления информации в источнике до монетизации знаний;
- с командой аналитиков реализовывать стабильный расчёт бизнес-метрик;
- поддерживать и изменять решения, отвечать за доступность сервиса и корректность данных, которые он предоставляет.
Мы ждем, что вы:
- отлично знаете Python;
- работаете со специализированными аналитическими базами данных (Greenplum, Vertica, ClickHouse, Teradata и пр.);
- участвовали в любом этапе проектирования хранилищ данных.
Будет плюсом, если вы:
- работали с большими объёмами данных (стек технологий — Hadoop, Spark, Hive);
- создавали сложные высоконагруженные ETL- и ELT-пайплайны (плюсом будет знание code-driven ETL Luigi, Airflow);
- разрабатываете процессы обработки сложных событий (CEP) почти в реальном времени (Kafka Streams, Spark, Flink и пр.);
- работаете с инструментами стека Python для data science (Jupyter, pandas, SciPy, Matplotlib, Bokeh и пр.);
- коммитите в публичные репозитории или пишете статьи с примерами работ.
Полезные материалы:
Подготовка к техническим интервью для аналитика-разработчика Подготовка к техническим интервью для бизнес-аналитика
Откликнуться на вакансию