TL;DR

Senior Data Engineer (Spark): Разработка MLOps/autoML платформы и высоконагруженных сервисов обработки данных с акцентом на Scala, Apache Spark и масштабируемую архитектуру. Фокус на проектировании структур хранения, оптимизации производительности распределенных систем и поддержке промышленных ML-решений для финтех-сектора.

Локация: Удаленно или в офисе в Москве.

Компания

Крупная телекоммуникационная компания, развивающая финтех-сервисы и платформы для машинного обучения, используемые большинством банковского сектора.

Что делать

Разрабатывать MLOps и autoML платформы.
Проектировать структуры хранения и представления данных.
Создавать промышленные сервисы распределенной обработки данных.
Мигрировать сервисы платформы на новые версии библиотек.
Масштабировать продукты под возрастающую нагрузку.
Проводить code review и писать юнит/интеграционные тесты.

Требования

Опыт разработки на Scala от 2 лет.
Глубокое знание Apache Spark.
Понимание принципов оптимизации обработки данных (storage formats, join strategies).
Навыки работы с Docker и Kubernetes.
Понимание архитектуры и принципов работы Spark-приложений.

Хорошо, если есть

Опыт работы со SparkML и понимание принципов обучения моделей.
Знание Python.
Опыт проектирования MLOps платформ.
Опыт работы с базами данных типа Cassandra или Scylla.

Культура и преимущества

Трудоустройство в аккредитованную ИТ-компанию.
Работа над социально значимыми продуктами в сфере финтеха.
Возможность удаленной работы.

Data Engineer

Описание вакансии