TL;DR

Senior Data Engineer (Spark): Разработка MLOps/autoML платформы и высоконагруженных сервисов обработки данных с акцентом на Scala, Apache Spark и масштабируемую архитектуру. Фокус на проектировании структур хранения, оптимизации производительности распределенных систем и поддержке промышленных ML-решений для финтех-сектора.

Локация: Удаленно или в офисе в Москве.

Компания

Крупная телекоммуникационная компания, развивающая финтех-сервисы и платформы для машинного обучения, используемые большинством банковского сектора.

Что делать

  • Разрабатывать MLOps и autoML платформы.
  • Проектировать структуры хранения и представления данных.
  • Создавать промышленные сервисы распределенной обработки данных.
  • Мигрировать сервисы платформы на новые версии библиотек.
  • Масштабировать продукты под возрастающую нагрузку.
  • Проводить code review и писать юнит/интеграционные тесты.

Требования

  • Опыт разработки на Scala от 2 лет.
  • Глубокое знание Apache Spark.
  • Понимание принципов оптимизации обработки данных (storage formats, join strategies).
  • Навыки работы с Docker и Kubernetes.
  • Понимание архитектуры и принципов работы Spark-приложений.

Хорошо, если есть

  • Опыт работы со SparkML и понимание принципов обучения моделей.
  • Знание Python.
  • Опыт проектирования MLOps платформ.
  • Опыт работы с базами данных типа Cassandra или Scylla.

Культура и преимущества

  • Трудоустройство в аккредитованную ИТ-компанию.
  • Работа над социально значимыми продуктами в сфере финтеха.
  • Возможность удаленной работы.