Data Engineer в Геосервисы (ML)

Обязанности:

  • Разрабатывать решения для сбора, валидации и предобработки данных для обучения моделей.
  • Проектировать структуру датасетов для задач детекции, сегментации и 3D-реконструкции.
  • Масштабировать решения для больших объёмов данных.
  • Подготавливать данные предварительной и постобработки (изображения, траектории, облака точек, 3D модели).
  • Разрабатывать инструменты автоматической и полуавтоматической разметки.
  • Создавать и версионировать датасеты и разрабатывать инструкции для команд разметки.

Требования:

  • Уверенное знание Python, pandas, numpy.
  • Понимание принципов построения качественных датасетов.
  • Знание методов аугментации данных.
  • Опыт работы с большими объёмами изображений и облаками точек.
  • Базовое понимание метрик качества ML-моделей для оценки влияния данных.