Data Engineer в Геосервисы (ML)
Обязанности:
- Разрабатывать решения для сбора, валидации и предобработки данных для обучения моделей.
- Проектировать структуру датасетов для задач детекции, сегментации и 3D-реконструкции.
- Масштабировать решения для больших объёмов данных.
- Подготавливать данные предварительной и постобработки (изображения, траектории, облака точек, 3D модели).
- Разрабатывать инструменты автоматической и полуавтоматической разметки.
- Создавать и версионировать датасеты и разрабатывать инструкции для команд разметки.
Требования:
- Уверенное знание Python, pandas, numpy.
- Понимание принципов построения качественных датасетов.
- Знание методов аугментации данных.
- Опыт работы с большими объёмами изображений и облаками точек.
- Базовое понимание метрик качества ML-моделей для оценки влияния данных.
