Мы — команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.
_Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!_
Обязанности
### Чем предстоит заниматься:
- разработка инструментов для валидации и замера качества моделей и систем контроля качества данных
- создание метрик оценки производительности и точности LLM
- автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки
- построение и оптимизация пайплайнов чистки и синтеза данных
- генерация высококачественных кодовых и технических датасетов
- поддержка инфраструктуры для хостинга open source моделей.
Требования
### Мы ждём что ты:
- отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)
- опыт работы с LLM (open source: Llama, Mistral, Qwen и проприетарными: GPT, Claude)
- понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация
- навыки построения ML пайплайнов и автоматизации процессов
- понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения
- понимание основ MLOps и работы с контейнеризацией (Docker).
Будет плюсом:
- опыт с фреймворками для работы с агентами и RAG
- знание подходов к fine-tuning (LoRA, QLoRA, SFT)
- опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W&B)
- понимание принципов работы с кодовыми данными и техническими текстами
- опыт развертывания и мониторинга ML-моделей в production.
Условия
### Что мы предлагаем:
- самое крупное DS&AI сообщество — более 600 специалистов банка
- дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
- гибридный или офисный формат работы
- современный офис у метро Кутузовская
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- специальные условия ипотеки под ставку до 7%
- бесплатная подписка СберПрайм+ и скидки на товары партнёров
- вознаграждение за рекомендации друзей.

