Мы ищем опытного лида, который возглавит разработку и масштабирование конвейера обучения языковых моделей. Наша главная цель — сделать процесс экспериментов быстрым, прозрачным и доступным: чтобы любой ресерчер мог добавить свои данные в пайплайн, автоматически прогнать их через проверки, обучить proxy-модель на этапе SFT или RL и получить валидацию гипотезы без ручной боли. Вам предстоит превратить разрозненные скрипты в надежный, автоматизированный self-service пайплайн.
Обязанности
- построить self-service конвейер данных: адаптировать существующие инструменты для автоматической валидации датасетов, проверок на утечки (data leaks) и деградацию качества перед стартом обучения;
- автоматизировать этапы обучения: превратить унифицированные пайплайны для SFT (Supervised Fine-Tuning), RL-фазы и Online RL в сервисы;
- ускорить проверку гипотез: реализовать флоу, при котором заливка новых данных автоматически триггерит легковесное обучение (на маленьких моделях) для быстрых проверок перед запуском тяжелых экспериментов;
- настроить инструментарий и доступы: пробить необходимые доступы к инфраструктуре, выстроить ролевую модель и создать удобные тулы для ML-команд;
- управлять командой и процессами: выстраивать кросс-функциональное взаимодействие (ML-ресерчеры, дата-инженеры, инфраструктура), руководить командой пайплайнов, растить специалистов.остроить self-service конвейер данных: адаптировать существующие инструменты для автоматической валидации датасетов, проверок на утечки (data leaks) и деградацию качества перед стартом обучения.
Требования
- глубокий опыт построения ML-инфраструктуры и пайплайнов обучения (от подготовки данных до сохранения готовых весов и метрик);
- понимание специфики обучения LLM: как устроены процессы SFT, RLHF/DPO, в чем сложность распределенного обучения;
- уверенное владение Python и современным стеком дата/ML-оркестрации (Airflow, Prefect, Kubeflow и т.д.);
- опыт руководства командой (от 3 человек), умение превращать хаос R&D-скриптов в инженерный продукт;
- навыки выстраивания процессов взаимодействия между техническими и R&D-командами
Будет плюсом:
- если строили автоматизированные пайплайны обучения для ML-разработчиков;
- опыт работы с фреймворками распределенного обучения (FSDP, Megatron-LM, DeepSpeed, Ray);
- работа с большими объемами данных (YT, Hadoop) для подготовки обучающих выборок.
Условия
- гибридный формат работы г. Москва, Кутузовский пр-т 32
- возможность оформления в IT-аккредитованную компанию;
- корпоративный спортзал и зоны отдыха.
- более 400 программ СберУниверситета для роста;
- программа адаптации и помощь руководителя на старте;
- крупнейшее DS&AI community — более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы;
- расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа;
- ипотека для сотрудников по дисконтной программе;
- сберПрайм+ и скидки у партнёров;
- бонус за рекомендации в команду.

