Мы — команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.

_Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!_

Обязанности

### Чем предстоит заниматься:

  • разработка инструментов для валидации и замера качества моделей и систем контроля качества данных
  • создание метрик оценки производительности и точности LLM
  • автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки
  • построение и оптимизация пайплайнов чистки и синтеза данных
  • генерация высококачественных кодовых и технических датасетов
  • поддержка инфраструктуры для хостинга open source моделей.

Требования

### Мы ждём что ты:

  • отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)
  • опыт работы с LLM (open source: Llama, Mistral, Qwen и проприетарными: GPT, Claude)
  • понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация
  • навыки построения ML пайплайнов и автоматизации процессов
  • понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения
  • понимание основ MLOps и работы с контейнеризацией (Docker).

Будет плюсом:

  • опыт с фреймворками для работы с агентами и RAG
  • знание подходов к fine-tuning (LoRA, QLoRA, SFT)
  • опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W&B)
  • понимание принципов работы с кодовыми данными и техническими текстами
  • опыт развертывания и мониторинга ML-моделей в production.

Условия

### Что мы предлагаем:

  • самое крупное DS&AI сообщество — более 600 специалистов банка
  • дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
  • гибридный или офисный формат работы
  • современный офис у метро Кутузовская
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • специальные условия ипотеки под ставку до 7%
  • бесплатная подписка СберПрайм+ и скидки на товары партнёров
  • вознаграждение за рекомендации друзей.