Мы исследовательское подразделение, которое отвечает в Сбере за «человека»: поведение, психология, тренды, изменения, особенности восприятия и мышления.

Наша ключевая задача: исследовать и рассказывать, что происходит и будет происходить с человеком, как эти изменения переложить в продукт, коммуникации, HR-процессы, чтобы они стали лучше.

Работа в Лаборатории – это возможность прикоснуться практически к любому бизнес-подразделению экосистемы Сбера, к большим данным Сбера, к клиентской базе более 100 млн человек.

Мы ищем ML Engineer — человека, который будет реализовывать ML-проекты Лаборатории: обучение и дообучение моделей, построение data-пайплайнов, вывод решений в production. В отличие от LLM-генералистов команды, которые быстро вайбкодят прототипы, вы будете отвечать за то, чтобы модели работали надёжно, воспроизводимо и масштабируемо, а также дорабатывать прототипы до продакшен решений. Вы рамках Лаборатории вы будете работать в команде “больших данных и гиперперсонализации” - это DS-команда, а также исследователи, психологи и социологи.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.

ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

### Чем предстоит заниматься:

  • ведение полного цикла проекта: от превращения исследовательских гипотез в работающие модели и надёжную инфраструктуру вокруг них.

Классический ML/NLP:

  • разработка и обучение моделей для анализа текстов, поведенческих данных, психометрических профилей.
  • кластеризация, классификация, NER, sentiment — всё, что требуется для исследований на данных.

LLM-интеграция:

  • fine-tuning и дообучение языковых моделей под задачи Лаборатории
  • построение embedding-пайплайнов
  • проектирование RAG-архитектур с графовыми и векторными БД
  • работа с промптами на уровне системной архитектуры, а не ad hoc экспериментов.

Production & MLOps:

  • вывод моделей из ноутбуков в production: контейнеризация, CI/CD, мониторинг, версионирование моделей и данных
  • построение воспроизводимых пайплайнов обработки данных.

Требования

### Наши ожидания от кандидата:

Опыт и готовность работать с технологическим стеком:

  • ML/DL: HuggingFace Transformers, SentenceTransformers, CatBoost, XGBoost
  • LLM & Vector Search: локальные модели (Llama 3, Qwen), API (OpenAI), FAISS
  • Data & Infra: ClickHouse, Docker, FastAPI, Postgres, RabbitMQ, MongoDB
  • MLOps & Orchestration: MLflow, W&B, Prefect, Dagster, Ray, Prometheus, OpenTelemetry
  • Инструменты: Hydra, Poetry.

ML & NLP:

  • практический опыт обучения и дообучения моделей (классический ML + deep learning)
  • уверенная работа с NLP: text classification, NER, embeddings, topic modeling, умение работать с ASR, Text-to-Speech задачами
  • опыт fine-tuning трансформерных моделей (HuggingFace Transformers, PEFT, LoRA, QLoRA)
  • понимание метрик качества моделей и умение проектировать эксперименты.

LLM & Retrieval-архитектуры:

  • опыт работы с LLM API (OpenAI, Anthropic и др.) на уровне production-решений
  • построение RAG-пайплайнов: chunking-стратегии, embedding-модели, векторные и графовые БД
  • понимание различий между векторным поиском и BM25
  • работа с LangChain / LangGraph или аналогами.

Engineering & MLOps:

  • уверенное владение python (как основной язык разработки)
  • опыт с Docker, CI/CD, базовые практики DevOps
  • опыт работы с ML-оркестраторами (MLflow, W&B, Prefect, Dagster — хотя бы один)
  • навыки разработки API (FastAPI / аналоги)
  • работа с SQL-базами (ClickHouse, Postgres) и очередями (RabbitMQ и т.п.).

Софты и майндсет:

  • техническое образование (ML, CS, математика, инженерия)
  • умение переводить абстрактные исследовательские гипотезы в формализованные ML-задачи
  • способность объяснять технические решения нетехнической аудитории (исследователям, бизнесу)
  • интерес к поведенческой науке, психологии, готовность погружаться в данную тематику.

Будет плюсом:

  • опыт работы с распределёнными вычислениями (Ray, DeepSpeed)
  • знакомство с Prometheus, OpenTelemetry, observability-стеком
  • опыт работы с графовыми базами данных (Neo4j и т.п.)
  • контроль стоимости и latency AI-вызовов
  • наличие публикаций, pet-проектов, вклада в open-source.

Условия

### Мы предлагаем:

  • комфортный современный офис г. Москва, рядом с метро Кутузовская
  • возможность выбрать удобный график – офис/гибрид
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.