Мы исследовательское подразделение, которое отвечает в Сбере за «человека»: поведение, психология, тренды, изменения, особенности восприятия и мышления.
Наша ключевая задача: исследовать и рассказывать, что происходит и будет происходить с человеком, как эти изменения переложить в продукт, коммуникации, HR-процессы, чтобы они стали лучше.
Работа в Лаборатории – это возможность прикоснуться практически к любому бизнес-подразделению экосистемы Сбера, к большим данным Сбера, к клиентской базе более 100 млн человек.
Мы ищем ML Engineer — человека, который будет реализовывать ML-проекты Лаборатории: обучение и дообучение моделей, построение data-пайплайнов, вывод решений в production. В отличие от LLM-генералистов команды, которые быстро вайбкодят прототипы, вы будете отвечать за то, чтобы модели работали надёжно, воспроизводимо и масштабируемо, а также дорабатывать прототипы до продакшен решений. Вы рамках Лаборатории вы будете работать в команде “больших данных и гиперперсонализации” - это DS-команда, а также исследователи, психологи и социологи.
Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.
ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!
Обязанности
### Чем предстоит заниматься:
- ведение полного цикла проекта: от превращения исследовательских гипотез в работающие модели и надёжную инфраструктуру вокруг них.
Классический ML/NLP:
- разработка и обучение моделей для анализа текстов, поведенческих данных, психометрических профилей.
- кластеризация, классификация, NER, sentiment — всё, что требуется для исследований на данных.
LLM-интеграция:
- fine-tuning и дообучение языковых моделей под задачи Лаборатории
- построение embedding-пайплайнов
- проектирование RAG-архитектур с графовыми и векторными БД
- работа с промптами на уровне системной архитектуры, а не ad hoc экспериментов.
Production & MLOps:
- вывод моделей из ноутбуков в production: контейнеризация, CI/CD, мониторинг, версионирование моделей и данных
- построение воспроизводимых пайплайнов обработки данных.
Требования
### Наши ожидания от кандидата:
Опыт и готовность работать с технологическим стеком:
- ML/DL: HuggingFace Transformers, SentenceTransformers, CatBoost, XGBoost
- LLM & Vector Search: локальные модели (Llama 3, Qwen), API (OpenAI), FAISS
- Data & Infra: ClickHouse, Docker, FastAPI, Postgres, RabbitMQ, MongoDB
- MLOps & Orchestration: MLflow, W&B, Prefect, Dagster, Ray, Prometheus, OpenTelemetry
- Инструменты: Hydra, Poetry.
ML & NLP:
- практический опыт обучения и дообучения моделей (классический ML + deep learning)
- уверенная работа с NLP: text classification, NER, embeddings, topic modeling, умение работать с ASR, Text-to-Speech задачами
- опыт fine-tuning трансформерных моделей (HuggingFace Transformers, PEFT, LoRA, QLoRA)
- понимание метрик качества моделей и умение проектировать эксперименты.
LLM & Retrieval-архитектуры:
- опыт работы с LLM API (OpenAI, Anthropic и др.) на уровне production-решений
- построение RAG-пайплайнов: chunking-стратегии, embedding-модели, векторные и графовые БД
- понимание различий между векторным поиском и BM25
- работа с LangChain / LangGraph или аналогами.
Engineering & MLOps:
- уверенное владение python (как основной язык разработки)
- опыт с Docker, CI/CD, базовые практики DevOps
- опыт работы с ML-оркестраторами (MLflow, W&B, Prefect, Dagster — хотя бы один)
- навыки разработки API (FastAPI / аналоги)
- работа с SQL-базами (ClickHouse, Postgres) и очередями (RabbitMQ и т.п.).
Софты и майндсет:
- техническое образование (ML, CS, математика, инженерия)
- умение переводить абстрактные исследовательские гипотезы в формализованные ML-задачи
- способность объяснять технические решения нетехнической аудитории (исследователям, бизнесу)
- интерес к поведенческой науке, психологии, готовность погружаться в данную тематику.
Будет плюсом:
- опыт работы с распределёнными вычислениями (Ray, DeepSpeed)
- знакомство с Prometheus, OpenTelemetry, observability-стеком
- опыт работы с графовыми базами данных (Neo4j и т.п.)
- контроль стоимости и latency AI-вызовов
- наличие публикаций, pet-проектов, вклада в open-source.
Условия
### Мы предлагаем:
- комфортный современный офис г. Москва, рядом с метро Кутузовская
- возможность выбрать удобный график – офис/гибрид
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

