Мы исследовательское подразделение, которое отвечает в Сбере за «человека»: поведение, психология, тренды, изменения, особенности восприятия и мышления.

Наша ключевая задача: исследовать и рассказывать, что происходит и будет происходить с человеком, как эти изменения переложить в продукт, коммуникации, HR-процессы, чтобы они стали лучше.

Работа в Лаборатории – это возможность прикоснуться практически к любому бизнес-подразделению экосистемы Сбера, к большим данным Сбера, к клиентской базе более 100 млн человек.

Мы ищем ML Engineer — человека, который будет реализовывать ML-проекты Лаборатории: обучение и дообучение моделей, построение data-пайплайнов, вывод решений в production. В отличие от LLM-генералистов команды, которые быстро вайбкодят прототипы, вы будете отвечать за то, чтобы модели работали надёжно, воспроизводимо и масштабируемо, а также дорабатывать прототипы до продакшен решений. Вы рамках Лаборатории вы будете работать в команде “больших данных и гиперперсонализации” - это DS-команда, а также исследователи, психологи и социологи.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.

ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

### Чем предстоит заниматься:

ведение полного цикла проекта: от превращения исследовательских гипотез в работающие модели и надёжную инфраструктуру вокруг них.

Классический ML/NLP:

разработка и обучение моделей для анализа текстов, поведенческих данных, психометрических профилей.
кластеризация, классификация, NER, sentiment — всё, что требуется для исследований на данных.

LLM-интеграция:

fine-tuning и дообучение языковых моделей под задачи Лаборатории
построение embedding-пайплайнов
проектирование RAG-архитектур с графовыми и векторными БД
работа с промптами на уровне системной архитектуры, а не ad hoc экспериментов.

Production & MLOps:

вывод моделей из ноутбуков в production: контейнеризация, CI/CD, мониторинг, версионирование моделей и данных
построение воспроизводимых пайплайнов обработки данных.

Требования

### Наши ожидания от кандидата:

Опыт и готовность работать с технологическим стеком:

ML/DL: HuggingFace Transformers, SentenceTransformers, CatBoost, XGBoost
LLM & Vector Search: локальные модели (Llama 3, Qwen), API (OpenAI), FAISS
Data & Infra: ClickHouse, Docker, FastAPI, Postgres, RabbitMQ, MongoDB
MLOps & Orchestration: MLflow, W&B, Prefect, Dagster, Ray, Prometheus, OpenTelemetry
Инструменты: Hydra, Poetry.

ML & NLP:

практический опыт обучения и дообучения моделей (классический ML + deep learning)
уверенная работа с NLP: text classification, NER, embeddings, topic modeling, умение работать с ASR, Text-to-Speech задачами
опыт fine-tuning трансформерных моделей (HuggingFace Transformers, PEFT, LoRA, QLoRA)
понимание метрик качества моделей и умение проектировать эксперименты.

LLM & Retrieval-архитектуры:

опыт работы с LLM API (OpenAI, Anthropic и др.) на уровне production-решений
построение RAG-пайплайнов: chunking-стратегии, embedding-модели, векторные и графовые БД
понимание различий между векторным поиском и BM25
работа с LangChain / LangGraph или аналогами.

Engineering & MLOps:

уверенное владение python (как основной язык разработки)
опыт с Docker, CI/CD, базовые практики DevOps
опыт работы с ML-оркестраторами (MLflow, W&B, Prefect, Dagster — хотя бы один)
навыки разработки API (FastAPI / аналоги)
работа с SQL-базами (ClickHouse, Postgres) и очередями (RabbitMQ и т.п.).

Софты и майндсет:

техническое образование (ML, CS, математика, инженерия)
умение переводить абстрактные исследовательские гипотезы в формализованные ML-задачи
способность объяснять технические решения нетехнической аудитории (исследователям, бизнесу)
интерес к поведенческой науке, психологии, готовность погружаться в данную тематику.

Будет плюсом:

опыт работы с распределёнными вычислениями (Ray, DeepSpeed)
знакомство с Prometheus, OpenTelemetry, observability-стеком
опыт работы с графовыми базами данных (Neo4j и т.п.)
контроль стоимости и latency AI-вызовов
наличие публикаций, pet-проектов, вклада в open-source.

Условия

### Мы предлагаем:

комфортный современный офис г. Москва, рядом с метро Кутузовская
возможность выбрать удобный график – офис/гибрид
ежегодный пересмотр зарплаты и годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
ДМС, льготное страхование для семьи и корпоративная пенсионная программа
гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

ML Engineer (Лаборатория нейронаук и поведения человека)

Описание вакансии

Обязанности

Требования

Условия

Мэтч