Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ.

Мы - команда MLOps в отделе Рекомендаций. Именно с помощью Рекомендаций совершается более трети всех покупок. Над алгоритмами и продуктами рекомендаций трудится большое количество DS/ML специалистов, которым необходимо предоставить все условия, чтобы их процесс разработки от идеи до выкатки в prod был удобным, понятным, быстрым и безопасным.

Для организации этого процесса мы разрабатываем и внедряем различные инструменты, а также выстраиваем ML инфраструктуру - как для ресерча, так и для продовых запусков.

Обязанности

  • Развивать существующие MLOps инструменты, утилиты и библиотеки, повышать их надежность, внедрять новые "фичи";
  • Дорабатывать существующие Open-source инструменты под нужды команды, патчить и контрибьютить;
  • Внедрять MLOps инструменты для автоматизации процессов жизненного цикла ML-моделей;
  • Оптимизировать инфраструктуру для Highload ML сервисов, заниматься оптимизацией инференса ML моделей;
  • Обеспечивать быстрое масштабирование и высокую доступность ML инфраструктуры;
  • Помогать DS'ам в создании пайплайнов и сервисов в production среде (помощь в продуктивизации), оптимизировать их производительность;
  • Развивать системы мониторинга и логирования ML решений;
  • Помогать проектировать и планировать ресурсы, инфраструктуру и архитектуру решений;
  • Участвовать в разработке стратегии развития MLOps направления;
  • Менторить младших специалистов;
  • Повышать качество внешней и внутренней документации по нашим продуктам.

Требования

  • Экспертное владение Python;
  • Опыт деплоя в production с помощью Kubernetes, глубокое понимание его работы, опыт работы с Helm-чартами;
  • Опыт построения сложных CI/CD пайплайнов (Gitlab CI/CD) и продвинутый опыт использования VCS (Git);
  • Опыт инференса ML/LLM моделей в production под высокой нагрузкой (Triton Nvidia Inference Server, vLLM);
  • Знания и опыт в оптимизации ML моделей для инференса;
  • Практический опыт внедрения с дальнейшей эксплуатацией MLOps инструментов для пользователей - Airflow, Dagster, Argo Workflows, Prefect, Flyte, MLFlow, JupyterHub, DVC, LakeFS, Seldon Core, KubeFlow и др;
  • Понимание современных алгоритмов машинного обучения и жизненного цикла ML модели;
  • Опыт написания пайплайнов / оптимизации запросов на Spark под экосистемой Hadoop;
  • Понимание современных архитектур распределенных систем / опыт реализации и использования для обучения/инференса;
  • Знание библиотек для веб-разработки: asyncio, FastAPI, Celery (SAQ);
  • Знакомство с компонентами мониторинга и логирования (Thanos, Grafana, OpenSearch).

Условия

  • Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
  • Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
  • Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
  • Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
  • Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
  • Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.