TL;DR

ML инженер (AI): Разработка и подготовка данных для обучения линейки моделей LLM GigaChat с акцентом на сбор данных для базовых моделей и их адаптацию под специфические бизнес-сценарии. Фокус на работе с современными проприетарными и open-source LLM, оптимизации процессов обработки данных и масштабировании решений для внутренних и внешних задач.

Локация: Москва, гибридный формат работы (2 дня в офисе, 3 дня удалённо).

Компания

Команда GigaChat Data в Сбере, занимающаяся созданием интеллектуальных ассистентов и интеграцией LLM в бизнес-процессы.

Что делать

  • Подготовка данных для обучения моделей GigaChat, GigaChat Vision, GigaChat Audio и Giga Embeddings.
  • Сбор и адаптация данных для базовых моделей и специфических прикладных задач.
  • Интеграция LLM в бизнес-процессы компании и решения для внешних заказчиков.
  • Автоматизация обработки документов и анализ финансовых данных с помощью ML.

Требования

  • Глубокие знания Python.
  • Опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Gemini, GPT и др.).
  • Понимание процессов подготовки и обработки данных для больших языковых моделей.
  • Навыки решения сложных проблем в условиях многозадачности.

Хорошо, если есть

  • Опыт работы с LLM-агентами и инструментами (LangChain, LangSmith, LangGraph).
  • Опыт работы с векторными БД и RAG (FAISS, ChromaDB).

Культура и преимущества

  • Гибридный формат работы и современный офис в Москве.
  • Ежегодный пересмотр зарплаты и годовая премия.
  • Расширенный полис ДМС с первого дня работы (включая страхование семьи).
  • Доступ к корпоративному спортзалу, зонам отдыха и льготной программе ипотеки.
  • Система обучения и профессионального развития.