TL;DR
ML инженер (AI): Разработка и подготовка данных для обучения линейки моделей LLM GigaChat с акцентом на сбор данных для базовых моделей и их адаптацию под специфические бизнес-сценарии. Фокус на работе с современными проприетарными и open-source LLM, оптимизации процессов обработки данных и масштабировании решений для внутренних и внешних задач.
Локация: Москва, гибридный формат работы (2 дня в офисе, 3 дня удалённо).
Компания
Команда GigaChat Data в Сбере, занимающаяся созданием интеллектуальных ассистентов и интеграцией LLM в бизнес-процессы.
Что делать
- Подготовка данных для обучения моделей GigaChat, GigaChat Vision, GigaChat Audio и Giga Embeddings.
- Сбор и адаптация данных для базовых моделей и специфических прикладных задач.
- Интеграция LLM в бизнес-процессы компании и решения для внешних заказчиков.
- Автоматизация обработки документов и анализ финансовых данных с помощью ML.
Требования
- Глубокие знания Python.
- Опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Gemini, GPT и др.).
- Понимание процессов подготовки и обработки данных для больших языковых моделей.
- Навыки решения сложных проблем в условиях многозадачности.
Хорошо, если есть
- Опыт работы с LLM-агентами и инструментами (LangChain, LangSmith, LangGraph).
- Опыт работы с векторными БД и RAG (FAISS, ChromaDB).
Культура и преимущества
- Гибридный формат работы и современный офис в Москве.
- Ежегодный пересмотр зарплаты и годовая премия.
- Расширенный полис ДМС с первого дня работы (включая страхование семьи).
- Доступ к корпоративному спортзалу, зонам отдыха и льготной программе ипотеки.
- Система обучения и профессионального развития.
