TL;DR
ML-аналитик (LLM): Улучшение качества и развитие функциональности языковых моделей Алисы с акцентом на анализ данных, оценку моделей и построение пайплайнов обучения. Фокус на промпт-инжиниринге, разработке метрик качества ответов и автоматизации процессов оценки через LLM-as-a-Judge.
Локация: Работа в российских офисах Яндекса.
Компания
Крупнейшая российская технологическая компания, развивающая поисковые, облачные и AI-продукты, включая интеллектуального ассистента Алиса.
Что делать
- Анализировать ответы моделей, выявлять типичные ошибки и точки роста для улучшения качества агентов.
- Участвовать в приёмке новых версий моделей, проводить эксперименты и сравнивать их по ключевым метрикам.
- Формировать задания на разметку данных, контролировать качество и подготавливать обучающие датасеты.
- Разрабатывать и внедрять инструменты автоматической оценки качества ответов (LLM-as-a-Judge).
- Писать аналитические скрипты на Python для обработки данных и проверки гипотез.
Требования
- Уверенное владение Python и опыт работы с данными.
- Опыт работы с текстовыми данными или задачами NLP.
- Понимание статистических методов анализа экспериментов.
- Навыки подготовки и структурирования датасетов.
- Внимательность к деталям и способность работать с большими объёмами данных.
- Способность разбираться в сложных системах и находить причины ошибок.
Хорошо, если есть
- Опыт работы с LLM или генеративными моделями.
- Опыт управления процессами разметки данных.
- Опыт построения evaluation-пайплайнов для моделей.
Культура и преимущества
- Расширенная программа ДМС с первого месяца (включая стоматологию и помощь за рубежом).
- Гибкий график начала и окончания рабочего дня.
- Доступ к корпоративной платформе обучения, менторству и оплата профильных конференций.
- Спортивный клуб, собственные тренеры и команды по разным видам спорта.
- Льготные жилищные займы для сотрудников российских офисов.
