_Мы разрабатываем LegalTech-продукты на основе передовых NLP-моделей. Наши решения ежедневно анализируют сотни типов юридических документов, извлекают из них знания и помогают людям принимать с их помощью ответственные решения. Это позволяет оптимизировать работу банка по правовым рискам кредитных сделок с минимальным участием человека._
Обязанности
— Решение сложных задач по созданию разнообразных AI-сервисов в юридической сфере с использованием LLM GigaChat;
— Исследование и подбор передовых решений, быстрая оценка их эффективности, оценка необходимых ресурсов (данные, вычисления), проверка гипотез, разработка плана разработки;
— Формирование требований к разметке: вопросов-ответов и чатов для задачи дообучения LLM на специализированном юридическом домене, взаимодействие с юристами и специалистами по разметке;
— Повышение качества генерации LLM за счет использования продвинутых техник промтинга (CoT, ToT, ReAct, Planning, etc);
— Создание собственных AI-агентов, решающих юридические задачи шаг за шагом;
— Участие в создании специализированного юридического бенчмарка для оценки способностей LLM;
— Желание разобраться в нюансах нашей доменной области.
Требования
— Опыт разработки NLP-моделей от 3-х лет;
— Знание передовых подходов, умение объяснить их команде;
— Отличное знание основ Data Science — от линейной алгебры и теории вероятностей до DNN и RLHF;
— Понимание архитектуры и принципов устройства и обучения больших лингвистических моделей (LLM) и генеративных трансформеров типа GPT/Bert;
— Понимание принципов обучения и применения моделей обучения с подкреплением (Reinforced Learning);
— Понимание основных методов Machine Learning (regressions, clustering, decision trees, и т.д.), уверенное знание когда их применять, а когда не надо;
— Оценка вычислительной сложности всего Pipeline, применение классических алгоритмов для её снижения;
— Готовность браться за нестандартные, сложные задачи;
— Быстро проверять гипотезы на небольших мощностях и масштабировать успешные решения;
— Умение оценивать прогресс решения на цифрах;
— Готовность работать в команде и применять Git, Jira, Confluence и другие средства командной работы;
— Высокая степень самоорганизации.
Условия
— Страшно интересные NLP задачи в самой сложной области предметных знаний (GPT + Legal domain);
— Возможность обучения и развития, участия в конференциях от Сбера;
— Уютный офис с печеньем и другими удобствами;
— Социальный пакет (ДМС, фитнес, льготное страхование).

