_Мы разрабатываем LegalTech-продукты на основе передовых NLP-моделей. Наши решения ежедневно анализируют сотни типов юридических документов, извлекают из них знания и помогают людям принимать с их помощью ответственные решения. Это позволяет оптимизировать работу банка по правовым рискам кредитных сделок с минимальным участием человека._

Обязанности

— Решение сложных задач по созданию разнообразных AI-сервисов в юридической сфере с использованием LLM GigaChat;

— Исследование и подбор передовых решений, быстрая оценка их эффективности, оценка необходимых ресурсов (данные, вычисления), проверка гипотез, разработка плана разработки;

— Формирование требований к разметке: вопросов-ответов и чатов для задачи дообучения LLM на специализированном юридическом домене, взаимодействие с юристами и специалистами по разметке;

— Повышение качества генерации LLM за счет использования продвинутых техник промтинга (CoT, ToT, ReAct, Planning, etc);

— Создание собственных AI-агентов, решающих юридические задачи шаг за шагом;

— Участие в создании специализированного юридического бенчмарка для оценки способностей LLM;

— Желание разобраться в нюансах нашей доменной области.

Требования

— Опыт разработки NLP-моделей от 3-х лет;

— Знание передовых подходов, умение объяснить их команде;

— Отличное знание основ Data Science — от линейной алгебры и теории вероятностей до DNN и RLHF;

— Понимание архитектуры и принципов устройства и обучения больших лингвистических моделей (LLM) и генеративных трансформеров типа GPT/Bert;

— Понимание принципов обучения и применения моделей обучения с подкреплением (Reinforced Learning);

— Понимание основных методов Machine Learning (regressions, clustering, decision trees, и т.д.), уверенное знание когда их применять, а когда не надо;

— Оценка вычислительной сложности всего Pipeline, применение классических алгоритмов для её снижения;

— Готовность браться за нестандартные, сложные задачи;

— Быстро проверять гипотезы на небольших мощностях и масштабировать успешные решения;

— Умение оценивать прогресс решения на цифрах;

— Готовность работать в команде и применять Git, Jira, Confluence и другие средства командной работы;

— Высокая степень самоорганизации.

Условия

— Страшно интересные NLP задачи в самой сложной области предметных знаний (GPT + Legal domain);

— Возможность обучения и развития, участия в конференциях от Сбера;

— Уютный офис с печеньем и другими удобствами;

— Социальный пакет (ДМС, фитнес, льготное страхование).