В команду сервиса “Новостной мониторинг” требуются Middle ML Engineer.

Мы занимаемся разработкой NLP моделей для анализа новостного потока, ключевые задачи: NER, entity linking, классификация. У нас открывается новое направление по OCR. Необходимо будет автоматизировать входящий поток документов в разных форматах.

Обязанности

### Задачи:

  • Есть end-to-end real-time пайплайн обработки новостей - от парсинга до поставки пользователям. Внутри происходит много чего интересного, но не всегда оптимально. Ожидается, что грамотный MLE поможет нам с этим.
  • Есть задачи по организации хранения данных (сейчас сделано медленное хранилище в PostgreSQL, быстрое - ElasticSearch), по микросервисной архитектуре (есть много докер-контейнеров, можно попробовать все в кубер затащить) и по деплою моделей (хочется организовать автоматическую выкатку в torchserve через gitlab-ci + ansible)

Требования

### Требования:

  • Уверенный Python, SOLID, умение разбираться в чужом коде
  • БД: PostgreSQL, знание ElasticSearch будет плюсом
  • ML/DL - sklearn/Pytorch, знание transformers будет плюсом
  • Gitlab CI, Docker, ansible
  • Желательно иметь опыт заворачивания торчевых моделей в onnx/tensorrt

Условия

### Условия:

  • ML Space для обучения моделей
  • Крупнейшее DS&AI community - более 600 DS банка, включая:
  • Регулярный обмен знаниями, опытом и лучшими практиками
  • Возможность переиспользования кода и библиотек из централизованного репозитория
  • Интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний
  • Дайджест о самых последних разработках в области DS&AI
  • Регулярные внутренние митапы