В команду сервиса “Новостной мониторинг” требуются Middle ML Engineer.
Мы занимаемся разработкой NLP моделей для анализа новостного потока, ключевые задачи: NER, entity linking, классификация. У нас открывается новое направление по OCR. Необходимо будет автоматизировать входящий поток документов в разных форматах.
Обязанности
### Задачи:
- Есть end-to-end real-time пайплайн обработки новостей - от парсинга до поставки пользователям. Внутри происходит много чего интересного, но не всегда оптимально. Ожидается, что грамотный MLE поможет нам с этим.
- Есть задачи по организации хранения данных (сейчас сделано медленное хранилище в PostgreSQL, быстрое - ElasticSearch), по микросервисной архитектуре (есть много докер-контейнеров, можно попробовать все в кубер затащить) и по деплою моделей (хочется организовать автоматическую выкатку в torchserve через gitlab-ci + ansible)
Требования
### Требования:
- Уверенный Python, SOLID, умение разбираться в чужом коде
- БД: PostgreSQL, знание ElasticSearch будет плюсом
- ML/DL - sklearn/Pytorch, знание transformers будет плюсом
- Gitlab CI, Docker, ansible
- Желательно иметь опыт заворачивания торчевых моделей в onnx/tensorrt
Условия
### Условия:
- ML Space для обучения моделей
- Крупнейшее DS&AI community - более 600 DS банка, включая:
- Регулярный обмен знаниями, опытом и лучшими практиками
- Возможность переиспользования кода и библиотек из централизованного репозитория
- Интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний
- Дайджест о самых последних разработках в области DS&AI
- Регулярные внутренние митапы

