**ASC AI Fabrique** — это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме **Agentic Swarm Coding**. Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.
Обязанности
- Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
- Организация MLOps-процессов и системная оценка качества моделей
- Обеспечение production latency <2s и uptime >95% для инфраструктуры inference
- Профилирование и оптимизация использования VRAM (CUDA OOM prevention)
- Мониторинг GPU-производительности.
Требования
- Python (asyncio, multiprocessing, typing) Advanced уровня
- Bash/Shell scripting Advanced уровня для автоматизации развертывания
- Практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
- Опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
- Знание оптимизаций Flash Attention и Paged Attention
- Навыки работы с PyTorch, JAX, ONNX для универсального развертывания
- Опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)
**Будет плюсом:**
- Опыт развертывания моделей на multi-GPU
- Практика профилирования VRAM usage в production-средах
- Опыт работы с моделями 480B+ параметров на кластерах GPU
- Знание специфических GPU scheduling инструментов (Volcano, Kueue).
Условия
- стабильный оклад и социальная поддержка сотрудников
- расширенный ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- корпоративная пенсионная программа
- корпоративное обучение за счет компании
- реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 40 тыс. рублей
- официальное оформление с первого дня
- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
- работу по Agile с лучшими из IT индустрии: 2000 продуктовых команд и возможность внутреннего перемещения.

