TL;DR
Ведущий инженер L3 (System Engineering): Обеспечение доступности и стабильности облачной платформы и развернутых на ней приложений с акцентом на инфраструктурные инциденты, мониторинг и автоматизацию. Фокус на управлении инфраструктурой через код, планировании мощностей и проведении DR-тестирований.
Локация: Офисный или гибридный формат в Москве, доступ к коворкингам в других городах России.
Компания
Cloud.ru — облачный провайдер, предоставляющий инфраструктурные сервисы и решения для бизнеса.
Что делать
- Обеспечивать доступность платформы и оперативно устранять инфраструктурные инциденты.
- Автоматизировать деплой и обновление платформы с покрытием тестами и поддержкой отката изменений.
- Настраивать качественный мониторинг и алертинг инфраструктуры и приложений.
- Выполнять регламентные работы по предотвращению деградации сервисов и планировать масштабирование мощностей.
- Проводить DR-тестирование и согласовывать архитектурные изменения продуктов.
- Актуализировать эксплуатационную документацию и готовить технические требования для модернизации.
Требования
- Глубокое знание сетевой модели OSI и стека TCP/IP.
- Экспертный уровень администрирования Unix-подобных ОС.
- Опыт написания скриптов для автоматизации на Bash и Python.
- Опыт управления инфраструктурой с использованием Terraform и Ansible.
- Понимание принципов работы виртуализации.
Культура и преимущества
- Оформление по ТК РФ.
- Достойный оклад и годовой бонус.
- Расширенный ДМС со стоматологией.
- Компенсация спорта, штатный терапевт и психолог.
- Гибкий график: пятница — сокращенный день.
- Эмпатичная культура с возможностью самостоятельного выстраивания рабочего процесса.
