TL;DR

Ведущий инженер L3 (System Engineering): Обеспечение доступности и стабильности облачной платформы и развернутых на ней приложений с акцентом на инфраструктурные инциденты, мониторинг и автоматизацию. Фокус на управлении инфраструктурой через код, планировании мощностей и проведении DR-тестирований.

Локация: Офисный или гибридный формат в Москве, доступ к коворкингам в других городах России.

Компания

Cloud.ru — облачный провайдер, предоставляющий инфраструктурные сервисы и решения для бизнеса.

Что делать

Обеспечивать доступность платформы и оперативно устранять инфраструктурные инциденты.
Автоматизировать деплой и обновление платформы с покрытием тестами и поддержкой отката изменений.
Настраивать качественный мониторинг и алертинг инфраструктуры и приложений.
Выполнять регламентные работы по предотвращению деградации сервисов и планировать масштабирование мощностей.
Проводить DR-тестирование и согласовывать архитектурные изменения продуктов.
Актуализировать эксплуатационную документацию и готовить технические требования для модернизации.

Требования

Глубокое знание сетевой модели OSI и стека TCP/IP.
Экспертный уровень администрирования Unix-подобных ОС.
Опыт написания скриптов для автоматизации на Bash и Python.
Опыт управления инфраструктурой с использованием Terraform и Ansible.
Понимание принципов работы виртуализации.

Культура и преимущества

Оформление по ТК РФ.
Достойный оклад и годовой бонус.
Расширенный ДМС со стоматологией.
Компенсация спорта, штатный терапевт и психолог.
Гибкий график: пятница — сокращенный день.
Эмпатичная культура с возможностью самостоятельного выстраивания рабочего процесса.

Ведущий инженер L3

Описание вакансии

TL;DR

Компания

Что делать

Требования

Культура и преимущества

Мэтч