TL;DR

Ведущий инженер L3 (System Engineering): Обеспечение доступности и стабильности облачной платформы и развернутых на ней приложений с акцентом на инфраструктурные инциденты, мониторинг и автоматизацию. Фокус на управлении инфраструктурой через код, планировании мощностей и проведении DR-тестирований.

Локация: Офисный или гибридный формат в Москве, доступ к коворкингам в других городах России.

Компания

Cloud.ru — облачный провайдер, предоставляющий инфраструктурные сервисы и решения для бизнеса.

Что делать

  • Обеспечивать доступность платформы и оперативно устранять инфраструктурные инциденты.
  • Автоматизировать деплой и обновление платформы с покрытием тестами и поддержкой отката изменений.
  • Настраивать качественный мониторинг и алертинг инфраструктуры и приложений.
  • Выполнять регламентные работы по предотвращению деградации сервисов и планировать масштабирование мощностей.
  • Проводить DR-тестирование и согласовывать архитектурные изменения продуктов.
  • Актуализировать эксплуатационную документацию и готовить технические требования для модернизации.

Требования

  • Глубокое знание сетевой модели OSI и стека TCP/IP.
  • Экспертный уровень администрирования Unix-подобных ОС.
  • Опыт написания скриптов для автоматизации на Bash и Python.
  • Опыт управления инфраструктурой с использованием Terraform и Ansible.
  • Понимание принципов работы виртуализации.

Культура и преимущества

  • Оформление по ТК РФ.
  • Достойный оклад и годовой бонус.
  • Расширенный ДМС со стоматологией.
  • Компенсация спорта, штатный терапевт и психолог.
  • Гибкий график: пятница — сокращенный день.
  • Эмпатичная культура с возможностью самостоятельного выстраивания рабочего процесса.