Повышение отказоустойчивости и доступности при снижении стоимости обслуживания

Цели

Заказчик обратился с проблемой низкой доступности сервисов. Для выявления причин был произведён аудит ИТ инфраструктуры в ходе которого выявились следующие проблемы:

Отсутствовала система мониторинга состояния серверной и клиентской инфраструктуры, инциденты решались реактивно, зачастую данные утрачивались безвозвратно. 

Сетевые ресурсы(папки) располагались на нескольких серверах, клиентских компьютерах и даже на сетевом оборудовании. Управление информацией и доступом к ней было невозможно, что в купе с отсутствием резервного копирования могло привести к катастрофическим последствиям.

Высокая степень «гетерогенности» оборудования и программного обеспечения не позволяла стандартизировать инструменты мониторинга, резервного копирования и поддержки систем.

Доступ в локальную сеть и интернет организован исключительно через центральный офис. В случае возникновения проблем с интернет каналом, простой возникал на всех площадках.

Значительная избыточность сетевых устройств и маршрутов замедляла скорость работы сервисов и увеличивала время решения проблем в несколько раз.

Выше перечислены только наиболее значимые проблемы\риски.

Результат

Реализация проекта позволила заказчику сократить:

  • количество используемого серверного и сетевого оборудования, как следствие и затраты на обслуживание на 60%,
  • повысить отказоустойчивость\доступность инфраструктуры и сервисов, снизить зависимость от наличия системного администратора на площадках на 90%
  • Время решения значительных инцидентов сократилось на 94%, что позволяет бизнесу гарантировать результат перед клиентами, а не зависеть от случая.

Детали

Все сервисы перенесены на 4 физических сервера (из 10) по средствам виртуализации Hyper-V и оптимизацией серверных ролей на основании рекомендаций от Microsoft.

Организована прозрачная, управляемая и отказоустойчивая сетевая связанность всех филиалов и инфраструктуры на базе не дорогого, но качественного оборудования Mikrotik. Все филиалы имеют независимый выход в интернет.

Сетевые ресурсы перенесены на выделенный сервер, организована доменная структура (каждый филиал в своём домене и между ними настроено делегирование для прозрачной авторизации пользователей из разных филиалов)

Настроена система мониторинга серверной, сетевой и клиентской инфраструктуры. Уже на 1-й день после сбора данных, исправлены 15 критических ошибок деградирующих жестких дисков, которые неизбежно привели бы к потере жизненно важных данных.

На базе программно-аппаратного комплекса, включающего в себя, программное обеспечение Veeam Backup&Replication и сетевые хранилища QNAP, организована система диверсифицированного резервного копирования данных виртуальных машин, настроек сетевого оборудования и сетевых папок для возможности быстрого восстановления как после аварии, так и при «случайном» удалении данных пользователями.

Все заявки\события регистрируются в специальной ITSM системе для структурированного хранения и возможности вести аналитику узких мест системы, в том числе с точки зрения финансовых затрат.