Повышение отказоустойчивости
Отказоустойчивость — свойство технической системы сохранять свою работоспособность после отказа одной или нескольких её составных частей.
Задумываться от необходимости проработки отказоусточивости системы нужно тогда когда потери от простоя начинают превышать затраты на обеспечение бесперебойной работы. Повышение надежности системы не означает, что необходимо внедрить сразу все меры и обеспечить 100% работу сервиса. В ИТ есть такое понятие как показатель времени восстановления (RTO), который определяет количество времени с момента наступления разрушительного события до момента, когда затронутые ресурсы должны быть полностью работоспособны и готовы поддерживать цели организации.
Когда ресурс выходит из строя, может потребоваться несколько действий, например, замена поврежденных компонентов, перепрограммирование и тестирование, прежде чем ресурс будет снова введен в эксплуатацию и начнется обычный режим работы. Существует обратная зависимость между временем восстановления и затратами, необходимыми для поддержки восстановления. В частности, чем короче RTO по времени, тем больше затраты на восстановление, и наоборот. Поэтому очень важно найти золотую середину между значением RTO и затратами на достижение этой цели.
Что обеспечиваем мы
Миран обеспечивает бесперебойное электропитание и связь в серверном зале, в котором размещаются серверные шкафы с клиентским оборудованием.
Бесперебойное электропитание
В каждый серверный шкаф подводится два независимых луча электропитания, каждый луч электропитания обеспечен источниками бесперебойной работы, генераторными установками. Однако для проведения профилактических работ один из двух лучей электропитания может быть отключен на непродолжительное время, что бы обеспечить безопасную работу персонала при работы на электрических сетях.
Бесперебойная работа сети
Каждый размещенный сервер подключается коммутатору доступа, который в свою очередь подключен к двум разным коммутаторам агрегации резервирующим друг друга. Выше каждый элемент сети зарезервирован по схеме N+1 и более.
Как повысить отказоустойчивость оборудования
- Размещать оборудование с 2-мя блоками питания
- Не подключать все блоки питания к одной линии электропитания
- В случае размещения оборудования с одним блоком питания, установить свой или арендовать АВР
- Использовать резервирование подключения оборудования MC-LAG от двух коммутаторов доступа одновременно
- Размещать оборудование в разных серверных шкафах или дата-центрах
Что такое АВР
Эта аббревиатура расшифровывается как автомат ввода резерва. Используется устройство для переключения нагрузок между основными и резервными линиями питания. Дата-центры высоких уровней Tier уже используют в свой схеме электропитания АВР, как правило он используется для переключения между городскими вводами и резервными дизельными генераторами.
В случае размещения оборудования с одним блоком питания возникает риск его отключения при проведении профилактических работ на одном из лучей электропитания подведенных в серверный шкаф. В этом случае можно использовать АВР на шкаф целиком или установить небольшой АВР только не несколько единиц оборудования.
Миран предлагает клиентам взять в аренду АВР от компании Бонч АЙТИ.
Номинальный ток нагрузки - 8 A;
Подключаемая мощность до 1700 Вт;
Время переключения до 14 мс.
АВР подключается одновременно в разные лучи электропитания, в случае пропадания электропитания на основном луче, автоматика переключает питание на резервный луч. Это происходит примерно за одну десятую секунды, при этом оборудование не замечает переключения и продолжает работать без отключения.