Публикации   Каталог оборудования   Анализ климата регионов   О проекте AboutDC.ru

Tier: уровни надежности ЦОД и что из этого следует

Опубликовано: 30.07.2012. AboutDC.ru

Основным требованием, предъявляемым к Центрам Обработки Данных (ЦОД) является отказоустойчивость. Именно отказоустойчивость ЦОД и определяет уровень надежности ЦОД. При этом подразумевается отключение ЦОД как на время планово-предупредительных работ и профилактики оборудования, так и внеплановых аварийных ситуаций.

Цель введения уровней надежности ЦОД

Главная цель введения классификации по уровням надежности - избежать расплывчатых формулировок как при формировании технического задания к строящимся дата-центрам, так и при описании характеристик уже функционирующих ЦОД.

Очевидно, что понятие отказоустойчивости ЦОД определяет и отказоустойчивость каждой из систем ЦОД. Это означает, что тот или иной уровень надежности накладывает определенные требования сразу на всю инфраструктуру дата-центра. Фактически, из этого следует, что выбраный уровень надежности целиком определяет концепцию ЦОД.

Авторы уровней надежности ЦОД

Существующие на сегодняшний день четыре уровня надежности ЦОД, названные Tier 1, Tier 2, Tier 3 и Tier 4 введены организацией Uptime Institute (Институт Бесперебойных Процессов, США). Uptime Institute основан в 1993 году с целью повышения надежности и доступности ЦОД. Институт разработал множество нововведений, которые к настоящему моменту стали стандартными решениями, применяемыми при построении ЦОД. В частности, классификация Tier вошла в повсеместно использующийся американский стандарт TIA/EIA-942.

Для кого введены уровни надежности ЦОД

Любая классификация должна быть ориентирована на определенный круг лиц. Классификация Tier описывает надежность функционирования ЦОД и является необходимой для компаний, как желающих построить свой ЦОД, так и для арендующих чужие вычислительные мощности. В зависимости от критичности бизнеса компании, в зависимости от потерь, которые компания понесет в случае остановки её бизнес-процессов избирается тот или иной Tier.

В свою очередь, высокий уровень надежности требует высоких как капитальных, так и эксплуатационных затрат, поэтому и стоимость вычислительных мощностей также резко зависит от уровня надежности ЦОД.

Основной показатель, определяющий Tier

На первый взгляд может показаться, что основным показателем, определяющим уровень надежности является время простоя ЦОД за год и вытекающий из него коэффициент отказоустойчивости, равный отношению времени простоя за год к длительности года. Однако, следует отметить, что есть ещё более принципиальное разделение четырех уровней надежности на две категории. Критерием является возможность проведения профилактических работ без полной остановки ЦОД:

  • При Tier I и II для выполнения планово-предупредительных работ необходимо остановить ЦОД,
  • При Tier III и IV любая плановая деятельность осуществляется без нарушения нормального хода работы ЦОД.

Но вернемся к отказоустойчивости. По данному показателю выделено 4 уровня надежности:

  • Tier I: время простоя 28,8 часов в год, коэффициент отказоустойчивости 99,671%;
  • Tier II: 22,0 часа в год, 99,749%;
  • Tier III: 1,6 часа в год, 99,982%;
  • Tier IV: 0,4 часа в год, 99,995%.

Требования, предъявляемые к каждому из уровней надежности ЦОД

Все четыре уровня Tier получили дорогу в жизнь через стандарт TIA/EIA-942. Именно в нем и указаны требования к каждому Tier.

Tier I. Базовый уровень.

ЦОД базового уровня подвержен нарушениям работы как от плановых, так и от внеплановых действий. Применение фальшпола, ИБП, ДГУ не обязательно. Если же ИБП и ДГУ используются, то выбираются более простые модели, без резерва, с множеством точек отказа. Возможны самопроизвольные отказы оборудования. Ошибки в действиях обслуживающего персонала также приведут к простою ЦОД.

В ЦОД Tier I отсутствует защита от случайных и намеренных событий, обусловленных действиями человека. Несущая способность перекрытий не менее 735кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.

Tier II. С резервированными компонентами.

В ЦОД Tier II время простоя возможно в связи с плановыми и внеплановыми работами, а также аварийными ситуациями, но оно сокращено благодаря введению одной резервной единицы оборудования в каждой системе. Таким образом, системы кондиционирования, ИБП и ДГУ имеют одну резервную единицу. Тем не менее, профилактические работы требуют отключения ЦОД.

Tier II требует наличия минимальных защитных мер от влияния человека. Стены и потолки снабжаются пароизоляцией, в двери устанавливается глазок с углом обзора 180°, все стены строятся на всю высоту помещения - от грязного пола до грязного потолка. Несущая способность перекрытий не менее 857кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.

Tier III. С возможностью параллельного проведения ремонтных работ.

Третий уровень надежности требует осуществления любой плановой деятельности без остановки ЦОД. Под плановыми работами подразумевается профилактическое и программируемое техническое обслуживание, ремонт и замена компонентов, добавление или удаление компонентов, их тестирование. Очевидно, что в этом случае необходимо иметь резервирование, позволяющее всю нагрузку пустить по другому пути во время работ на первом.

Итак, для реализации Tier III необходима схема резервирования блоков систем кондиционирования, ИБП, ДГУ N+1, также требуется наличие двух комплектов трубопроводов для системы кондиционирования, построенной на основе чиллера. Строительные требования обязывают сохранять работоспособность ЦОД при большинстве случаев намеренных и случайных вмешательств человека. Следует предусмотреть резервные входы, дублирующие подъездные пути, контроль доступа, отсутствие окон, защиту от электромагнитного излучения, несущую способность перекрытий не менее 1225кг/м² при нагрузке сверху плюс 245кг/м² нагрузки снизу.

Tier IV. Отказоустойчивый.

Отказоустойчивый ЦОД характеризуется безостановочной работой при проведении плановых мероприятий и способен выдержать один серьезный отказ без последствий для критически важной нагрузки. Необходим дублированный подвод питания, резервирования системы кондиционирования и ИБП по схеме 2(N+1). Для ДГУ необходима отдельная площадка с зоной хранения топлива.

Tier IV требует защиту от всех потенциальных проблем в связи с человеческим фактором. Регламентированы даже избыточные средства защиты от намеренных или случайных действий человека. Также учтено влияние непреодолимой силы - сейсмоявления, потопы, пожары, ураганы, штормы, терроризм. Несущая способность перекрытий не менее 857кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.

Обобщенная таблица характеристик Tier

Параметр Tier I Tier II Tier III Tier VI
Год внедрения 1965 1970 1985 1995
Отказоустойчивость
Время простоя за год, ч 28.8 22 1.6 0.4
Доступность ЦОД 99.671% 99.749% 99.982 99.995
Уровень загрузки оборудования 100% 100% 90% 90%
Обслуживание без отключения Нет Нет Да Да
Планируемые остановки ЦОД 2х12ч в год 3х12ч за 2 года Нет Нет
Аварийность 6 аварий
за 5 лет
1 авария
ежегодно
1 авария
за 2.5 года
1 авария
за 5 лет
Отказоустойчивость как одиночное событие Нет Нет Нет Да
Строительные требования
Тип здания С соседями С соседями Отдельно стоящее Отдельно стоящее
Огнестойкость стен Нет Нет 1 час 2 часа
Несущая способность перекрытия 735кг/м² сверху
125кг/м² снизу
857кг/м² сверху
125кг/м² снизу
1225кг/м² сверху
245кг/м² снизу
1225кг/м² сверху
245кг/м² снизу
Высота фальшпола Нет или
до 305мм (12")
457мм
(18")
762-914мм
(30-36")
762-1067мм
(30-42")
Резервирование
ИБП N N+1 N+1 2(N+1)
ДГУ N N N+1 2(N+1)
Кондиционирование N N+1 N+1 2(N+1)
Трубопроводы теплоносителя и конденсата N N 2N 2N
Точки подключения
Количество энерговводов 1 1 1 раб, 1рез 2 рабочих
Точки слива дренажа 1 1 2 2 рабочих
Точки водозабора для увлажнения 1 2 2 2
Наличие особых систем
Мониторинг Нет Нет Да (выборочно) Да (всех систем)
Увлажнение Да Да Да Да
Пожарные извещатели Нет Да Да Да
Течеискатели Нет Да Да Да
Контроль доступа Нет Нет Да Да
Общие характеричтики
Срок ввода в эксплуатацию 3 мес. 3-6 мес. 15-20 мес. 15-30 мес.
Ориентировочная стоимость 5000 $/м²
10 000 $/кВт
6500 $/м²
11 000 $/кВт
9700 $/м²
20 000 $/кВт
12 000 $/м²
22 000 $/кВт

Некоторые выводы и следствия

Во-первых, в характеристиках Tier II и Tier III бросается в глаза резкая разница в длительности допустимого простоя за год (22 и 1.6 часа соответственно). И это при внешне одинаковой схеме резервирования N+1. Однако следует помнить то, что второй и третий уровни надежности принадлежат к двум принципиально разным категориям, связанным с проведением плановых работ. Если Tier II подразумывает, что при плановых работах допустимо обесточить весь ЦОД, то уровень Tier III исключает эту возможность.

Во-вторых, на основе вышеуказанного различия Tier II и Tier III можно сделать один важный вывод. Если длительность простоя с учетом плановых работ составляет 22 часа в год, а без учета - 1.6 часа в год, то простой в связи именно с плановыми работами должен составить 20.4 часа в год. Таким образом, любой производитель, выпускающий технику для ЦОД, должен ориентироваться именно на такой годовой простой. Учитывая, что производители, как правило, не любят сообщать доступность или вероятность отказа своего изделия, то при расчетах можно условно принять следующие цифры:

  • время простоя 20.4 часа в год,
  • вероятность отказа 20.4/(24*365)=0.233%,
  • доступность оборудования 100-0.233=99.767%.

В-третьих, хотелось бы упомянуть тот факт, что для ЦОД с системой холодоснабжения на основе чиллеров третий уровень надежности требует резервирования трубопроводов, причем сразу и прямого и обратного. Однако, как показывает опыт, иногда, стремясь достичь Tier III, резерв труб не предусматривается вовсе, а иногда прокладывается лишь одна дополнительная труба. А ведь Tier всего ЦОД рассчитывается исходя из наиболее критичной системы!

Наконец, критичность некоторых современных бизнес-процессов столь велика, что простой даже в 20-25 минут в год приводит к огромным убыткам для компании. Поэтому многие специалисты сходятся во мнении, что в скором времени должен появиться пятый уровень надежности ЦОД, характеризующийся пятью девятками (доступность 99.999%) и временем простоя всего 8.8 минут в год.

Дополнительные материалы

В ЗАО "ДатаДом" сделали чрезвычайно полезную выжимку информации по уровням надежности ЦОД из стандарта TIA/EIA-942 и "белой книги" Uptime Institute и объединили её в единый документ: скачать

Также подробное описание каждого из четырех Tier содержится в приложении G стандарта TIA/EIA-942: скачать приложение G из TIA/EIA-942

Комментарии

Ваше имя:

E-mail:  (на сайте не показывается)

Введите код с картинки:      

 

09.12.2013 12:24. Евгений

Хорошая статья, но поправьте несколько ошибок:
1. Раздел "Tier IV. Отказоустойчивый."
...Несущая способность перекрытий не менее 857кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.
Должно
1225кг/м² сверху
245кг/м² снизу

2. Дополнительные материалы
Кривая ссылка на скачать приложение G из TIA/EIA-942
ведет на ссылку выше.

Каталог оборудования

 ИБП   Кондиционеры   Чиллеры 

HYIP (Хайп)

 About HYIP (о хайпах)   HYIP платит   HYIP скам   Обменники   Платёжные системы 

Компании

 DataCenterDynamics   Exsol (Эксол)   HTS   NVisionGroup   Union Group   Uptime Institute   UptimeTechnology   Ай-Теко   АйТи   АМТ-груп   Астерос   Аякс   ВентСпецСтрой   ДатаДом   Крок   Радиус ВИП   Термокул   Техносерв 

Оборудование

 Кондиционирование   Контроль доступа и безопасность   Мониторинг   Пожаротушение   Серверное оборудование   СКС   Фальшпол   Шкафы и стойки   Электроснабжение (ИБП, ДГУ) 

Пресса

 Connect - Мир связи   FOCUS   PC Week   ServerNews   Журнал сетевых решений / LAN   ИКС-Медиа 

Производители

 AEG   Chloride   Conteg   Delta Electronics   Eaton   Emerson Network Power   Green Revolution Cooling   HiRef   Hitec   Lampertz   Lande   LSI   Powerware   RC Group   Rittal   Schneider Electric   Stulz   Uniflair 

Рубрики

 Базовые станции   Интернет вещей   История   Криптовалюты   Мероприятия   Мобильный ЦОД   Обслуживание ЦОД   Опыт ЦОД   Суперкомпьютеры   Терминология   ЦОД в целом