Tier: уровни надежности ЦОД и что из этого следует

Основным требованием, предъявляемым к Центрам Обработки Данных (ЦОД) является отказоустойчивость. Именно отказоустойчивость ЦОД и определяет уровень надежности ЦОД. При этом подразумевается отключение ЦОД как на время планово-предупредительных работ и профилактики оборудования, так и внеплановых аварийных ситуаций.

Цель введения уровней надежности ЦОД

Главная цель введения классификации по уровням надежности - избежать расплывчатых формулировок как при формировании технического задания к строящимся дата-центрам, так и при описании характеристик уже функционирующих ЦОД.

Очевидно, что понятие отказоустойчивости ЦОД определяет и отказоустойчивость каждой из систем ЦОД. Это означает, что тот или иной уровень надежности накладывает определенные требования сразу на всю инфраструктуру дата-центра. Фактически, из этого следует, что выбраный уровень надежности целиком определяет концепцию ЦОД.

Авторы уровней надежности ЦОД

Существующие на сегодняшний день четыре уровня надежности ЦОД, названные Tier 1, Tier 2, Tier 3 и Tier 4 введены организацией Uptime Institute (Институт Бесперебойных Процессов, США). Uptime Institute основан в 1993 году с целью повышения надежности и доступности ЦОД. Институт разработал множество нововведений, которые к настоящему моменту стали стандартными решениями, применяемыми при построении ЦОД. В частности, классификация Tier вошла в повсеместно использующийся американский стандарт TIA/EIA-942.

Для кого введены уровни надежности ЦОД

Любая классификация должна быть ориентирована на определенный круг лиц. Классификация Tier описывает надежность функционирования ЦОД и является необходимой для компаний, как желающих построить свой ЦОД, так и для арендующих чужие вычислительные мощности. В зависимости от критичности бизнеса компании, в зависимости от потерь, которые компания понесет в случае остановки её бизнес-процессов избирается тот или иной Tier.

В свою очередь, высокий уровень надежности требует высоких как капитальных, так и эксплуатационных затрат, поэтому и стоимость вычислительных мощностей также резко зависит от уровня надежности ЦОД.

Основной показатель, определяющий Tier

На первый взгляд может показаться, что основным показателем, определяющим уровень надежности является время простоя ЦОД за год и вытекающий из него коэффициент отказоустойчивости, равный отношению времени простоя за год к длительности года. Однако, следует отметить, что есть ещё более принципиальное разделение четырех уровней надежности на две категории. Критерием является возможность проведения профилактических работ без полной остановки ЦОД:

  • При Tier I и II для выполнения планово-предупредительных работ необходимо остановить ЦОД,
  • При Tier III и IV любая плановая деятельность осуществляется без нарушения нормального хода работы ЦОД.

Но вернемся к отказоустойчивости. По данному показателю выделено 4 уровня надежности:

  • Tier I: время простоя 28,8 часов в год, коэффициент отказоустойчивости 99,671%;
  • Tier II: 22,0 часа в год, 99,749%;
  • Tier III: 1,6 часа в год, 99,982%;
  • Tier IV: 0,4 часа в год, 99,995%.

Требования, предъявляемые к каждому из уровней надежности ЦОД

Все четыре уровня Tier получили дорогу в жизнь через стандарт TIA/EIA-942. Именно в нем и указаны требования к каждому Tier.

Tier I. Базовый уровень.

ЦОД базового уровня подвержен нарушениям работы как от плановых, так и от внеплановых действий. Применение фальшпола, ИБП, ДГУ не обязательно. Если же ИБП и ДГУ используются, то выбираются более простые модели, без резерва, с множеством точек отказа. Возможны самопроизвольные отказы оборудования. Ошибки в действиях обслуживающего персонала также приведут к простою ЦОД.

В ЦОД Tier I отсутствует защита от случайных и намеренных событий, обусловленных действиями человека. Несущая способность перекрытий не менее 735кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.

Tier II. С резервированными компонентами.

В ЦОД Tier II время простоя возможно в связи с плановыми и внеплановыми работами, а также аварийными ситуациями, но оно сокращено благодаря введению одной резервной единицы оборудования в каждой системе. Таким образом, системы кондиционирования, ИБП и ДГУ имеют одну резервную единицу. Тем не менее, профилактические работы требуют отключения ЦОД.

Tier II требует наличия минимальных защитных мер от влияния человека. Стены и потолки снабжаются пароизоляцией, в двери устанавливается глазок с углом обзора 180°, все стены строятся на всю высоту помещения - от грязного пола до грязного потолка. Несущая способность перекрытий не менее 857кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.

Tier III. С возможностью параллельного проведения ремонтных работ.

Третий уровень надежности требует осуществления любой плановой деятельности без остановки ЦОД. Под плановыми работами подразумевается профилактическое и программируемое техническое обслуживание, ремонт и замена компонентов, добавление или удаление компонентов, их тестирование. Очевидно, что в этом случае необходимо иметь резервирование, позволяющее всю нагрузку пустить по другому пути во время работ на первом.

Итак, для реализации Tier III необходима схема резервирования блоков систем кондиционирования, ИБП, ДГУ N+1, также требуется наличие двух комплектов трубопроводов для системы кондиционирования, построенной на основе чиллера. Строительные требования обязывают сохранять работоспособность ЦОД при большинстве случаев намеренных и случайных вмешательств человека. Следует предусмотреть резервные входы, дублирующие подъездные пути, контроль доступа, отсутствие окон, защиту от электромагнитного излучения, несущую способность перекрытий не менее 1225кг/м² при нагрузке сверху плюс 245кг/м² нагрузки снизу.

Tier IV. Отказоустойчивый.

Отказоустойчивый ЦОД характеризуется безостановочной работой при проведении плановых мероприятий и способен выдержать один серьезный отказ без последствий для критически важной нагрузки. Необходим дублированный подвод питания, резервирования системы кондиционирования и ИБП по схеме 2(N+1). Для ДГУ необходима отдельная площадка с зоной хранения топлива.

Tier IV требует защиту от всех потенциальных проблем в связи с человеческим фактором. Регламентированы даже избыточные средства защиты от намеренных или случайных действий человека. Также учтено влияние непреодолимой силы - сейсмоявления, потопы, пожары, ураганы, штормы, терроризм. Несущая способность перекрытий не менее 857кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.

Обобщенная таблица характеристик Tier

Параметр Tier I Tier II Tier III Tier VI
Год внедрения 1965 1970 1985 1995
Отказоустойчивость
Время простоя за год, ч 28.8 22 1.6 0.4
Доступность ЦОД 99.671% 99.749% 99.982 99.995
Уровень загрузки оборудования 100% 100% 90% 90%
Обслуживание без отключения Нет Нет Да Да
Планируемые остановки ЦОД 2х12ч в год 3х12ч за 2 года Нет Нет
Аварийность 6 аварий
за 5 лет
1 авария
ежегодно
1 авария
за 2.5 года
1 авария
за 5 лет
Отказоустойчивость как одиночное событие Нет Нет Нет Да
Строительные требования
Тип здания С соседями С соседями Отдельно стоящее Отдельно стоящее
Огнестойкость стен Нет Нет 1 час 2 часа
Несущая способность перекрытия 735кг/м² сверху
125кг/м² снизу
857кг/м² сверху
125кг/м² снизу
1225кг/м² сверху
245кг/м² снизу
1225кг/м² сверху
245кг/м² снизу
Высота фальшпола Нет или
до 305мм (12")
457мм
(18")
762-914мм
(30-36")
762-1067мм
(30-42")
Резервирование
ИБП N N+1 N+1 2(N+1)
ДГУ N N N+1 2(N+1)
Кондиционирование N N+1 N+1 2(N+1)
Трубопроводы теплоносителя и конденсата N N 2N 2N
Точки подключения
Количество энерговводов 1 1 1 раб, 1рез 2 рабочих
Точки слива дренажа 1 1 2 2 рабочих
Точки водозабора для увлажнения 1 2 2 2
Наличие особых систем
Мониторинг Нет Нет Да (выборочно) Да (всех систем)
Увлажнение Да Да Да Да
Пожарные извещатели Нет Да Да Да
Течеискатели Нет Да Да Да
Контроль доступа Нет Нет Да Да
Общие характеричтики
Срок ввода в эксплуатацию 3 мес. 3-6 мес. 15-20 мес. 15-30 мес.
Ориентировочная стоимость 5000 $/м²
10 000 $/кВт
6500 $/м²
11 000 $/кВт
9700 $/м²
20 000 $/кВт
12 000 $/м²
22 000 $/кВт

Некоторые выводы и следствия

Во-первых, в характеристиках Tier II и Tier III бросается в глаза резкая разница в длительности допустимого простоя за год (22 и 1.6 часа соответственно). И это при внешне одинаковой схеме резервирования N+1. Однако следует помнить то, что второй и третий уровни надежности принадлежат к двум принципиально разным категориям, связанным с проведением плановых работ. Если Tier II подразумывает, что при плановых работах допустимо обесточить весь ЦОД, то уровень Tier III исключает эту возможность.

Во-вторых, на основе вышеуказанного различия Tier II и Tier III можно сделать один важный вывод. Если длительность простоя с учетом плановых работ составляет 22 часа в год, а без учета - 1.6 часа в год, то простой в связи именно с плановыми работами должен составить 20.4 часа в год. Таким образом, любой производитель, выпускающий технику для ЦОД, должен ориентироваться именно на такой годовой простой. Учитывая, что производители, как правило, не любят сообщать доступность или вероятность отказа своего изделия, то при расчетах можно условно принять следующие цифры:

  • время простоя 20.4 часа в год,
  • вероятность отказа 20.4/(24*365)=0.233%,
  • доступность оборудования 100-0.233=99.767%.

В-третьих, хотелось бы упомянуть тот факт, что для ЦОД с системой холодоснабжения на основе чиллеров третий уровень надежности требует резервирования трубопроводов, причем сразу и прямого и обратного. Однако, как показывает опыт, иногда, стремясь достичь Tier III, резерв труб не предусматривается вовсе, а иногда прокладывается лишь одна дополнительная труба. А ведь Tier всего ЦОД рассчитывается исходя из наиболее критичной системы!

Наконец, критичность некоторых современных бизнес-процессов столь велика, что простой даже в 20-25 минут в год приводит к огромным убыткам для компании. Поэтому многие специалисты сходятся во мнении, что в скором времени должен появиться пятый уровень надежности ЦОД, характеризующийся пятью девятками (доступность 99.999%) и временем простоя всего 8.8 минут в год.

Дополнительные материалы

В ЗАО "ДатаДом" сделали чрезвычайно полезную выжимку информации по уровням надежности ЦОД из стандарта TIA/EIA-942 и "белой книги" Uptime Institute и объединили её в единый документ: скачать

Также подробное описание каждого из четырех Tier содержится в приложении G стандарта TIA/EIA-942: скачать приложение G из TIA/EIA-942

Теги:
#Монтаж
#Электроснабжение (ИБП, ДГУ)
#Мониторинг
#Пожаротушение
#СКС
#Контроль доступа и безопасность
#Шкафы и стойки
#ЦОД в целом
#Терминология

Оставить комментарий

Ваше имя:
E-mail:
(Не обязательно)
Текст комментария:
Введите код с картинки:  

Дополнительные материалы

ПРОФЕССИОНАЛЬНОЕ обучение проектированию систем вентиляции и кондиционирования

Можно ли зимой включать кондиционер на обогрев

Вытяжка в стену: как подобрать и правильно сделать своими руками

3 способа сделать увлажнитель воздуха для квартиры и дома своими руками

Всё самое важное про турбодефлекторы: что такое, принцип работы, внешний вид, как подобрать

Вентиляция в квартире: самое полное руководство простым языком

Встраиваемая вытяжка на кухне: важные нюансы по устройству и подключению

Вытяжка в дачном туалете: как сделать правильно своими руками

Комментарии читателей

Antonioiza

Antoniodif

Victorfrl

Andreasykq

Antonioymm

agrohimyjs

agrohimtgk

Victorlzj

Robfwu

Novost

Serzsni

coin

Evalll

Med

Renatixhj

urenrjrjkvnm

Renaticeq

urenrjrjkvnm

Vikidjg

urenrjrjkvnm

Renatitvk

Renatiitq

Leonvfd

urenrjrjkvnm

Renatiwoo

Juliaaniv

Novost

Igorbwa

Ukraine

Juliaaqdg

Novost

Juliaakoe

Novost

Svetlcvc

Novyny

Allaiad

Cinema

Renatiiey

c.h.erep.a.n.ovren.at.2.3.5.079@gmail.com

Allaefe

Cinema

Renativvw

c.h.e.re.p.a.novr.e.na.t.2.35.079@gmail.com

Allaogv

Cinema

Allamqr

Cinema

Renatimzg

c.her.ep.an.ovr.e.n.at.2.3507.9@gmail.com

Veronakqi

urenrjrjkvnm

Vikihbz

urenrjrjkvnm

Veronatma

urenrjrjkvnm

Vikirxs

urenrjrjkvnm

Veronapdl

urenrjrjkvnm

Vikiorj

urenrjrjkvnm

Viktoriqnx

Cinema

Vikibkx

urenrjrjkvnm

Ilushikjyd

Viktorifsa

Cinema

Margaretvwv

Novost

Ilushikyei

Viktoriedn

Cinema

Margaretrjy

Novost

Ilushikmnb

Margaretkft

Novost

Viktoriebe

Cinema

Margaretxbo

Novost

Ilushikxne

Eldarrtf

coin

Eldarlmd

coin

Evajmm

Med

Robqic

Novost

Eldarqjm

coin

Evafup

Med

Evacsf

Med

Eldarbjc

coin

Vikijtx

urenrjrjkvnm

Julimdk

Juligmi

Veronakmf

Life

Svetlanaevf

urenrjrjkvnm

Svetlgbm

Novyny

Igorusl

Ukraine

Serghjb

Novost

Svetlbyb

Novyny

Igorpey

Ukraine

Kitty

Евгений

Хорошая статья, но поправьте несколько ошибок:
1. Раздел "Tier IV. Отказоустойчивый."
...Несущая способность перекрытий не менее 857кг/м² при нагрузке сверху плюс 125кг/м² нагрузки снизу.
Должно
1225кг/м² сверху
245кг/м² снизу

2. Дополнительные материалы
Кривая ссылка на скачать приложение G из TIA/EIA-942
ведет на ссылку выше.