Метрика tPUE

Кристиан Белади, редактор документа The Green Grid о метриках PUE, хорошо знаком с недостатками PUE. Он предлагает ввести понятие коэффициента продуктивности ЦОД (Data Center Productivity index, DCP).

Содержание статьи:

Продуктивность ЦОД

Определение DCP:

DCP = Полезная работа предприятия / Общая мощность, потребляемая предприятием

В целом, подход неплохой, но проблема состоит в определении величины «полезной работы». Что мы будем использовать в качестве меры полезной работы, покрывающей все возможные виды нагрузки на всех операционных системах? Некоторые виды нагрузки используют операции с плавающей точкой, некоторые – нет. Некоторые используют специализированные интегральные схемы, а некоторые запускаются на обычном железе. Программные продукты бывают как эффективными, так и неэффективными.

В принципе, цель выбрана верная, но мы никогда не сможем придумать достаточно универсальный способ измерения полезной работы. Существует возможность посчитать DCP для заданного типа нагрузки, но я не вижу способа использовать данную величину для общего описания инфраструктуры предприятия.

tPUE - модификация PUE

Вместо DCP я (автор данной статьи) предлагаюиспользовать индекс tPUE, который является модификацией PUE, позволяющей избежать ряда указанных выше недостатков. Признаю, что он является более сложным показателем, чем PUE, но он позволяет сравнивать между собой различные схемы инфраструктуры и различные типы нагрузки. Используя tPUE, предприятия с установленными системами высокопроизводительных вычислений могут сравнить свою производительность с производительностью коммерческих ЦОД.

tPUE стандартизирует точку измерения общей мощности предприятия и четко устанавливает область, относящуюся к ИТ-оборудованию, а также границу между серверами и инфраструктурой. За счет использования tPUE мы стремимся избежать неопределенности, связанной с разделением ИТ-оборудования и инфраструктуры. Неопределенность возникает в силу положительных тенденций. Вентиляторы типа 1RU являются крайне неэффективными, так что их замена на крупные стоечные или контейнерные импеллеры является хорошим шагом. Использование общих блоков питания также является хорошей идеей. Необходима метрика, которая бы позволяла корректно измерить влияние соответствующих схем на эффективность работы ЦОД. В настоящий момент PUE будет демонстрировать негативный прирост эффективности в обоих случаях.

Определение tPUE:

tPUE = общая мощность, потребляемая предприятием / производительная мощность  ИТ-оборудования

Данное определение почти полностью совпадает с определением PUE. Однако, здесь важны детали. О них - далее.

Отличие tPUE от PUE

Определение «общей мощности, потребляемой ЦОД» является крайне простым: это мощность, поставляемая на среднем уровне напряжения  (10кВ) и измеренная до включения в цепь ИБП и других приборов преобразования мощности. Большая часть крупных предприятий получает ток с таким напряжением, или выше. Менее крупные предприятия могут получать ток с напряжением 380В, в таком случае, величину поставляемой мощности получить сложнее. Мы решаем проблему за счет использования коэффициента трансформации, предоставляемого производителем трансформатора, если проведение прямых измерений невозможно. К счастью, значения коэффициента трансформации для высоковольтных трансформаторов четко прописываются производителями.

Для определения tPUE измерение напряжения необходимо производить при среднем уровне напряжения, если это возможно. Если же это невозможно сделать, допускается производить измерение при низком уровне напряжения (480В в Северной Америке и 380 или 400В во многих других странах) с учетом потери мощности на трансформаторе. Естественно, измерения необходимо производить до точки включения в цепь ИБП и других приборов преобразования мощности. Определение допускает применение указанного производителем значения коэффициента трансформации для трансформатора, преобразующего среднее напряжение в низкое, но именно среднее напряжение используется в качестве базового значения.

Определение «производительной мощности ИТ-оборудования» выглядит несколько более сложно. PUE определяет ИТ-нагрузку, как мощность, поставляемую на ИТ-оборудование. Однако, ИТ-оборудование крупных ЦОД работает особым образом. Некоторые сервера имеют встроенные вентиляторы, а некоторые используют вентиляторы уровня инфраструктуры. У некоторых нет встроенных блоков питания, и они питаются постоянным током с напряжением 12В на уровне инфраструктуры. tPUE относит все вентиляторы и все приборы преобразования мощности к инфраструктурным затратам. Я определяю «производительную мощность ИТ-оборудования», как общую мощность, поставляемую на полупроводниковые устройства (память, процессор, северный и южный мосты, сетевые контроллеры, диски, специализированные интегральные схемы, ППВМ и т.д.). Вся мощность, потребляемая блоками питания, модулями контроля напряжения и вентиляторами теперь относится к потерям на инфраструктуре. Сюда также относятся все приборы преобразования мощности, ИБП, коммутационное оборудование, и другие потери, связанные с передачей энергии, и затраты на охлаждение.

Вопрос в том, как измерить tPUE. Мы получаем возможность сравнивать между собой различные ЦОД, так как все измерения будут происходить на основании общих определений. tPUE дает правильные результаты, в том числе, для инновационных схем охлаждения и питания, размывающих традиционную границу между ИТ-оборудованием и инфраструктурой. Я считаю, что данная метрика превосходит PUE, остается только решить вопрос с ее измерением. Смогут ли операторы ЦОД производить необходимые измерения, отслеживать изменения на принадлежащих им предприятиях и понимать, как сравнивать полученные результаты с результатами других дата-центров?

Мы обсуждали то, как производить измерение общей мощности, потребляемой ЦОД. Говоря кратко, измерения необходимо производить до точки включения в цепь ИБП и других приборов преобразования мощности при среднем уровне напряжения. Если на ваше предприятие подается высокое напряжение, измерения необходимо производить сразу после первого понижающего трансформатора. Если на предприятие подается низкое напряжение, тогда вам необходимо узнать у поставщика электроэнергии (будет ли это коммунальная компания, владелец колокационного дата-центра или инфраструктурное подразделение вашего предприятия) значение коэффициента трансформации для трансформатора, осуществляющего преобразование среднего напряжения в низкое, при среднем уровне загрузки. Подставьте данное значение в формулу. Предложенный подход не идеален, но он позволяет добиться лучших результатов, нежели PUE.

Когда мы измеряем «производительную мощность ИТ-оборудования» на уровне сервера, мы также вынуждены применять приближенные оценки. Мы хотим измерить мощность, поставляемую на индивидуальные компоненты: память, процессор и т.д. Наша цель состоит в том, чтобы получить значение мощности после последней конвертации, и этого бывает сложно добиться, поскольку модули понижения напряжения часто находятся на той же плате, что и сами компоненты.

С учетом того, что измерить напряжение на данном уровне достаточно непросто, мы используем индуктивный амперметр на каждом проводнике, поставляющем мощность на плату. Затем, мы узнаем значения коэффициентов преобразования для модулей понижения напряжения от производителя (вам в любом случае необходимо знать данные значения – они существенно влияют на эффективность работы сервера).

При таком подходе мы зачастую можем узнать только напряжение на определенном уровне мощности, и реальная эффективность работы модулей понижения напряжения будет ниже. Однако, мы используем данную величину, поскольку она дает хотя бы приблизительные результаты, а более подробные сведения либо недоступны, либо их очень сложно получить. Мы не учитываем затраты на питание вентиляторов (серверные вентиляторы обычно питаются от шины 12В). Мы, по сути дела, берем определение нагрузки на ИТ-оборудование, используемое в определении PUE, и вычитаем из него потери на модулях понижения напряжения, блоках питания и вентиляторах. Измерения необходимо производить при полной загрузке серверов.

Приведенные выше измерения являются не настолько точными, как нам бы хотелось, но я уверен, что данный подход позволит получить гораздо более точную картину эффективности инфраструктуры ЦОД вне зависимости от используемой нагрузки, чем используемый в настоящее время PUE.

Теги:
#Терминология

Оставить комментарий

Ваше имя:
E-mail:
(Не обязательно)
Текст комментария:
Введите код с картинки:  

Дополнительные материалы

Можно ли зимой включать кондиционер на обогрев

Вытяжка в стену: как подобрать и правильно сделать своими руками

3 способа сделать увлажнитель воздуха для квартиры и дома своими руками

Всё самое важное про турбодефлекторы: что такое, принцип работы, внешний вид, как подобрать

Вентиляция в квартире: самое полное руководство простым языком

Встраиваемая вытяжка на кухне: важные нюансы по устройству и подключению

Вытяжка в дачном туалете: как сделать правильно своими руками

Вентиляция гаража: как сделать правильно своими руками