Дифференциация серверов в зависимости от эффективности работы при высоких температурах

Повышение рабочих температур в дата-центрах послужит поводом для новой борьбы среди производителей серверов. В случае использования высоких температур разница между удачным и неудачным конструкторским решением становится ярко выраженной и может служить критерием выбора сервера при покупке.

Работа при высокой температуре имеет явные преимущества с точки зрения эффективности использования инфраструктуры. В среднестатистическом ЦОД порядка 1/3 мощности, поступающей на предприятие, потребляется системами охлаждения. Этих расходов можно избежать, повысив рабочую температуру. В большей части климатических зон увеличение рабочей температуры до 35°С позволит перейти на охлаждение с использованием воздушных экономайзеров, что приведет к сокращению общих издержек на 10-15%.

Серьезное сокращение издержек – это хорошо. Однако, у такого решения имеется ряд недостатков:

  1. увеличение вероятности выхода серверов из строя,
  2. повышение тока утечки на полупроводниках,
  3. рост затрат на перемещение воздуха по причине увеличения скорости вращения вентиляторов.

Рассмотрим каждый из пунктов в отдельности.

Увеличение вероятности выхода серверов из строя

Первый пункт практически не подкреплен опытными данными. Я сталкивался с рядом исследований, подтверждающих повышение вероятности отказа оборудования с ростом температуры, и с рядом работ, утверждающих в точности противоположное. Очевидно, что для любого сервера существует некоторая предельная рабочая температура, по достижении которой вероятность выхода из строя резко повышается. Не ясно только, каково ее значение.

Известно также, что местоположение излома на графике кривой характеристики, отражающего рост числа отказов, сильно зависит от выбора компонентов сервера и его конструкции. Конструктивные решения, обеспечивающие более эффективное охлаждение, позволяют использовать сервер при повышенной температуре без какого бы то ни было негативного эффекта. Можно было бы изучить детальное устройство каждого сервера и попробовать создать модель, предсказывающую вероятность выхода оборудования из строя в зависимости от температуры, но задача осложняется многообразием серверов и компонентов и почти полным отсутствием данных о работе при высоких температурах.

Не имея возможности построить такую модель, я решил положиться на другой метод: предлагать OEM-поставщикам производить сервера усовершенствованной конструкции. Если заказать OEM-производителю сервер, рассчитанный на определенную рабочую температуру, то проблема моделирования окажется в руках тех, у кого хватит знаний и навыков, чтобы ее решить. Также немаловажно, что конструкция сервера может быть изменена в случае, если он плохо себя покажет в реальных рабочих условиях. Доверив проблему стороне, которая способна ее решить, и стимулируя эту сторону в финансовом отношении, можно добиться успеха.

Я считаю, что передача рисков, моделирования отказов и слежения за реальной работой серверов на сторону производителя позволит справиться с первым из перечисленных выше недостатков (рост вероятности выхода оборудования из строя). Известно также, что телекоммуникационное оборудование уже в течение многих лет работает при температуре 40°С, так что серверы вполне могут разрабатываться с учетом высоких рабочих температур, что позволит им служить дольше современных аналогов. Проблема выглядит решаемой.

Повышение тока утечки на полупроводниках

Вторым из указанных выше недостатков является повышение тока утечки на полупроводниках при высокой рабочей температуре. Величина утечки может быть легко измерена. Однако, проведя грубые измерения, я выяснил, что вклад данного фактора незначителен по сравнению с увеличением скорости вращения вентиляторов. Также отмечу, что величина утечки зависит от температуры на полупроводниках, а не от температуры воздуха на входе сервера. Применение улучшенной схемы охлаждения или повышение объема прокачиваемого воздуха позволит избежать повышения температуры непосредственно на полупроводниках. Измерения, проведенные на используемых в настоящее время серверах, показывают, что вклад данного фактора крайне незначителен, так что я не буду его рассматривать в дальнейшем.

Рост затрат на перемещение воздуха

Влияние третьего фактора крайне велико, и его нельзя игнорировать. По мере роста температуры сервера повышается потребность в объеме прокачиваемого воздуха. Перемещение большего объема воздуха требует большей мощности, и надо заметить, что связанные с этим затраты очень велики. Повышение скорости вращения вентиляторов приводит к значительному росту издержек. Это означает, что преимущества, связанные с повышением рабочей температуры, становятся все менее значительными с ростом температуры, пока не будет достигнута точка, после которой затраты на работу вентиляторов превысят затраты на поддержание работы традиционной системы охлаждения.

Где будет расположен излом кривой характеристики, показывающий превышение затрат на работу вентиляторов над экономией за счет использования повышенной рабочей температуры? Ответ на данный вопрос зависит от множества факторов. Однако, существует ряд интересных закономерностей. Неудачное конструкторское решение от производителя серверов, который считает, что работа инженера-механика – это пустая трата денег, будет прекрасно работать при температуре 35°С. Даже моих навыков инженера достаточно для создания такого решения. Задача состоит в том, чтобы разместить в корпусе большой вентилятор и прокачивать большой объем воздуха.

Такой подход крайне неэффективен и требует больше энергии, но он прекрасно подойдет для охлаждения сервера. В итоге, напрашивается вывод, что первые два из перечисленных выше недостатков не играют существенной роли. Очевидно, не существует препятствий для использования воздуха с температурой 35°С для охлаждения серверов, что позволит поддерживать температуру внутри сервера на том же уровне, на котором она находится сегодня, что полностью устраняет первые два недостатка. Однако, устранение этих недостатков за счет применения неудачного конструкторского решения будет дорогим и неэффективным.

Грамотно разработанный сервер с продуманным расположением компонентов, хорошей конструкцией и качественным импеллером с эффективной системой контроля будет работать несравнимо лучше по сравнению с сервером, сделанным кое-как. Сочетание грамотного конструктивного решения и продуманного выбора компонентов позволит серверу работать при 35°С с небольшим увеличением энергопотребления, связанным с увеличением объема прокачиваемого воздуха. Плохо сконструированная система будет работать неэффективно при повышенных температурах. У производителей серверов появится шанс дифференцироваться и начать состязаться в создании инженерных разработок вместо производства одинаковых конфигураций и максимальной экономии на используемом железе.

Ранее я отмечал, что выбор серверов при покупке должен происходить с учетом таких характеристик, как работа на доллар, и работа на джоуль. Измерьте выполняемую сервером работу при полной загрузке, или при базовой загрузке, или используйте для этого бенчмарк, который позволяет имитировать необходимую степень загрузки. Измерения величин работы на доллар и работы на джоуль (Вт/с), необходимо производить при планируемой рабочей температуре ЦОД. Чем выше температура, тем ниже операционные издержки, и в то же время измерение величин при высокой температуре с последующим сравнением полученных значений для различных серверов позволит выявить серьезную дифференциацию между их конструкциями. Хорошие конструкторские решения будут показывать заведомо лучшие результаты. Если же измерение работы на джоуль (другими словами, потребления мощности под нагрузкой) при высокой температуре воздуха на входе сервера станет стандартной процедурой в отрасли, это приведет к появлению эффективных серверов, надежно работающих при высокой температуре.

Заставьте производителей конкурировать за лучшее значение величины работы на джоуль при рабочей температуре 35°С, и мир серверов будут ждать большие перемены. Это положительно скажется на состоянии окружающей среды и, возможно, станет наиболее эффективным способом снижения издержек в ближайшем будущем.

Джеймс Гамильтон, сотрудник Amazon Web Services по направлению энергоэффективности, надежности и расширения ЦОД

Комментарии

Ваше имя:

E-mail:  (на сайте не показывается)

Введите код с картинки: