Microsoft избавляется от дизель-генераторов

Конференция DCD Converged London: новое программное обеспечение меняет традиционный подход к построению инфраструктуры ЦОД. Компания Microsoft отказывается от использования многих традиционных элементов инфраструктуры ЦОД, в том числе, дизель-генераторов.

В погоне за созданием облачного ЦОД на базе отказоустойчивого ПО, Microsoft решила полностью избавиться от здания дата-центра, оставив только контейнерные модули, расположенные на открытом воздухе и питаемые от электросети. Новый дата-центр в  Бойтоне, штат Вирджиния, является далеко не первым объектом компании, работающим без использования дизель-генераторов. Такой же подход применяется на площадках, расположенных в Чикаго и в Квинси.

Дэвид Готье

«Суммарная мощность этого ЦОД и других дата-центров компании составляет десятки мегаватт, и все они работают без дизель-генераторов», - сообщил Дэвид Готье, руководитель подразделения по проектированию ЦОД в Microsoft GFS.

«Мы тщательно проанализировали электросеть, которую используем в качестве источника питания, ее надежность и структуру, и решили воспользоваться всеми доступными нам преимуществами».

Резервное питание?

«Многие говорят: а как же резервное питание? В Чикагском дата-центре мы не раз сталкивались с серьезными скачками напряжения, приводившими к отказу оборудования мощностью в несколько мегаватт. В подобной ситуации программное обеспечение продолжает работать. Пользователь перенаправляется в другой ЦОД, а мы восстанавливаем объект, и дальше все идет как по маслу».

Готье сообщил, что Microsoft избавилась от затрат, связанных с техобслуживанием и ремонтом генераторов, а также ликвидировала выбросы углекислого газа в атмосферу.

Дата-центры компании функционируют в рамках единой виртуальной сети  – рабочая нагрузка может распределяться между различными облачными ЦОД.

Контейнерные ЦОД!

Расположенный в Бойтоне дата-центр, подобно Чикагской площадке, использует модульные контейнеры. Готье утверждает, что переход на модульную схему стал первым шагом в рамках эволюции облачной инфраструктуры компании.

«В Чикаго контейнеры установлены внутри большого склада. Это изящная, удобная и простая в обслуживании схема. Реализация данного подхода дала нам возможность получить полезный опыт, позволивший разобраться с тем, как работают контейнерные ЦОД. Главное – привыкнуть к нововведениям», - сообщил Готье.

После получения опыта во время строительства ЦОД в Чикаго в 2009 году, пришло время установки контейнеров на открытом воздухе. И теперь уроки, извлеченные из строительства объекта в Бойтоне, позволят Готье и его команде строить в будущем еще более облегченные версии модульных ЦОД.

«Мы уже почерпнули для себя много нового из этого проекта», - сказал Готье. «Поскольку программное обеспечение является отказоустойчивым, оно может эволюционировать, может меняться, и это значит, что дата-центр также будет меняться, что позволит в будущем сократить затраты на его эксплуатацию».

Готье сообщил, что важно представлять себе контейнерный ЦОД, как единое целое.

«Мы рассматриваем все установленное в контейнере оборудование и программное обеспечение, как единую систему. Сюда входит и система управления зданием, и система пожаротушения. Все это управляется, как единый операционный блок», - сообщил Готье.

Масштабирование на уровне контейнеров-ЦОДов

По словам Готье, Чикагский дата-центр стал первым объектом компании, где использовалось отказоустойчивое ПО. Он разрабатывался с расчетом на то, что в случае отключения питания нагрузка, которая выполнялась на мощностях дата-центра, будет поддерживаться другим ЦОД.

«Контейнер представляет собой наименьший структурный элемент ЦОД, который может выйти из строя. Строго говоря, это компьютер размером с контейнер», - заявил Готье.

Данный подход также позволил устранить один из наиболее опасных факторов в управлении ЦОД – человеческий фактор.

«Отказоустойчивость предполагает высочайшую степень сложности. Существует масса способов расположить модули распределения питания (PDU) внутри здания. Однако, мы неизбежно сталкиваемся с множеством человеческих ошибок», - утверждает Готье.

«Поэтому, мы решили максимально снизить влияние человеческого фактора. В результате, мы смогли свести отказы оборудования к минимуму и сделали их частью нормального процесса функционирования ЦОД».

«Облачная среда плохо справляется с отказами смешанного типа. С программной точки зрения, лучше потерять все десять стоек контейнера, чем потерять только одну стойку».

Комментарии

Ваше имя:

E-mail:  (на сайте не показывается)

Введите код с картинки: