
Ваш ЦОД как на ладони
Сегодня ключевой тенденцией на рынке коммерческих ЦОД стала консолидация. Согласно отчету IDC, количество дата-центров в 2017 году вырастет до 8,6 млн. Также увеличивается суммарная площадь, по прогнозам она вырастет на 22% за пять лет и составит 180 млн кв. м. Как следствие, в ведении служб эксплуатации оказываются огромные пространства, оборудованные инженерной инфраструктурой – кондиционерами, источниками бесперебойного электропитания, пожарной сигнализацией, видеонаблюдением, контролем доступа и слаботочными сетями. И все это хозяйство так же, как и серверы, обязано оставаться работоспособным в любых условиях.
С чего все начиналось
Во время бума развития массовых дата-центров со стандартным x86 оборудованием, в начале 2000-х, производители и крупные эксплуатанты начали вводить стандарты и требования к помещениям для компьютерного оборудования. А также правила эксплуатации систем управления кондиционированием, электроснабжением, пожарной безопасностью, доступом и т.д.
По мере роста естественным решением стало интегрированное управление с целью упрощения работы персонала и обеспечения стабильной работы ЦОД. Современные системы DCIM (Data Center Infrastructure Management) глубоко интегрированы с инфраструктурой и оборудованием центра, а информацию и каналы управления они выводят на панель диспетчера, представляющую данные в удобном формате и сигнализирующую о проблемах.
Система накапливает данные обо всех параметрах работы компонентов ЦОД: это сведения с датчиков климата (температура и влажность), параметры энергопотребления, режим работы кондиционеров, – и сопоставляет все это с архитектурой ЦОДа.
Подобных систем достаточно много, и, хотя их объединяет общий набор функциональных возможностей, каждая имеет определенную специфику. Например, DCIM компании Schneider Electric, специализирующейся на системах электроснабжения, имеют очень развитый функционал по управлению электропитанием. А в DCIM компании HP – сильные возможности по управлению серверами.
Больше, чем контроль
Будучи интеллектуальной системой, DCIM может гораздо больше, чем простое отслеживание текущего состояния и оперативное оповещение о нештатных ситуациях. Например, система позволяет контролировать потребление питания, оптимизировать охлаждение, управлять ИТ-ресурсами (а не только инженерными системами) и установить контроль над конкретными физическими активами в дата-центре.
DCIM «знает» все о размещении оборудования по стойкам, конфигурации серверного и сетевого оборудования, о кабельных соединениях в коммуникационных панелях. Это позволяет выявить взаимосвязи в текущей конфигурации площадки и избежать ситуаций, когда руководители ИТ-групп не имеют представления, за что отвечает та или иная стойка. А при размещении нового сервера в стойке DCIM сразу показывает, в каком шкафу есть и свободное место, и свободные электрические розетки и коммутационные разъемы.
Конечно, при внедрении системы необходимо внимательно и точно ввести в нее все данные о стойках, серверах и СХД, о сетевой топологии с точностью до кабеля, а в дальнейшем фиксировать все изменения. Это едва ли проще, чем завести кабельный журнал в Excel, но необходимо, чтобы функционал DCIM заработал. Впрочем, некоторые системы облегчают работу, позволяя считывать данные оборудования по штрих-кодам. А DCIM от Schneider Electric и вовсе может автоматически просканировать всю сеть, считать ее топологию и автоматически обнаружить не только ИТ-оборудование, но и ИБП, и кондиционеры – ведь они тоже подключены к сети.
Некоторые программы могут проводить глубокий анализ поступающих данных, так, в Vertiv (ранее Emerson Network Power) реализовали в своем решении Trellis Thermal System Manager возможность обнаружить, какие блоки охлаждения неэффективны или те, которые можно безопасно выключить. Вы можете безопасно скорректировать температуру, скорости вращения вентиляторов систем кондиционирования непосредственно с платформы Trellis и контролировать эффект в режиме реального времени через 3D-визуализацию тепловыделения стоечных систем.
Прогнозируем и планируем
Автоматически анализируя состояние вычислительного оборудования и инфраструктуры ЦОД, система позволяет обнаружить и локализовать узкие места. Причем она может сообщает об аварийных ситуациях не только по факту, но и предиктивно, на основе анализа сценариев «что-если».
Например, DCIM компании Schneider Electric может при нехватке электропитания на стойке или прогнозируемого через полтора часа перегрева из-за сбоя кондиционера запустить процедуру миграции виртуальных машин на другие стойки, а проблемную стойку выключить для обслуживания. Чтобы сделать возможным такой функционал, производители DCIM тесно сотрудничают с разработчиками как железа, так и софта – операционных систем и гипервизоров.
Также функции прогнозирования позволяют понять, как те или иные действия, например, размещение дополнительных стоек и оборудования, повлияют на ту или иную ситуацию в ЦОД. Моделирование различных ситуаций помогает не только рассчитать нагрузку на системы кондиционирования или электроснабжения, но и дают возможность избежать аварийных ситуаций.
Например, компания, предоставляющая мощности дата-центра в аренду, может имитировать отказ определенного оборудования, и увидеть, сервера каких клиентов от этого пострадают.
А еще можно вспомнить, что большинство ЦОДов постоянно пребывают в состоянии перманентного апгрейда. Этому способствует появление новых заказчиков и растущие требования текущих клиентов. В таком же состоянии находятся и корпоративные ЦОДы, постоянно подвергающихся изменениям из-за новых потребностей бизнеса.
DCIM поможет смоделировать планируемые изменения и быть уверенным в том, что перемены не нарушат работу сервисов. Помимо этого она же может сформировать наряд на работу инженеров, а по результатам сотрудники отражают действия в системе, тем самым поддерживая ее в актуальном состоянии.
То же касается и сервисного обслуживания. DCIM не только напомнит, когда его надо провести по расписанию, и выпишет через хелпдеск тикет с заданием для администратора, но и подскажет, произойдет ли перегрев, если такой-то кондиционер отключить на час для обслуживания, причем с неплохой достоверностью. Точность прогнозов зависит, впрочем, не только от аналитических возможностей системы, но и от количества и правильности размещения датчиков, наличия электросчетчиков на розетках и т.д.
Например, решение от Schneider Electric позволяет находить способы экономии за счет перераспределения ресурсов при отключении неиспользуемых серверов. Модуль StruxureWare Power Monitoring Expert не только работает с устройствами распределения питания (PDU), но и определяет потребности в техническом обслуживании энергетического оборудования, находит гармонические напряжения в сети и многое другое. Стоит отметить, что StruxureWare – это полноценная DCIM-система, построенная на модульной основе и состоящая более чем из 13 отдельных подсистем.
Кому это выгодно
Отлаженная система управления дата-центром важна не только для технических ИТ-специалистов. Например, отделу материального обеспечения функционал инвентаризации и учета активов позволяет держать под контролем всю начинку ЦОДа и сделать прозрачным перемещение и эксплуатацию большого количества разнородного оборудования. Бизнес-подразделения могут получить отчет о загрузке тех или иных мощностей, а также параметры эффективности ЦОДа.
Конечно, внедрение DCIM является технически сложным и трудоемким процессом. Система должна взаимодействовать со всеми элементами центра – физическими и логическими. И внедрение системы дает возможность переосмыслить свой подход к управлению дата-центром. Потому что DCIM – это только инструмент, пусть мощный и многопрофильный, на пути к снижению рисков, уменьшению затрат, оптимизации планирования и, как следствие, улучшению экономических показателей центра.
Также следует понимать, что DCIM – это дорого. Только один программный модуль может стоить 100 тыс. долларов, поэтому DCIM – это решение для больших ЦОДов на сотни и тысячи стоек.
Подпишитесь на нашу рассылку последних новостей и событий
Подписаться