Подписка
МЕНЮ
Подписка

Мероприятия для специалистов в области безопасности:  10 декабря. Комплексная безопасность объектов промышленности и ТЭК 11 декабря. Пожарная безопасность и минимизация ущерба от возгораний 12 декабря. Технологии защиты периметра для объектов промышленности Регистрируйтесь и участвуйте в обсуждении!

Предиктивная аналитика в эксплуатации дата-центра

Антон Турсунов, 09/10/24

В эксплуатации дата-центров существует два вида обслуживания – реактивное и проактивное. Реактивное обслуживание предполагает реакцию на инциденты, на выход оборудования из строя. Эта статья будет посвящена проактивному обслуживанию, которое также называют плановым или предупредительным.

Предиктивная аналитика все больше используется за рубежом, в основном в здравоохранении, розничной торговле и финансах. Например, платежная система American Express, анализируя текущие операции, выявляет и прогнозирует угрозы мошеннических действий для снижения рисков. Недавно президент России Владимир Путин заявил о необходимости развития предиктивной аналитики в здравоохранении. Внимание к технологии на таком уровне говорит о том, что не стоит игнорировать ее и в рамках центров обработки данных (ЦОД).

Обзор российских продуктов и решений для дата-центров. ПРИСОЕДИНИТЬСЯ МОЖНО ПО КНОПКЕ В КОНЦЕ ОБЗОРА

Предиктивный анализ как тренд

Пока нет никаких устоявшихся цифр, гарантирующих процент улучшения тех или иных операций или снижения рисков, происходящих благодаря предиктивной аналитике, каждый проект считается уникальным, учитывающим именно тот объем оборудования и направление оборудования, которое вы выбрали для внедрения технологии.

По прогнозам Maintenance Market, рынок предиктивной аналитики продемонстрирует 35% роста до 2029 г. по всем крупнейшим рынкам Америки, Европы, Азии, Ближнего Востока и Африки.

Российский рынок сейчас отстает примерно на пять лет; будет справедливо предположить, что и нас ожидает бурное развитие.

Приведу пример работы предиктивной аналитики на конкретном проекте (рис. 1).

001-Oct-09-2024-04-12-26-3032-AMРис. 1. Предиктивная аналитика позволяет выявить неполадки на самых ранних стадиях

Между голубой точкой и желтой точкой находится зона предиктивного обслуживания. Здесь мы еще не видим проблему в классическом мониторинге, но она начинает определяться по косвенным признакам. Данная схема рисовалась на основе оборудования холодоснабжения, конкретно в ветке управления влажностью.

Показатели ниже 40% – это аварийная ситуация, выше 60% – предиктивная аналитика. Детектировать проблемы до того момента, когда один из показателей идет вниз, пока остается несбыточной мечтой.

00 (5)-1Рис. 2. Мировой рынок предиктивной аналитики

Преимущества предиктивного анализа для ЦОД

Контроль и предотвращение аварий

Одним из основных методов прогнозирования, используемых в предиктивной аналитике, является регрессионный анализ данных. Учитывая внешние факторы и опираясь на данные предыдущих ошибок на оборудовании, вы можете использовать полученные результаты для определения оптимальных настроек оборудования и предсказания потенциальных сбоев. Вы можете анализировать с помощью машинного обучения и ИИ непосредственно логи вашего оборудования, используя наиболее эффективные модели для предиктивного анализа в зависимости от глубины и его количества, и на этой основе строить прогноз более точно, чем вручную или через стандартные методы анализа.

Одним из основных методов прогнозирования, используемых в предиктивной аналитике, является регрессионный анализ данных. Учитывая внешние факторы и опираясь на данные предыдущих ошибок на оборудовании, вы можете использовать полученные результаты для определения оптимальных настроек оборудования и предсказания потенциальных сбоев.

Оптимизация и управление

Оптимизация ресурсов холодоснабжения с оценкой пиковых нагрузок и управлением установками оборудования крайне интересна в рамках экономии.

Анализ текущей работы источников бесперебойного питания (ИБП) и дизель-генераторных установок (ДГУ), прогнозирование эффективных действий в случае аварии для уменьшения периода восстановления или объема затронутых сервисов и оборудования позволяют оптимизировать инструкции и снизить потери при авариях. Управление системами при помощи ИИ и предиктивного анализа несет большие риски, связанные с формированием единой точки отказа, и поэтому вызывает справедливый скепсис у специалистов эксплуатации, но такие системы появляются на рынке и заслуживают как минимум внимательного изучения. Например, по данным, опубликованным Google*, использование предиктивного анализа позволило уменьшить расходы на эксплуатацию ЦОД на 15%.

Планирование расходов

Раннее информирование об эксплуатируемом оборудовании позволяет не дожидаться ТО и обслуживания для выявления проблем, своевременно обновляя ресурсную базу и снижая требования к объему хранения запасных частей, инструментов и принадлежностей (ЗИП) на площадке.

Если вы можете более точно рассчитывать тайминг реальных поломок своего оборудования и при помощи предиктивного анализа планировать, насколько при условии амортизации этот объем будет меняться, склады будут эксплуатироваться более эффективно и вы будете лучше планировать бюджетирование ваших расходов в рамках эксплуатации.

Кроме того, типовые решения для компаний, которые занимаются строительством ЦОД, в том числе модульных, и предиктивный анализ на основе данных строительства позволят более эффективно рассчитывать следующие площадки, масштабируя уже имеющиеся данные.

Типовые решения для компаний, которые занимаются строительством ЦОД, в том числе модульных, и предиктивный анализ на основе данных строительства позволят более эффективно рассчитывать следующие площадки, масштабируя уже имеющиеся данные.

Реализация с помощью готового решения

Когда вы обращаетесь к специалистам, предлагающим готовое решение по внедрению предиктивной аналитики, данный шаг имеет плюсы и минусы.

Плюсы:

  1. Работа под ключ.
  2. Сравнительно небольшой объем начальных расходов. Некоторые компании практикуют решения, когда они сами устанавливают свое оборудование и датчики и вы платите только за ту разницу, которую получаете на экономии, которую они могут вам дать.
  3. Не нужен штат сотрудников и не нужны свои мощности для обработки данных.

Минусы, как часто бывает, вытекают из плюсов готовых решений:

  1. Управление и координация мониторинга на объекте. действительно, любому сотруднику эксплуатации страшно отдавать управление куда-либо, потому что вы не сможете его вовремя перехватить.
  2. Сложность с гарантией безопасности хранения данных. Существует известная фраза: "Как только вы отдали логи, эти логи перестают быть вашими".
  3. Отсутствие правовой базы с четкой регламентацией порядка обработки и степени персональности данных и требований к их качеству, зависимость от поставщика решения.

Собственная разработка. Как реализовать?

Если компания понимает, что готовое решение не подходит, и принимается решение о самостоятельной разработке и внедрении, то у нас есть несколько советов.

Разработка начинается со сбора и анализа данных о работе инфраструктуры ЦОД. Как правило, на этом этапе возникают вопросы к частоте и объему данных, количеству участвующих в выборке единиц оборудования. Дальнейшим шагом будет выбор технологий и инструментов. Оборудование – это дополнительные датчики, элементы серверного оборудования, элементы, на которых будут размещены библиотеки, которые будут выступать физикой для обработки этих данных, и выбор моделей. Моделей огромное количество. для оптимизации будут эффективны одни модели, для управления лучше использовать другие.

Внедряя систему мониторинга, нет необходимости делать все с нуля. Как и в готовом решении, можно по API подключить библиотеки, они хорошо интегрируются, например, с Zabbix.

В мониторинге следует отдельно выводить элемент, возможно, как виртуального помощника, или вам потребуются дополнительные сигналы в рамках прогностической модели. Варианты элементов зависят только от ваших целей.

Сложности собственной разработки

Разработка внутри компании предполагает преодоление определенных трудностей.

  1. Нехватка квалифицированных специалистов. Мы решали это путем развития и обучения собственных сотрудников. Подойдет специалист АСУ или даже непрофильный специалист, которому интересно заниматься в рамках R&D.
  2. Высокие затраты на внедрение. Они обусловлены тем, что при выборе линейки графических процессоров или специализированных ускорителей для высоконагруженных решений требуется оборудование, которое в среднем стоит 2,5 млн руб. Правда, нужно учитывать, что не весь бизнес нуждается в ускорителях А100 и не всякая прогностическая модель требует такой скорости обработки. Ускорители А30, А40 тоже прекрасно подходят, и даже простые А16 можно использовать, грамотно ставя задачу, под которую вы их планируете. Стоимость ускорителей А30 около 400 тыс. руб. Это уже та цифра, с которой можно работать, если вы четко ставите целью внедрение предиктивной аналитики и понимаете, где вы сможете на этом зарабатывать.
  3. Недостаток данных для анализа. Любой математический анализ требует широкой выборки. Когда оборудования немного или глубина логов небольшая, будет очень сложно обрабатывать эту информацию: она будет некорректной и с высокой долей вероятности модель будет давать не те результаты, которые реально станут использоваться. Следует осуществлять сбор и анализ всех доступных данных, включая данные о неправильной работе оборудования и данные смежных единиц для расширения базы.

Важно помнить: если вы считаете, что предиктивная аналитика может быть полезна вашему бизнесу, обратите внимание на готовые решения и не бойтесь задумываться о собственной разработке. Предиктивная аналитика в эксплуатации дата-центра – наше ближайшее будущее.

Иллюстрации предоставлены автором.

* 21.03.2022 г. компания Meta признана в России экстремистской организацией.

Опубликовано в журнале "Системы безопасности" № 4/2024

Все статьи журнала "Системы безопасности"
доступны для скачивания в iMag >>

Изображение от freepik

All-over-IP 2024 14 ноября  – 6 декабря | онлайн

Темы:Центры обработки данных (ЦОД)Комплексная безопасностьЖурнал "Системы безопасности" №4/2024
Статьи по той же темеСтатьи по той же теме

Хотите участвовать?

Выберите вариант!

 

КАЛЕНДАРЬ МЕРОПРИЯТИЙ
ПОСЕТИТЬ МЕРОПРИЯТИЯ
ВЫСТУПИТЬ НА КОНФЕРЕНЦИЯХ
СТАТЬ РЕКЛАМОДАТЕЛЕМ
Комментарии

More...

More...