продолжаем - http://anrad13.blogspot.ru/2014/02/4.html
Часть 5 - Принятие решений или Подсистема корреляции и обобщения данных контроля
Надо сказать что смерть больших систем мониторинга наступает как раз часто из-за отсутствия инструментов аналитики для ИТ менеджмента и диспетчерских групп. Если нет реального потребителя, то система не нужна. И то что должно давать информацию для CIO, так и остается инструментом сисадмина за шесть нулей американских денег.
В этой части я опишу свой взгляд на ядро комплексной системы мониторинга, собственно это и есть сама суть комплексного мониторинга, а все остальное нежно рассматривать всего лишь как некие "коннекторы", поставщики данных.
Как
работает подсистема корреляции? Достаточно
просто
Данные
контроля из других систем мониторинга собираются в единую базу событий (события
мониторинга) и единую базу показателей (суть численные параметры контроля)
Далее
с использованием единой базы взаимосвязей и правил расчета метрик
работоспособности, подсистема контроля состояния процессов и сервисов формирует
«наглядную картинку» ЧТО и ГДЕ? Что
не работает и где сломалось.
Дополнительно
наличие единой базы событий позволяет проводит исторический анализ и
прогнозировать возможные проблемы в будущем. Например
на основе учащающихся кратковременных пиковых нагрузок на процессор, можно
спрогнозировать проблемы с прохождением бизнес-процесса
Безусловно
в этой подсистеме главным и самым трудоемким является обеспечение адекватной БД
взаимосвязей. Ее
поддержание представляет из себя достаточно сложную задачу.
Но
прогресс не стоит на месте и то что приходилось делать раньше вручную, теперь
делается автоматически на основе так называемых «типовых профилей работы»
Которые
позволяют контролировать не отдельные события, а динамику их изменения или
отклонения от «обычной» базовой линии, которая определяется автоматически
Это
сердце этой системы.
А лицом системы являются обобщенные
экраны мониторинга. Графические
схемы которые позволяют «одним взглядом» держать всю картину ИТ
На чем это реализовывать?
А фиг его знает.
Я реально не знаю более менее успешных внедрений.
И не могу сказать что вот эта система все умеет. Из того что я видел, наиболее мне нравится Universal CMDB from HP. Но работа с ней требует вложений персонала и наличия такой редко встречаемой позиции как Главный архитектор ИТ предприятия.
Обзорные экраны - тоже проблема.
То что есть в любом ПО для АСУ ТП, точему-то нет в системах мониторинга ИТ. Хотя сейчас может и есть. По крайней мере произвольные мигающие схемы можно рисовать в IBM BSM.
В собственном проекте мы используем собственные
наработки для экранов мониторинга для пунктов управления, которые позволяют
получать произвольное количество графических схем-индикаторов в нужной нам
конфигурации.
А для расчета интегральных статусов мы используем собственный движок и XML файл правил в формате логических схем.
Комментариев нет:
Отправить комментарий