Мониторинг более не обнаруживаемых LLD элементов

Различные вопросы по системе мониторинга Заббикс
satoo
Гость
Сообщения: 5
Стаж: 5 месяцев

Мониторинг более не обнаруживаемых LLD элементов

Сообщение satoo »

День добрый

Т.к. пишу в первый раз, то хочу поблагодарить за качественный материал, которым вы делитесь на данном форуме. По себе знаю, насколько это трудная работа.

Как я считаю, в "мониторинге из коробки" есть проблема: в официальных и в ваших шаблонах зачастую используется LLD. Получается авантюрный подход - через LLD автоматически диск, например, находится и ставится на мониторинг. А потом, в один не очень приятный момент, когда диск в системе "пропадает", то мониторинг об этом ничего не говорит. Администратор может узнать об этом только если зайдет в настройки хоста и глазами посмотрит на восклицательные знаки и не увидит что-то вроде "The item is not discovered anymore and will be deleted". Причем даже в интерфейсе нет возможности фильтровать такие элементы, наподобие элементов "not supported".

Если честно, такое поведение системы мониторинга ставит меня в тупик. Вы как-то решаете данную проблему (а я считаю, что это проблема)?
Вы как-то мониторите, что в хосте есть не обнаруживаемые элементы?
количество слов: 14
Аватара пользователя
Артём Мамзиков
Admin
Сообщения: 755
Стаж: 4 года 3 месяца
Откуда: Вологодская область
Поблагодарили: 28 раз
Контактная информация:

Мониторинг более не обнаруживаемых LLD элементов

Сообщение Артём Мамзиков »

satoo, Добрый день!
На мой взгляд есть несколько вариантов, прикрутить хотя бы к одному из элементов триггер на условие нет данных более чем например 24 часа. Это при условии что элемент перестал обнаруживаться и данные на него не идут.

Есть отправка сообщений когда элемент падает в неподдерживаемый
Это у нас действия Внутренний :
Не Поддерживаемые элементы отчета Тип события равно Элемент данных в "неподдерживаемом" состоянии

Отчет не поддерживает правила обнаружения низкого уровня Тип события равно Правило низкоуровневого обнаружения в "неподдерживаемом" состоянии

Сообщить о неизвестных триггерах Тип события равно Триггер в "неизвестном" состоянии

В разных правилах lld может быть разное количество дней если у нас 0 то элементы могут сразу пропасть и оповещения вовсе не будет.

Можно создать обычный элемент но с ключем от LLD правила сделать без истории 0 дней и проверять какую ни будь строку с него регуляркой в триггер если ее нет значит данные с LLD не приходят.
Что то подобное я делал тут Как проверить что у нас данные приходят в JONS или данные корректные не ошибка или что то еще ?

Пока вот такие идеи и решения.
количество слов: 8
satoo
Гость
Сообщения: 5
Стаж: 5 месяцев

Мониторинг более не обнаруживаемых LLD элементов

Сообщение satoo »

Таким образом необходимо переделывать все шаблоны. Это очень "грустно" и трудоемко;)

Если взять даже стандартные шаблоны, то работы очень много, т.к. по-хорошему надо все переделывать, а после обновления шаблона (что, порой, нужно) - опять переделывать.

Как мне кажется, для админа даже "безымянный" алерт "есть ХХ не обнаруживаемых более элементов" значительно лучше, чем текущее дефолтное поведение. Аналогичный триггер на "not supported" я сделал (делается очень легко) - несколько раз уже выручал.

Хочется "шаблонного" подхода. Имхо, надо делать на уровне хоста, через скрипт, обращающийся api к заббиксу. Я через api еще не работал, есть рабочие шаблоны запросов к серверу через api?
количество слов: 5
Аватара пользователя
Артём Мамзиков
Admin
Сообщения: 755
Стаж: 4 года 3 месяца
Откуда: Вологодская область
Поблагодарили: 28 раз
Контактная информация:

Мониторинг более не обнаруживаемых LLD элементов

Сообщение Артём Мамзиков »

satoo, Ну без этого никак все сделал , потом что то выплывет надо переделывать или условия безопасности и снова переделывать. Некоторые шаблоный 4-6 раз правяться.

Не совсем понял реализацию через api.
Но как работает из примеров есть
API Zabbix через Bash и Curl
Скрипты API Zabbix для Hardware Monitor
Получение Истории по ключу элемента API zabbix
количество слов: 14
satoo
Гость
Сообщения: 5
Стаж: 5 месяцев

Мониторинг более не обнаруживаемых LLD элементов

Сообщение satoo »

Мне не хочется переделывать шаблоны с lld не из-за "лени" или последующих переделок, а из-за того, что в каждом шаблоне надо делать что-то свое. При этом обязательно будут ошибки, неточности и пр. Кроме того, обновление такого шаблона будет не тривиальным. Я, похоже, пойду по пути создания одного шаблона, в котором будет скрипт обращающийся к серверу заббикса и получающий "потерянные" lld айтемы.

Таким образом, можно без каких-либо переделок присоединить данный шаблон к любому хосту и контролировать пропадающие элементы. Про то, что таким образом не обнаружится элемент с временем жизни 0 - понятно. Но такой элемент никаким образом не обнаружится при использовании механизма lld.

Мне как-то странно видеть, что в системе мониторинга из коробки есть механизм "автоматического поиска и регистрации" элементов, но нет механизма гарантированного оповещения о том, что какой-то из ранее обнаруживаемых элементов пропал.

Получается так: есть новый диск - ок, поставили в мониторинг, заканчивается на нём место - ок, оповестили. А если диск пропал, то пропал. А что об этом админов оповещать ;)) бред какой-то.

Неужели у вас такого не было или не возникали подобные вопросы?

ps мы как-то вовремя "не поймали" пропажу диска (lld диск вышел из строя), а так же отсутствие службы (при обновлении службы, инсталлятор удалил службу, но не установил). после таких событий начинаешь сомневаться в надежности мониторинга.

pps за ссылки на примеры спасибо. за то, что на баше написано - спасибо вдвойне. не хочется ставить на сервер дополнительное по, а потом разбирать вопросы с их версиями. буду попробовать с api заббикса разобраться, похоже, что без этого не решить данную задачу
количество слов: 8
Аватара пользователя
Артём Мамзиков
Admin
Сообщения: 755
Стаж: 4 года 3 месяца
Откуда: Вологодская область
Поблагодарили: 28 раз
Контактная информация:

Мониторинг более не обнаруживаемых LLD элементов

Сообщение Артём Мамзиков »

satoo, По службам у нас 10 дней на удаление после того как они перестали обнаруживаться , ну иона почти сразу отстреливает что не запущенна.
По дискам у нас обычно вылетало когда флешка успеет определиться после ее извлекут, либо есть скрипт который ночью подключает внешний диск и делает на его копию доков и после отключается через диспетчер устройств так же попадает попадал под общее правил обнаружения
По ним какие то триггеры отрабатывали только не помню какие.

А так у нас везде на серверах RAID там ПО для SNMP допом идет и по дискам видим.
Где обычный диск там на нем еще Ось крутиться тут сразу заметно если он отпал.
Прям таких отдельных у нас немного.

в плане в целом LLD , в основном удаление минимум через 2 дня , и какой ни будь триггер нет данных более 24ч.

В целом нюансов хватает что могло быть лучше и удобнее, фильтрация триггеров по группам если в узле 8тыс элементов и куча триггеров их можно отсортировать только в элементах и посмотреть какой триггер висит на нем.

Или цепляешь шаблон к узлу, а там уже есть часть элементов с таким ключом и нужно делать клон шаблона либо в текущем убирать дубли если нужны оба шаблона.

При подключении шаблона если в нем есть мониторинг службы которая найдена авто обнаружением, автоматом прописать правило не искать ее и использовать проверку из последнего подключенного шаблона , при отключении шаблона вернуть правило и службу обратно стандартный шаблон. Либо одинаковые проверки оставлять 1 шт спрашивать из какого шаблона (разные имена возможно действие, описание количество триггеров на элемент и тд)

Дат стандартно нет в макросах для элементов и триггеров что то же очень странно в целом ничего сложного добавить их по умолчанию нет.

И другие нюансы.

А так zabbix открытый бесплатный дорабатывай под себя что хочешь куча всего из коробки, но есть вроде элементарные вещи которых там почему то нет.
количество слов: 10
satoo
Гость
Сообщения: 5
Стаж: 5 месяцев

Мониторинг более не обнаруживаемых LLD элементов

Сообщение satoo »

На рабочих станциях мы используем стандартный шаблон заббикса. Его более чем достаточно для стандартных машин. Кроме того, есть другие шаблоны с lld, которые подходят без доработки. Из-за этого и стремимся к шаблонному подходу, не правя готовое.

Соглашусь, что многие элементы в заббиксе сделаны странно. Да и комьюнити бывает странным. Тот же функционал о "подавлении" проблемы я спрашивал/предлагал несколько лет назад. Все удивлялись и говорили, что не нужно, используй костыль с обслуживанием. А вот сейчас, когда наконец-то реализовали, многие стали говорить, что да, нужная функция. Уверен, что и мой текущий запрос будет реализован. Когда - хз, но 100% будет.

Уникальность ключей тоже детская болезнь. Когда делаем свои шаблоны, то обязательно используем свой префикс, чтобы не получилось что-то банальное "Process", что может конфликтовать с другими шаблонами.

Но, что больше всего меня удивило, что при возникновении ошибок в макросах и получения айтемов (или пропажи lld) мониторинг из коробки об этом молчит. Ну как так? Это же главная функция мониторинга!!! Есть ошибка - сообщи адину. Если не возможно вычислить макрос из-за деления на ноль - скажи админу, пусть формулу поправит или увидит, что 0 это не ошибка, а отсутствие места на диске, как пример. Если не можешь найти ранее обнаруживаемый элемент - скажи админу, пусть думает. Меня такое поведение _мониторинга_ раздражает и вводит в расстройство (как в анекдоте про учительницу).

Накипело ;)

Еще раз спасибо за примеры с api. Буду делать
количество слов: 6
Аватара пользователя
Артём Мамзиков
Admin
Сообщения: 755
Стаж: 4 года 3 месяца
Откуда: Вологодская область
Поблагодарили: 28 раз
Контактная информация:

Мониторинг более не обнаруживаемых LLD элементов

Сообщение Артём Мамзиков »

satoo, Будем думать что в дальнейшем все реализуют и все обновления будут только-только лучшую сторону :)
количество слов: 1
Ответить Пред. темаСлед. тема

Вернуться в «Вопросы по Zabbix»