Доступные метрики¶
Формат метрик¶
Метрики collectd имеют следующий формат:
host/plugin[-plugin_instance]/type[-type_instance]
Более подробное описание формата доступно по ссылке.
Примечание
- В списке метрик ниже параметр
host/опущен. - При использовании утилиты
collectd_nagiosпараметрhost/опускается. Имя хоста задается отдельно с помощью параметра-H(подробнее об использовании утилиты).
Типы метрик Вебмониторэкс¶
Вебмониторэкс использует типы метрик, перечисленные ниже. Тип указывается в параметре type метрики.
-
gauge— числовое значение измеряемой величины. Значение может увеличиваться и уменьшаться. -
derive— скорость изменения значения измеряемой величины с момента предыдущего измерения значения (производная величина). Значение может увеличиваться и уменьшаться. -
counter— числовое значение измеряемой величины. Значение может только увеличиваться.
Метрики NGINX и модуля Вебмониторэкс для NGINX¶
Количество запросов¶
Количество запросов, обработанных с момента установки WAF‑ноды.
-
Величина:
curl_json-wallarm_nginx/gauge-requests -
Значение величины:
-
Скорость изменения:
curl_json-wallarm_nginx/derive-requests - Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте работоспособность WAF‑ноды, как описано в инструкции. После одной тестовой атаки значение должно увеличиться на
1.
Количество атак¶
Количество атак, зафиксированных WAF‑нодой с момента установки.
-
Величина:
curl_json-wallarm_nginx/gauge-attacks -
Значение величины:
-
Скорость изменения:
curl_json-wallarm_nginx/derive-attacks - Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте работоспособность WAF‑ноды, как описано в инструкции. После одной тестовой атаки значение должно увеличиться на
1.
Количество заблокированных запросов¶
Количество запросов, заблокированных WAF‑нодой с момента установки. Метрика записывается, если нода находится в режиме block.
-
Величина:
curl_json-wallarm_nginx/gauge-blocked -
Значение величины:
-
Скорость изменения:
curl_json-wallarm_nginx/derive-blocked -
Рекомендации при отклонении значений:
- Проверьте настройки WAF‑ноды и статус
block. - Проверьте работоспособность WAF‑ноды, как описано в инструкции. После одной тестовой атаки значение должно увеличиться на
1.
- Проверьте настройки WAF‑ноды и статус
Количество нетипичных запросов¶
Количество запросов, нетипичных для приложения. Временно в метрику записываются все запросы, обработанные WAF‑нодой (gauge-requests).
-
Величина:
curl_json-wallarm_nginx/gauge-abnormal -
Значение величины: временно равно
gauge-requests -
Скорость изменения:
curl_json-wallarm_nginx/derive-abnormal -
Рекомендации при отклонении значений: временно не имеют значения
Количество потерянных запросов¶
Количество запросов, которые не были проанализированы модулем постаналитики или не были переданы в Вебмониторэкс API. К запросам применяются правила блокировки, но запросы не отображаются в интерфейсе Личного кабинета и не учитываются при проверке следующих запросов. Значение параметра формируется из суммы tnt_errors и api_errors.
-
Величина:
curl_json-wallarm_nginx/gauge-requests_lost -
Значение величины:
0, формируется из суммыtnt_errorsиapi_errors -
Скорость изменения:
curl_json-wallarm_nginx/derive-requests_lost -
Рекомендации при отклонении значений: проверьте значения
tnt_errorsиapi_errors, следуйте описанным рекомендациям ниже
Количество потерянных запросов: модуль постаналитики¶
Количество запросов, которые не были проанализированы модулем постаналитики. Метрика записывается, если все запросы отправляются в модуль постаналитики (wallarm_upstream_backend tarantool). К запросам применяются правила блокировки, но запросы не отображаются в интерфейсе Личного кабинета и не учитываются при проверке следующих запросов.
-
Величина:
curl_json-wallarm_nginx/gauge-tnt_errors -
Значение величины:
0 -
Скорость изменения:
curl_json-wallarm_nginx/derive-tnt_errors -
Рекомендации при отклонении значений:
- Проверьте логи NGINX и Tarantool, проанализируйте записанные ошибки.
- Проверьте корректность указанного сервера Tarantool (
wallarm_tarantool_upstream). - Убедитесь, что Tarantool хватает выделенной памяти.
- Обратитесь в службу поддержки Вебмониторэкс, если не удалось решить проблему.
Количество потерянных запросов: Вебмониторэкс API¶
Количество запросов, которые не были переданы в Вебмониторэкс API. Метрика записывается, если все запросы отправляются в API (wallarm_upstream_backend api). К запросам применяются правила блокировки, но запросы не отображаются в интерфейсе Личного кабинета и не учитываются при проверке следующих запросов.
-
Величина:
curl_json-wallarm_nginx/gauge-api_errors -
Значение величины:
0 -
Скорость изменения:
curl_json-wallarm_nginx/derive-api_errors -
Рекомендации при отклонении значений:
- Проверьте логи NGINX и проанализируйте записанные ошибки.
- Проверьте корректность настроек API (
wallarm_api_conf). - Обратитесь в службу поддержки Вебмониторэкс, если не удалось решить проблему.
Количество проблем при завершении рабочего процесса NGINX¶
Количество проблем, которые привели к некорректному завершению рабочего процесса NGINX. Чаще всего причиной является критичная ошибка в работе NGINX.
-
Величина:
curl_json-wallarm_nginx/gauge-segfaults -
Значение величины:
0 -
Скорость изменения:
curl_json-wallarm_nginx/derive-segfaults -
Рекомендации при отклонении значений:
- Соберите информацию о текущем состоянии, используя скрипт
/usr/share/wallarm-common/collect-info.sh. - Передайте сгенерированный файл в службу поддержки Вебмониторэкс.
- Соберите информацию о текущем состоянии, используя скрипт
Количество превышений размера виртуальной памяти¶
Количество ситуаций, когда был превышен размер виртуальной памяти.
-
Величина:
curl_json-wallarm_nginx/gauge-memfaultsпри превышении памяти в вашей системеcurl_json-wallarm_nginx/gauge-softmemfaultsпри превышении памяти для экземпляра proton.db+lom (wallarm_ts_request_memory_limit)
-
Значение величины:
0 - Скорость изменения:
curl_json-wallarm_nginx/derive-memfaultsдляcurl_json-wallarm_nginx/gauge-memfaultscurl_json-wallarm_nginx/derive-softmemfaultsдляcurl_json-wallarm_nginx/gauge-softmemfaults
- Рекомендации при отклонении значений:
- Соберите информацию о текущем состоянии, используя скрипт
/usr/share/wallarm-common/collect-info.sh. - Передайте сгенерированный файл в службу поддержки Вебмониторэкс.
- Соберите информацию о текущем состоянии, используя скрипт
Время анализа запросов (в секундах)¶
Время, потраченное WAF‑нодой на анализ запросов с момента установки.
-
Величина:
curl_json-wallarm_nginx/gauge-time_detect -
Значение величины:
>0 -
Скорость изменения:
curl_json-wallarm_nginx/derive-time_detect - Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте работоспособность WAF‑ноды, как описано в инструкции. После одной тестовой атаки значение должно увеличиться на
1.
Версия proton.db¶
Версия подключенной proton.db.
-
Величина:
curl_json-wallarm_nginx/gauge-db_id -
Значение величины: ограничений нет
Версия ЛОМ¶
Версия подключенного ЛОМ.
-
Величина:
curl_json-wallarm_nginx/gauge-custom_ruleset_id(До версии ноды 3.6 —
curl_json-wallarm_nginx/gauge-lom_id. Устаревшая метрика все еще собирается, но скоро ее поддержка прекратится.) -
Значение величины: ограничений нет
Экземпляры proton.db и ЛОМ¶
Количество экземпляров proton.db и ЛОМ¶
Количество подключенных экземпляров proton.db и ЛОМ.
-
Величина:
curl_json-wallarm_nginx/gauge-proton_instances-total -
Значение величины:
>0 - Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте корректность пути до файла proton.db (
wallarm_protondb_path). - Проверьте корректность пути до файла ЛОМ (
wallarm_custom_ruleset_path).
Количество успешно загруженных экземпляров proton.db и ЛОМ¶
Количество экземпляров proton.db и ЛОМ, которые были успешно прочитаны и загружены.
-
Величина:
curl_json-wallarm_nginx/gauge-proton_instances-success -
Значение величины:
>0 -
Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте корректность пути до файла proton.db (
wallarm_protondb_path). - Проверьте корректность пути до файла ЛОМ (
wallarm_custom_ruleset_path).
Количество экземпляров proton.db и ЛОМ из последних сохраненных файлов¶
Количество экземпляров proton.db и ЛОМ из последних сохраненных файлов. В сохраненные файлы записываются последние успешно загруженные экземпляры. Если экземпляры обновились, но их не удалось загрузить, используются данные из сохраненных файлов.
-
Величина:
curl_json-wallarm_nginx/gauge-proton_instances-fallback -
Значение величины:
>0 -
Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте корректность пути до файла proton.db (
wallarm_protondb_path). - Проверьте корректность пути до файла ЛОМ (
wallarm_custom_ruleset_path).
Количество неактивных экземпляров proton.db и ЛОМ¶
Количество подключенных экземпляров proton.db и ЛОМ, которые не удалось прочитать.
-
Величина:
curl_json-wallarm_nginx/gauge-proton_instances-failed -
Значение величины:
0 - Рекомендации при отклонении значений:
- Проверьте корректность настроек WAF‑ноды.
- Проверьте корректность пути до файла proton.db (
wallarm_protondb_path). - Проверьте корректность пути до файла ЛОМ (
wallarm_custom_ruleset_path).
Метрики модуля постаналитики¶
Идентификатор последнего обработанного запроса¶
ID последнего обработанного запроса. Значение может как увеличиваться, так и уменьшаться.
-
Величина:
wallarm-tarantool/counter-last_request_id, если значение увеличилосьwallarm-tarantool/gauge-last_request_id, если значение уменьшилось
-
Значение величины: нет ограничений
-
Рекомендации при отклонении значений: если при поступающих запросах значение не изменяется, проверьте корректность настроек WAF‑ноды
Удаление запросов¶
Признак удаления запросов¶
Флаг, сигнализирующий об удалении из модуля постаналитики запросов, которые содержат атаки и не отправлены в облако.
-
Величина:
wallarm-tarantool/gauge-export_drops_flag -
Значение величины:
0, если запросы не удаляются1, если запросы удаляются (сигнализирует о недостаточном объеме памяти, необходимо следовать рекомендациям ниже)
- Рекомендации при отклонении значений:
- Выделите больше памяти для Tarantool.
- Установите модуль постаналитики на отдельный сервер, как описано в инструкции.
Количество удаленных запросов¶
Количество удаленных запросов, которые содержат атаки и не отправлены в облако. Количество атак в запросе не влияет на значение показателя. Метрика записывается, если wallarm-tarantool/gauge-export_drops_flag: 1.
При настройке уведомлений мониторинга рекомендуется отслеживать значение метрики wallarm-tarantool/gauge-export_drops_flag.
-
Величина:
wallarm-tarantool/gauge-export_drops -
Значение величины:
0 -
Скорость изменения:
wallarm-tarantool/derive-export_drops - Рекомендации при отклонении значений:
- Выделите больше памяти для Tarantool.
- Установите модуль постаналитики на отдельный сервер, как описано в инструкции.
Задержка экспорта запросов (в секундах)¶
Задержка между записью запроса модулем постаналитики и выгрузкой информации об обнаруженных атаках в облако Вебмониторэкс.
-
Величина:
wallarm-tarantool/gauge-export_delay -
Значение величины:
- оптимальное
<60 - предупреждающее
>60 - критичное
>300
- оптимальное
- Рекомендации при отклонении значений:
- Проверьте логи в файле
/var/log/wallarm/export-attacks.logи проанализируйте записанные ошибки. Увеличение значения может быть вызвано проблемами с пропускной способностью Вебмониторэкс API: проблемы соединения с API, большое количество атак. - Убедитесь, что Tarantool хватает выделенной памяти. При превышении памяти также изменяется метрика
tnt_errors.
- Проверьте логи в файле
Время хранения запросов в модуле постаналитики (в секундах)¶
Время, в течение которого модуль постаналитики хранит запросы. Значение зависит от количества выделенной памяти, размера и характера обрабатываемых HTTP‑запросов. Чем меньше значение, тем хуже работают алгоритмы обнаружения, которым необходим доступ к историческим данным. В результате злоумышленник может выполнять атаки перебора быстрее, оставаясь незамеченным. При этом будет получено меньше данных об истории поведения атакующего.
-
Величина:
wallarm-tarantool/gauge-timeframe_size -
Значение величины:
- оптимальное
>900 - предупреждающее
<900 - критичное
<300
- оптимальное
- Рекомендации при отклонении значений:
- Выделите больше памяти для Tarantool.
- Установите модуль постаналитики на отдельный сервер, как описано в инструкции.