Система мониторинга производительности сети
Система мониторинга производительности сети (англ. Network Performance Monitor, NPM) — компонент пакета Operations Management Suite, входящего в состав Microsoft Azure. Система предназначена для мониторинга производительности сетей между офисными площадками, центрами обработки данных, облачными инфраструктурами и приложениями практически в режиме реального времени. Она помогает сетевым администраторам выявлять и устранять такие проблемы, как сетевые задержки, потери пакетов и проблемы с доступностью любых сетевых соединений — как в локальных сетях, так и между виртуальными сетями, виртуальными частными облаками, гибридными инфраструктурами, VPN, а также публичными интернет-соединениями[1].
Network Performance Monitor
Система мониторинга производительности сети (NPM) — решение для мониторинга сетей из состава Operations Management Suite. Она отслеживает доступность соединения и качество соединения между различными площадками как внутри кампусов, так и между частными и публичными облаками. Для тестирования связности используются синтетические транзакции, и систему можно применять на любой IP-сети независимо от производителя и модели сетевых маршрутизаторов или коммутаторов.
Возможности
- Формируется дашборд для отображения обобщённой информации о сети, включая события по состоянию сети, подозрительно работающие сетевые соединения и подсети, где наблюдаются наибольшие потери пакетов и задержки. Дополнительно можно создавать пользовательские дашборды для анализа состояния сети в разные моменты времени.
- Создаётся интерактивная топологическая карта, показывающая маршруты между узлами. Сетевой администратор может использовать эту карту для выявления проблемных путей и поиска их причин.
- Можно настроить оповещения по электронной почте для заинтересованных лиц при достижении заданных пороговых значений.
- Две локальные сети: мониторинг соединения между двумя офисными площадками, соединёнными через канал MPLS WAN или VPN.
- Несколько площадок: мониторинг соединения с центральной площадкой из разных офисов — например, когда пользователи из множества офисов получают доступ к приложениям на центральном сервере.
- Гибридные сети: мониторинг соединения между локальной сетью и виртуальными сетями, связанными через S2S VPN или ExpressRoute.
- Несколько виртуальных сетей в облаке: мониторинг соединения между несколькими VNet в одной или разных регионах Azure; такие сети могут быть связаны пиринговыми соединениями или через VPN.
- Любое облако: мониторинг соединения между инфраструктурой и локальной сетью, а также между AWS и виртуальными сетями Azure.
Работа системы
Для работы системы не требуется доступа к сетевым устройствам. На серверах в необходимых подсетях должна быть установлена программа Microsoft Monitoring Agent (MMA) или расширение OMS.
- Агент OMS автоматически загружает специальные модули мониторинга сети, которые запускают агент NPM; он обнаруживает подключённые к нему подсети и передаёт эту информацию в OMS.
- Агент NPM получает список IP-адресов других агентов от OMS.
- Агент NPM инициирует активные проверки (пробы) — используя ICMP или TCP (Ping). Время доставки пакетов между двумя узлами используется для расчёта потерь и задержки на соединении. Данные передаются в OMS, где формируются настраиваемые дашборды.
Видеодемонстрация работы системы доступна онлайн: демо NPM.
Система использует синтетические транзакции для проверки связности и вычисления сетевых характеристик между узлами. Тестирование проводится с использованием протоколов TCP или ICMP по выбору пользователя. Выбор протокола влияет на поступающие результаты:
- TCP даёт более точные результаты по сравнению с ICMP ECHO, поскольку маршрутизаторы и коммутаторы присваивают пакетам ICMP ECHO меньший приоритет, чем TCP Ping.
- Для TCP требуется настройка сетевого и локального файервола на компьютерах, где установлены агенты NPM, для пропуска трафика по порту 8084 (по умолчанию). Возможен выбор и других портов.
- ICMP не требует настройки файервола, но для мониторинга всех маршрутов между подсетями необходимо установить агенты на большее число машин, чем при использовании TCP.
Хронология
Поддерживаемые операционные системы
- CentOS Linux 7
- Red Hat Enterprise Linux 7.2
- Ubuntu 14.04 LTS, 15.04, 16.04 LTS
- Debian 8
- SUSE Linux Enterprise Server 12
- Windows 7 SP1 и новее
Доступность по регионам
Система мониторинга производительности сети доступна в следующих регионах Azure:
- Восточное побережье США (Eastern US)
- Западная Европа (Western Europe)
- Юго-Восточная Азия (South East Asia)
- Юго-Восточная Австралия (South East Australia)
- Центральный Запад США (West Central US)
- Южный регион Великобритании (South UK)
- Вирджиния (US Gov Virginia)
Частота сбора данных
TCP handshakes совершаются каждые 5 секунд, а данные передаются каждые 3 минуты[3].