Зажги персонал. Включи клиентов

Аудит пропускной способности распределённой сети

В этой статье мы рассмотрим решение ProLAN для измерения пропускной способности каналов связи распределённой корпоративной сети. Уникальность решения в том, что измерения выполняются автоматически и только в периоды наименьшей активности внутренних пользователей, что обеспечивает высокую достоверность результатов и позволяет использовать их для обоснования претензий провайдерам сетевых услуг. Пропускная способность каналов измеряется на уровне TCP.

Вы – ИТ-менеджер крупной компании, отвечающий за работу распределённой корпоративной сети. В центре сети (например, в центральном офисе) расположен ЦОД, доступ к которому из удалённых офисов осуществляется по арендуемым каналам связи. Для управления такой сетью необходимо решить, как минимум, три задачи:

  1. Организовать постоянный контроль доступности каналов связи (availability). Если какой-то канал упадёт, вы сможете узнать об этом до того, как пользователи обратятся в Service Desk. Кроме того, неплохо знать, соблюдают ли NSP (Network Service Providers, Провайдеры Сетевых Услуг) свои обязательства по доступности каналов связи.

    Эта задача сравнительно несложная. Для её решения можно использовать любую систему мониторинга, которая из центра по ICMP будет пинговать оборудование удалённых офисов.

Примечание. Обычно в SLA с провайдерами сетевых услуг (NSP, Network Service Provider) сформулированы требования только к доступности и физической скорости арендуемых каналов. Физическая скорость постоянна. Поэтому единственное, что можно проверять, это доступность каналов.

  1. Организовать постоянный контроль качества передачи данных по каналам связи (jitter, delay, packet loss). Контроль необходим для быстрой диагностики корневых причин инцидентов (жалоб пользователей), в частности, для определения, виновата ли в них сеть.

    Это несколько более сложная задача, и её можно решать разными способами:
    • Если каналообразующее оборудование поддерживает технологию IP SLA (например, оборудование Cisco Systems), лучшим способом является внедрение системы мониторинга, поддерживающей данную технологию; см. Паспорт качества IP-канала.
    • Если используется оборудование, не поддерживающее IP SLA , то есть несколько путей: установить в сети специальные аппаратные зонды (самый правильный, но и самый дорогой вариант); ограничиться мониторингом качества работы каналообразующего оборудования, например, утилизации портов, числа ошибок и т.п. (на безрыбье и рак рыба); внедрить Нагрузочный Мониторинг Сети, см. Виновата сеть? Нагрузочный Мониторинг Сети.
  2. Периодически проводить аудит пропускной способности каналов связи на уровне TCP. Такой аудит необходим для контроля качества услуг NSP. Вас интересует пропускная способность на уровне TCP, т.к. большинство критически важных бизнес-приложений работает именно по TCP. При этом вам требуется достоверная информация, полученная на основе большого числа измерений (представительной выборки). Это позволит при разговоре с NSP аргументировано обосновывать свои претензии.

    В статье мы рассмотрим, как эта задача решается методом Нагрузочного Мониторинга Сети, поддерживаемого (в разной степени) всеми продуктами семейства ProLAN SLA-ON (Администратор, Аналитик, Эксперт), в том числе бесплатным продуктом QuTester Plus.

Примечание. Решение не сертифицировано, поэтому полученные с его помощью результаты при разрешении юридических споров правовой силы не имеют.

Почему не Iperf или Chariot?

Для измерения пропускной способности сети часто используют утилиты типа Iperf, Chariot и т.п. Они идеально подходят для разовых измерений пропускной способности сети, например, на этапе её пуско-наладки (или приёмки-сдачи), но неприменимы для проведения аудита. Это объясняется, как минимум, тремя причинами:

  1. При проведении аудита наиболее интересна пропускная способность сети в рабочее время. Именно в это время опорная сеть провайдера наиболее загружена, и её пропускная способность может снижаться. Но именно в это время сеть наиболее активно используется внутренними пользователями. Поэтому, если вы будете измерять пропускную способность сети с помощью Iperf или Chariot в рабочее время, то, во-первых, результаты измерений будут очень не точны, во-вторых, это негативно отразится на работе пользователей.
  2. Для получения репрезентативной выборки каждый канал нужно измерить не менее 50 раз. Чем больше измерений, тем достовернее результат. Выполнять измерения вручную – очень трудоёмкая задача. Можно написать скрипт, который будет запускать тестирование автоматически. Но это не такая простая задача. Скрипт должен уметь анализировать готовность сервера, перезапускаться при сбоях и многое другое.
  3. Кроме того, если выяснится, что пропускная способность арендуемых каналов хуже ожиданий, и вы захотите предъявить аргументированные претензии NSP, вам потребуется привязать результаты всех измерений ко времени. Только в этом случае NSP сможет сопоставить результаты ваших измерений с данными своей системы мониторинга, только так он сможет определить, «кто виноват», и попытаться устранить узкое место. При использовании Iperf и Chariot привязку ко времени нужно делать вручную. Это сложно, трудоёмко и велика вероятность ошибки.

Примечание. Юридических претензий к NSP вы предъявить, скорее всего, не сможете, т.к. для этого необходимо, во-первых, чтобы измеритель был сертифицирован, во-вторых, чтобы в SLA были прописаны гарантии на пропускную способность каналов на уровне TCP, что очень маловероятно.

Поэтому для проведения аудита пропускной способности сети нужны другие решения. Примером такого решения является Нагрузочный Мониторинг Сети компании ProLAN. Это измерение эффективной пропускной способности сети (network throughput), выполняемое методом Управляемой Генерации TCP-трафика с заданными параметрами.

Как это работает

Рисунок 1. Архитектура решения для Нагрузочного Мониторинга Сети

В ЦОДе устанавливается система мониторинга, включающая Зонд (их может быть несколько) и консоль управления. В удалённых офисах устанавливаются ответчики под Windows или Linux. Для проведения Нагрузочного Мониторинга Сети используется Тест пропускной способности сети на уровне TCP, входящий в состав всех продуктов семейства ProLAN SLA-ON (Администратор, Аналитик, Эксперт), в том числе в состав бесплатного продукта QuTester Plus.

Тест пропускной способности сети на уровне TCP – это VB-скрипт, выполняемый на Зонде. Зонд – компьютер под управлением любой версии Windows, на котором выполняется служба SLA-ON Probe. Работа Теста основана на генерации UDP и TCP-Трафика между Зондом и Ответчиками. UDP используется только для мониторинга доступности Ответчиков: Зонд с заданной периодичностью пингует Ответчики по UDP. Для нагрузки каналов и измерения их пропускной способности используется TCP. Ответчик – это служба Linux или Windows, которая может работать на серверах или встраиваться в активное оборудование, например, в роутеры.

В параметрах настройки Теста можно задавать:

  1. Режим генерации трафика:
    • Последовательно один канал за другим или все каналы одновременно. В первом режиме генерация осуществляется по очереди между Зондом и каждым Ответчиком. Во втором режиме генерация осуществляется между Зондом и всеми Ответчиками одновременно.
    • Мониторинг Сети и Нагрузочное Тестирование. В первом случае, между Зондом и Ответчиком с заданной периодичностью передаётся массив данных фиксированного размера (от 1 МБ до 100 МБ). Во втором случае между Зондом и Ответчиком (или Ответчиками) в течение определённого периода времени выполняется передача данных с максимально возможной интенсивностью.
  2. Размер блока данных, которыми осуществляется обмен между Зондом и Ответчиками.
  3. Направление передачи данных:
    • только от Зонда к Ответчику;
    • только от Ответчика к Зонду;
    • одновременно в обоих направлениях;
    • сначала в одном направлении, потом в другом направлении.
  4. Расписание генерации:
    • с заданной периодичностью (например, каждые 15 минут);
    • в заданное время (например, ежедневно в 0:15, 2:45 и т.п.).
  5. Дополнительные параметры:
    • использовать или не использовать при передаче данных алгоритм Найгла;
    • контролировать или не контролировать доступность Ответчиков по UDP;
    • включить (выключить) управление генерацией трафика; если режим включён, то сколько времени ожидать наступление условий генерации, прежде чем отложить генерацию (см. ниже).

В ходе теста измеряются следующие характеристики:

Характеристика Описание
1 READ (Mbps, %) Пропускная способность сети при передаче данных от Ответчика к Зонду. Во всех случаях одновременно измеряется абсолютная и относительная (относительно установленного значения) пропускная способность.
2 WRITE (Mbps, %) Пропускная способность сети при передаче данных от Зонда к Ответчику.
3 RD-WR (Mbps, %) Пропускная способность сети при встречной передаче данных между Зондом и Ответчиком.
4 TOTAL (Mbps, %) Общая пропускная способность сети при одновременной передаче данных между Зондом и несколькими Ответчиками. В зависимости от направления передачи данных может быть: TOTAL READ, TOTAL WRITE, TOTAL RD-WR.
5 AVERAGE (Mbps, %) Средняя пропускная способность сети при поочерёдной передаче данных между Зондом и несколькими Ответчиками. В зависимости от направления передачи данных может быть: AVERAGE READ, AVERAGE WRITE, AVERAGE RD-WR.
6 Responder Availability (%) Доступность Ответчиков по UDP. Проверка доступности Ответчиков может быть отключена.
7 TCP Link Availability (%) Доступность TCP-канала. TCP-канал считается недоступным, когда при доступности Ответчика UDP с ним невозможно установить связь по TCP и во время передачи данных происходит разрыв связи между Ответчиком и Зондом.

Ключевым преимуществом Нагрузочного Мониторинга Сети является поддержка Управляемой Генерации Трафика. Для этого в Зонд добавляется специальная программа Регулировщик, которая постоянно следит, можно или нельзя в данный момент выполнять генерацию трафика. Генерация трафика начнётся только в том случае, если Регулировщик говорит «Можно». Если в процессе генерации трафика Регулировщик скажет «Нельзя», то генерация прекращается. В простейшем случае, Регулировщиком может быть немного модифицированный Профессиональный тест оценки «здоровья» коммутаторов, поддерживающих MIB-II, выполняющий, в частности, мониторинг загруженности портов каналообразующего маршрутизатора.

Рисунок 2. Управляемая Генерация Трафика

Предположим, тестируется канал связи, подключённый к 6-му порту маршрутизатора; см. Рисунок 2. При этом Зонд подключён к 1-му порту, а пользователи – к 4-му порту. Предположим, Тест пропускной способности сети должен с 9:00 до 20:00 каждый час передавать 10 Мбайт данных от Ответчика к Зонду.

Генератор трафика постоянно следит за сигналом Регулировщика и начнёт генерацию трафика только в том случае, если Регулировщик говорит «Можно». А это произойдёт только в том случае, если утилизация порта 4 будет меньше определённого значения, например, 5%. Если в то время, когда должна начаться генерация трафика, Регулировщик говорит «Нельзя», то Генератор будет ждать определённое время. Если в течение этого времени он так и не дождётся сигнала «Можно» (снижения утилизации до 5%), то генерация трафика будет отложена до следующего часа. Начав генерацию трафика, Генератор продолжает контролировать сигнал Регулировщика, и если он увидит сигнал «Нельзя» (утилизацию порта 4 выше 5%), то сразу прекращает генерацию, фиксирует конфликт, и аннулирует результаты данного измерения.

Регулировщик может работать в фоне, и, таким образом, заранее знать, можно или нельзя в данный момент времени выполнять генерацию трафика (даже если его не спрашивают), а может запускаться по требованию (если проверка условий выполняется быстро). Первый режим предпочтительнее. Условия выдачи сигналов «Можно» и «Нельзя» могут быть самыми разными (не только утилизация портов). Это может быть, например, число активных подключений к базе данных или число активных пользователей какого-то бизнес-приложения. При необходимости Регулировщика можно отключать. Регулировщик не входит в состав Теста (т.к. практически всегда требует кастомизации), а поставляется дополнительно на возмездной основе.

Результаты Нагрузочного Мониторинга Сети

Набор получаемых результатов зависит от используемого продукта ProLAN. В приведённой ниже таблице приведено соответствие между используемыми продуктами ProLAN и результатами, которые с их помощью можно получить.

Используемый продукт Результаты
1 Бесплатный продукт QuTester Plus (только один канал единовременно + ограничения по отображению значений исторических данных)

ProLAN: Администратор
  1. Оперативный мониторинг. Отображение Светофора, и текущих значений Индикаторов и Метрик на Карте Cockpit приложения SLA-ON Operations. Посмотреть пример.
  2. Оперативный Мониторинг. Отображение историй Светофора и Индекса пропускной способности канала на Карте Dashboard приложения SLA-ON Operations. Посмотреть пример.
  3. Оперативный Мониторинг. Отображение историй Светофора и Индекса пропускной способности канала на Карте Plan приложения SLA-ON Operations. Посмотреть пример.
2 ProLAN: Аналитик
  1. Все возможности ProLAN: Администратор.
  2. Тактические отчёты. Отчёт о пропускной способности сети на уровне ТСР в формате MS Excel. Посмотреть пример.
  3. Ретроспективный анализ. Отображение исторических данных (Метрик и Светофоров) в программе TrendViewer.NET. Посмотреть пример
3 ProLAN: Эксперт
  1. Все возможности ProLAN:Аналитик
  2. Стратегические отчёты. Отчёт о Здоровье Сети. Посмотреть пример

Cкриншоты и примеры отчётов

Оперативный мониторинг. Приложение SLA-ON Operations. Карта Cockpit

Текущие значения и интегральные оценки (светофоры) пропускной способности канала связи и здоровья активного сетевого оборудование.

Оперативный мониторинг. Приложение SLA-ON Operations. Карта Dashboard

Индекс пропускной способности канала связи и Индексы здоровья активного сетевого оборудования. (Индекс – доля временных интервалов в процентах, в течение которых ни одна из метрик не выходила за диапазон допустимых значений.)

Оперативный мониторинг. Приложение SLA-ON Operations. Карта Plan

Индексы, Оценки (Светофоры) и текущие значения пропускной способности каналов связи.

Тактические отчёты. Приложение SLA-ON Operations. Отчёты в формате MS Excel

Статистически обработанные результаты пропускной способности каналов связи.

Ретроспективный анализ. Приложение TrendViewer.NET

Графики метрик и диаграммы оценок за прошедшее время

Стратегические отчёты. Приложение TrendViewer.NET SE. Отчёт о здоровье сети

Посмотреть пример Отчёта

Заключение

Рассмотренное в статье решение позволяет с минимальными затратами проводить аудит пропускной способности сети на уровне TCP. Такой аудит целесообразно проводить:

  1. Ежемесячно, для проверки качества услуг, предоставляемых NSP;
  2. Если внедряется новое бизнес-приложение, чтобы точно знать, что каналы связи имеют достаточную пропускную способность;
  3. При организации Service Level Management для определения SLR, SLO, SLT и разработки адекватного SLA;
  4. Чтобы получить из независимого источника документальное подтверждение качества работы сети (Due Diligence, объединение компаний, пришёл новый CIO и т.п.)

Если вы хотите проводить аудит регулярно, то вам следует приобрести постоянную лицензию на один из продуктов семейства ProLAN SLA-ON: Администратор, Аналитик, Эксперт. Если вам достаточно проводить аудит по требованию, то вы можете приобрести временную лицензию на Аналитик или Эксперт (минимально – 3 месяца) или воспользоваться услугами партнёров компании ProLAN. Если вы – ИТ-компания, и хотели бы проводить аудит пропускной способности сети у своих и наших клиентов, станьте партнёром ProLAN.

Мониторинг эмоций + Анализ речи

Сервис с Улыбкой

Подробнее ...

© 2013-2024 ProLAN
При полном или частичном использовании материалов ссылка на сайт обязательна (в интернете — гиперссылка).