Технические
науки/6. Электротехника и радиоэлектроника
Ст. преп. Мирзакулова Ш.А.
Алматинский университет энергетики и связи
ИССЛЕДОВАНИЯ ГИПОТЕЗЫ СООТВЕТСТВИЯ ЭМПИРИЧЕСКОГО
РАСПРЕДЕЛЕНИЯ ТЕОРИТИЧЕСКОМУ
В настоящее время все большей
популярностью пользуются непараметрические методы обработки статистических
данных. Эти методы используются в случае, когда неизвестны параметры
распределения исследуемой (эмпирической) выборки. В работе в среде Excel был
выполнен анализ распределений числа широковещательных запросов пакетов
протокола ARP в локальную сеть. Осуществлена
проверка гипотезы статистического распределения Пуассоновскому распределению с
применением критерия согласия Пирсона.
Одним из основных элементов
СМО является входной поток заявок (пакетов, требований). Если поток заявок
обладает свойствами стационарности, ординарности и отсутствия последствия, то
такой поток называется простейшим (или пуассоновским) потоком требований.
Вероятность поступления m требований
за промежуток времени t в пуассоновском потоке определяется из выражения [1]:
(1)
Время между соседними заявками
распределено по экспоненциальному закону с плотностью вероятности:
(2)
Основной задачей при
проведении измерения реального трафика данных (широковещательных запросов ARP в локальную сеть) осуществлялось с целью практической
проверки гипотезы соответствия эмпирического распределения теоретическому
распределению в соответствии классической теории телетрафика.
Исходные данные получены с помощью
программы – сниффер Wireshark в течение пяти часов с магистрали Интернет
провайдера. При этом исследован поток запросов протокола ARP. Измерено 493 пакетов ARP систем-отправителей в локальную сеть по определению
адреса канального уровня по известному адресу сетевого уровня. На основании
измеренных данных осуществлен расчет значений интервалов между пакетами и
составлен временной ряд из 492 значений .
Оценим эмпирическое распределение первым
способом и результат обработки трафика (интервалов между поступлениями запросов
ARP) представим в таблице 1.
Таблица 1 – Числовые характеристики
случайной величины
Наименование |
Значение |
Математическое ожидание |
1,367 |
Дисперсия |
3,816 |
Среднеквадратическое отклонение |
1,953 |
Коэффициент вариации |
1,43 |
Для простейшего потока верно: Определим .
На рисунке 1 показано
распределение количества запросов протокола ARP в единицу времени (эмпирическое) и на которой видно неравномерность
интенсивности поступления пакетов и пульсирующий характер трафика с существенной
дисперсией, наличием резких всплесков, группировкой в «пачки» и или их мало в
других интервалах времени. При сравнительно небольшом среднем значении
поступления пакетов имеются пиковые значения. Для приведенного трафика
математическое ожидание числа пакетов составляет 1,64 на интервале 300 м, а
пиковые значения достигают 6, 7 и выше (10 пакетов). Соответственно дисперсия и
среднеквадратическое отклонение равны 4,39 и 2,095.
Рисунок 1 – Распределение числа пакетов в единицу
времени ARP
На рисунке 2 в трехмерном
изображении представлено эмпирическое распределение. Характерной особенностью
распределения Пуассона являются совпадения математического ожидания и
дисперсии, однако измеренное распределение числа пакетов в единицу времени
имеет не равные значения математического ожидания и дисперсии (1,64 не
равен 4,39).
Рисунок 2
– Эмпирическое распределение пакетов в единицу времени
Для проверки согласия
полученного экспериментального закона распределения с пуассоновским
распределением осуществим по критерию согласия Пирсона. Построим графики
(рисунок 3), полученные на основе формулы (1) и при этом получаем теоретическое (вероятностное) распределение (ряд 1) и наложим на него график полученный в результате
обработки измеренных данных (ряд 2).
Рисунок 3 – Теоретическое и
эмпирическое распределение данных
Осуществим статистическую проверку гипотезы
для того, чтобы использовать полученную по выборке информацию для суждения о
законе распределения измеренных данных. Обычно статистическая гипотеза проверяется
с помощью критериев согласия, которые позволяют оценить соответствие того или
иного теоретического закона распределения некоторому эмпирическому ряду
распределения. Критерий согласия должен дать ответ на вопрос, можно ли принять
для данного эмпирического распределения модель, выражаемую теоретическим
законам распределения Пуассона. В математической статистике близость
эмпирических и теоретических распределений оценивают с помощью критериев
согласия, которые разработаны многими учеными. Если оцениваются вероятность
расхождения между эмпирическими и теоретическими данными используют критерии
согласия Пирсона и Колмогорова, в обратных случаях критерии согласия
Романовского и Ястремского.
Известный английский
статистик К. Пирсон в 1900 году предложил для оценки расхождения между
эмпирическими и теоретическими частотами критерий, который основан на
определении величины хи-квадрат .
Расчетная формула критерия равна:
(3)
где m – эмпирические частоты рассматриваемого распределения;
m1 –
теоретические частоты;
n - число групп наблюдений.
Пирсоном было найдено распределение величин
хи-квадрат, для которого были составлены специальные таблицы в [1] в табл.4, в
которой указаны значения в зависимости от r и p. Используя таблицу
распределения Пирсона, по вычисленной величине хи-квадрат найдем вероятность того, что
хи-квадрат эмпирическое значение превысит хи-квадрат теоретическое. В результате проведенных расчетов
искомая величина хи-квадрат составляет значение 14,55. Значение равно 0,1.
Малая величина указывает на недостаточное совпадение
предполагаемого закона распределения с полученным в результате эксперимента. В
этом случае гипотеза о распределении Пуассона измеренного распределения
отменяется.
Список литературы
1. Вентцель Е.С., Теория вероятностей – М.: Наука, 1969.
– 576 с.