Математика/Теория вероятностей и математическая статистика

 

Статников И.Н., Фирсов Г.И.

Институт машиноведения им. А.А.Благонравова РАН

АЛГОРИТМ ФОРМИРОВАНИЯ НОРМАЛЬНО РАСПРЕДЕЛЕННЫХ СЛУЧАЙНЫХ ЧИСЕЛ С ПОМОЩЬЮ ПЛП-ПОИСКА

 

Стандартная процедура образования нормально распределенных чисел hi с заданным математическим ожиданием М(h) и дисперсией D(h) = s2(h) состоит в реализации линейного преобразования типа

                                                    hi = Axi + B,                                                        (1)

где xi — нормально распределенное число с М(x) = 0 и s2(x) = 1. Тогда, применяя к формуле (1) операции взятия математического ожидания и дисперсии, получим

                                            М(h) = B, s2(h) = A2.                                                  (2)

Таким образом, точность вычислений по формулам (1) и (2) обусловлена точностью характеристик чисел

Широкое распространение для формирования чисел xi имеет следующий алгоритм [1]:

                                                                                            (3)

где qj Î (0; 1) — равномерно распределенное по вероятности псевдослучайное число со следующими характеристиками [2]:

                                          М(q) = 1/2, s2(q) = 1/12.                                             (4)

Очевидно, что теоретические значения xi случайных чисел, выработанных по формуле (3), с учетом (4) будут 0 и 1 независимо от числа n.

Однако, поскольку в реальных расчетах приходится иметь дело с выборками из конечного числа N элементов xi, значения xi при достаточно больших N заменяются их приближенными оценками:

                                                                                          (5)

Рассматривается метод построения нормально распределенных чисел xi, у которых выполняется точно равенство

                                                                                                               (6)

и при этом не ухудшаются значения s2(x). Метод основан на использовании свойств ПЛП-поиска [3]. Покажем, что, применяя ПЛП-поиск для выработки чисел xi по формуле (3), получаем  и, значит,

Для доказательства воспользуемся формулой (3), в которой числа qj - это псевдослучайные числа ЛПt-последовательности [2]. Данный датчик псевдослучайных чисел обладает свойством равномерности в смысле распределения r-мерных точек по ортантам r-мерного гиперкуба, отсутствием корреляции между составляющими r-мерного вектора Q = (q1, q2, …, qr), и, наконец, тем, что оба свойства сохраняются в пространстве большой размерности (). В данном датчике действует следующий алгоритм расчета чисел qij (i = 1,..., N; j = 1,..., r), где i - номер j-мерной точки Q = (qi1, …, qir); j - номер координаты этой точки. Номер точки i записывается в двоичной форме следующим образом: e1e2...em, где m - максимальное число двоичных разрядов, а само es (s = 1, 2, ..., m) есть 0 или 1. В этом случае qij = V1 * V2 * V3 * ... * Vm, где * - операция поразрядного сравнения по mod 2; Vs - направляющий числитель из таблицы направляющих числителей, приведенной, в частности, в работах [2, 3]. Если es = 0, то Vs = 0, если es = 1, то Vs принимает соответствующее значение, стоящее на пересечении s-го столбца и j-той строки в таблице направляющих числителей.

Запишем выражение для

                                                       (7)

В алгоритме ПЛП-поиска всегда берется N1 = 2n, а N2 = 2n+1 - 1, где n = 1, 2, 3,... Подсчитаем сумму Sqij по индексу i. Получим

                                                                     (8)

где N = N2 - N1 + 1 = 2n - число членов выборки. С учетом (8) выражение (7) приобретает следующий вид:

                                                                                 (9)

что и требовалось доказать.

Нормальность чисел xi, формируемых по предлагаемому алгоритму, проверялась по критерию c2. Для этого генерировались по формуле (3) с помощью чисел qij последовательности N нормальных чисел xi. При этом число серий Т оставалось неизменным (Т = 16), а число Мj n-мерных точек gij бралось разным (Мj = 8; 16; 32; соответственно число N = TМj). Варьировалось также число n. Результаты расчетов представлены в табл. 1, где на пересечении столбца и строки стоит дробь, в числителе который — расчетное значение c2, в знаменателе - теоретическое [4] значение при выбранном уровне значимости р и получившемся числе степеней свободы m, которое проставлено справа от дроби. В данном эксперименте был выбран уровень значимости р = 0,01, т. е. проверялась следующая нулевая гипотеза: если  то предположение о нормальности чисел xi можно считать оправданным, и наоборот. Как видно из табл. 1, нулевая гипотеза оправдывается уже при малых N и даже при n = 3.

Качество нормальных чисел (среднее xср, дисперсия sв, асимметрия А, эксцесс E) проверялось экспериментально на ЭВМ. Для сравнения те же характеристики вычислялись для нормальных чисел xi, также полученных по формуле (3), но при этом номера чисел j брались фиксированными в отличие от ПЛП-поиска. При экспериментах по одному и другому способу исследовалось по 12 выборок в N членов, где N = 26, 27, 28 и 29 чисел xi.

Таблица 1

 

N

n

 

3

6

12

128

256

 

Таблица 2

 

N

sA

sE

 

n = 3

1,0132

0,0475

- 0,1100

0,1980

- 0,2792

0,2887

64

n = 6

1,0016

0,0787

- 0,1716

0,2648

- 0,1774

0,6026

 

n = 12

1,0430

0,1120

- 0,0510

0,3586

  0,2420

0,7338

 

n = 3

1,0042

0,0417

  0,0496

0,1632

- 0,4788

0,2164

128

n = 6

1,0334

0,0642

- 0,0044

0,1610

- 0,3304

0,2523

 

n = 12

0,9971

0,0558

  0,0151

0,2065

- 0,0204

0,3438

 

n = 3

0,9904

0,0166

  0,0592

0,1251

- 0,4225

0,1134

256

n = 6

0,9853

0,0501

  0,0622

0,1055

- 0,1971

0,2367

 

n = 12

0,9974

0,0572

  0,0464

0,1064

- 0,0891

0,3422

 

n = 3

0,9984

0,0047

  0,0300

0,0307

- 0,3966

0,0836

512

n = 6

1,0030

0,0391

  0,0385

0,0776

- 0,2640

0,1811

 

n = 12

1,0024

0,0547

  0,0019

0,1026

- 0,0886

0,1808

Таблица 3

 

N

 

I

  0,4512

0,0401

0,8980

0,0097

64

II

  0,0011

0,0146

0,9630

0,1021

 

III

  0,0006

0,0226

0,9922

0,0459

 

I

  0,4180

0,0267

0,9319

0,0112

128

II

- 0,0015

0,0101

0,9520

0,0660

 

III

- 0,0050

0,0084

0,9864

0,0409

 

I

  0,2897

0,0049

0,9559

0,0047

256

II

- 0,0040

0,0069

0,9884

0,0764

 

III

  0,0013

0,0076

0,9787

0,0217

 

I

  0,2560

0,0049

0,9253

0,0011

512

II

- 0,0005

0,0055

1,0080

0,0352

 

III

  0,0012

0,0033

1,0029

0,0262

 

N

sA

sE

 

I

- 0,1640

  0,0630

  0,9600

0,1395

64

II

- 0,0304

  0,3366

  0,1455

0,6243

 

III

- 0,0553

- 0,2766

  0,0085

0,4014

 

I

- 0,2370

  0,0420

  0,7165

0,0845

128

II

- 0,0121

  0,02390

  0,1086

0,3951

 

III

- 0,0932

  0,1247

- 0,0294

0,3025

 

I

  0,0100

  0,0230

  0,4130

0,0158

256

II

- 0,0702

  0,1500

  0,0388

0,3194

 

III

- 0,0747

  0,0898

- 0,0575

0,1766

 

I

- 0,0540

  0,0061

  0,5998

0,0209

512

II

- 0,1225

  0,0927

- 0,1012

0,1087

 

III

  0,0602

  0,1214

- 0,1777

0,0906

 

Для всех 12 выборок при каждом N подсчитывались свои интегральные характеристики по обычным формулам:

                  (10)

где Т = 12. Для оценок (10) также подсчитывались и эмпирические значения их дисперсий. Результаты численных экспериментов при расчете чисел xi с использованием ПЛП-поиска приведены в табл. 2, а в табл. 3 - результаты экспериментов для случая фиксированных комбинаций номеров j (I - j = 1, 2,..., 12; II - j = 25, 26,..., 37; III - j=38, 39,..., 49; при этом в формуле (3) всюду бралось n = 12).

Сопоставление одноименных выборочных характеристик в табл. 2 и 3 показывает, что особого преимущества, за исключением значений xср, у каждого из двух способов формирования нормально распределенных чисел нет. В обоих случаях с ростом N наблюдается сходимость выборочных оценок дисперсий  причем в табл. 2 эта сходимость наблюдается и для n = 3. Сходимость выборочных значений асимметрии А к нулю несколько выше в табл. 2, чем в табл. 3. Сходимость выборочных значений эксцесса Е с ростом N в обеих таблицах примерно одинакова.

Следует отметить, что по времени реализации предлагаемый способ формирования чисел xi, конечно, уступает многим другим, например способу простого суммирования. Однако он может оказаться достаточно эффективным в задачах моделирования динамических систем, находящихся под воздействием случайных возмущений. Так, при исследовании механических колебательных систем методом ПЛП-поиска, описанном в работе [5], имитация различных вариантов в пространстве параметров может осуществляться с помощью датчиков ПЛП-поиска, а формирование случайных возмущающих воздействий может быть поручено описанному алгоритму, поскольку в основе и метода ПЛП-поиска, и способа создания нормальных чисел лежит один и тот же датчик псевдослучайных чисел, программа которого для пакета MATLAB приведена в работе [6]. В качестве примера возможного эффективного использования такого комбинированного подхода можно привести задачу оценки информативности различных параметров динамической системы для ее диагностики [7].

 

ЛИТЕРАТУРА

 

1. Полляк Ю.Г. Вероятностное моделирование на электронных вычислительных машинах. М.: Сов. радио, 1971. - 356 с.

2. Соболь И. М. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. - 288 с.

3. Статников И.Н., Фирсов Г.И. ПЛП-поиск и его реализация в среде MATLAB // Проектирование инженерных и научных приложений в среде MATLAB. - М.: ИПУ РАН, 2004. - С.398-411.

4. Колкот Э. Проверка значимости. М.: Статистика, 1978. - 242 с.

5. Статников И.Н., Фирсов Г.И. Проектирование динамических систем и их информационное обеспечение // Информационные системы и модели в научных исследованиях, промышленности и экологии. - Тула: Изд-во ТулГУ, 2004. - С.22-27.

6. Статников И.Н., Фирсов Г.И. Об одной технологии дискретного зондирования пространства исследуемых параметров // Современные информационные технологии. - Пенза: Пензенская гос. технол. академия, 2004. - С.63-68.

7. Статников И.Н., Фирсов Г.И. Методология планируемого вычислительного эксперимента в задачах обеспечения вибрационной надежности машин на различных стадиях жизненного цикла // ИПИ (CALS)-2003. Информационные технологии в управлении жизненным циклом изделий. - СПб.: Центр печати «СеверРосс», 2003. - С.22-24.