20.1.2.1 Обнаружение анормальных измерений в исходных данных, проверка гипотезы о виде распределения данных

В соответствии со стандартом СТ СЭВ 545-77 анормальным называется результат наблюдения, который по причинам случайного нарушения нормальных условий или грубых ошибок измерения резко отклоняется от группы результатов наблюдений, которые называются нормальными. При этом следует иметь в виду, что резко отклоняющийся результат мог принадлежать той же генеральной совокупности, что и остальные результаты наблюдений, но вероятность его появления мала. В этом случае исключение такого результата приведет к ошибке расчетов. В стандарте СТ СЭВ 545-77 решение данной задачи рассмотрено в различных условиях наблюдения – при неизвестных генеральном среднем и дисперсии, при известном одном из этих параметров, при обоих известных параметрах. Из этих вариантов обсудим простейший, когда среднее значение и дисперсия известны. Алгоритм принятия решения для этого случая выглядит следующим образом.

Производится упорядочение выборки результатов наблюдения

. (2.1)

Подсчитываются величины

, (2.2)

или сравнивают с величиной h, взятой из таблицы для заданного уровня значимости . Пороговая константа h в таблице рассчитывается исходя из вероятности выхода за границу h хотя бы одного отношения ν.

. (2.3)

Алгоритм расчета для случаев, когда неизвестны значения или аналогичен приведенному выше и отличается лишь тем, что вместо известных значений среднего и дисперсии используются их оценки, а расчет пороговой константы h производится сложнее, чем это делается в соответствии с соотношением (2.3). Данный расчет приведен в приложении к СТ СЭВ 545-77.

Проверка гипотезы о виде распределения исходных данных может быть произведена по критерию Пирсона ( он же называется критерий ). Суть этого критерия состоит в следующем. Ранжированный статистический ряд n результатов измерений анализируемой случайной величины разбивают на интервалов и подсчитывают в каждом из этих интервалов число значений m. В результате получают экспериментальный ряд частот

(2.4)

Полагая гипотетическое интегральное распределение известным, подсчитывают в этих же интервалах теоретические частоты

(2.5)

При этом расчет теоретических частот для каждого i– го интервала производится по формулам

(2.6)

Здесь и соответственно верхняя и нижняя границы i- го интервала.

Далее рассчитывается мера расхождения теоретического и экспериментального распределений

(2.7)

Данная мера имеет распределение с степенями свободы ( , f – число параметров теоретического распределения).

Гипотеза о том, что анализируемое экспериментальное распределение принадлежит предполагаемому теоретическому распределению принимается на заданном пользователем уровне значимости ( вероятность отвергнуть гипотезу, когда на самом деле ее следовало принять), если выполняется неравенство

(2.8)

Здесь - критическое значение статистики , которое находится из уравнения

(2.9)

Здесь - дифференциальное распределение.

! См. также:

20.1.2 Оценки центра настройки и рассеяния параметров технологических объектов