20.1.2.1 Обнаружение анормальных измерений в исходных данных, проверка гипотезы о виде распределения данных |
В соответствии со стандартом СТ СЭВ 545-77 анормальным называется результат наблюдения, который по причинам случайного нарушения нормальных условий или грубых ошибок измерения резко отклоняется от группы результатов наблюдений, которые называются нормальными. При этом следует иметь в виду, что резко отклоняющийся результат мог принадлежать той же генеральной совокупности, что и остальные результаты наблюдений, но вероятность его появления мала. В этом случае исключение такого результата приведет к ошибке расчетов. В стандарте СТ СЭВ 545-77 решение данной задачи рассмотрено в различных условиях наблюдения – при неизвестных генеральном среднем и дисперсии, при известном одном из этих параметров, при обоих известных параметрах. Из этих вариантов обсудим простейший, когда среднее значение и дисперсия известны. Алгоритм принятия решения для этого случая выглядит следующим образом.
Производится упорядочение выборки результатов наблюдения
. (2.1)
Подсчитываются величины
, (2.2)
или сравнивают с величиной h, взятой из таблицы для заданного уровня значимости . Пороговая константа h в таблице рассчитывается исходя из вероятности выхода за границу h хотя бы одного отношения ν.
Алгоритм расчета для случаев, когда неизвестны значения или аналогичен приведенному выше и отличается лишь тем, что вместо известных значений среднего и дисперсии используются их оценки, а расчет пороговой константы h производится сложнее, чем это делается в соответствии с соотношением (2.3). Данный расчет приведен в приложении к СТ СЭВ 545-77.
Проверка гипотезы о виде распределения исходных данных может быть произведена по критерию Пирсона ( он же называется критерий ). Суть этого критерия состоит в следующем. Ранжированный статистический ряд n результатов измерений анализируемой случайной величины разбивают на интервалов и подсчитывают в каждом из этих интервалов число значений m. В результате получают экспериментальный ряд частот
(2.4)
Полагая гипотетическое интегральное распределение известным, подсчитывают в этих же интервалах теоретические частоты
(2.5)
При этом расчет теоретических частот для каждого i– го интервала производится по формулам
(2.6)
Здесь и соответственно верхняя и нижняя границы i- го интервала.
Далее рассчитывается мера расхождения теоретического и экспериментального распределений
(2.7)
Данная мера имеет распределение с степенями свободы ( , f – число параметров теоретического распределения).
Гипотеза о том, что анализируемое экспериментальное распределение принадлежит предполагаемому теоретическому распределению принимается на заданном пользователем уровне значимости ( вероятность отвергнуть гипотезу, когда на самом деле ее следовало принять), если выполняется неравенство
(2.8)
Здесь - критическое значение статистики , которое находится из уравнения
(2.9)
Здесь - дифференциальное распределение.
! См. также:
20.1.2 Оценки центра настройки и рассеяния параметров технологических объектов