20.1.2.1 Обнаружение анормальных измерений в исходных данных, проверка гипотезы о виде распределения данных | ![]() ![]() ![]() |
В соответствии со стандартом СТ СЭВ 545-77 анормальным называется результат наблюдения, который
по причинам случайного нарушения нормальных условий или грубых ошибок измерения
резко отклоняется от группы результатов
наблюдений, которые называются нормальными. При этом следует иметь в виду, что
резко отклоняющийся результат мог принадлежать той же генеральной совокупности,
что и остальные результаты наблюдений, но вероятность его появления мала. В
этом случае исключение такого результата приведет к ошибке расчетов. В
стандарте СТ СЭВ 545-77 решение
данной задачи рассмотрено в различных условиях наблюдения – при неизвестных
генеральном среднем и дисперсии, при известном одном из этих параметров, при
обоих известных параметрах. Из этих
вариантов обсудим простейший, когда среднее значение и
дисперсия
известны. Алгоритм принятия решения для этого
случая выглядит следующим образом.
Производится упорядочение выборки результатов наблюдения
. (2.1)
Подсчитываются величины
, (2.2)
или
сравнивают с величиной h, взятой из таблицы для заданного
уровня значимости
.
Пороговая константа h в
таблице рассчитывается исходя из
вероятности
выхода за границу h хотя бы одного отношения ν.
Алгоритм расчета для случаев, когда неизвестны значения
или
аналогичен приведенному выше и отличается
лишь тем, что вместо известных значений среднего и дисперсии используются их
оценки, а расчет пороговой константы h производится сложнее, чем это делается в соответствии с
соотношением (2.3). Данный расчет
приведен в приложении к СТ СЭВ 545-77.
Проверка гипотезы о виде распределения исходных данных может
быть произведена по критерию Пирсона (
он же называется критерий ). Суть
этого критерия состоит в следующем. Ранжированный статистический ряд n результатов измерений
анализируемой случайной величины разбивают на
интервалов и подсчитывают в каждом из этих
интервалов число значений m.
В результате получают экспериментальный ряд частот
(2.4)
Полагая гипотетическое интегральное распределение известным,
подсчитывают в этих же интервалах теоретические частоты
(2.5)
При этом расчет теоретических частот для каждого i– го интервала производится по формулам
(2.6)
Здесь и
соответственно верхняя и нижняя границы i- го интервала.
Далее рассчитывается мера расхождения теоретического и экспериментального распределений
(2.7)
Данная мера имеет распределение с
степенями свободы (
, f – число параметров теоретического распределения).
Гипотеза о том, что анализируемое экспериментальное
распределение принадлежит предполагаемому теоретическому распределению
принимается на заданном пользователем уровне значимости (
вероятность отвергнуть гипотезу, когда на самом деле ее следовало принять), если выполняется неравенство
(2.8)
Здесь - критическое значение статистики
,
которое находится из уравнения
(2.9)
Здесь - дифференциальное
распределение.
! См. также:
20.1.2 Оценки центра настройки и рассеяния параметров технологических объектов