Критерий Неймана-Пирсона для абсолютно непрерывных моделей

Критерий МП получается из критерия минимального среднего риска, если принять, что П 12 = 1/P(S 1 ), П 21 = 1/P(S 2 ).

При этом оптимальный приемник принимает решение таким образом, что минимизируется значение

l п = P(y 2 /S 1 ) + P(y 1 /S 2 ) . (2.3)

Критерий МП иногда называется критерием минимума потерь информации , так как оптимальное правило решения в этом случае устанавливает границу подпространства (рис.1.2) так, чтобы уменьшить вероятность искажения того сигнала, вероятность передачи которого меньше (следовательно, этот сигнал содержит больше информации).

Критерий МП применяется в системах связи также в тех случаях, когда априорные вероятности Р(S 1 ) и P(S 2 ) неизвестны.

3. Критерий идеального наблюдателя.

Если весовые коэффициенты П 12 = П 21 =1, то критерий минимального среднего риска минимизирует среднюю вероятность ошибки

p ош = P(S 1 )P(y 2 /S 1 ) + P(S 2 )P(y 1 /S 2 ) (2.4)

и называется критерием идеального наблюдателя.

Критерий идеального наблюдателя широко применяется в системах связи, когда искажения любого сигнала одинаково нежелательны и совпадает с критерием МП, если вероятности Р(S 1 ) = P(S 2 ) = 0,5 .

4. Критерий Неймана-Пирсона.

В некоторых системах передачи информации (системах радиолокации, некоторых системах сигнализации) имеется необходимость фиксирования (задания) одной из условных вероятностей Р(у 1 /S 2 ) илиР(у 2 /S 1 ). При этом оптимальный приемник принимает решение таким образом, чтобы минимизировать ту условную вероятность, которая не задана. Критерий оптимальности, который используется таким приемником называетсякритерием Неймана-Пирсона .

Например, задана вероятность пропуска сигнала S 1 , то естьР(у 2 /S 1 ) = .. Тогда критерий Неймана-Пирсона требует минимизации условной вероятностиР(у 1 /S 2 ), обеспечивая заданное значение. ВероятностьР(у 1 /S 2 ) обычно обозначается , тогда (1- ) = Р(у 2 /S 2 ) называется качеством решения. Правило решения Неймана-Пирсона обеспечивает(min ) илимах(1- ) при = const .

Приемник при использовании критерия Неймана-Пирсона строится таким образом, чтобы получить достаточно малую вероятность пропуска cигнала(цели) Р(у 2 /S 1 )= .. С тем, что при этом может (несмотря на минимизацию=Р(у 1 /S 2 ) ) оказаться много ложных тревог, приходится мириться. В этом и заключается сущность данного критерия.

3. Отношение правдоподобия

Различение сигналов в приемном устройстве обычно осуществляют путем установления некоторого "порога" на выходе приемника, фактически играющего роль "границы подпространств" сигналов S 1 иS 2 .

На рис. 3.1. приведен некоторый дискретный сигнал х(t) (импульсы постоянного тока), на который накладывается флюктуационная помеха и проведена пунктирная линия, соответствующая выбранному порогух п .

Если величина x(t) < x п , приемник выдает сигналS 1 , если жеx(t) >x п , приемник выдает сигнал S 2 . Как видно из рисунка, на отрезке времениt 1 , t 2 под действием сильной помехи величина х > x п , т. е. в этом случае приемник может выдать сигналS 2 , хотя передавалсяS 1 .

Различные критерии приема дискретных сигналов фактически отличаются способом установления величины порога. Данная задача проще всего решается с помощью "отношения правдоподобия ". Для рассмотрения этого вопроса обратимся к рис. 3. 2.

Если бы на входе приемника отсутствовали помехи, мы имели бы дело с "чистыми" сигналами S 1 иS 2 и задача разделения сигналов была бы очень проста. При наличии же помех сигналы искажаются и для их описания приходится использовать вероятностное пространство. Сами сигналы вместе с помехами описываются уже функциями плотности вероятности w(x/S 1 ) и w(x/S 2 ), которые изображены на рис. 3.2. (эти функции умножены также на весовые коэффициентыП 12 Р(S 1 ) иП 21 Р(S 2 )). На этом же рисунке показан порог х п .

Заштрихованная часть рисунка левее х п имеет площадь, равную

П 21 Р (S 2 )w(x/S 2 )dx = П 21 Р (S 2 )P(x/S 2 ), (3.1)

а заштрихованная часть правее х п имеет площадь, равную

П 12 Р (S 1 )w(x/S 1 )dx = П 12 Р (S 1 )P(x/S 1 ), (3.2)

Сумма этих величин, в соответствии с формулой (2.1), есть средний рискR ср . Из рис. 3.2. видно, чтоR ср будет минимальным, когда минимальна суммарная площадь под кривыми. Это будет в том случае, если величинах п соответствует точке пересечения кривых на рис. 3.2. Следовательно, условием полученияmin{R ср } является такой порогх п , при котором наступает равенство ординат приведенных кривых, т. е.

П 12 Р (S 1 )w(x/S 1 )dx = П 21 Р (S 2 )w(x/S 2 ), (3.3)

откуда получаем следующее соотношение:

. (3.4)

Стоящее слева выражение называется отношением правдоподобия

(х) = , (3.5)

а w(x/S i ), которая представляет собой плотность вероятности того, что принятый сигнал х образовался при передаче сигнала S i , обычно называетсяфункцией правдоподобия (функцией правдоподобия является также любая монотонная функция от w(x/S i ), напримерlog[ w(x/S i )]).

Чем больше значение w(x/S i ), тем более вероятно, чтох содержит сигналS i (это очевидно из рис. 3.2). Справа стоящее выражение называетсяпороговым отношением правдоподобия

0 = . (3.6)

Приемник, использующий отношение правдоподобия, работает следующим образом.

1. Анализируя поступающий на его вход сигнал, вычисляет отношение правдоподобия (х).

2. По известным значениям априорных вероятностей Р(S 1 ) иP(S 2 ), а также заданным весовым коэффициентомП 21 и П 12 , вычисляется пороговое отношение правдоподобия 0 .

3. Величина (х) сравнивается с 0 ,

если (х) > 0 , приемник выдает сигнал S 1 ,

в противном случае сигнал S 2 . (3.7)

Выражение (3.7) является правилом решения Ф(х) решающего устройства, показанного на рис.1.3.

Правило решения (3.7) является общим для двоичных систем связи, использующих любой критерий оптимального приема; отличие только в значении порога 0 .

Если приемник работает по критерию минимального среднего риска, величина 0 определяется формулой (3.6).

Для критерия идеального наблюдателя, в этой формуле коэффициенты

П 12 = П 21 = 1 и тогда 0 = P(S 2 )/ P(S 1 ) , (3.8)

Для критерия максимального правдоподобия

П 12 = 1/ P(S 1 ) , П 21 = 1/ Р (S 2 ), тогда 0 =1. (3.9)

Если приемник использует критерий Неймана-Пирсона, то отношение правдоподобия (х) становится случайной величиной, так как в равенстве (3.1) Р(у 1 /S 2 ) =(задается потребителем). Пороговое отношение правдоподобия определяется как верхний предел интеграла

(3.10)

где w() - плотность распределения отношения правдоподобия (х).

Правило принятия решения приемником с использованием отношения правдоподобия рассмотрим на следующих примерах.

Условия задачи.

Пусть на вход приемника поступает аддитивная смесь сигнала (дискретная амплитудная модуляция) и помехи:

Где i=1,2;

n(t) флюктуационная помеха типа гауссовского шума с дисперсией.

На протяжении длительности одной элементарной посылки в решающей схеме приемника в синхронные моменты времени t 1 иt 2 произведено два отсчета(замера) сигналаx(t) , причем t = t 2 -t 1 больше интервала корреляции помехиn(t) . Измеренные значенияx(t 1 )= x 1 = 0,2 B; x(t 2 )= x 2 = 0,3 B. Амплитуда сигнала A =0,4 B.

Определить отношение правдоподобия и принять решение по критерию идеального наблюдателя, какой из двух сигналов (S 1 или S 2 ) поступил на вход приемника для двух случаев:

б );.

Решение задачи(когерентный прием).

1. Найдем отношение правдоподобия.

Плотность вероятности сигнала x(t)=S 1 (t)+n(t) имеет вид

.

Так как на протяжении элементарного сигнала производятся два отсчета, то для нахождения отношения правдоподобия требуется найти двухмерную плотность вероятностей w 2 (x 1 x 2 /s 1 ) . Учитывая, что отсчеты некоррелированы (t больше интервала корреляции), а помеха распределена по гауссовскому закону, эти отсчеты можно считать независимыми. В этом случае двухмерная плотность вероятностей равна произведению одномерных плотностей

.

Аналогично

.

Отношение правдоподобия

.

Подставляя численные значения A, n , x 1 , x 2 , получим: (0,2;0,3)= 2,7.

2.Применяем правило решения (3.7).

а ) Пороговое отношение правдоподобия приP(s 1 )=P(s 2 )=0,5

.

В нашем случае (x 1 x 2 )=2,7 > 0 =1 и приемник выдает сигнал S 1 .

б) Пороговое отношение правдоподобия приP(s 1 )=0,2 и P(s 2 )=0,8

.

В этом случае (x 1 x 2 )=2,7 < 0 =4 и приемник выдает сигналS 2 .

Полученные результаты вполне объяснимы: в случае a) измеренное значениеx(t 1 )=0,2B соответствует половине амплитудыА =0,4В, а измеренное значениеx(t 2 )=0,3B ближе к сигналуS 1 , поэтому при равной вероятности сигналов приемник выдает решение в пользу сигналаS 1 ; в случаеб ) измеренные значения сигнала ближе кS 1 , но зато сигналS 2 (t) встречается в 4 раза чаще, чем сигналS 1 (t), и точное решение задачи с учетом всех обстоятельств во втором случае получается в пользу сигнала S 2 .

Решение задачи(некогерентный прием).

Решим эту же задачу в предположении, что в приемнике используется обычный амплитудный детектор.

Найдем отношение правдоподобия для этого случая. Плотность вероятности x(t) при передаче сигнала S 1 (t) определяется обобщенным законом Релея

,

а плотность вероятности x(t) при передаче сигналаS 2 (t) определяется простым законом Релея

.

Как и в предыдущем примере, отношение правдоподобия будет определяться отношением двухмерных плотностей вероятности. После простых преобразований получаем

.

Подставляя сюда численные значения А, n , x 1 , x 2 , получим

Как и в предыдущем примере, а) 0 =1 и б) 0 =4 .

В обоих случаях (x 1 x 2 )< 0 и в обоих случаях приемник выдает решение в пользу сигнала S 2 (t) .

Сравнивая случаи принятия решения решающей схемой приемника при когерентном и некогерентном приеме, невольно возникает вопрос: почему получаются разные результаты в случае а) .

Дело в том, что при когерентном приеме сигналы x(t) распределены по гауссовскому закону и оптимальный порогx o , определяемый точкой пересечения функций P(S 1 ) w(x/s 1 ) иP(S 2 ) w(x/s 2 ) (рис. 3.3), в этом случае (когдаP(S 1 ) =P(S 2 ) и 0 =1) соответствует половине амплитуды сигнала S 1 (t) ; измеренные же значения сигналаx(t) близки к пороговому значению и ближе к сигналу S 1 (t) . Однако при некогерентном приеме сигналы x(t) распределены по законам Релея и оптимальный порогx o значительно выше, чем половина амплитуды сигнала S 1 (t) (рис. 3.4). Поэтому те же измеренные значенияx(t 1 ) иx(t 2 ) оказываются дальше от порога в области сигналаS 2 (t) и решающая схема приемника при заданных в условиях задачи вероятностях сигналовS 1 (t) иS 2 (t) выдает решение в пользу сигналаS 2 (t) .

Учитывая, что при когерентном приеме уровень помех на входе решающей схемы существенно ниже, чем при некогерентном, более вероятно, что ошибочное решение принял некогерентный приемник.

Ситуация, в которой практически невозможно определить априорную вероятность передачи отдельных элементарных сообщений, а последствия ошибок разного рода неодинаковы, типична для радиолокации, когда приёмник, анализируя принимаемое колебание z (t ) (отражённый сигнал плюс помеха), должен определить, имеется в данном направлении и на данном расстоянии объект наблюдения (цель) или нет. Как правило, априорная вероятность наличия отражённого от цели сигнала (передачи 1) заранее не известна. Последствия двух родов ошибок - ложной тревоги (приемник фиксирует, что цель существует, в то время как в действительности её нет) и пропуска цели (приёмник отмечает отсутствие цели, в то время как фактически она имеется) - неравноценны.

В этой и других сходных ситуациях чаще всего пользуются критерием приёма, известным под названием критерия Неймана-Пирсона. Суть его заключается в том, что решающая схема считается оптимальной, если при заданной вероятности ложной тревоги р ЛТ обеспечивается минимальная вероятность пропуска цели р прц . Введём в рассмотрение функции правдоподобия гипотезы об отсутствии цели w (z|0)и о наличии цели w (z|1)

Очевидно, что можно различными способами разбить пространство принимаемых колебаний z(t ) на две области: B 0 (область решения об отсутствии цели) и B 1 , (о наличии цели) -так, чтобы вероятность ложной тревоги

равнялась заданной величине. Поскольку в локации символ 0 (отсутствие цели) передаётся паузой, то w (z |о) - это плотность распределения помехи. Следовательно, вероятность ложной тревоги определяется вероятностными характеристиками помехи и выбором области B 1 . Но от выбора этой области зависит и вероятность правильного обнаружения цели:

где p прц - вероятность пропуска цели.

Интегралы в (16), (17) и в аналогичных других формулах, взятые по векторной переменной, очевидно, многократные.

Максимизация (17) при заданной величине (16) достигается, если решение о наличии цели принимается при выполнении неравенства

,

где l - пороговый уровень, определяемый заданной вероятностью ложной тревоги р ЛТ.

Существуют и другие критерии качества приёма, не требующие знания априорных вероятностей символов.

В технике связи преимущественно применяют правило максимального правдоподобия (12), (13). В том случае, когда все символы передаются равновероятно, правило максимального правдоподобия реализует критерий идеального наблюдателя. Однако очень часто это правило решения применяют и при неизвестных или известных, но не одинаковых априорных вероятностях символов. Конечно, оно не обеспечивает в этих случаях максимума вероятности правильного приёма. Изменив решающую схему на схему, построенную по правилу максимальной апостериорной вероятности (6), реализующему критерий идеального наблюдателя, можно было бы уменьшить вероятность ошибок. При этом, очевидно, пришлось бы сократить области приёма маловероятных и расширить области высоко вероятных символов. В результате редко передаваемые символы принимались бы менее надёжно, нежели часто передаваемые. Но редкие символы несут больше информации, чем частые. Поэтому переход от правила максимального правдоподобия к правилу максимальной апостериорной вероятности, хотя и уменьшает безусловную вероятность ошибки, может привести к увеличению потери информации при демодуляции. Легко показать, что правило максимального правдоподобия, реализует критерий минимума среднего риска (15), если положить L ij = 0 при i=j и L ij = 1/p (b i ) при j¹i.

Заключение

Выбор критерия качества приема определяет порядок разбиения пространства принимаемых сигналов, т.е. выбор оптимальной решающей схемы приёмного устройства.

В технике связи преимущественно применяют правило максимального правдоподобия, решающую схему которого называют оптимальной.

Разработал

Доктор военных наук, профессор

Обычно в приёмных устройствах демодулятору предшествуют усилители и преобразователи частоты. Здесь все они считаются включёнными в состав канала. В ряде случаев именно они являются основными источниками аддитивных помех канала.

Начало этого отрезка для удобства совместим с началом координат. В принципе интервал анализа на приёме не всегда совпадает с тактовым интервалом Т (см. ниже). Сигналы на тактовом интервале часто будем называть элементом сигнала.

В математической теории связи это разбиение и называют решающей схемой. Заметим, что в некоторых случаях пользуются решающей схемой со стиранием, или отказом от решения. Это значит, что m областей не охватывают всего пространства сигналов и если приходящий сигнал не попадает ни в одну из этих областей, то принимается решение о стирании либо о невозможности определить передаваемый символ.

Вместо неравенств (12) можно было бы просто записать w (z|b i )> w (z|b j ) Сравнение отношений правдоподобия вместо сравнения условных плотностей вероятностей вызвано тем, что понятие отношения правдоподобия можно распространить и на сигналы из бесконечномерного гильбертова пространства, для которых понятие плотностей вероятности w (z|b i ,), w (z|b j ) теряет смысл.

Если стоимости потерь от ошибочно принятых решений неизвестны, правило постановки диагноза можно установить из условия минимума значения вероятности одной из ошибок диагностирования при заданном (допустимом) уровне другой. По методу Неймана - Пирсона минимизируется вероятность ошибки 2-го рода (пропуска дефекта) Р м, см. второе соотношение в (26), при условии, что вероятность ошибки 1-го рода (ложной тревоги) P F не превышает заданного значения :

(31)

Этот уровень устанавливается на основе опыта эксплуатации объектов или интуитивных соображений с учетом разрешающей способности диагностических средств, степени опасности дефектов и экономических затрат. В практических расчетах принимают

(32)

где k коэффициент избыточности, выбираемый из диапазона 1...3, если пропуск дефекта приводит к несущественным потерям, или из интервала 3...10, если пропуск дефекта влечет катастрофические последствия.

Соотношение (31) определяет пороговое значение . Уравнение граничной поверхности в пространстве параметров и правило постановки диагноза по-прежнему описываются формулами (24) и (25).

Можно использовать другой подход определить пороговое значение исходя из допустимой вероятности пропуска дефекта (ошибки 2-го рода) Р м:

.

Если пропуск дефекта влечет тяжелые последствия нежелателен, принимают

,

где N общее число контролируемых объектов, k = 1,..., 10 коэффициент избыточности.

Еще раз отметим, что для упрощения вычислений во всех вышеприведенных формулах вместо отношения правдоподобия можно использовать монотонную функцию логарифм этого отношения.

Пример. Рассмотрим диагностику по двум параметрам х = (x 1 ,x 2), имеющим нормальное распределение в состояниях D 0 и D 1 . Параметры будем считать статистически независимыми, то есть их совместная плотность вероятности равна произведению плотностей вероятности распределения каждого параметра:

;

где
,
(i = 0,1) средние значения параметров, a и
среднеквадратические отклонения параметров в состояниях D 0 и D 1 . Логарифмируя обе части (25), находим правило постановки диагноза по методу минимального риска

.

Если в этой формуле знаки неравенства заменить на знак равенства, получим уравнение граничной линии второго порядка на плоскости диагностических параметров (x 1 ,x 2). В случае равенства среднеквадратических отклонений
(j =1,2) правило упрощается:

.

Задача 2. Состояние подшипника циркуляционного насоса контролируется по содержанию металла в смазке, появляющегося в результате износа конструкционных элементов подшипника. Предварительно установлено, что концентрация металла подчиняется нормальному закону распределения, причем в исправном состоянии D 0 , среднее содержание металла составляет х 0 =0,5 мг/кг при среднеквадратическом отклонении =0,2 мг/кг, а для предельно изношенногосостояния D 1 эти величины соответственно равны х 1 =1,5 мг/кг, =0,3 мг/кг. Используя различные статистические методы принятия решений, определить предельное содержание металла в смазке, при котором подшипник подлежит разборке и ремонту, если их стоимость в условных величинах составляет П 01 =10 единиц, а последствия аварийной ситуации, связанной с остановкой, оцениваются в П 10 = 200 единиц. Априорные вероятности исправного и изношенного состояний подшипника на момент диагностики соответственно равны Р (D 0)=0,95 и P (D 1)=0,05.

Метод минимального риска

Плотности вероятностей распределения диагностического параметра – концентрации металла в смазке – при нормальном и изношенном состоянии подшипника описываются функциями

Составив отношение правдоподобия и прологарифмировав обе части соотношения (24), получим уравнение для определения критической концентрации (граничное значение) металла в смазке:

Здесь, поскольку выигрыш от правильно поставленных диагнозов, они приняты равными нулю. Введя обозначение z=
уравнение (34) можно записать в виде

(35)

Подставив исходные данные, определяем положительный корень уравнения (35) – z=1,842. Следовательно,
мг/кг. Вероятности ошибок 1-го и 2-го рода, см. рис. 1 вычисляются по формулам (20), которые в нашем случае имеют вид:

(36)

В результате вычислений находим . Средний риск равен усл. ед.

Метод минимального числа ошибочных решений

Критическую концентрацию металла в смазке определяем из уравнения (34), положив в правой его части
.

В результате вычислений находим
мг/гк. Вероятности ошибок 1-го и 2-го рода вычисляются по формулам (36) при найденном значении:
и
. Средний риск составляет
усл. ед.

Метод максимального правдоподобия

Критическую концентрацию металла в смазке вычислим из уравнения (34), положив в правой его части П 01 P (D 1)= П 01 P (D 0), (см. п. 2.3). При этом уравнение (34) для определения х * принимает вид:

Решив это уравнение, находим х * =0,92 мг/кг. Вероятности ошибок 1-го и 2-го рода рассчитываются согласно (36) при найденном значении х * : Р F = 0,0161 и Р м = 0,00137. Средний риск составляет величину R = 0,44 усл. ед.

  • 5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ СОГЛАСИЯ
  • 5.1. Понятие статистической гипотезы. Основные этапы проверки гипотез
  • 5.2. Критерий Неймана – Пирсона
  • 5.3. Проверка гипотез о числовых значениях параметров нормального распределения
  • 5.4. Проверка гипотез о параметрах двух нормальных распределений
  • 5.5. Лабораторная работа № 5. Проверка статистических гипотез о числовых значениях нормальных распределений в математических пакетах STATGRAPHICS и MATHCAD
  • 5.6. Критерии согласия
  • Решение
  • 5.7. Лабораторная работа № 6. Критерии согласия в статистическом пакете STATGRAPHICS
  • 5.8. Лабораторная работа №7. Критерии согласия в математическом пакете MATHCAD
  • 6. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
  • 6.1. Постановка задачи
  • 6.2. Дисперсионный анализ
  • Решение
  • 6.3. Ранговый однофакторный анализ
  • 6.4. Критерий Краскела - Уоллиса (Н-критерий)
  • Решение
  • 6.5. Лабораторная работа № 8. Однофакторный ранговый и дисперсионный анализ в статистическом пакете STATGRAPHICS
  • 7. РЕГРЕССИОННЫЙ АНАЛИЗ
  • 7.1. Модели регрессии
  • 7.4. Проверка адекватности линейной регрессии
  • 7.5. Выбор наилучшей регрессии
  • 8. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ
  • 8.2. Критерий знаков
  • 8.3. Критерий знаков для одномерной выборки
  • 8.4. Ранговый критерий (одновыборочный критерий Вилкоксона)
  • 8.5. Двухвыборочный ранговый критерий Вилкоксона
  • 5.2. Критерий Неймана – Пирсона

    Если имеется некоторая выборка x 1 ,x 2 ,...,x n , то с помощью заданных ошибок первого и второго рода α и β можно решать задачу о наилучшем критерии. Именно по заданному значению уровня значимости α ищется такой критерий, чтобы его мощность 1− β была максимальна. Введем

    предварительно несколько обозначений и определений.

    Размером α0 критерия называется максимальное значение вероятности ошибки первого рода при использовании данного критерия, т.е.

    Равномерно наиболее мощные критерии существуют в крайне редких слу-

    чаях, например, в случае простых гипотез H 0 иH 1 .

    x 1 ,x 2 ,...,x n

    Рассмотрим

    две простые гипотезы

    H 0 : F (x ) =F 0 (x )

    и H 1 :F (x ) = F 1 (x ) , где

    F0 (x)

    и F 1 (x )

    Известные

    функции распределения. В этом случае равномерно наиболее мощный критерий называется критерием отношения правдоподобия и описывается следующим образом. Введем статистику

    Λ(x, x

    (x 1 ,x 2 ,...,x n )

    (x 1

    X 2 ,...,x n )

    где L 0 (x 1 ,x 2 ,...,x n ) = f (x 1 )

    f (x2 ) ... f(xn )

    для непрерывной случайной

    величины

    X иL 0 (x 1 ,x 2 ,...,x n ) = P (x 1 ) P (x 2 ) ...P (x n )

    для дискретной.

    Статистика

    Λ(x 1 ,x 2 ,...,x n ) носит название отношения правдоподобия и

    является отношением вероятностей (или плотностей распределения) получить выборку x 1 ,x 2 ,...,x n при условии справедливости гипотезH 0 иH 1 .

    Естественно предположить, что чем больше отношение правдоподобия, тем большее предпочтение мы должны оказать гипотезе H 1 . Об этом го-

    вориться в лемме Неймана - Пирсона.

    Лемма Неймана – Пирсона. Среди всех критериев заданного уровня значимостиα , проверяющих две простые гипотезыH 0 иH 1 , кри-

    терий отношения правдоподобия является наиболее мощным.

    При практической реализации критерия отношения правдоподобия обычно удобно пользоваться не отношением правдоподобия, а его лога-

    Λ > C . В соответствии с общим правилом уровень значимости α и мощность 1− β критерия отношения правдоподобия в зависимости от крити-

    ческого значения C определяются по формулам:

    α =α (C ) =P (Λ(x 1

    X 2 ,...,x n ) > C H 0 ) =

    ) dx dx

    ) ...f

    Λ(x, x

    P (Λ(x 1

    X 2 ,...,x n ) > C H 1 ) =

    β =β (C ) =

    = ∫ ...∫

    (x 1 )

    (x2 ) ... f1 (xn ) dx1 dx2 ... dxn .

    Λ(x, x

    x 1 ,x 2 ,...,x n N (m ,D )

    H0 : m= a0 ,

    H 1 :m = a 1 > a 0 . Воспользуемся критерием Неймана – Пирсона. Крити-

    гипотезы

    определена

    Λ(x 1 ,x 2 ,...,x n )> C .

    (x i ) =

    (x i − a 0 )2

    2 D,

    2π D

    −a 1 ) 2

    −a

    n −

    ∑ (xi

    f (x) =

    e−

    Тогда Λ (x ,x

    2 π D) e

    i= 1

    > C .

    2π D

    ∑(x

    −a

    (1 2π D ) n e

    2 Di = 1

    Упростим последнее выражение:

    )2 − (x

    ∑(x

    −a

    −a

    i= 1

    > C ,

    ∑ n [(x i −a 0 )2 − (x i −a 1 )2 ]=∑ n (x i 2

    i = 1

    i = 1

    ]> 2D lnC ,

    ∑ [(x i −a 0 )2 − (x i −a 1 )2

    i= 1

    − 2 x i a 0 +a 0 2 −x i 2 +2 x i a 1 2 −a 1 2 )=

    2 ∑ x i (a 0 −a 1 )+n (a 0 2 −a 1 2 )>2 D ln C ,

    ∑ x i= m X=

    i = 1

    n i = 1

    2 Dln C− n(a0 2 − a1 2 ) = ϕ(C , D , a

    A) = C.

    Итак, m

    > C , а так как

    2 (a 0 −a 1 )

    D n ) , то можно по этому неравенству найтиC , зная α, на-

    пример,

    − a

    − a

    α = P

    C 1− a 0

    − t2

    dt = 1

    − a

    Таким образом, по α находится C 1 из

    − a

    = α. Кроме того,

    1 − Φ

    − a

    − a

    ства β = P

    1 ≤

    можно найти и β

    Φ C 1− a 1. D n

    решения уравнения

    из аналогичного равен-

    5.3. Проверка гипотез о числовых значениях параметров нормального распределения

    Обозначим через X случайную величину, имеющую нормальный закон распределения с параметрамиm X иD X , т.е.X N (m X ,D X ) , при-

    чем числовые значения либо одного, либо обоих параметров неизвестны. Узнать, каково численное значение неизвестного параметра, можно, обследовав всю генеральную совокупность, что сделать, как правило, нельзя.

    Обычно вместо этого проводят выборочные наблюдения, предполагая при этом, что они независимы и проводятся в одинаковых условиях. Тогда

    несмещенными

    оценками

    являются

    ∑x

    n i = 1

    ∑ (x i −m X )

    Затем приступают к проверке гипотез.

    n − 1 i = 1

    1. Проверка

    гипотезы

    числовом

    значении

    математического

    ожидания нормального распределения при известной дисперсии

    Нулевая гипотеза здесь

    H 0 :m X = a 0 , а альтернативная гипотеза мо-

    сформулирована

    H 1: m X = a 1> a 0,

    2) H 1 :m X = a 1 < a 0 , 3)H 1 :m X = a 1 ≠ a 0 .

    Зададим уровень значимости критерия α, а так как D X

    известна, то в

    качестве

    статистики

    критерия

    случайную

    величину

    z = m X − a 0 .

    mX N(a0 , DX n) ,

    что было уже несколько раз

    показано ранее, ибо x i N (a 0 ,D X ) , тоz N (0,1) .

    Выделим критическую область ω статистики z , при которойH 0 отвергается. Размер и расположение критической области зависят от форму-

    альтернативной

    f (z H0 )

    гипотезы. Рассмотрим 3-й

    H 1: m X = a 1≠ a 0,

    здесь целесообразно выбрать

    двусторонний

    критерий

    (рис. 5.6). Критическую об-

    α 2

    ласть образуют два интерва-

    α 2

    (− ∞ , z лев,α 2)

    (z пр,α 2, +∞) .

    Критические

    W \ ω

    точки определяются из ус-

    t α2

    t 1 −α2

    ловий P (z < z лев, α 2 )= α 2 и

    Рис. 5.6. Двусторонняя критическая область для

    P (z > z пр, α 2 )= α 2. Так как

    матожидания

    z N (0,1) , то

    критические

    точки – это квантили нор-

    мального

    распределения

    лев,α 2

    α 2

    = Φ− 1 (α2 ), а z

    пр,α 2

    = Φ− 1 (1 − α2 ).

    1 −α2

    ∑ x i . Еслиz в ω , гипотеза

    отвергается с уровнем значимо-

    n i = 1

    сти α и принимается гипотеза

    H 1 . Если жеz в W \ ω , то гипотеза

    принимается.

    2. Проверка гипотезы о числовом значении математического ожидания нормального распределения при неизвестной дисперсии.

    В этом случае отличие от предыдущих формул и предположений будет касаться лишь статистики критерия z и ее распределения. Выберем в

    качестве статистики величину z = (m X ) − a 0 ) . Как было уже показано

    ранее (см. подразд. 4.7, п. 2), эта статистика имеет распределение Стьюдента с (n − 1) - й степенью свободы, т.е.z S n − 1 (t ) . Все остальные пунк-

    ты проверки остаются без изменений. Например, если выбрана альтернативная гипотеза 2-го видаH 1 :m X = a 1 < a 0 (рис. 5.7), критическая об-

    ласть будет левосторонней, ее образует один интервал (−∞ ,z лев,α ) ,

    P (z < z лев,α= t α,n − 1)= α

    t α,n − 1

    ∫ s (t ) dt = α, т.е.

    t α,n − 1= S

    −1

    (α )

    t α,n − 1

    W \ ω

    Рис. 5.7. Левосторонняя критическая область

    для матожидания

    3. Проверка гипотезы о числовом значении дисперсии нормаль-

    ного распределения.

    в этом случае известно, что X N (m X ,D ) , но числовое значе-

    ние дисперсии неизвестно. По выборке наблюдений x 1 ,x 2 ,...,x n

    вычислим

    точечные оценки m X =

    ∑x i

    и D X =

    ∑ (x i −m X )

    и проверим ги-

    n i = 1

    n − 1 i = 1

    H 0 :D X = D 0 , гдеD 0 - заранее заданное число. В качестве стати-

    гипотезы

    случайную

    величину

    D X (n − 1) D 0 . Ранее (см. подразд. 4.7) было показано, что эта случай-

    величина

    имеет χ2 -распределение

    n − 1

    степенью свободы, т.е.

    z χ n 2 − 1 .

    z и определения ее распределения все ос-

    После выбора статистики

    тальные вопросы проверки гипотезы носят технический характер. Зададимся уровнем значимости α, сформулируем альтернативную гипотезу и

    перейдем к построению критической области и проверке H 0 . Рассмотрим правосторонний критерий, т.е. альтернативная гипотеза должна быть

    сформулирована в виде

    H 1 :D X > D 0 , (рис. 5.8). Критическую область

    образует один интервал

    (z пр,1 − α ,+∞) , где точкаz пр,1 − α есть 1− α - про-

    центный квантиль χ2 -распределения,

    определяется из условия

    P (z >z пр,1 − α ) =α или

    ∫ kn − 1 (t) dt= α,

    т.е. z пр,1 − α = K − 1 (1− α) . Далее

    z п р,1− α