Грешки от първи и от втори род: Разлика между версии

Изтрито е съдържание Добавено е съдържание
м Bot: Automated text replacement (-( +()
м замяна с n-тире
Ред 1:
{{обработка|форматиране}}
 
'''Грешките от първи род''' ({{lang-en|type I errors, α errors, false positives}}) и '''грешките от втори род ''' ({{lang-en|type II errors, β errors, false negatives}}) в [[математическата статистика|математическа статистика]] са ключови понятия на задачите за проверка на статистическите хипотези. Все пак, тези понятия често се ползват и в други области, когато става въпрос за вземане на „бинарно“ решение (да или не) на базата на някакъв критерий (тест, проверка, измерване), който с някаква вероятност може да даде фалшив резултат.
 
''Забележка:''
 
В англоезичната статистическа литература не се среща понятието критерий(criterion). Навсякъде се използва тест (test - проверка). Напр. (вж. Lehman Testing statistical hypothesis)
 
В руската литература по (математическа) статистика (оригинална и преводна) не се среща понятието тест - всичко е или критерий или проверка. (вж. Lehman Проверка статистических гипотез). <ref>Д. Л. Въндев Записки по Приложна статистика 1, СОФИЯ, юни 2003, http://www.fmi.uni-sofia.bg/fmi/statist/personal/vandev/lectures/applstat1.pdf </ref>
 
== Определения ==
Ред 13:
Нека е дадена извадка <math>\mathbf{X} = (X_1,\ldots,X_n)^{\top}</math> от неизвестно съвместно разпределение <math>\mathbb{P}^{\mathbf{X}}</math>, и е поставена бинарна задача за проверка (тест) на статистическите хипотези:
: <math> \begin{matrix} H_0 \\ H_1, \end{matrix} </math>
където <math>H_0</math> — [[нулева хипотеза]], а <math>H_1</math> [[алтернативна хипотеза]]. Да предположим, че е даден статистически критерий
: <math>f:\mathbb{R}^n \to \{H_0,H_1\}</math>,
съпоставящ на всяка реализация на извадката <math>\mathbf{X} = \mathbf{x}</math> една от наличните хипотези. Тогава са възможни следните четири случая:
Ред 46:
Както се вижда от приведеното по горе определение, '''грешките от първи и от втори род''' взаимно са симетрични, то ест ако се сменят местата на хипотезите <math>H_0</math> и <math>H_1</math>, то ''грешките от първи род'' ще се превърнат в ''грешки от втори род'' и обратно. Но все пак, в повечето ситуации от практиката объркване не възниква, тъй като се приема да се счита, че ''нулева хипотеза'' <math>H_0</math> ще съответства на състояние „по подразбиране“ (нормалното, най-очакваното състояние) — например, че изследвания пациент е здрав, или че пътника преминаващ през рамката на металдетектора не притежава забранени метални предмети. Съответно, ''алтернативната хипотеза'' <math>H_1</math> означава противоположната ситуация, която обикновено се тълкува като по-малко вероятна, необичайна, или изискваща някаква реакция.
 
В този смисъл ''грешки от първи род'' често биват наричани '''фалшива аларма''' или '''лъжлива тревога''', '''лъжливо сработване''' или '''[[Лъжливо-положителен]] резултат''' например, анализа на кръвта е показал наличие на заболяване, но всъщност пациента е здрав, или металдетектора е подал сигнал тревога, породена от металната тока на колан.
 
Терминът широко се ползва в медицината. Например, тестовете, предназначени за диагностика на заболяване, понякога дават положителен резултат (т.е. показват наличие на това заболяване у пациента), докато всъщност пациентът не страда от това заболяване. Такъв резултат се нарича лъжливоположителен.
Ред 71:
Тези две характеристики обикновено се пресмятат чрез така наречената [[функция на мощност]] на критерия. В частност, вероятността за грешка от първи род е функция на мощност, пресметната при нулева хипотеза. За критерии, основани на извадка с фиксиран обем, вероятността за грешка от втори род е единица минус функцията на мощност, пресметната при предположение, че разпределението на наблюденията съответства на алтернативната хипотеза. За [[последователен статистически критерий|последователни критерии]] това също е в сила, ако критерия се установява с вероятност единица (при даденото разпределение от алтернативата).
 
В статистическите тестове обикновено се търси компромис между приемливо ниво на ''грешки от първи и втори род''. Често при приемането на решение се използва прагова стойност, която може да варира с цел проверката (тестът) да се получи по-строг или пък, напротив, по-мек. Такова прагово значение има [[равнище на значимост|равнището на значимост]], което се задава при проверката на [[Статистическа хипотеза|статистически хипотези]]. Например, в случая с металдетектор, повишаването на чувствителността на уреда ще доведе до увеличаване на риска от ''грешка от първи род'' (фалшива тревога), докато понижаването на чувствителността до увеличение на риска от ''грешка от втори род'' (пропускане на забранен предмет).
 
== Изчочници ==