Грешки от първи и от втори род: Разлика между версии

Изтрито е съдържание Добавено е съдържание
BotNinja (беседа | приноси)
{{lang-en}} => {{lang|en}}
мРедакция без резюме
Ред 7:
В англоезичната статистическа литература не се среща понятието критерий(criterion). Навсякъде се използва тест (test – проверка). Напр. (вж. Lehman Testing statistical hypothesis)
 
В руската литература по (математическа) статистика (оригинална и преводна) не се среща понятието тест – всичко е или критерий или проверка. (вж. Lehman Проверка статистических гипотез). <ref>Д. Л. Въндев. Записки по Приложна статистика 1, СОФИЯ, юни 2003, [http://www.fmi.uni-sofia.bg/fmi/statist/personal/vandev/lectures/applstat1.pdf Записки по Приложна статистика 1], СОФИЯ, юни 2003. </ref>
 
== Определения ==
 
Нека е дадена извадка <math>\mathbf{X} = (X_1,\ldots,X_n)^{\top}</math> от неизвестно съвместно разпределение <math>\mathbb{P}^{\mathbf{X}}</math>, и е поставена бинарна задача за проверка (тест) на статистическите хипотези:
: <math> \begin{matrix} H_0 \\ H_1, \end{matrix} </math>
където <math>H_0</math> – [[нулева хипотеза]], а <math>H_1</math> – [[алтернативна хипотеза]]. Да предположим, че е даден статистически критерий
: <math>f:\mathbb{R}^n \to \{H_0,H_1\}</math>,
съпоставящ на всяка реализация на извадката <math>\mathbf{X} = \mathbf{x}</math> една от наличните хипотези. Тогава са възможни следните четири случая:
Line 44 ⟶ 43:
 
== За смисъла на грешките от първи и от втори род ==
Както се вижда от приведеното по горе определение, '''грешките от първи и от втори род''' взаимно са симетрични, то ест ако се сменят местата на хипотезите <math>H_0</math> и <math>H_1</math>, то ''грешките от първи род'' ще се превърнат в ''грешки от втори род'' и обратно. Но все пак, в повечето ситуации от практиката объркване не възниква, тъй като се приема да се счита, че ''нулева хипотеза'' <math>H_0</math> ще съответства на състояние „по подразбиране“ (нормалното, най-очакваното състояние) – например, че изследвания пациент е здрав, или че пътника преминаващ през рамката на металдетектора не притежава забранени метални предмети. Съответно, ''алтернативната хипотеза'' <math>H_1</math> означава противоположната ситуация, която обикновено се тълкува като по-малко вероятна, необичайна, или изискваща някаква реакция.
 
В този смисъл ''грешки от първи род'' често биват наричани '''фалшива аларма''' или '''лъжлива тревога''', '''лъжливо сработване''' или '''[[Лъжливо-положителен]] резултат''' – например, анализа на кръвта е показал наличие на заболяване, но всъщност пациента е здрав, или металдетектора е подал сигнал тревога, породена от металната тока на колан.
Line 50 ⟶ 49:
Терминът широко се ползва в медицината. Например, тестовете, предназначени за диагностика на заболяване, понякога дават положителен резултат (т.е. показват наличие на това заболяване у пациента), докато всъщност пациентът не страда от това заболяване. Такъв резултат се нарича лъжливоположителен.
 
В други областия традиционно се ползват словосъчетания с подобен смисъл, например, "лъжливо„лъжливо сработване"сработване“, "лъжлива„лъжлива (фалшива) тревога"тревога“ и др. В информационните технологии често се ползва английския термин false positive без превод.
 
Поради възможността за лъжливи сработвания борбата с много видове заплахи не може да се автоматизира напълно. Като правило, вероятността за лъжливо сработване корелира с вероятността за пропускане на събитието (грешки от втори род). Тоест, колкото една система е по-чувствителна, толкова тя открива повече опасни събития и, следователно, предотвратява. Но при увеличаване на чувствителността неизбежно нараства и вероятността за лъжливо сработвания. Затова прекалено чувствително (параноично) настроена система за защита може да се изроди в своята противоположност и да доведе до това, че страничната вреда от нея ще бъде по-голяма от ползата.
Line 56 ⟶ 55:
Съответно, ''грешката от втори род'' понякога се нарича '''пропускане на събитието''' или '''[[лъжливоотрицателно]] сработване''' – напр. човек е болен, но анализа на кръвта не го показал, или пътник притежава хладно оръжие, но рамката на металдетектора не го е открила (например, поради това, че чувствителността на рамката е настроена да открива само масивни метални предмети).
 
Думата "отрицателен"„отрицателен“ в конкретния случай няма отношение към това желателно или нежелателно е самото събитие.
 
Терминът широко се използва в медицината. Например, тестовете, предназначени за диагностика на заболявания понякога дават отрицателен резултат (т.е. показват отсъствие на заболяване на пациента), докато всъщност пациента страда от това заболяване. Такъв резултат се нарича лъжливоотрицателен.
 
При други области, традиционно, използват словосъчетания с подобен смисъл, например, "пропуск„пропуск на събитие"събитие“, и т.н. В информационните технологии често се използва без превод английския термин false negative.
 
Степента на чувствителност на системата за охрана трябва да представлява именно компромис между вероятността за грешки от първи и за грешки от втори род. Къде всъщност е точката на баланс, зависи от оценката на риска и за двата вида грешки.
Line 67 ⟶ 66:
: Вероятността за грешка от първи род при проверка на [[Статистическа хипотеза|статистически хипотези]] се нарича [[ниво на значимост|'''ниво на значимост''']] или равнище на значимост и традиционно се означава с гръцката буква <math>\alpha</math> (откъдето и названието <math>\alpha</math>-errors).
: ''Виж още [[ниво на значимост]]''
Вероятността за грешка от втори род няма някакво специално общоприето название, като се означава с гръцката буква <math>\beta</math> (оттук и <math>\beta</math>-errors). Все пак с тази величина е тясно свързана друга, която носи голямо статистическо значение – '''мощност на критерия'''. Тя се пресмята по формулата <math>(1-\beta)</math>. Така че, колкото е по-голяма мощността, толкова е по-ниска вероятността да се допусне грешка от втори род.
 
Тези две характеристики обикновено се пресмятат чрез така наречената [[функция на мощност]] на критерия. В частност, вероятността за грешка от първи род е функция на мощност, пресметната при нулева хипотеза. За критерии, основани на извадка с фиксиран обем, вероятността за грешка от втори род е единица минус функцията на мощност, пресметната при предположение, че разпределението на наблюденията съответства на алтернативната хипотеза. За [[последователен статистически критерий|последователни критерии]] това също е в сила, ако критерия се установява с вероятност единица (при даденото разпределение от алтернативата).