Грешки от първи и от втори род: Разлика между версии
Изтрито е съдържание Добавено е съдържание
м без запетая между месец и година; козметични промени |
|||
Ред 3:
'''Грешките от първи род''' ({{lang-en|type I errors, α errors, false positives}}) и '''грешките от втори род ''' ({{lang-en|type II errors, β errors, false negatives}}) в [[математическата статистика|математическа статистика]] — са ключови понятия на задачите за проверка на статистическите хипотези. Все пак, тези понятия често се ползват и в други области, когато става въпрос за вземане на „бинарно“ решение (да или не) на базата на някакъв критерий (тест, проверка, измерване), който с някаква вероятност може да даде фалшив резултат.
''Забележка:''
В англоезичната статистическа литература не се среща понятието критерий(criterion). Навсякъде се използва тест (test - проверка). Напр. (вж. Lehman Testing statistical hypothesis)
В руската литература по (математическа) статистика (оригинална и преводна) не се среща понятието тест - всичко е или критерий или проверка. (вж. Lehman Проверка статистических гипотез). <ref>Д. Л. Въндев Записки по Приложна статистика 1, СОФИЯ, юни
== Определения ==
Нека е дадена извадка <math>\mathbf{X} = (X_1,\ldots,X_n)^{\top}</math> от неизвестно съвместно разпределение <math>\mathbb{P}^{\mathbf{X}}</math>, и е
: <math> \begin{matrix} H_0 \\ H_1, \end{matrix} </math>
където <math>H_0</math> — [[нулева хипотеза]], а <math>H_1</math> — [[алтернативна хипотеза]]. Да предположим, че е даден статистически критерий
Ред 44:
== За смисъла на грешките от първи и от втори род ==
Както се вижда от приведеното по горе определение, '''грешките от първи и от втори род''' взаимно са симетрични, то ест ако се сменят местата на хипотезите <math>H_0</math> и <math>H_1</math>, то ''грешките от първи род'' ще се превърнат в ''грешки от втори род'' и обратно.
В този смисъл ''грешки от първи род'' често биват наричани '''фалшива аларма''' или '''лъжлива тревога''', '''лъжливо сработване''' или '''[[Лъжливо-положителен]] резултат''' — например, анализа на кръвта е показал наличие на заболяване, но всъщност пациента е здрав, или металдетектора
Терминът широко се ползва в медицината. Например, тестовете, предназначени за диагностика на заболяване, понякога дават положителен резултат (т.е. показват наличие на това заболяване у пациента), докато всъщност пациентът не страда от това заболяване. Такъв резултат се нарича лъжливоположителен.
Ред 52:
В други областия традиционно се ползват словосъчетания с подобен смисъл, например, "лъжливо сработване", "лъжлива(фалшива) тревога" и др. В информационните технологии често се ползва английския термин false positive без превод.
Поради възможността за лъжливи сработвания борбата с много видове заплахи не може да се автоматизира напълно. Като правило, вероятността за лъжливо сработване корелира с вероятността за пропускане на събитието (грешки от втори род). Тоест, колкото една система е по-чувствителна, толкова тя открива повече опасни събития и, следователно, предотвратява. Но при увеличаване на чувствителността неизбежно нараства
Съответно, ''грешката от втори род'' понякога се нарича '''пропускане на събитието''' или
Думата "отрицателен" в конкретния случай няма отношение към това желателно или нежелателно е самото събитие.
Терминът широко се използва в медицината. Например, тестовете, предназначени за
При други области, традиционно, използват словосъчетания с подобен смисъл,
Степента на чувствителност на системата за охрана трябва да представлява именно
== Вероятност за грешка (равнище на значимост и мощност) ==
: Вероятността за грешка от първи род при проверка на [[Статистическа хипотеза|статистически хипотези]] се нарича [[ниво на значимост|'''ниво на значимост''']] или равнище на значимост и традиционно се означава с гръцката буква <math>\alpha</math> (откъдето и названието
: ''Виж още [[ниво на значимост]]''
Вероятността за грешка от втори род няма някакво специално общоприето название, като се означава с гръцката буква <math>\beta</math> (оттук и
Тези две характеристики обикновено се пресмятат чрез така наречената [[функция на мощност]] на критерия. В частност, вероятността за грешка от първи род е функция на мощност, пресметната при нулева хипотеза. За критерии, основани на извадка с фиксиран обем, вероятността за грешка от втори род е единица минус функцията на мощност, пресметната при предположение, че разпределението на наблюденията съответства на алтернативната хипотеза. За [[последователен статистически критерий|последователни критерии]] това също е в сила, ако критерия се установява с вероятност единица (при даденото разпределение от
В статистическите тестове обикновено се търси компромис между приемливо ниво на ''грешки от първи и втори род''. Често при приемането на решение
== Изчочници ==
|