Откриване на аномалии: Разлика между версии

Изтрито е съдържание Добавено е съдържание
Нова страница: „'''Откриване на аномалии''' ({{lang|en|anomaly detection, outlier detection}}) е понятие от анализ на данни|анали...“
 
мРедакция без резюме
Ред 1:
'''Откриване на аномалии''' ({{lang|en|anomaly detection, outlier detection}}) е понятие от [[анализ на данни|анализа на данни]], с който се означава резултата от идентифицирането на единични (редки) обекти, събития или наблюдения, които будят подозрения с открояването си от голямата част от [[данни]]те. Типично аномалните обекти са индикатор за някакъв вид проблем с данните, като за примери от различни контексти могат да се дадат банкова измама, структурен дефект, медицински проблем, грешка в текста. Като аномалии се разглеждат [[статистически аутлайер]]и („силно отличаващи се наблюдения“, „отдалечени наблюдения“, „екстремални наблюдения“), новости (нови наблюдения), шум, [[девиация|девиации]], изключения.
 
Съществуват три широки класа от техники от [[машинно обучение|машинното обучение]], които служат за откриване на аномалии.
* Техники за откриване на аномалии ''[[машинно обучение без учител|без учител]]'' (''unsupervised'') – за некласифицирани тестови [[множество от данни|множества от данни]] (''unlabeled test data set'') работят при предположението, че преобладаващата част от данните в множеството са нормални и с тях се сравняват онези инстанции, които в най-малка степен се вписват сред тях.
* Техники за откриване на аномалии ''[[машинно обучение с учител|с учител]]'' (''supervised'') – изискват данните в тестовото множество да са (предварително) класифицирани като „нормални“ или „абнормални“ и работата им включва обучение на класификатор (''classifier'').
* Смесени техники (''semi-supervised'') – на база множество нормални тестови данни конструират модел на нормално поведение и после проверяват [[вероятност]]та дадена инстанция да е генерирана от модела.
 
Някои от популярните техники за откриване на аномалии са: [[метод на k-най-близките съседи]], базирани на [[корелация]] техники за откриване на статистически аутлайери, [[машина с поддържащи вектори]], [[Бейсова мрежа|бейсови мрежи]], [[Скрит модел на Марков|скрити модели на Марков]], техники за откриване на аутлайери, базирани на [[клъстерен анализ]], [[Машинно самообучение|техники с асоциативни правила]], техники базирани на [[размита логика]], и други. Резултатите от работата на различните методи до голяма степен зависят от множеството данни и от параметрите.