Средноквадратично отклонение

В теорията на вероятностите и статистиката е най-често срещаният показател за разпръскването (дисперсията) на стойностите на случайна вел

Средноквадратичното отклонение /СКО/ (на английски: root-mean-square deviation, RMSD) или средноквадратичната грешка /СКГ/ е често използвана мярка за разликите между стойности (стойности на извадка или съвкупност), прогнозирани от модел или статистическа оценка, и реално наблюдаваните стойности.

Отклонения на набор от 8 елемента

СКО представлява квадратен корен от квадрата на дисперсията на разликите между прогнозираните стойности и наблюдаваните стойности или средната квадратична стойност на тези разлики. Тези отклонения се наричат остатъци, когато изчисленията се извършват върху извадката от данни, която е била използвана за оценка, и се наричат грешки (или грешки при прогнозиране), когато се изчисляват извън извадката. СКГ служи за обединяване на величините на грешките в прогнозите за различни точки от данни в единна мярка за предсказваща сила. СКГ е мярка за точност за сравняване на грешки при прогнозиране на различни модели за определен набор от данни, а не между набори от данни, тъй като зависи от мащаба. [1]

СКО винаги е неотрицателно и стойност 0 (почти никога не се постига на практика, би означавало перфектно съответствие с данните). Като цяло, по-ниско RMSD е по-добро от по-високо. Сравненията между различни типове данни обаче биха били невалидни, тъй като мярката зависи от мащаба на използваните числа.

СКГ е корен квадратен от средната стойност на квадратичните грешки. Ефектът от всяка грешка върху СКГ е пропорционален на размера на квадратичната грешка; следователно по-големите грешки имат непропорционално голям ефект върху СКГ. Следователно СКГ е чувствителна към отклонения. [2][3]

СКО на оценката   по отношение на оценения параметър   се определя като корен квадратен от средната квадратична грешка (CKГ):

 

За безпристрастна оценка СКО е корен квадратен от дисперсията, известна като стандартно отклонение.

СКО на   стойности на регресионно зависимата променлива  , спрямо прогнозираните стойности   за моменти t, се изчислява като корен квадратен от средната стойност на квадратите на отклоненията:

 

За регресии на кръстосани данни индексът t се заменя с i, а T се заменя с n.

В някои дисциплини СКО се използва за сравняване на разликите между две неща, които могат да варират, нито едно от които не се приема като „стандарт“. Например, когато се измерва средната разлика между два времеви реда   and  , формулата става

 

Източници

редактиране
  1. Hyndman, Rob J. и др. Another look at measures of forecast accuracy // International Journal of Forecasting 22 (4). 2006. DOI:10.1016/j.ijforecast.2006.03.001. с. 679 – 688.
  2. Pontius, Robert и др. Components of information for multiple resolution comparison between maps that share a real variable // Environmental Ecological Statistics 15 (2). 2008. DOI:10.1007/s10651-007-0043-y. с. 111 – 142.
  3. Willmott, Cort и др. On the use of dimensioned measures of error to evaluate the performance of spatial interpolators // International Journal of Geographical Information Science 20. 2006. DOI:10.1080/13658810500286976. с. 89 – 102.

Вижте също

редактиране
    Тази страница частично или изцяло представлява превод на страницата Root-mean-square deviation в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите. ​

ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни.​