Регресионен модел: Разлика между версии

Изтрито е съдържание Добавено е съдържание
м без изпуснат интервал преди точка
м замяна с n-тире
Ред 8:
mediocrity“. От съвременна гледна точка това название е неподходящо <ref name=Vandev>[http://www.fmi.uni-sofia.bg/fmi/statist/Personal/Vandev/lectures/applstat1.pdf Въндев, Д., (2013) ''Записки по приложна статистика 1'']</ref>, имайки
предвид сегашния смисъл на регресионния модел, а
именно - описание на връзката между множество от входни и друго множество
от изходни величини
<ref name=Casella>Casella, G., S. Fienberg and I. Olkin, (1998) ''Applied Regression Analysis - A Research Tool''. Springer-Verlag, New York</ref>,
<ref name=Chattefuee>Chattefuee, S. and A. S. Hadi, (2006) ''Regression Analysis by Example.'' John Wiley & Sons, Inc., Hoboken, New Jersey</ref>. Понякога входовете се наричат въздействия, независими
или описателни променливи/характеристики, атрибути, а ако моделът е статичен, също се
Ред 25:
отчетени от модела, те да се наричат входни въздействия или независими променливи.
 
В някои източници се прави разлика между фактор и регресор <ref name=Bojanov>Божанов, Е. и И. Вучков, (1973) ''Статистически методи за моделиране и оптимизране на многофакторни обекти.'', Техника, София]</ref>, като под регресор се има предвид променлива, която участва в модела, а фактор е реална, физическа величина. В този смисъл, ако даден фактор се трансформира, например с цел получаване на линеен по параметри модел, то трансформираната величина е регресор, а първоначалната - фактор. Естествено, ако даден фактор участва директно в модела, той е и регресор. По-долу не се прави разлика между двете понятия, защото в изложението се акцентира на типа на модела, а не на пътя, по който е получен. Още повече че често в литературата векторът на регресорите се означава с буквата <math>\varphi</math> (от фактори) <ref name=Garipov_II>Гарипов, E., (2004) ''Част II. Идентификация чрез дискретни стохастични регресионни модели.'' ТУ - София, ISBN 954-438-392-1</ref>.
 
== Общ вид на регресионен модел ==
Ред 48:
броят на факторите и параметрите е еднакъв, при многомерните системи (с повече входове и/или изходи)
обикновено броят им е различен. Ако случаят е такъв, броят на факторите е означен с <math>z</math>,
а броят на параметрите - с <math>p</math>.
 
Често регресионните модели се представят като изходът им <math>\hat{y}_k</math> се замени с измерения изход на
Ред 72:
<ref name=Mateev>[http://www.fmi.uni-sofia.bg/lecturers/vois/pmat/Regression.pdf Матеев, П., (2012) ''Линеен регресионен модел. Метод на най-малките квадрати. Теорема на Гаус-Марков'', София]</ref>
под „линеен“ се разбира модел, изходът на който е линейна функция на параметрите, докато в
<ref name=Garipov_I>Гарипов, E., (2004) ''Идентификация на системи Част I. Въведение.'' ТУ - София, ISBN 954-438-391-3</ref>, <ref name=Vuchkov>Вучков, И., (1996) ''Идентификация.'' ИК Юрапел, София</ref> и др., ако моделът е линеен, то изходът му зависи линейно от входа. По тази причина, ако изходът на модел е линеен по параметри, в статията това изрично се указва.
 
По-долу се използват съкращенията:
* MIMO (Multiple Input Multiple Output) - за модел с много входове и много изходи (многомерен модел)
* MISO (Multiple Input Single Output) - за модел с много входове и един изход (многомерен модел)
* SISO (Single Input Single Output) - за модел с един вход и един изход (едномерен модел)
 
=== MIMO модел ===
Ред 97:
матрица и вектор, както е показано на фигурата. Така възникват две групи представяния на линейните по параметри MIMO регресионни модели записани в общ вид
<ref name=Efremov_2014>[http://anp.tu-sofia.bg/aefremov/publications/EfremovITC14_01.pdf Efremov, A., (2014) General Forms of a Class of Multivariable Regression Models. ''In: Journal of Information Technologies and Control''. Sofia, Bulgaria]</ref>,
<ref name=Efremov_2013>[http://anp.tu-sofia.bg/aefremov/publications/EfremovSAI13_01.pdf Efremov, A., (2013) Generalized representations multivariable linear parameterized models ''In: International Conference of Automatics and Informatics'', pp. I-233 - I-236. Sofia, Bulgaria]</ref>. При едното параметрите се подреждат във вектор, а факторите - в матрица с
подходяща структура, докато при другото представяне факторите са във вектор,
а параметрите в матрица. Първият запис на MIMO модел в общ вид е
Ред 119:
<ref name=Yiu>Yiu, J. and S. Wang, (2007) Multiple ARMAX modelling scheme for forecasting air conditioning system performance, ''In: Energy Conversion and Management'', volume 48, pp. 2276–2285</ref>
. На пръв поглед няма значение как се
формира <math>\hat{y}_k</math> - и в двата случая изходът е линейна функция на
параметрите и на факторите. Въпреки това горните две представяния са свързани с различни особености, които са важни още на ниво уточняване на структурата на модела.
 
Ред 147:
Под нелинейни модели се има предвид такива, които не може да се представят в линеен по параметри вид.
Също така, в някои източници
<ref>Ищев, К., (2007) ''Теория на автоматичното управление.'' ТУ - София</ref>
, когато се набляга на връзката между входните и изходните величини, ако тя е нелинейна, такъв модел също се нарича нелинеен, независимо дали изходът е линейна функция на параметрите. Например нека изходът на модела е
: <math>
Ред 168:
 
Един често използван нелинеен модел в практиката е логистичният. Той се използва във финансите
<ref name=Thomas> Thomas, L., D. Edelman and J. Crook, (2002) Credit Scoring & Its Applications (Monographs on Mathematical Modeling and Computation), SIAM - society of industrial and applied mathematics, ISBN-13: 978-0898714838</ref>
, медицината
<ref> [http://www.biometrica.tomsk.ru/logit_1.htm Leonov, V., (2012) Logistic regression in medicine and biology. ''In Biostatistics'', in Russian.]</ref>
, автоматиката - за откриване на повреди, в психологията
<ref>Weiner, I., J. Schinka and W. Velicer, (2003) ''Handbook of Psychology, Research Methods in Psychology'', John Wiley & Sons, Inc.</ref>
и др.). За описание на свойствата на модела е представен вариант с един изход. MISO логистичният модел има вида
Ред 179:
Моделът намира приложение, когато изходът на обекта има смисъл на вероятност. Например в системите за оценка на кредитния риск
<ref name=Thomas/>
<math>y_k</math> приема стойности между 0 и 1 (0 - „лош“, 1 - „добър“ кредитополучател). В този случай предствянето като линейна по параметри функция
: <math>
\tilde{y}_k = \ln {\tfrac{y_k }{1-y_k }} = \varphi_k^T \theta + e_k,