E.3. Porovnanie kvality modelov

Slides:



Advertisements
Podobné prezentácie
BOX – JENKINSOVE MODELY
Advertisements

Využívanie metódy meraní ložísk u výťahoch
ZNALOSTNÉ SYSTÉMY prednáška č. 13
Miroslav Jakubec, Peter Kardoš
Algorithmic Chemistry in Genetic Programming Informatics and Information Technologies Student Research Conference, 2006 Vojtech Szöcs Vedúci projektu:
Pytagorova veta Autor: Matúš Halaj.
OBJAVOVANIE VZOROV POHĽADU PRI NAVIGAČNÝCH ÚLOHÁCH NA WEBE
Svet bublín Martina Ľuptáková, 3.A Šk. rok: 2008/2009.
Extrakcia informácií z medicínskych záznamov
Základné ukazovatele vývoja národného hospodárstva
ZVUK Marián Pitel.
Rozpoznávanie obrazcov šk.r
Gymnázium Pavla Jozefa Šafárika - Pavol Jozef Šafárik Gimnázium Rožňava Kód ITMS projektu: Názov projektu: Kvalitou vzdelávania otvárame brány.
Zlepšiť vzdelávacie prostredie - vylepšiť prístup k CŽV pre všetkých
MODELOVANIE ČASOVÝCH RADOV
Makroekonomický jav „...a aby nám žiaci neutiekli...“
ŠTATISTICKÁ INDUKCIA.
Štatistika a spracovanie údajov
Náhoda a pravdepodobnosť
MANAŽMENT ĽUDSKÝCH ZDROJOV
Usmrtené osoby a príčiny DN počas jesenných mesiacov
Sporenie a Investovanie
Riešenie krízových situácií
Spracovanie postupnosti pohľadu pravdepodobnostnými modelmi
Rovnice a ich riešenia Dušan Vágner 3.B.
Elektromagnetické vlnenie
ZNALOSTNÉ SYSTÉMY prednáška č. 6
JEDNOTKY OBSAHU km2 ha a m2 dm2 cm2 mm2
Úvod do jazyka C Algoritmizácia úloh.
Možnosti podnikania mladých farmárov v ŽV
Gymnázium Pavla Jozefa Šafárika - Pavol Jozef Šafárik Gimnázium Rožňava Kód ITMS projektu: Názov projektu: Kvalitou vzdelávania otvárame brány.
Ing. Magdaléna Hajtmanková
SILVERGAS s.r.o. Bardejov
MODEL METEOROLOGICKÉHO
Magnetické pole PaedDr. Jozef Beňuška
Dopyt, ponuka, rovnovážna cena
Nezdaniteľné časti základu dane
Ing. Jana Ďurišová Grafika pre web.
Kritériá vyhodnocovania investičných projektov
Základné nástroje manažérstva kvality (Kontrolná tabuľka a histogram)
Sem zadajte názov projektu Vaše meno Meno vyučujúceho Vaša škola
Testovanie štatistických hypotéz
Vertikálne systémy zberu komunálnych odpadov
Dopady aktívnych opatrení trhu práce na zvyšovanie zamestnanosti
Opakovanie sekvencia postupnosť príkazov (príkaz je povel, ktorý počítač alebo iné zariadenie pozná a dokáže vykonať) vykonávanú v takom poradí, v akom.
ZŠ Park Angelinum Košice
Spracovanie digitálneho videa a vyhodnocovanie jeho kvality - základy
Matematika 6. ročník Spracovala: Mgr. Jaroslava LOŠÁKOVÁ
Vplyv stavebných úprav na všeobecnú hodnotu bytu
Prognóza trhu práce - skúsenosť z Českej republiky
Simplexová metóda Algoritmus primárne simplexovej metódy možno ideovo vyjadriť nasledovným spôsobom: Stanovenie bázického prípustného riešenia (bázy s.
OPTIMALIZÁCIA KAPITÁLOVEJ SKLADBY INVESTÍCIE
Testovanie štatistických hypotéz v programe Excel
Pomer prevrátený pomer postupný pomer.
Lineárne r o v n i c e Mgr. Ján Nandráži spracovala: E. Hlačinová.
PREPOJENIE EURÓPSKYCH
Problém výberu portfólia
PYTAGOROVA VETA.
TURISTICKÁ A INFORMAČNÁ MAPA MESTA LUČENEC
Štandardy v procese spracovania bibliografických informácií i u nás.
Minimálna mzda za každú hodinu odpracovanú zamestnancom 46,60 Sk,
Výhody štandardizácie v prostredí Pro|ENGINEER
PhDr. Tatiana ARBE, OEMP ÚM STU
Kvantitatívny prieskum TV BA
Rozpoznávanie obrazcov a spracovanie obrazu
Vyjadrovacie prostriedky v štatistike
Základná charakteristika médií Stavba CD-R, CD-RW a DVD
Ako zobrazujeme skutočnosť
Nepriama úmernosť – tabuľka, rovnica a graf
Prepis prezentácie:

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Cieľom analýzy kvality modelov je nájsť optimálnu rovnováhu medzi presnosťou a jednoduchosťou modelu Model Rozklad variability Počet parametrov Presnosť Jednoduchosť Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu všetky vychádzajú z rozkladu variability čím je model lepší, tým väčší objem z celkovej variability vysvetlí niektoré penalizujú zložitosť modelu počtom parametrov čím je model lepší, tým menší počet parametrov potrebuje na vysvetlenie rovnakého objemu variability Random Walk R 2 RMSE MSE MAPE SSE Max Error 2 R Amemiya’s Adjusted R 2 Adjusted R 2 Min Error SBC AIC Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Rozklad variability skutočná hodnota ČR - yt yt odhadnutá = vyrovnaná hodnota ČR - ^ priemer ČR - y _ Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Rozklad variability nevysvetlená variabilita reziduálov ( yt- yt )  rezidál ^ celková variabilita ( yt- y ) _ ( yt- y ) variabilita vysvetlená modelom ^ _ Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Typy variability celková variabilita na koľko sa odchyľujú skutočné hodnoty v jednotlivých časových okamihoch od celkového priemeru variabilita vysvetlená modelom na koľko sa odchyľujú odhadnuté hodnoty v jednotlivých časových okamihoch od celkového priemeru variabilita nevysvetlená - variabilita reziduálov na koľko sa odchyľujú odhadnuté hodnoty od skutočných hodnôt čím väčšia časť z celkovej variability je vysvetlená modelom, tým je model kvalitnejší Celkovú variabilitu môžeme vyjadriť ako súčet: - variability medzi skupinami - menlivosť skupinových priemerov v porovnaní s celkovým priemerom - vyjadruje pôsobenie faktora - preto aj variabilita vysvetlená modelom - variability v rámci skupín - menlivosť hodnôt v porovnaní s ich skupinovým priemerom, - vyjadruje pôsobenie náhodných činiteľov - variabilita nevysvetlená modelom Keďže variabilita medzi skupinami je variabilita vysvetlená modelom, znamená to že jej väčší podiel vyjadruje väčší vplyv faktora. Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Meranie variability sumou štvorcov - SS (Sum of Squares) sú väčšie odchýlky hodnôt od priemerov, tým je väčšia variabilita súčet odchýlok od priemeru sa rovná nule použije druhé mocniny odchýlok od priemerov suma štvorcov modelu - SSM meria variabilitu modelu akú časť variability časového radu možno vysvetliť pôsobením časovej premennej suma štvorcov náhodnej chyby (reziduálov) - SSE meria variabilitu náhodných činiteľov, čiže variabilitu chybovú akú časť variability časového radu nemožno vysvetliť pôsobením časovej premennej celková suma štvorcov - SST meria celkovú variabilitu časového radu Intuitívne je zrejmé, že variabilitu budeme merať podľa veľkosti odchýlok. Tie môžu mať ale kladné aj záporné znamienka, čím by sa ich vypovedacia schopnosť mohla stratiť. Preto použijeme ich druhé mocniny a aby sme akumulovali objem variability budeme používať sumu druhých mocnín na meranie variability v modeloch ANOVA. O sumách štvorcov platí tiež, že: SST=SSM+SSE Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Meranie variability celková variabilita variabilita vysvetlená modelom nevysvetlená variabilita celková variabilita Už je zrejmé, že posúdenie, či je vplyv faktora štatistický významný, bude vychádzať z porovnania variability. Porovnávať však možno len porovnateľné veličiny. Sumy štvorcov, preto musíme prepočítať na priemerné sumy, ktoré vyjadrujú, aká variabilita - vysvetlená alebo nevysvetlená - pripadá ne jednu jednotku. Z jednotkových mier už môžeme zostaviť mieru, ktorá nám bude slúžiť na zber dôkazov o dôležitosti vplyvu faktorov - testovaciu štatistiku. Testovacia štatistika pri ANOVA porovnáva jednotkovú variabilitu vysvetlenú modelom s jednotkovou variabilitou nevysvetlenou modelom. F= priemerná SSM / priemerná SSE na základe predchádzajúcej logiky môžeme prijať rozhodovacie pravidlo, čím je F a teda aj podiel variability vysvetlenej modelom väčší, tým viac máme dôkazov tým nižšia je p-hodnota tým na nižšej hladine môžeme zamietnuť nulovú hypotézu tým na nižšej hladine môžeme tvrdiť, že hodnoty závislej premennej sú výrazne ovplyvňované úrovňami faktora. Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu v Prognózovacom systéme informačné informujú o základných charakteristikách modelu Number of Nonmissing Observation počet nechýbajúcich pozorovaní v časovom rade - n Number of Observation celkový počet pozorovaní - dĺžka časového radu Number of Missing Actuals počet chýbajúcich vyrovnaných hodnôt ČR - odhadnutých skutočných Number of Missing Predicted Values počet chýbajúcich predikovaných hodnôt ČR - odhadnutých prognózovaných Number of Model Parameters počet parametrov odhadnutého modelu - k Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu v Prognózovacom systéme tradičné - merajú kvalitu modelu cez nevysvetlenú variabilitu, ktorá má podobu reziduálov ako celkovú hodnotu reziduálov Mean Error priemerná reziduálna odchýlka čím viac sa blíži k nule, tým je prognóza presnejšia Mean Percent Error priemerná percentuálna odchýlka ako absolútnu hodnotu reziduálov Mean Absolute Error priemerná absolútna reziduálna odchýlka Mean Percent Absolute Error priemerná percentuálna absolútna reziduálna odchýlka Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu v Prognózovacom systéme tradičné - merajú kvalitu modelu cez nevysvetlenú variabilitu, ktorá má podobu reziduálov ako štvorec hodnoty reziduálov Total Sum of Squares celková suma štvorcov ČR - SST Sum of Square Errors suma štvorcov reziduálov SSE ako nevysvetlená časť variability Mean Square Error priemerná štvorcová reziduálna odchýlka Root Mean Square Error odmocnina z priemernej štvorcovej reziduálnej odchýlky R-Square akú časť z celkovej variability vysvetlil model čím je vyššia, tým je model presnejší Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu v Prognózovacom systéme penalizačné - korigujú presnosť modelu o počet parametrov, ktoré boli potrebné na jej dosiahnutie Adjusted R-Square R-Square upravený počet parametrov umožňuje porovnávať modely s rôznym počtom parametrov Akaike’s Information Criterion vychádza z logaritmu MSE, ktorý upravuje o počet parametrov Schwarz Bayesian Information Criterion vychádza z logaritmu MSE, ktorý upravuje o počet parametrov a pozorovaní Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu v Prognózovacom systéme penalizačné - korigujú presnosť modelu o počet parametrov, ktoré boli potrebné na jej dosiahnutie Amemiya’s Adjusted R-Square prísnejšia úprava R2 o počet parametrov Amemiya’s Prediction Criterion meria kvalitu predikcie cez Amemiya’s Adjusted R-Square Random Walk R-Square je štatistikou porovnávajúcou chybu nami zvoleného modelu s chybou modelu náhodnej prechádzky Bratislava, Holiday Inn, 26. októbra 1998

E.3. Porovnanie kvality modelov SAS Institute E.3. Porovnanie kvality modelov Miery kvality modelu v Prognózovacom systéme doplnkové - upresňujú predstavu o intenzite reziduálnych odchýlok Maximum Error maximálna reziduálna odchýlka Minimum Error minimálna reziduálna odchýlka Maximum Percent Error maximálna percentuálna reziduálna odchýlka Minimum Percent Error minimálna percentuálna reziduálna odchýlka Bratislava, Holiday Inn, 26. októbra 1998