Testovanie štatistických hypotéz

Slides:



Advertisements
Podobné prezentácie
BOX – JENKINSOVE MODELY
Advertisements

Abstrakt Mgr. Imrich IŠTVAN, PhD..
ROZHODOVACIE STROMY doc. Ing. Kristína Machová, CSc.
Editovanie nových záznamov Modifikácia zadaní
E.3. Porovnanie kvality modelov
Pytagorova veta Autor: Matúš Halaj.
OBJAVOVANIE VZOROV POHĽADU PRI NAVIGAČNÝCH ÚLOHÁCH NA WEBE
Svet bublín Martina Ľuptáková, 3.A Šk. rok: 2008/2009.
Rodinné právo prednáška č. 3.
7., 8. Signalizácia realizovaná LED - diódou
ZVUK Marián Pitel.
Rozpoznávanie obrazcov šk.r
Makroekonomický jav „...a aby nám žiaci neutiekli...“
ŠTATISTICKÁ INDUKCIA.
Štatistika a spracovanie údajov
Školiteľ: Ing. Helena Fidlerová, PhD.
Náhoda a pravdepodobnosť
Učíme efektívne a moderne – inovácia vyučovacieho procesu
ROEP REGISTER OBNOVENEJ EVIDENCIE PODY
Riešenie krízových situácií
Spracovanie postupnosti pohľadu pravdepodobnostnými modelmi
Pravdepodobnosť podmienená.
Market – trh Ing – dej, činnosť
Rekurzívne funkcie.
Rovnice a ich riešenia Dušan Vágner 3.B.
ZNALOSTNÉ SYSTÉMY prednáška č. 6
Úvod do jazyka C Algoritmizácia úloh.
ŠTVORUHOLNÍKY spracovala Mgr. Jaroslava Lošáková
Výkaz ISCP TREXIMA.
Nezdaniteľné časti základu dane
Kritériá vyhodnocovania investičných projektov
Základné nástroje manažérstva kvality (Kontrolná tabuľka a histogram)
Binárne Relácie Szendreyová Alžbeta.
Databázové systémy.
Odčítanie celých čísel
Sem zadajte názov projektu Vaše meno Meno vyučujúceho Vaša škola
Interpolačné metódy Medzi základné interpolačné metódy patria:
Čierne diery.
EBSCO Discovery Service ~ Jednoduché vyhľadávanie
(Digitálny prezentačný materiál)
stavebný a znalecký softvér
Regióny a regionálny rozvoj
Optika Optické zobrazovanie
Opakovanie sekvencia postupnosť príkazov (príkaz je povel, ktorý počítač alebo iné zariadenie pozná a dokáže vykonať) vykonávanú v takom poradí, v akom.
Y = log x y = x2 + 3x + 7 y = x Funkcia y = 3x+ 5 y = sin x y = x + 4.
Bregmanove divergencie Využitie indexovacích štruktúr pre efektívne podobnostné vyhľadávanie Lukáš Holecy Bregmanove divergencie.
Matematika 6. ročník Spracovala: Mgr. Jaroslava LOŠÁKOVÁ
Stredná odborná škola automobilová Moldavská cesta 2, Košice
Zakladanie živností v Maďarsku 1. prednáška
optimálne programovanie
Simplexová metóda Algoritmus primárne simplexovej metódy možno ideovo vyjadriť nasledovným spôsobom: Stanovenie bázického prípustného riešenia (bázy s.
Rovnice a ich riešenia.
Testovanie štatistických hypotéz v programe Excel
Pomer prevrátený pomer postupný pomer.
Lineárne r o v n i c e Mgr. Ján Nandráži spracovala: E. Hlačinová.
Problém výberu portfólia
PYTAGOROVA VETA.
ŠTATISTIKA A EFKÁRI IVONA MAGYAROVÁ 3.F BANSKÁ BYSTRICA 2006.
PhDr. Tatiana ARBE, OEMP ÚM STU
Kvantitatívny prieskum TV BA
Rozpoznávanie obrazcov a spracovanie obrazu
Vyjadrovacie prostriedky v štatistike
Aerodynamika u áut D.Jesenovský.
Sopka z fyzikálneho hľadiska
Štatistika Martin Čuka 2010/ B.
Čo s malými písmenkami vo Win10 ?
PRAVDEPODOBNOSTNÝ POJEM doc. Ing. Kristína Machová, CSc.
Nepriama úmernosť – tabuľka, rovnica a graf
Prepis prezentácie:

Testovanie štatistických hypotéz

Parametre základného súboru nepoznáme. Môžeme však o nich vysloviť určité predpoklady, ktoré formulujeme ako hypotézy a overujeme štatistickými postupmi - testovanie štitistických hypotéz (TH). Overovať možno nielen predpoklady o parametroch (napríklad strednej hodnote, rozptyle, smerodajnej odchylke), ale aj o tvare rozdelenia štatistického znaku (napr. testovanie zhody empirického rozdelenia s normálnym.

Príklady: Chceme overiť, či sa priemerné výdavky na potraviny v r. 2000 významne zvýšili oproti r.1999, pričom na základe výberového skúmania predstavovali v r. 1999 34% a v r. 2000 36% Výrobca reflektorov uvádza, že ich životnosť predstavuje 70 hodín. Za tým účelom sa uskutočnilo výberové skúmanie a na vzorke 20 reflektorov sa zistila priemerná životnosť 67 hodín a výberová smerodajná odchýlka 2 hodiny. Má výrobca pravdu ???

Základné pojmy H0 :  = 0, , všeobecne H0 : G= G0 Formulujeme východiskovú - nulovú hypotézu H0 , ktorá vždy tvrdí zhodu toho čo porovnávame - testujeme Oproti nulovej hypotéze formulujeme alternatívnu hypotézu H1, napr. H1 :   0, , všeobecne H1 : G  G0, obojstranný test resp. H1 : G > G0 jednostranné H1 : G <G0 testy Nulová a alternatívna hypotéza sa musia vzájomne vylučovať

Parameter základného súboru G, o ktorom máme určitú hypotézu, nepoznáme, iba ho odhadujeme na základe výberového súboru, pomocou výberovej charkteristiky un . Rozhodnutie o zamietnutí resp. nezamietnutí nulovej hypotézy uskutočňujeme na základe náhodného výberu. Nemôžme ho urobiť s absolútnou presnosťou. Existuje riziko odhadu. Za predpokladu, že platí nulová hypotéza , rovná sa parameter G predpokladanej veličine G0. Keďže est. G = un, potom rozdiel  = un - G0 je iba náhodnou chybou , spôsobenou náhodným výberom.

Ak však H0 neplatí , t.j. G  G0 , potom sa rozdiel môže skladať z náhodnej chyby systematickej chyby, ktorá odráža skutočný rozdiel medzi parametrom základného súboru G a jeho predpokladanou veľkosťou G0  = un - G0 = (un - G) + (G - G0 ) Náhodná chyba Systematická chyba - rozdiel V praxi nemožno zistiť , či rozdiel  obsahuje iba náhodnú chybu, alebo aj systematickú. Ak je však  malé pripisujeme ho iba náhodnosti výberu, ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel.

Rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá znalosť kritickej hodnoty, ktorá všetky možné výsledky  rozdelí na dve časti : pri rozdieloch menších ako kritická hodnota H0 nezamietame, pri rozdieloch  ako kritická hodnota, H0 zamietame. Veľkosť  v konkrétnych prípadoch kolíše, je náhodnou veličinou,. Preto sa snažíme transformovať , ktoré je funkciou un a parametra základného súboru G na veličinu G, ktorá má známe teoretické rozdelenie (napr. Normované normálne, res. Studentovo či iné rozdelenie). G = f() pričom funkcia hustoty náhodnej premennej G je f(g) Vychádzame z platnosti H0:G = G0 a vypočítame testovaciu charakteristiku g = f(un , G0)

Rozhodnutie o výsledku testu:Môžeme potom nájsť také kritické hodnoty g1 a g2 náhodnej veličiny G , pre ktoré platí: P(g1  G  g2) = 1 -  alebo P(g1  G  g2) =  /2 1 -  g1 Obor prijatia hypotézy H0  - hladina významnosti, základná hodnota je 0.05 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0

Rozhodnutie o výsledku testu, zamietnutí resp Rozhodnutie o výsledku testu, zamietnutí resp. nezamietnutí nulovej hypotézy H0 závisí od voľby hladiny významnosti , hladina významnosti  rozdeľuje obor hodnôt veličiny G na obor prijatia a obory zamietnutia H0

1 -  … pravdepodobnosť prijatia správnej hypotézy Pri testovaní sa všeobecne dopúšťame dvoch chýb: Chyba prvého druhu  chyba druhého druhu  1 -  … pravdepodobnosť prijatia správnej hypotézy 1 -  …sila testu f(H0) f(H1) 1 -  1 -   = P(H1/H0) = P(H0/H1)

- chyba prvého druhu, ktorá vzniká pri zamietnutí správnej hypotézy Schematicky môžeme možné výsledky rozhodovacieho procesu pri testovaní štatistických hypotéz znázorniť takto:   Hypotéza Rozhodnutie Správna Nesprávna   Nezamietam Správne rozhodnutie Chyba 2.druhu Zamietam Chyba 1.druhu   -  chyba prvého druhu, ktorá vzniká pri zamietnutí správnej hypotézy - chyba druhého druhu, ktorá vzniká pri prijatí nesprávnej hypotézy

Všeobecný algoritmus testovania:   na základe vecne logického rozboru úlohy formulujeme nulovú (základnú) a alternatívnu hypotézu. na základe naformulovaných hypotéz volíme testovacie kritérium výpočet hodnoty testovacieho kritéria z údajov náhodného výberu určíme obor prijatia a obor zamietnutia nulovej hypotézy, tj. vyhľadáme v tabuľkách alebo vypočítame kvantily rozdelenia testovacieho kritéria. formulujeme záver a vyhodnotenie testu, na základe porovnania vypočítanej hodnoty testovacieho kritéria a kritických hodnôt.

Testy hypotéz o strednej hodnote Testy zhody strednej hodnoty so známou konštantou H0 : = 0 Nech štatistický znak X má v základnom súbore približne normálne rozdelenie ….N(, 2) Predpokladajme, že odhadovaná stredná hodnota  sa rovná známej konštante  0, t.j. H0 : = 0 oproti alternatívnej hypotéze - pri obostrannom teste H1 :   0 -         pri pravostrannom teste H1 :  > 0 -         pri ľavostrannom teste H1 :  < 0

a) predpokladajme, že poznáme rozptyl základného súboru 2 (teoretický predpoklad) a n je väčšie ako 30 Potom vytvoríme ako testovaciu chrakteristiku náhodnú veličinu: má …N(0,1)

Rozhodnutie o výsledku testu: H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný Pravostranný Ľavostranný Rozhodnutie Test

b) Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru n > 30 môžme použiť N(0,1) Vyhodnotenie testu je rovnaké ako v predchádzajúcom prípade.

Rozhodnutie o výsledku testu: H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný Pravostranný Ľavostranný Rozhodnutie Test

c) Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru n  30 t má Studentovo rozdelenie s v = (n-1) stupňami voľnosti

Schéma vyhodnotenia testu: H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný Pravostranný Ľavostranný Rozhodnutie Test Ak znázorníme obor možných hodnôt testovacieho kritéria v absolútnej hodnote úsečkou takto:   OP – OZ + OZ + +

Testy hypotéz o rozptyle Test zhody rozptylu s konštantou Testujeme nulovú hypotézu o zhode rozptylu základného súboru so známou konštantou , čo sformulujeme do zápisu: H0 : oproti alternatívnej hypotéze   -         pri obojstrannom teste H1 :

Schéma vyhodnotenia testu: Testovacie kritérium má chí kvadrát rozdelenie s (n-1) stupňami voľnosti. Obor prijatia a obor zamietnutia nulovej hypotézy pre stupne voľnosti v  = n-1 a hladinu významnosti, sú nasledovné:   Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný a

Test zhody dvoch rozptylov Uvažujeme, dva náhodné výbery z normálnym rozdelením prvý o veľkosti n1 s výberovým rozptylom   druhý s rozsahom n2 s výberovým rozptylom . Predpokladajme zhodu rozptylov dvoch základných súborov tj:   H0 : oproti alternatívnej hypotéze pri obojstrannom teste H1 : Testovacím kritériom je veličina    ktorá má rozdelenie F so stupňami voľnosti v = (n1 – 1);(n2 – 1) a hladinou významnosti .

Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný a

Testy zhody viac ako dvoch rozptylov   Ak porovnávame zhodu viac ako dvoch rozptylov navzájom nezávislých náhodných výberov pochádzajúcich zo základných súborov s normálnym rozdelením , pričom parametre základných súborov nepoznáme, formulujme nulovú hypotézu v tvare: H0 : kde k je počet náhodných výberov s rozsahmi Nulovú hypotézu overujeme pomocou Bartlettovho, Cochranovho a Hartteyovho testu. Bartlettov test vychádza z predpokladu, že všetkých k  výberov pochádza zo základného súboru s normálnym rozdelením  s rovnakým rozptylom, je založený na výpočte testovacieho kritéria

Kde ( ) je nestranný výberový rozptyl i-teho výberu, Veličina B má pri platnosti H0 približne rozdelenie s stupňami voľnosti (pokiaľ ni > 6, pre ). Nulovú hypotézu o zhode rozptylov na hladine významnosti prijímame, ak testovacie kritérium je menšie ako kritická hodnota . Bartlettov test je veľmi citlivý na dodržanie predpokladu normality rozdelenia náhodných chýb.

Ak majú všetky výberové súbory rovnaké rozsahy tj. = n, je k testovaniu nulovej hypotézy lepšie použiť Cochranov test, založený na testovacom kritériu:   pričom ak je vypočítaná hodnota testovacieho kritéria G menšia ako kritická hodnota pre Cochranov test , nulovú hypotézu o zhode rozptylov prijímame (k je počet porovnávaných rozptylov, sú stupne voľnosti, je zvolená hladina významnosti).

Hartleyov test vychádza z tých istých predpokladov o zhode rozsahov výberových súborov a predpoklade normality rozdelenia a testovacie kritérium je definované vzťahom   nulovú hypotézu prijímame ak vypočítaná hodnota je menšia ako kritická hodnota pre Hartleyov test , (k je počet porovnávaných rozptylov, sú stupne voľnosti, je zvolená hladina významnosti).

Testy hypotéz o zhode dvoch stredných hodnôt Pred samotným popisom testov parametrov z niekoľkých súborov je potrebné rozlíšiť či robíme úsudky z nezávislých alebo závislých súborov. U nezávislých súborov predpokladáme, že výber štatistických jednotiek z jedného základného súboru nezávisí na výbere štatistických jednotiek z druhého súboru. U závislých súborov naopak výber jednotiek z prvého súboru závisí na výbere jednotiek zo súboru druhého, pričom sa vytvára logický pár z jednotiek oboch súborov ( často sa používa označenie párový test ). Niekedy môže byť vytvorenie takéhoto páru dané priamo tým, že skúmame rovnaké jednotky za rôznych okolností, v rôznych obdobiach (napr. tržby pred a po reklame ) a pod.

Testy hypotéz o zhode dvoch stredných hodnôt pre nezávislé súbory Nech štatistický znak X1 má v prvom základnom súbore približne normálne rozdelenie ….N(1, 12) Štatistický znak X2 má v druhom základnom súbore tiež približne normálne rozdelenie ….N(2, 22) Predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné, t.j. testujeme H0 :1 = 2 oproti alternatívnej hypotéze H1 :1  2 pri obostrannom teste est 1 = … N(1, 12/n1) est 2 = … N(2, 22/n2)

základných súborov , čo je však vzácne a výberové súbory ► ďalší postup závisí na tom, čo platí pre rozptyly. Ak poznáme rozptyly základných súborov , čo je však vzácne a výberové súbory sú veľké (rozsahy výberových súborov sú väčšie ako 30), použijeme pre testovacie kritérium veličinu ktorá má normované normálne rozdelenie s parametrami 0,1 Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný

ktorá má normované normálne rozdelenie s parametrami 0,1 ► ak nepoznáme rozptyly základných súborov a a výberové súbory sú veľké, použijeme ako testovacie kritérium veličinu u, v ktorej nahradíme rozptyly základných súborov ich odhadmi pomocou výberových rozptylov . ktorá má normované normálne rozdelenie s parametrami 0,1 Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný

► ak nepoznáme rozptyly základných súborov, ale môžeme aspoň predpokladať ich zhodu (o reálnosti tohto predpokladu sa presvedčíme testom o zhode rozptylov) a výberové súbory sú malé (rozsahy sú menšie ako 30), použijeme ako testovacie kritérium   ktorá má Studentovo t rozdelenie s (n1 + n2 – 2) stupňami voľnosti. Vypočítané testovacie kritérium t porovnávame s kvantilmi Studentovho t rozdelenia pre zvolenú hladinu významnosti a  v = ( n – 1 ) stupňov voľnosti. Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný

Zhoda dvoch stredných hodnôt pre závislé súbory. Predpokladajme, že máme dva závislé súbory s normálnym rozdelením a rovnakými rozsahmi n1 = n2 = n. Pre každú dvojicu ( pár ) údajov vypočítame rozdiel a vypočítame aritmetický priemer a rozptyl : Nulovú hypotézu pre posúdenie zhody dvoch stredných hodnôt pre závislé súbory naformulujeme v tvare H0 :

oproti alternatívnej hypotéze - H1 :   -         H1 : Testovacím kritériom je veličina   ktorá má Studentovo t rozdelenie s  v = (n – 1) stupňami voľnosti. Obory prijatia a zamietnutia nulovej hypotézy sú definované takto: Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný