ŠTATISTICKÁ INDUKCIA.

Slides:

Advertisements

Podobné prezentácie

BOX – JENKINSOVE MODELY

Advertisements

Abstrakt Mgr. Imrich IŠTVAN, PhD..

ROZHODOVACIE STROMY doc. Ing. Kristína Machová, CSc.

Editovanie nových záznamov Modifikácia zadaní

E.3. Porovnanie kvality modelov

Miroslav Jakubec, Peter Kardoš

Algorithmic Chemistry in Genetic Programming Informatics and Information Technologies Student Research Conference, 2006 Vojtech Szöcs Vedúci projektu:

Určovanie storočí STOROČIE – časová jednotka, ktorá má sto rokov

Gymnázium J.G.Tajovského Kvantová mechanika Doplnok

OBJAVOVANIE VZOROV POHĽADU PRI NAVIGAČNÝCH ÚLOHÁCH NA WEBE

Riziká informačných technológií

ZVUK Marián Pitel.

MODELOVANIE ČASOVÝCH RADOV

Makroekonomický jav „...a aby nám žiaci neutiekli...“

Štatistika a spracovanie údajov

Náhoda a pravdepodobnosť

POMER RNDr. Marta Megyesiová.

Riešenie krízových situácií

Spracovanie postupnosti pohľadu pravdepodobnostnými modelmi

Pravdepodobnosť podmienená.

Market – trh Ing – dej, činnosť

Rovnice a ich riešenia Dušan Vágner 3.B.

ZNALOSTNÉ SYSTÉMY prednáška č. 6

Lineárna nerovnica.

Úvod do jazyka C Algoritmizácia úloh.

MODEL METEOROLOGICKÉHO

Ing. Jana Ďurišová Grafika pre web.

Základné nástroje manažérstva kvality (Kontrolná tabuľka a histogram)

Integrované riešenia EPM (Enterprise Project Management)

Databázové systémy.

Sem zadajte názov projektu Vaše meno Meno vyučujúceho Vaša škola

25/9/2018 Výsledok Tomáš Pavlík

Testovanie štatistických hypotéz

Inštalácia Windows verzie

Vedúci diplomovej práce: prof. Ing. Stanislav Marchevský, Csc.

Právna úprava podnikania

Dopady aktívnych opatrení trhu práce na zvyšovanie zamestnanosti

Opakovanie sekvencia postupnosť príkazov (príkaz je povel, ktorý počítač alebo iné zariadenie pozná a dokáže vykonať) vykonávanú v takom poradí, v akom.

Y = log x y = x2 + 3x + 7 y = x Funkcia y = 3x+ 5 y = sin x y = x + 4.

Komplexná technická starostlivosť o dopravnú techniku

Spracovanie digitálneho videa a vyhodnocovanie jeho kvality - základy

Matematika 6. ročník Spracovala: Mgr. Jaroslava LOŠÁKOVÁ

Zakladanie živností v Maďarsku 1. prednáška

optimálne programovanie

Mária Hrnčárová, Marek Mažáry 3.E

Vplyv stavebných úprav na všeobecnú hodnotu bytu

Prognóza trhu práce - skúsenosť z Českej republiky

Simplexová metóda Algoritmus primárne simplexovej metódy možno ideovo vyjadriť nasledovným spôsobom: Stanovenie bázického prípustného riešenia (bázy s.

Rovnice a ich riešenia.

Testovanie štatistických hypotéz v programe Excel

Pomer prevrátený pomer postupný pomer.

Problém výberu portfólia

Štandardy v procese spracovania bibliografických informácií i u nás.

ŠTATISTIKA A EFKÁRI IVONA MAGYAROVÁ 3.F BANSKÁ BYSTRICA 2006.

PhDr. Tatiana ARBE, OEMP ÚM STU

Rozpoznávanie obrazcov a spracovanie obrazu

Vyjadrovacie prostriedky v štatistike

Sopka z fyzikálneho hľadiska

Štatistika Martin Čuka 2010/ B.

Čo s malými písmenkami vo Win10 ?

PRAVDEPODOBNOSTNÝ POJEM doc. Ing. Kristína Machová, CSc.

Teórie ekonomického rastu Ing. Magdaléna Hajtmanková

Umiestnenia benchmarkov Štruktúry súborov Použitie súborov

Nepriama úmernosť – tabuľka, rovnica a graf

Prepis prezentácie:

ŠTATISTICKÁ INDUKCIA

PREDNÁŠKA 4 štatistická indukcia úlohy štatistickej indukcie druhy výberov teoretické rozdelenia teória odhadu bodový odhad intervalový odhad

Štatistická indukcia zaoberá sa výberovým skúmaním vo všeobecnosti štatistické skúmanie rozlišujeme: vyčerpávajúce (úplné) zisťovanie skúmajú sa všetky štatistické jednotky v rámci štatistického súboru spadá do deskriptívnej (popisnej) štatistiky závery majú deterministický charakter

Štatistická indukcia výberové (neúplné) zisťovanie skúmajú sa len vybrané jednotky závery majú pravdepodobnostný charakter spadá do induktívnej štatistiky

Výberové skúmanie Ak chceme vedieť ako chutí víno, uložené v hektolitrovom sude, nemusíme vypiť celý sud. Stačí malý dúšok k posúdeniu jeho kvality…. Ak však chceme zistiť, či náklad orechov v nákladnom aute je z veľkej časti pokazený, stačí keď vyberieme pár orechov z rôznych miest nákladu a rozlúskneme ich…

Štatistická indukcie – základné pojmy rozlišujem 2 základné pojmy: základný súbor (ZS) výberový súbor (VS)

Základný súbor všetky jednotky rozlišujeme ZS: ZS z hľadiska rozsahu: reálny hypotetický ZS z hľadiska rozsahu: konečný nekonečný

Výberový súbor je tvorený len vybranou časťou jednotiek ZS podmnožina jednotiek ZS je reprezentatívnou vzorkou ZS pri vyčerpávajúcom skúmaní je VS totožný so ZS

Výberové skúmanie vychádzajúc z teórie pravdepodobnosti závery z výberových skúmaní sú prakticky rovnocenné záverom z vyčerpávajúceho skúmania

Parameter základného súboru Označenia Parameter charakteristika popisujúca základný súbor Výberová charakteristika charakteristika popisujúca výberový súbor je odhadom parametrov základného súboru Parameter základného súboru Štatistika výberového súboru N - rozsah n - rozsah výberového súboru  - stredná hodnota - výberový priemer 2 - rozptyl s12 - výberový rozptyl  - smerodajná odchýlka s1 - výberová smerodajná odchýlka Q – všeobecné označenie un – všeobecné označenie

Štatistická indukcie cieľ – poznávať vlastnosti ZS na základe VS má dve základné úlohy: teória odhadu testovanie štatistických hypotéz pomocné úlohy: vytváranie VS – určovanie rozsahu VS, určenie spôsobu, druhu výberu jednotiek určenie teoretických rozdelení charakteristík získaných z výberových súborov - keďže výberové charakteristiky sú z hľadiska ZS náhodné veličiny, je potrebné zvoliť správny model rozdelenia výberových charakteristík

Vytváranie výberového súboru rozlišujeme rôzne druhy výberov podľa kritéria pre výber jednotiek: náhodný výber zámerný výber samovýber podľa opakovateľnosti výberu jednotky výber s opakovaním výber bez opakovania podľa členenia ZS jednoduchý zložený skupinový oblastný

Vytváranie výberového súboru Spôsob výberu = technika náhodného výberu: losovanie generátor náhodných čísel systematický náhodný výber

Teoretické rozdelenia v konkrétnom VS je výberová charakteristika (priemer, rozptyly, atď.) konštantnou veličinou z hľadiska skúmania ZS je však náhodnou veličinou z jedného ZS je možné vytvoriť veľký počet výberových súborov s určitým, vopred stanoveným rozsahom dostávame rôzne hodnoty výberových charakteristík každá výberová charakteristika je náhodnou veličinou

Teoretické rozdelenia každá náhodná veličina má svoje rozdelenie pravdepodobnosti, ktoré závisí od: rozdelenia pravdepodobnosti skúmanej premennej v ZS typu výberovej charakteristiky rozsahu VS

Teoretické rozdelenia najčastejšie používané rozdelenia: normálne rozdelenie c2 rozdelenie Studentovo rozdelenie Fischerovo rozdelenie

Teória odhadu bodový odhad – neznámy parameter ZS odhadujeme jedným číslom intervalový odhad – neznámy parameter ZS odhadujeme intervalom s vopred stanovenou spoľahlivosťou

Bodový odhad odhad parametra Q ZS jedným bodom (číslom) pomocou výberovej charakteristiky un, symbolicky: est Q = un výberová charakteristika je náhodná veličina, ktorej hodnoty kolíšu podľa toho, aké hodnoty xj sa dostali do VS

Bodový odhad rozdiel medzi Q a un – chyba odhadu Dun Dun=Q – un chyba odhadu - čo najmenšia pri odhadoch použiť najlepšie odhady, t.j. také výberové charakteristiky, ktoré zaručujú malú chybu odhadu Dun

Bodový odhad výberová charakteristika un, ktorá je bodovým odhadom parametra Q ZS musí mať vlastnosti, ktoré zabezpečia, aby Dun bola čo najmenšia základné vlastnosti bodových odhadov: konzistencia neskreslenosť výdatnosť suficiencia

Konzistencia výberová charakteristika un je konzistentným odhadom parametra Q ZS, ak platí: tzn.: čím je väčší rozsah VS, tým sa výberová charakteristika líši od parametra len minimálne.

Konzistencia podstata konzistencie je v zákone veľkých čísel. Konzistencia zabezpečuje, že rozdiel medzi odhadom a parametrom sa s rastúcou veľkosťou výberu znižuje. postačujúcou podmienkou konzistencie je asymptotická neskreslenosť odhadu un a splnenie vzťahu:

Neskreslenosť výberová charakteristika un je neskresleným odhadom parametra Q ZS, ak platí: asymptoticky neskreslený odhad parametra Q je výberová charakteristika, pre ktorú platí:

Neskreslenosť neskreslenosť znamená, že stredná hodnota odchýlok odhadov zo všetkých možných VS s rozsahom n od parametra Q sa rovná 0 v každom konkrétnom prípade výberového skúmania sa dopúšťame chyby, avšak požadujeme aby stredná hodnota chýb bola rovná nule (t.j. aby sa v priemere nulovali…)

Výdatnosť každá výberová charakteristika je náhodná veličina, ktorej variabilitu meriame rozptylom výberovú charakteristiku nazývame výdatným odhadom, ak zo všetkých možných výberových charakteristík má najmenší rozptyl

Suficiencia dostatočnosť okrem výberovej charakteristiky un neexistuje žiadna iná charakteristika, ktorá by poskytovala ďalšie doplňujúce informácie o odhadovanom parametri Q ZS.

Bodový odhad strednej hodnoty  nazývame stredná, resp. štandardná chyba priemeru Pretože dáva neskreslený odhad  platí:

Bodový odhad strednej hodnoty  je splnená postačujúca podmienka konzistencie a je neskresleným a konzistentným odhadom strednej hodnoty  odhadom strednej hodnoty ZS je výberový priemer

Bodový odhad rozptylu s2 rozptyl výberového súboru s2 teda nie je neskresleným odhadom 2 rozptyl výberového súboru je asymptoticky neskresleným odhadom 2, pretože

Bodový odhad rozptylu s2 neskresleným bodovým odhadom rozptylu základného súboru 2 je výberový rozptyl s12 Besselova oprava rozdiel medzi s12 a s2 je tým menší, čím je väčšie n, teda pri rozsiahlych výberových súboroch je zanedbateľný (už pri n>50)

Bodový odhad - záver strednú hodnotu ZS odhadujeme pomocou výberového priemeru rozptyl ZS odhadujeme pomocou výberového rozptylu smerodajnú odchýlku ZS odhadujeme pomocou výberovej smerodajnej odchýlky

Intervalový odhad bodový odhad – vtedy keď je nevyhnutné, aby odhadom bolo jedno konkrétne číslo bodový odhad výberovej charakteristiky poskytuje síce neskreslený a výdatný odhad, nevieme však určiť chybu, ktorej sa dopúšťame bodový odhad sa preto používa len ako východisko pre intervalové odhady a testovanie štatistických hypotéz

Intervalový odhad intervalovým odhadom parametra ZS Q: t.j. odhadovaný parameter Q sa nachádza v intervale (q1,q2) s pravdepodobnosťou 1-a interval (q1,q2) = interval spoľahlivosti je závislý od a

Intervalový odhad a – udáva pravdepodobnosť, že parameter Q nie je z intervalu spoľahlivosti – riziko odhadu pravdepodobnosť 1-a potom hovorí, že parameter ZS je z intervalu (q1,q2) a nazýva sa koeficient spoľahlivosti, resp. spoľahlivosť odhadu f(un) a1+a2=a a1 1-a a2 q1 q2 Q

Intervalový odhad so zvyšovaním spoľahlivosti sa rozširuje interval spoľahlivosti a tým sa znižuje presnosť odhadu pri nižšej spoľahlivosti je síce interval spoľahlivosti užší, ale súčasne sa zvyšuje riziko odhadu prakticky sa volí spoľahlivosť 1-a = 95%, resp. 99% základom intervalového odhadu je: odhad charakteristiky un určenie rozdelenia un

Intervalový odhad pre strednú hodnotu m predpokladajme, že štatistický znak X v základnom súbore má …N(,2) ak vytvoríme výberový súbor o rozsahu n, potom aj ak poznáme rozptyl základného súboru (teoretické východisko), vytvoríme normovanú premennú: u má rozdelenie N(0,1) nezávislé od strednej hodnoty 

Intervalový odhad pre strednú hodnotu m f(un)=N(0,1) a/2 1-a a/2 -u1-a/2 u1-a/2 podľa N(0,1) určíme q1, q2 = u1-a/2

Intervalový odhad pre strednú hodnotu m po úprave: 1-a a/2 -u1-a/2 u1-a/2 prípustná chyba závisí od: zvolenej spoľahlivosti variability ZS rozsahu VS D D

Intervalový odhad pre strednú hodnotu m určenie hodnoty u1-a/2 áno poznáme s? nie est s=s1 u1-a/2 ..... N(0,1) NORMSINV(1-a/2) áno n>30 nie u1-a/2 ..... ta, (n-1) TINV(a, (n-1))

Rozsah výberu pri zvolenej prípustnej chybe, spoľahlivosti a na základe odhadu variability je možné odvodiť vzťah pre určenie rozsahu výberu:

Intervalový odhad pre rozptyl s2 a s vytvoríme veličinu: c2 má c2 rozdelenie s (n-1) stupňami voľnosti na základe c2 vytvoríme interval spoľahlivosti pre s2 po úprave:

Intervalový odhad pre rozptyl s2 a s interval spoľahlivosti pre smerodajnú odchýlku s /2 21-/2 2/2 f(2) 1 -  hodnoty c21-a/2 a c2a/2 Þ kvantily c2 rozdelenia CHIINV(a/2, (n-1)) CHIINV(1-a/2, (n-1))

ĎAKUJEM ZA POZORNOSŤ