Statistika malog uzorka. Vrste uzoraka. Mali uzorak Linearna statistika malog uzorka

U praksi se često mora raditi sa vrlo malim uzorcima, čiji je broj znatno manji od dvadeset do trideset. U statistici se takvi uzorci nazivaju mali uzorci. Potreba za posebnim razmatranjem malih uzoraka uzrokovana je činjenicom da metode tačkaste i intervalne procjene karakteristika uzorka o kojima se govorilo zahtijevaju dovoljno veliki broj uzoraka.

Koncept malih uzoraka. Distribucija studenata

Srednja vrijednost uzorka i, shodno tome, njegova greška su normalno raspoređeni, a korekcija za pristrasnost varijanse uzorka je vrlo blizu jedinici i nema praktični značaj. Greška uzorkovanja u ovim uslovima veoma retko prelazi ovu vrednost. Situacija je drugačija s malom veličinom uzorka. Kod malih uzoraka, varijansa uzorka je značajno pristrasna. Stoga bi bilo neprikladno koristiti funkciju normalne distribucije za vjerojatnostne zaključke o mogućoj veličini greške. Kada je veličina uzorka mala, uvijek biste trebali koristiti nepristrasnu procjenu varijance:

Stoga, da bi se dobila nepristrasna procjena varijanse iz podataka malog uzorka, zbir kvadrata odstupanja mora se podijeliti sa vrijednošću. Ova veličina se naziva brojem stupnjeva slobode varijacije. U nastavku, radi kratkoće, broj stupnjeva slobode varijacije će biti označen grčkim slovom (nu).

Problem procene karakteristika uzorka na osnovu malih uzoraka prvi je proučavao engleski matematičar i statističar W. Gosset, koji je svoj rad objavio pod pseudonimom Student (1908).

Na osnovu pretpostavke da je distribucija neke karakteristike u opštoj populaciji normalna i uzimajući u obzir, umjesto apsolutnih odstupanja, njihov odnos prema nezavisnom standardu, Student je pronašao distribuciju koja ovisi samo o veličini uzorka. Kasnije (1925) R. Fisher je dao rigorozniji dokaz ove distribucije, koji je nazvan Studentovom raspodjelom.

Studentova t vrijednost se izražava kao sljedeći omjer:

Brojač izraza sadrži promenljivu vrednost koja odražava moguća odstupanja srednjih vrednosti uzorka od opšte srednje vrednosti. Količina je normalno raspoređena sa centrom jednakim nuli i varijansom jednakom.

Posebno treba naglasiti da se imenilac izraza ne može smatrati prosječnom greškom varijable. Količina se ovdje razmatra kao varijabla nezavisno raspoređena od brojilaca. označava srednju kvadratnu (standardnu) devijaciju datog uzorka i nije procjena populacije, pošto Studentova raspodjela ne zavisi ni od jednog parametra populacije. utvrđeno iz podataka uzorka kao

Distribucije su nezavisne jedna od druge. Samo pod ovim uslovom i za uzorke iz normalnih populacija dolazi do Studentove distribucije.

Glavna prednost Studentove distribucije je u tome što ne zavisi od parametara populacije i bavi se samo količinama dobijenim direktno iz uzorka.

Diferencijalni zakon Studentova raspodjela (gustina vjerovatnoće) ima oblik:

gdje je veličina uzorka;

vrijednost koja odgovara maksimalnoj ordinati krivulje distribucije pri t = 0.

U skladu s tim, Studentova funkcija raspodjele je izražena:

Drugim riječima,

gdje je t f standardizirana (normalizirana) razlika izračunata iz rezultata malog uzorka.

Veličine G() i G() su gama funkcije. Za određeni broj, gama funkcija je izražena nepravilnim integralom:

U malim uzorcima to je uvijek pozitivan cijeli broj (veličina uzorka).

U ovom slučaju, gama funkcija uvijek ima konačnu vrijednost i izražava se kroz faktorijele:

dakle:

Prilikom izračunavanja gama funkcije korisno je znati sljedeća svojstva:

1) ako postoji;

  • 3) Na primjer,

Koristeći ovo svojstvo, možete lako izračunati vrijednosti G() i G() u smislu gustine distribucije;

4) Funkcija dostiže minimum na razlomku vrijednosti

Slika 3.1

Opšti pogled na gama funkciju prikazan je na Sl. 3.1.

Od svojstava Studentove distribucije, koja se obično razmatraju u predmetu teorije vjerovatnoće, skreće se pažnja na sljedeće:

1) Studentova distribucija je izuzetna po tome što zavisi samo od jednog parametra - veličine uzorka i ne zavisi od srednje vrednosti i varijanse populacije (za razliku od normalne distribucije koja zavisi od ova dva parametra).

  • 2) Studentova distribucija je tačna za bilo koju veličinu uzorka, a samim tim i za male uzorke, što omogućava da se iz malog broja zapažanja donesu vjerovatnočni zaključci.
  • 3) Kako se veličina uzorka povećava, vrijednost se približava vrijednosti, a Studentova distribucija se približava normalnoj. Kada Studentova distribucija postane normalna. U praksi se smatra dovoljnim za normalnu aproksimaciju.

Slika 3.2

Na sl. Slika 3.2 prikazuje odnos između Studentove distribucije i normalne distribucije.

Kao što se može videti sa sl. 3.2, ispod krajeva Studentove krive raspodjele, na primjer ili, nalazi se znatno veći dio površine nego ispod krive normalne distribucije za iste vrijednosti. To znači da se s malom veličinom uzorka vjerovatnoća velikih grešaka značajno povećava. Slika pokazuje da je za vrijednosti normaliziranog odstupanja koje prelaze apsolutnu vrijednost, površina ispod Studentove krive raspodjele mnogo veća nego ispod krive normalne distribucije.

O veličini neslaganja između vrijednosti funkcije Studentove distribucije u zavisnosti od veličine uzorka i vrijednosti normalne funkcije raspodjele može se suditi iz podataka u tabeli. 3.2, koji prikazuje vrijednosti površina ispod krivulje distribucije za različite veličine uzorka pri.

Tabela 3.1

Vrijednost funkcije normalne distribucije

Tabela 3.2

Vrijednosti vjerojatnosti za različite veličine uzorka

Normalizovano odstupanje

Značaj za male uzorke sa brojevima

Značaj za velike uzorke

Iz tabele 3.2. Može se vidjeti da kako se veličina uzorka povećava, mali uzorak se brzo približava normalnom. Istovremeno, s vrlo malom veličinom uzorka, odstupanja između vrijednosti na datoj vrijednosti su vrlo značajna.

Istraživanja su pokazala da je Studentova raspodjela praktično primjenjiva ne samo u slučaju normalne distribucije neke karakteristike u opštoj populaciji. Pokazalo se da to dovodi do praktično prihvatljivih zaključaka čak i kada distribucija karakteristike u općoj populaciji nije normalna, već samo simetrična, pa čak i donekle asimetrična, ali veličina uzorka nije premala.

Vrijednosti funkcije Studentove distribucije tabelarizirane su na različitim vrijednostima, pa se za procjenu karakteristika uzorka koriste gotove tabele:

Tabela 3.3

Tablica vrijednosti funkcije

Vrijednosti funkcije Studentove raspodjele mogu se koristiti na različite načine ovisno o prirodi problema koji se rješavaju prilikom određivanja vjerovatnoće odstupanja uzorka od opšteg. Najčešće korišteni:

1) Određivanje vjerovatnoće da će razlika između uzorka i opšte srednje vrijednosti biti manja za određeni određeni iznos. Kod normalizovanih odstupanja zadatak se svodi na određivanje verovatnoće da će to biti manje od vrijednosti, specificirano uslovima problema, tj. do pronalaženja vrednosti

Slika 3.3

Ovo je vjerovatnoća velikih negativnih odstupanja, što je prikazano na Sl. 3.3 odgovara zasjenjenom području.

2) Određivanje vjerovatnoće da razlika između uzorka i opšte srednje vrijednosti neće biti manja od određene specificirane vrijednosti, drugim riječima, treba pronaći

Slika 3.4

Ovo je vjerovatnoća velikih pozitivnih odstupanja, što je prikazano kao zasjenjeno područje na Sl. 3.4. ova vjerovatnoća se može lako pronaći pomoću tabela.

3) Određivanje vjerovatnoće da će normalizovano odstupanje u apsolutnoj vrijednosti biti manje izraženo

Ovo je vjerovatnoća odstupanja manjih apsolutnih vrijednosti. Ova vjerovatnoća se može odrediti pomoću tabela. Budući da je u praksi najčešće potrebno odrediti ovu vjerovatnoću, sastavljena je posebna tabela vrijednosti (tabela 3.3).

Grafička ilustracija vjerovatnoće odstupanja manjih apsolutnih vrijednosti data je na Sl. 3.5

Slika 3.5

4) Određivanje vjerovatnoće da greška uzorkovanja u apsolutnoj vrijednosti neće biti manja od određene specificirane vrijednosti. U normalizovanim jedinicama biće izražena verovatnoća da apsolutna vrednost neće biti ništa manja

Ovo je vjerovatnoća odstupanja velikih apsolutnih vrijednosti. To je grafički ilustrovano na Sl. 3.6.

Slika 3.6

Za pronalaženje vjerovatnoće velikih apsolutnih odstupanja vrijednosti postoje posebne tabele (Prilog 3). Ova vjerovatnoća se može lako izračunati korištenjem tabela.

Prilikom kontrole kvaliteta robe u ekonomskim istraživanjima, eksperiment se može provesti na osnovu malog uzorka.

Ispod mali uzorak odnosi se na nekontinuirano statističko istraživanje u kojem se populacija uzorka formira od relativno malog broja jedinica u općoj populaciji. Volumen malog uzorka obično ne prelazi 30 jedinica i može doseći 4-5 jedinica.

U trgovini, minimalna veličina uzorka se koristi kada je veliki uzorak ili nemoguć ili nepraktičan (na primjer, ako istraživanje uključuje oštećenje ili uništavanje uzoraka koji se ispituju).

Veličina greške malog uzorka određena je formulama koje se razlikuju od formula posmatranja uzorka sa relativno velikom veličinom uzorka (n>100). Prosječna greška malog uzorkau(mu)m.v. izračunato po formuli:

um.v = korijen (Gsquare(m.v.) . /n),

gdje je Gsquared (m.v.) varijansa malog uzorka. *ovo je sigma*

Prema formuli (broj je tamo) imamo:

G0kvadrat=Gkvadrat *n/ (n-1).

Ali pošto je kod malog uzorka n/(n-1) značajan, izračunavanje varijanse malog uzorka se vrši uzimajući u obzir takozvani broj stepeni slobode. Broj stupnjeva slobode odnosi se na broj opcija koje mogu uzeti proizvoljne vrijednosti bez promjene vrijednosti prosjeka. Prilikom određivanja varijanse Gsquared, broj stupnjeva slobode je n-1:

Gkvadrat(m.v.) = zbir (xi–x(sa valovitom linijom))/(n-1).

Granična greška malog uzorka Dm.v. (znak trokuta) određena je formulom:

U ovom slučaju, vrijednost koeficijenta povjerenja t ovisi ne samo od date vjerovatnoće povjerenja, već i od broja jedinica uzorkovanja n. Za pojedinačne vrijednosti t i n, vjerovatnoća pouzdanosti malog uzorka se određuje pomoću posebnih Studentovih tabela, koje daju distribuciju standardiziranih odstupanja:

t= (x(sa talasastom linijom) –x(sa linijom)) /Gm.v.

Učeničke tabele su date u udžbenicima na matematičke statistike. Evo nekih vrijednosti iz ovih tabela koje karakteriziraju vjerovatnoću da marginalna greška malog uzorka neće premašiti t puta prosječnu grešku:

St=P[(x(sa valovitom linijom) –x(sa linijom)

Kako se veličina uzorka povećava, Studentova raspodjela se približava normalnoj, a na 20 više se ne razlikuje mnogo od normalne distribucije.

Prilikom provođenja istraživanja malih uzoraka, važno je imati na umu da što je manji uzorak, to je veća razlika između Studentove distribucije i normalne distribucije. Uz minimalnu veličinu uzorka (n=4), ova razlika je prilično značajna, što ukazuje na smanjenje tačnosti rezultata malog uzorka.

Koristeći mali uzorak u trgovini, rješava se niz praktičnih problema, prije svega utvrđivanje granice unutar koje se nalazi opći prosjek karakteristike koja se proučava.

S obzirom da se prilikom provođenja malog uzorka vrijednost od 0,95 ili 0,99 praktično prihvata kao pouzdana vjerovatnoća, onda za određivanje maksimalne greške uzorkovanja Dm.v. Koriste se sljedeća očitanja Studentove distribucije.

statistika malog uzorka

Općenito je prihvaćeno da je početak S. m.v. ili, kako je često nazivaju, „mala n“ statistika, osnovana je u prvoj deceniji 20. veka objavljivanjem dela W. Gosseta, u koji je postavio t-distribuciju koju je postulirao „student“ koji svjetsku slavu stekao nešto kasnije. U to vrijeme, Gosett je radio kao statističar u Guinnessovim pivarama. Jedna od njegovih dužnosti bila je analiziranje uzastopnih serija bačvi svježe skuvanog portera. Iz razloga koji nikada nije objasnio, Gosett je eksperimentisao sa idejom da značajno smanji broj uzoraka uzetih iz veoma velikog broja bačvi u skladištima pivare kako bi nasumično kontrolisao kvalitet portera. To ga je navelo da postulira t-distribuciju. Budući da su propisi Guinnessovih pivara zabranjivali njihovim zaposlenicima da objavljuju rezultate istraživanja, Gosett je objavio rezultate svog eksperimenta upoređujući uzorkovanje kontrole kvaliteta koristeći t-distribuciju za male uzorke i tradicionalnu z-distribuciju (normalnu distribuciju) anonimno, pod pseudonimom "Student " - otuda naziv Studentova t-distribucija).

t-distribucija. Teorija t-distribucije, kao i teorija z-distribucije, koristi se za testiranje nulte hipoteze da su dva uzorka jednostavno nasumični uzorci iz iste populacije i stoga su izračunate statistike (npr. srednja vrijednost i standardna devijacija) nepristrasne procjene parametara populacije. Međutim, za razliku od teorije normalne distribucije, teorija t-distribucije za male uzorke ne zahtijeva apriorno znanje ili tačne procjene matematičko očekivanje i varijacije stanovništva. Štaviše, iako testiranje razlike između srednjih vrijednosti dva velika uzorka za statističku značajnost zahtijeva osnovnu pretpostavku da su karakteristike populacije normalno raspoređene, teorija t distribucije ne zahtijeva pretpostavke o parametrima.

Dobro je poznato da su normalno raspoređene karakteristike opisane jednom jedinom krivom - Gausovom krivom, koja zadovoljava sljedeću jednačinu:

Sa t-distribucijom, cijela porodica krivulja predstavljena je sljedećom formulom:

To je razlog zašto jednačina za t uključuje gama funkciju, što u matematici znači da kako se n mijenja ovu jednačinu druga kriva će zadovoljiti.

Stepeni slobode

U jednadžbi za t, slovo n označava broj stupnjeva slobode (df) povezanih s procjenom varijanse populacije (S2), koja predstavlja drugi trenutak bilo koje funkcije koja generiše trenutak, kao što je jednačina za t distribuciju . U S., broj stupnjeva slobode pokazuje koliko karakteristika ostaje slobodno nakon njihove djelomične upotrebe u specifičan oblik analiza. U t-distribuciji, jedno od odstupanja od srednje vrijednosti uzorka je uvijek fiksno, jer zbir svih takvih odstupanja mora biti jednak nuli. Ovo utiče na zbir kvadrata kada se izračunava varijansa uzorka kao nepristrasna procjena parametra S2 i dovodi do toga da je df jednak broju mjerenja minus jedan za svaki uzorak. Dakle, u formulama i postupcima za izračunavanje t-statistike za testiranje nulte hipoteze, df = n - 2.

F-pacdivision. Nul hipoteza testirana t testom je da su dva uzorka nasumično izvučena iz iste populacije ili su nasumično izvučena iz dvije različite populacije sa istom varijansom. Šta učiniti ako trebate napraviti analizu više grupe? Odgovor na ovo pitanje tražio se dvadeset godina nakon što je Gosset otkrio t-distribuciju. Dvojica najeminentnijih statističara 20. veka bila su direktno uključena u njegovu proizvodnju. Jedan je najveći engleski statističar R. A. Fisher, koji je predložio prve teorije. formulacije čiji je razvoj doveo do proizvodnje F-distribucije; njegov rad na teoriji malih uzoraka, razvijajući Gossetove ideje, objavljen je sredinom 20-ih (Fisher, 1925). Drugi je George Snedecor, jedan iz galaksije ranih američkih statističara, koji je razvio način za upoređivanje dva nezavisna uzorka bilo koje veličine izračunavanjem omjera dvije procjene varijanse. On je ovaj odnos nazvao F-razmjerom, po Fischeru. Rezultati istraživanja Snedecor je doveo do činjenice da je F-distribucija počela da se specificira kao distribucija omjera dvije statistike c2, svaka sa svojim vlastitim stupnjevima slobode:

Iz ovoga je proizašao Fisherov klasični rad o analizi varijanse, statističkoj metodi koja je eksplicitno fokusirana na analizu malih uzoraka.

Distribucija uzorkovanja F (gdje je n = df) predstavljena je sljedećom jednadžbom:

Kao i kod t-distribucije, gama funkcija ukazuje da postoji porodica distribucija koje zadovoljavaju jednačinu za F. U ovom slučaju, međutim, analiza uključuje dvije df veličine: broj stupnjeva slobode za brojilac i za imenilac F-razmera.

Tabele za procjenu t- i F-statistike. Prilikom testiranja nulte hipoteze pomoću S., zasnovane na teoriji velikih uzoraka, obično je potrebna samo jedna tabela za pretraživanje - tabela normalnih odstupanja (z), koja vam omogućava da odredite površinu ispod normalne krivulje između bilo koje dvije vrijednosti z na x-osi. Međutim, tabele za t- i F-distribuciju su nužno predstavljene u skupu tabela, budući da su ove tabele zasnovane na različitim distribucijama koje su rezultat variranja broja stepeni slobode. Iako su t- i F-distribucije distribucije gustoće vjerovatnoće, poput normalne distribucije za velike uzorke, one se razlikuju od ove posljednje na četiri načina koja se koriste za njihovo opisivanje. Distribucija t, na primjer, je simetrična (obratite pažnju na t2 u svojoj jednadžbi) za sve df, ali postaje sve više vrhunska kako se veličina uzorka smanjuje. Vrhunske krivulje (one sa kurtozom većim od normalnog) imaju tendenciju da budu manje asimptotične (to jest, manje blizu x-osi na krajevima distribucije) nego krive sa normalnim kurtozom, kao što je Gausova kriva. Ova razlika rezultira uočljivim odstupanjima između tačaka na x-osi koje odgovaraju vrijednostima t i z. Sa df = 5 i dvostranim α nivoom od 0,05, t = 2,57, dok je odgovarajući z = 1,96. Dakle, t = 2,57 ukazuje statistički značaj na nivou od 5%. Međutim, u slučaju normalne krive, z = 2,57 (tačnije 2,58) će već ukazivati ​​na nivo statističke značajnosti od 1%. Slična poređenja se mogu napraviti sa F distribucijom, pošto je t jednako F kada je broj uzoraka dva.

Šta čini “mali” uzorak?

Svojevremeno se postavljalo pitanje koliki uzorak treba da bude da bi se smatrao malim. Jednostavno ne postoji definitivan odgovor na ovo pitanje. Međutim, smatra se da je konvencionalna granica između malog i velikog uzorka df = 30. Osnova za ovu donekle proizvoljnu odluku je rezultat poređenja t-distribucije sa normalnom distribucijom. Kao što je gore navedeno, razlika između t i z vrijednosti ima tendenciju povećanja kako se df smanjuje i smanjivanja kako se df povećava. Zapravo, t počinje da se približava z mnogo prije graničnog slučaja gdje je t = z za df = ∞. Jednostavan vizualni pregled tabličnih vrijednosti t pokazuje da ova aproksimacija postaje prilično brza, počevši od df = 30 i više. Uporedne vrijednosti t (pri df = 30) i z su jednake, respektivno: 2,04 i 1,96 za p = 0,05; 2,75 i 2,58 za p = 0,01; 3,65 i 3,29 za p = 0,001.

Ostale statistike za “male” uzorke

Iako su statistike kao što su t i F posebno dizajnirane za upotrebu s malim uzorcima, one su podjednako primjenjive i na velike uzorke. Međutim, postoje mnogi drugi. statističke metode, namijenjen za analizu malih uzoraka i često se koristi u tu svrhu. To se odnosi na tzv. neparametarske metode ili metode bez distribucije. U osnovi, skale koje se pojavljuju u ovim metodama su namijenjene za primjenu na mjerenja dobivena korištenjem skala koje ne zadovoljavaju definiciju omjera ili intervalnih skala. Najčešće su to ordinalne (rang) ili nazivne mjere. Neparametarske skale ne zahtijevaju pretpostavke o parametrima distribucije, posebno u pogledu procjena disperzije, jer ordinalne i nominalne skale eliminišu sam pojam disperzije. Iz tog razloga, neparametarske metode se također koriste za mjerenja dobivena korištenjem intervalnih i omjernih skala kada se analiziraju mali uzorci i kada postoji vjerovatnoća da će osnovne pretpostavke potrebne za korištenje parametarskih metoda biti narušene. Ovi testovi, koji se razumno mogu primijeniti na male uzorke, uključuju: Fišerov test egzaktne vjerovatnoće, Friedmanov dvofaktorsku neparametarsku (rang) analizu varijanse, Kendallov t rang koeficijent korelacije, Kendallov koeficijent podudarnosti (W), Kruskalov H test - Wallace za neparametarsku (rang) jednosmjernu analizu varijanse, Mann-Whitney U-test, test medijane, test znakova, Spearmanov koeficijent korelacije ranga r i Wilcoxon t-test.

Osoba može prepoznati svoje sposobnosti samo ako ih pokuša primijeniti. (Seneca)

Bootstrap, mali uzorci, primjena u analizi podataka

glavna ideja

Bootstrap metodu je predložio B. Efron kao razvoj metode jackknifea 1979. godine.

Hajde da opišemo glavnu ideju bootstrapa.

Svrha analize podataka je da se dobiju najtačniji selektivno procjene i generalizirati rezultate na cjelokupnu populaciju.

Tehnički termin za numeričke podatke izvučene iz uzorka je statistika uzorka.

Osnovna deskriptivna statistika je selektivno srednja vrijednost, medijan, standardna devijacija, itd.

Zbirna statistika kao što je srednja vrijednost uzorka, medijana, korelacija će se razlikovati od uzorka do uzorka.

Istraživač treba da zna veličinu ovih varijacija kao funkciju populacije. Na osnovu toga se izračunava granica greške.

Početna slika svih mogućih vrijednosti statistike uzorka u obliku distribucije vjerovatnoće naziva se distribucija uzorkovanja.

Ključ je veličina uzorci. Šta ako je veličina uzorka mala? Jedan razuman pristup je da nasumično način izdvajanja podataka iz postojećeg uzorka.

Ideja bootstrapa je da koristi rezultate izračunavanja na uzorcima kao „fiktivnu populaciju“ da bi se odredila uzorkovana distribucija statistike. U stvari, analizira veliki broj “fantomskih” uzoraka, koji se nazivaju bootstrap uzorci.

Obično se nekoliko hiljada uzoraka generira nasumično, iz ovog skupa možemo pronaći bootstrap distribuciju statistike koja nas zanima.

Dakle, hajde da imamo uzorak, u prvom koraku nasumično biramo jedan od elemenata uzorka, vraćamo ovaj element u uzorak, opet nasumično biramo element, i tako dalje.

Ponovimo opisanu proceduru slučajnog odabira n puta.

U bootstrapu, slučajni odabir je napravljen sa povratak, odabrani elementi originalnog uzorka vraća u izbor i zatim se može ponovo odabrati.

Formalno, na svakom koraku biramo element originalnog uzorka sa vjerovatnoćom 1/n.

Ukupno imamo n elemenata originalnog uzorka, vjerovatnoća dobijanja uzorka sa brojevima (N 1 ... Nn), gdje Ni varira od 0 do n je opisana polinomskom raspodjelom.

Generiše se nekoliko hiljada takvih uzoraka, što je sasvim izvodljivo za moderne računare.

Za svaki uzorak se konstruiše procjena količine od interesa, a zatim se procjene prosječuju.

Pošto postoji mnogo uzoraka, možemo napraviti empirijska funkcija distribucija procjena, zatim izračunati kvantile, izračunati interval povjerenja.

Jasno je da je bootstrap metoda modifikacija Monte Carlo metode.

Ako se generiraju uzorci nema povratka elemenata, onda se dobija poznata metoda preklapanja noža.

Pitanje: zašto to činiti i kada je razumno koristiti metodu u stvarnoj analizi podataka?

U bootstrapping-u ne dobijamo nove informacije, ali mudro koristimo dostupne podatke, na osnovu zadatka koji je pred nama.

Na primjer, bootstrap se može koristiti za mala uzorke, za procjenu medijana, korelacija, konstruiranje intervala povjerenja iu drugim situacijama.

Efronov originalni rad se bavio procjenama parne korelacije za veličinu uzorka od n = 15.

B = generira se 1000 bootstrap uzoraka (bootstrap replikacija).

Na osnovu dobijenih koeficijenata ro 1 ... ro B konstruiše se opšta procjena koeficijenta korelacije i procjena standardne devijacije.

Standardna greška koeficijenta korelacije uzorka, izračunata upotrebom normalne aproksimacije, je:

gdje je koeficijent korelacije 0,776, originalna veličina uzorka je n = 15.

Bootstrap procjena standardne greške je 0,127, vidi Efron, Gall Gong, 1982.

Teorijska pozadina

Neka bude ciljni parametar studije, na primjer, prosječni prihod u odabranom društvu.

Koristeći proizvoljni uzorak veličine, dobijamo skup podataka Neka bude odgovarajuća statistika uzorka

Za većinu uzoraka statistike na veliki vrijednost (>30), distribucija uzorkovanja je normalna kriva sa centrom i standardnom devijacijom, gdje pozitivni parametar ovisi o populaciji i vrsti statistike

Ovaj klasični rezultat poznat je kao središnja granična teorema.

Često postoje ozbiljne tehničke poteškoće u procjeni potrebnog standardnog odstupanja od podataka.

Na primjer, ako medijana ili korelacija uzorka.

Bootstrap metoda prevazilazi ove poteškoće.

Ideja je jednostavna: označimo proizvoljnom vrijednošću koja predstavlja istu statistiku izračunatu iz bootstrap uzorka, koji je dobiven iz originalnog uzorka

Šta se može reći o distribuciji uzorkovanja ako je „početni“ uzorak fiksan?

U granici, distribucija uzorkovanja je također zvonasta sa parametrima i

Dakle, bootstrap distribucija dobro aproksimira distribuciju uzorkovanja

Imajte na umu da kada prelazimo s jednog uzorka na drugi, samo se , u izrazu, mijenja, budući da je izračunat pomoću

Ovo je u suštini bootstrap verzija središnjeg graničnog teorema.

Također je pronađeno da ako marginalna distribucija uzorkovanja statističke funkcije ne uključuje nepoznate populacije, bootstrap distribucija daje bolju aproksimaciju distribucije uzorkovanja od središnje granične teoreme.

Konkretno, kada statistička funkcija ima oblik gdje označava pravu ili uzorkovanu procjenu standardne greške, ograničavajuća distribucija uzorkovanja je obično standardna normalna.

Ovaj efekat se naziva korekcija drugog reda pomoću pokretanja.

Neka tj. prosjek stanovništva itd. prosjek uzorka; je standardna devijacija populacije, je standardna devijacija uzorka izračunata iz originalnih podataka i izračunata je iz uzorka za pokretanje.

Tada će distribucija uzorka vrijednosti gdje , biti aproksimirana bootstrap distribucijom, gdje je prosjek početnog uzorka, .

Slično, distribucija uzorkovanja će biti aproksimirana bootstrap distribucijom, gdje je .

Prve rezultate o korekciji drugog reda objavili su Babu i Singh 1981-83.

Bootstrap aplikacije

Aproksimacija standardne greške procjene uzorka

Pretpostavimo da je parametar poznat za populaciju

Neka je procjena napravljena na osnovu slučajnog uzorka veličine, tj. je funkcija od Budući da uzorak varira kroz skup svih mogućih uzoraka, za procjenu standardne greške koristi se sljedeći pristup:

Hajde da izračunamo koristeći istu formulu koja je korištena za, ali ovaj put na osnovu različitih uzoraka za pokretanje svake veličine. Grubo govoreći, može se prihvatiti osim ako nije jako velika. U ovom slučaju, možete ga smanjiti na n ln n. Tada se može odrediti na osnovu, zapravo, suštine bootstrap metode: populaciju (uzorak) zamjenjuje empirijska populacija (uzorak).

Bayesova korekcija korištenjem bootstrap metode

Srednja vrijednost distribucije uzorkovanja često ovisi o obično kao za veliku, odnosno Bayesovu aproksimaciju:

gdje su bootstrap kopije. Tada će prilagođena vrijednost biti -

Vrijedi napomenuti da je prethodna metoda ponovnog uzorkovanja, nazvana metoda jackknifea, popularnija.

Intervali pouzdanosti

Intervali pouzdanosti (CI) za dati parametar su rasponi zasnovani na uzorku.

Ovaj raspon ima svojstvo da mu pripada vrijednost s vrlo velikom (unaprijed određenom) vjerovatnoćom. Ovo se zove nivo značajnosti. Naravno, ova vjerovatnoća se mora primijeniti na svaki mogući uzorak, jer Svaki uzorak doprinosi određivanju intervala pouzdanosti. Dva najčešće korišćena nivoa značajnosti su 95% i 99%. Ovdje ćemo se ograničiti na vrijednost od 95%.

Tradicionalno, CI zavise od distribucije uzorkovanja količine, tačnije u granici. Postoje dvije glavne vrste intervala povjerenja koji se mogu konstruirati korištenjem bootstrapa.

Percentilna metoda

Ova metoda je već spomenuta u uvodu, vrlo je popularna zbog svoje jednostavnosti i prirodnosti. Pretpostavimo da imamo 1000 bootstrap kopija, označimo ih sa Tada će interval pouzdanosti uključivati ​​vrijednosti iz raspona. Vraćajući se na teorijsku opravdanost metode, vrijedi napomenuti da zahtijeva simetriju distribucije uzorkovanja okolo. Razlog za to je što metoda aproksimira distribuciju uzorkovanja koristeći bootstrap distribucije, iako logično ispada da je treba aproksimirati vrijednošću koja je suprotnog predznaka.

Metoda centriranog bootstrap-a

Pretpostavimo da je distribucija uzorkovanja aproksimirana korištenjem bootstrap distribucije, to jest, kako je prvobitno pretpostavljeno u bootstrap-u. Označimo 100. percentil (u bootstrap ponavljanjima) sa Tada će pretpostavka da se vrijednost nalazi u rasponu od do biti tačna sa vjerovatnoćom od 95%. Isti izraz se lako može pretvoriti u sličan za raspon od do. Ovaj interval se naziva centrirani interval povjerenja zasnovan na bootstrap percentilima (na nivou značajnosti od 95%).

Bootstrap-t test

Kao što je već napomenuto, bootstrap koristi funkciju forme u kojoj postoji uzorak procjene standardne greške

Ovo daje dodatnu preciznost.

Kao osnovni primjer, uzmimo standardnu ​​t-statistiku (otuda naziv metode): odnosno poseban slučaj kada (srednja populacija), (srednja vrednost uzorka) i - standardna devijacija uzorka. Bootstrap analog takve funkcije je gdje se izračunava na isti način kao i korištenje samo uzorka za pokretanje.

Označimo 100. bootstrap percentil sa i pretpostavimo da vrijednost leži u intervalu

Koristeći jednakost možete prepisati prethodnu izjavu, tj. leži u intervalu

Ovaj interval se naziva početni interval t-pouzdanja za nivo od 95%.

U literaturi se koristi za postizanje veće tačnosti od prethodnog pristupa.

Primjer stvarnih podataka

Kao prvi primjer, uzmite podatke iz Hollander i Wolfe 1999, stranica 63, koji predstavljaju uticaj svjetlosti na stope izleganja pilića.

Standardni boxplot ne pretpostavlja normalnost u podacima o populaciji. Izvršili smo početnu analizu medijane i srednje vrijednosti.

Odvojeno, vrijedno je napomenuti nedostatak simetrije u bootstrap t-histogramu, koji se razlikuje od standardne granične krive. Intervali pouzdanosti od 95% za medijanu i srednju vrijednost (izračunati korištenjem metode bootstrap percentila) otprilike pokrivaju raspon

Ovaj raspon predstavlja ukupnu razliku (povećanje) u rezultatima stope izleganja pilića u funkciji osvjetljenja.

Kao drugi primjer, razmotrite podatke iz Devorea 2003, str.553, koji su ispitivali korelaciju između biohemijske potražnje kisika (BOD) i rezultata hidrostatičkog vaganja (HW) profesionalnih fudbalera.

Dvodimenzionalni podaci se sastoje od parova, a parovi se mogu nasumično odabrati tokom ponovnog uzorkovanja. Na primjer, prvo uzmi pa, itd.

Na slici, dijagram kutija sa brkovima pokazuje nedostatak normalnosti za osnovne populacije. Histogrami korelacije izračunati iz početnih bivarijatnih podataka su asimetrični (pomaknuti ulijevo).

Iz tog razloga, metoda za podizanje sistema je centrirana percentila u ovom slučaju prikladniji.

Analiza je otkrila da su mjerenja korelirana za najmanje 78% populacije.

Podaci na primjer 1:

8.5 -4.6 -1.8 -0.8 1.9 3.9 4.7 7.1 7.5 8.5 14.8 16.7 17.6 19.7 20.6 21.9 23.8 24.7 24.7 25.0 40.7 46.9 48.3 52.8 54.0

Podaci na primjer 2:

2.5 4.0 4.1 6.2 7.1 7.0 8.3 9.2 9.3 12.0 12.2 12.6 14.2 14.4 15.1 15.2 16.3 17.1 17.9 17.9

8.0 6.2 9.2 6.4 8.6 12.2 7.2 12.0 14.9 12.1 15.3 14.8 14.3 16.3 17.9 19.5 17.5 14.3 18.3 16.2

U literaturi se često predlažu različite šeme pokretanja koje bi mogle dati pouzdane rezultate u različitim statističkim situacijama.

Ono o čemu smo gore govorili su samo najosnovniji elementi, a zapravo postoji mnogo drugih opcija šeme. Na primjer, koju metodu je bolje koristiti u slučaju dvostepenog uzorkovanja ili stratificiranog uzorkovanja?

U ovom slučaju nije teško smisliti prirodnu shemu. Bootstrapping u slučaju podataka s regresijskim modelima općenito privlači veliku pažnju. Postoje dvije glavne metode: u prvom, kovarijanse i varijable odgovora se ponovo uzorkuju zajedno (parno bootstrapping), u drugom, bootstrapping se izvodi na rezidualima (rezidualno bootstrapping).

Metoda parova ostaje ispravna (u smislu rezultata na ) čak i ako varijanse greške u modelima nisu jednake. Druga metoda je u ovom slučaju neispravna. Ovaj nedostatak se kompenzira činjenicom da takva shema pruža dodatnu tačnost u procjeni standardne greške.

Mnogo je teže primijeniti bootstrapping na podatke vremenske serije.

Analiza vremenskih serija, međutim, jedno je od ključnih područja u ekonometriji. Ovdje postoje dvije glavne poteškoće: prvo, podaci vremenskih serija imaju tendenciju da budu sekvencijalno zavisni. Odnosno, zavisi od itd.

Drugo, statistička populacija se vremenom mijenja, odnosno javlja se nestacionarnost.

U tu svrhu razvijene su metode koje prenose ovisnost u izvornim podacima na bootstrap uzorke, posebno na blok dizajn.

Umjesto bootstrap uzorka, uzorak se odmah konstruiše blok podatke koji zadržavaju zavisnosti iz originalnog uzorka.

Trenutno se provodi dosta istraživanja u oblasti primjene bootstrappinga na polja ekonometrije, općenito se metoda aktivno razvija.

Pored stvarnog slučajnog uzorka sa svojim jasnim probabilističkim opravdanjem, postoje i drugi uzorci koji nisu potpuno slučajni, ali se široko koriste. Treba napomenuti da striktna primjena čisto slučajnog odabira jedinica iz opće populacije nije uvijek moguća u praksi. Takvi uzorci uključuju mehaničko uzorkovanje, tipično, serijsko (ili ugniježđeno), višefazno i ​​niz drugih.

Rijetko je da je populacija homogena; to je prije izuzetak nego pravilo. Dakle, ako postoji stanovništvo u populaciji razne vrsteČesto je poželjno osigurati ravnomjerniju zastupljenost različitih tipova fenomena u populaciji uzorka. Ovaj cilj se uspješno postiže korištenjem tipičnog uzorkovanja. Glavna poteškoća je što moramo imati dodatne informacije o cijeloj populaciji, što je u nekim slučajevima teško.

Tipičan uzorak se takođe naziva stratifikovani ili stratifikovani uzorak; koristi se i u svrhu ujednačenije zastupljenosti različitih regija u uzorku, te se u ovom slučaju uzorak naziva regionaliziranim.

Dakle, ispod tipično Pod uzorkom se podrazumijeva uzorak u kojem je opća populacija podijeljena u tipične podgrupe formirane prema jednoj ili više bitnih karakteristika (npr. populacija je podijeljena u 3-4 podgrupe prema prosječnom dohotku po glavi stanovnika ili stepenu obrazovanja - osnovno , sekundarni, viši, itd.). Zatim, iz svih tipičnih grupa, možete odabrati jedinice za uzorak na nekoliko načina, formirajući:

a) tipičan uzorak sa ujednačenim rasporedom, gde se uzorci uzimaju iz različitih tipova (slojeva) jednak broj jedinice. Ova šema dobro funkcioniše ako se slojevi (tipovi) u populaciji ne razlikuju mnogo jedni od drugih po broju jedinica;

b) tipično uzorkovanje sa proporcionalnim rasporedom, kada se zahteva (za razliku od jednolikog rasporeda) da proporcija (%) selekcije za sve slojeve bude ista (na primer, 5 ili 10%);

c) tipičan uzorak sa optimalnim plasmanom, kada se uzima u obzir stepen varijacije karakteristika u različitim grupama opšte populacije. Ovakvim smještajem povećava se udio selekcije za grupe sa velikom varijabilnosti osobine, što u konačnici dovodi do smanjenja slučajne greške.

Formula za prosječnu grešku u tipičnoj selekciji slična je uobičajenoj grešci uzorkovanja za čisto slučajni uzorak, s jedinom razlikom što se umjesto ukupne varijanse unosi prosjek pojedinih varijansi unutar grupe, što prirodno vodi do smanjenja greške u poređenju sa čisto slučajnim uzorkom. Međutim, njegova upotreba nije uvijek moguća (iz mnogo razloga). Ako nema potrebe za velikom preciznošću, lakše je i jeftinije koristiti serijsko uzorkovanje.

Serial(klastersko) uzorkovanje se sastoji u tome da se za uzorak ne biraju jedinice populacije (na primjer, studenti), već pojedinačne serije ili gnijezda (na primjer, studijske grupe). Drugim riječima, kod serijskog (klasterskog) uzorkovanja jedinica promatranja i jedinica uzorkovanja se ne poklapaju: odabiru se određene grupe jedinica (gnijezda) koje se nalaze jedna uz drugu, a jedinice uključene u ta gnijezda podliježu ispitivanju. Tako, na primjer, prilikom provođenja uzorka istraživanja uslova stanovanja, možemo nasumično odabrati određeni broj domaćinstava (jedinica uzorka), a zatim saznati uslove života porodica koje žive u tim kućama (jedinice posmatranja).

Serije (gnijezda) se sastoje od jedinica koje su međusobno povezane teritorijalno (okruzi, gradovi, itd.), organizaciono (preduzeća, radionice itd.), ili vremenski (na primjer, skup jedinica proizvedenih tokom ovom segmentu vreme proizvodnje).

Serijska selekcija se može organizovati u obliku jednostepene, dvostepene ili višestepene selekcije.

Slučajno odabrane serije su podvrgnute kontinuiranom istraživanju. Dakle, serijsko uzorkovanje se sastoji od dvije faze slučajnog odabira serija i kontinuiranog proučavanja ovih serija. Serijski odabir omogućava značajne uštede u radnoj snazi ​​i resursima i stoga se često koristi u praksi. Greška serijskog odabira razlikuje se od greške samog slučajnog odabira po tome što se umjesto vrijednosti ukupne varijanse koristi međuserija (međugrupna) varijansa, a umjesto veličine uzorka koristi se broj serija. Preciznost obično nije velika, ali je u nekim slučajevima prihvatljiva. Serijski uzorak može se ponavljati ili ne ponavljati, a serije mogu biti jednake ili nejednake veličine.

Serijsko uzorkovanje se može organizovati prema različitim šemama. Na primjer, možete formirati populaciju uzorka u dvije faze: prvo, serije koje će se istraživati ​​biraju se slučajnim redoslijedom, a zatim se iz svake odabrane serije također odabire određeni broj jedinica slučajnim redoslijedom koje će se direktno promatrati (mjeriti, vagati , itd.). Greška takvog uzorka zavisiće od greške serijske selekcije i od greške individualne selekcije, tj. Višestepena selekcija, po pravilu, daje manje precizne rezultate u odnosu na jednostepenu selekciju, što se objašnjava pojavom grešaka reprezentativnosti u svakoj fazi uzorkovanja. U ovom slučaju morate koristiti formulu greške uzorkovanja za kombinirano uzorkovanje.

Drugi oblik selekcije je višefazna selekcija (1, 2, 3 faze ili faze). Ova selekcija se razlikuje po strukturi od višestepene selekcije, jer se kod višefaznog odabira koriste iste jedinice selekcije u svakoj fazi. Greške u višefaznom uzorkovanju izračunavaju se u svakoj fazi posebno. Osnovna karakteristika dvofaznog uzorka je da se uzorci međusobno razlikuju prema tri kriterijuma u zavisnosti od: 1) proporcije jedinica proučavanih u prvoj fazi uzorka i ponovo uključenih u drugu i naredne faze; 2) od održavanja jednakih šansi da svaka jedinica uzorka prve faze ponovo bude predmet proučavanja; 3) na veličinu intervala koji razdvaja faze jedna od druge.

Hajde da se zadržimo na još jednoj vrsti selekcije, naime mehanički(ili sistematski). Ovaj izbor je vjerovatno najčešći. To se očito objašnjava činjenicom da je od svih tehnika selekcije ova tehnika najjednostavnija. Konkretno, mnogo je jednostavniji od slučajnog odabira, koji zahtijeva mogućnost korištenja tablica slučajnih brojeva, a ne zahtijeva dodatne informacije o populaciji i njenoj strukturi. Osim toga, mehanička selekcija je usko isprepletena s proporcionalnom stratificiranom selekcijom, što dovodi do smanjenja greške uzorkovanja.

Na primjer, korištenjem mehaničkog odabira članova stambene zadruge sa liste sastavljene po redoslijedu prijema u ovu zadrugu osigurat će se proporcionalna zastupljenost zadrugara s različitim dužinama staža. Korištenje iste tehnike za odabir ispitanika s abecednog popisa pojedinaca osigurava jednake šanse za imena koja počinju sa različita slova, i tako dalje. Korištenje radnih listova ili drugih lista u preduzećima ili obrazovne institucije itd. može osigurati potrebnu proporcionalnost u zastupljenosti radnika sa različitim dužinama iskustva. Imajte na umu da se mehanička selekcija široko koristi u sociologiji, u proučavanju javnog mnijenja itd.

Kako bi se smanjila veličina greške, a posebno troškovi provođenja uzorkačke studije, široko se koriste različite kombinacije pojedinačnih tipova selekcije (mehanička, serijska, pojedinačna, višefazna itd.) U takvim slučajevima, složenije greške uzorkovanja treba izračunati, koji se sastoje od grešaka koje se javljaju u različitim fazama studije.

Mali uzorak je skup jedinica manjih od 30. Mali uzorci se često javljaju u praksi. Na primjer, broj rijetkih bolesti ili broj jedinica koje posjeduju rijetku osobinu; Osim toga, malom uzorku se pribjegava kada je istraživanje skupo ili istraživanje uključuje uništavanje proizvoda ili uzoraka. Mali uzorci se široko koriste u oblasti ispitivanja kvaliteta proizvoda. Teorijska osnova za utvrđivanje grešaka na malom uzorku postavio je engleski naučnik W. Gosset (pseudonim Student).

Mora se imati na umu da prilikom određivanja greške za mali uzorak, umjesto veličine uzorka, trebate uzeti vrijednost ( n– 1) ili prije određivanja prosječne greške uzorkovanja izračunajte tzv. korigovanu varijansu uzorka (u nazivniku umjesto n treba staviti ( n- 1)). Imajte na umu da se takva korekcija vrši samo jednom - prilikom izračunavanja varijanse uzorka ili prilikom utvrđivanja greške. magnituda ( n– 1) naziva se stepen slobode. Osim toga, normalna distribucija je zamijenjena t-distribucija (Studentova distribucija), koja je tabelarno i zavisi od broja stepeni slobode. Jedini parametar Studentove distribucije je vrijednost ( n- 1). Još jednom naglasimo da je amandman ( n– 1) je važno i značajno samo za male populacije uzoraka; at n> 30 i više razlika nestaje, približavajući se nuli.

Do sada smo govorili o slučajnim uzorcima, tj. kao kada je odabir jedinica iz populacije slučajan (ili gotovo slučajan) i sve jedinice imaju jednaku (ili skoro jednaku) vjerovatnoću da budu uključene u uzorak. Međutim, odabir jedinica može biti zasnovan na principu neslučajnog odabira, kada je u prvom planu princip pristupačnosti i svrsishodnosti. U takvim slučajevima nemoguće je govoriti o reprezentativnosti rezultujućeg uzorka, a izračunavanje grešaka reprezentativnosti može se vršiti samo sa podacima o opštoj populaciji.

Postoji nekoliko poznatih shema za formiranje neslučajnog uzorka, koje su postale široko rasprostranjene i koriste se uglavnom u sociološkim istraživanjima: odabir dostupnih jedinica promatranja, odabir nirnberškom metodom, ciljano uzorkovanje prilikom identifikacije stručnjaka itd. Bitan Takođe ima i kvotni uzorak, koji istraživač formira prema malom broju značajnih parametara i daje vrlo blisko podudaranje sa opštom populacijom. Drugim riječima, odabir kvota bi trebao istraživaču pružiti gotovo potpunu podudarnost uzorka i opće populacije prema njegovim odabranim parametrima. Namjerno postizanje blizine dvije populacije u ograničenom rasponu indikatora postiže se, po pravilu, korištenjem uzorka znatno manje veličine nego slučajnim odabirom. Upravo ta okolnost čini odabir kvote atraktivnim za istraživača koji nema priliku da se fokusira na samoponderisani slučajni uzorak velike veličine. Treba dodati da se smanjenje veličine uzorka najčešće kombinuje sa smanjenjem novčanih troškova i vremena istraživanja, što povećava prednosti ove metode selekcije. Napomenimo i to da kod kvotnog uzorkovanja postoje prilično značajne preliminarne informacije o strukturi stanovništva. Glavna prednost ovdje je da je veličina uzorka znatno manja nego kod slučajnog uzorkovanja. Odabrane karakteristike (najčešće socio-demografske – spol, starost, obrazovanje) treba da budu u bliskoj korelaciji sa proučavanim karakteristikama opšte populacije, tj. predmet istraživanja.

Kao što je već navedeno, metoda uzorkovanja omogućava dobijanje informacija o opštoj populaciji sa mnogo manje novca, vremena i truda nego uz kontinuirano posmatranje. Također je jasno da je kompletno proučavanje cjelokupne populacije u nekim slučajevima nemoguće, na primjer, prilikom provjere kvaliteta proizvoda čiji su uzorci uništeni.

Istovremeno, međutim, treba istaći da populacija nije u potpunosti „crna kutija“ i da o njoj još imamo neke podatke. Provodeći, na primjer, oglednu studiju koja se tiče života, svakodnevnog života, imovinskog stanja, prihoda i rashoda učenika, njihovih mišljenja, interesovanja itd., još uvijek imamo podatke o njihovom ukupnom broju, grupisanju po spolu, starosti, bračnom statusu, mjesto stanovanja, smjer studija i druge karakteristike. Ove informacije se uvijek koriste u istraživanju uzoraka.

Postoji nekoliko tipova distribucije karakteristika uzorka na opštu populaciju: metoda direktnog preračunavanja i metoda korekcijskih faktora. Ponovno izračunavanje karakteristika uzorka vrši se, po pravilu, uzimajući u obzir intervale povjerenja i može se izraziti u apsolutnim i relativnim vrijednostima.

Ovdje je sasvim prikladno naglasiti da se većina statističkih informacija koje se odnose na ekonomski život društva u njegovim najrazličitijim pojavnim oblicima i tipovima zasniva na podacima iz uzorka. Naravno, oni su dopunjeni potpunim podacima o registraciji i informacijama dobijenim kao rezultat popisa (stanovništva, preduzeća, itd.). Na primjer, sva budžetska statistika (o prihodima i rashodima stanovništva) koju daje Rosstat zasniva se na podacima iz uzorka studije. Informacije o cijenama, obimu proizvodnje i obimu trgovine, izražene u odgovarajućim indeksima, također su u velikoj mjeri zasnovane na podacima uzorka.

Statističke hipoteze i statistički testovi. Osnovni koncepti

Koncepti statističkog testa i statističke hipoteze usko su povezani sa uzorkovanjem. Statistička hipoteza (za razliku od drugih naučnih hipoteza) je pretpostavka o nekim svojstvima populacije koja se može testirati korišćenjem podataka iz slučajnog uzorka. Treba imati na umu da je dobijeni rezultat vjerovatnoće po prirodi. Shodno tome, rezultat studije, koji potvrđuje valjanost iznesene hipoteze, gotovo nikada ne može poslužiti kao osnova za njeno konačno prihvatanje, i obrnuto, rezultat koji nije u skladu s njim sasvim je dovoljan da odbaci postavljenu hipotezu kao pogrešnu. ili lažno. To je zato što dobijeni rezultat može biti u skladu s drugim hipotezama, a ne samo s onom iznesenom.

Ispod statistički kriterijum shvaća se kao skup pravila koja nam omogućavaju da odgovorimo na pitanje pod kojim se rezultatima promatranja hipoteza odbacuje, a pod kojim ne. Drugim riječima, statistički kriterij je svojevrsno odlučujuće pravilo koje osigurava prihvatanje istinite (tačne) hipoteze i odbacivanje lažne hipoteze sa visokim stepenom vjerovatnoće. Statistički testovi su jednostrani i dvostrani, parametarski i neparametarski, manje ili više moćni. Neki kriterijumi se koriste često, drugi se koriste rjeđe. Neki kriterijumi su namenjeni rešavanju posebnih pitanja, a neki kriterijumi se mogu koristiti za rešavanje široke klase problema. Ovi kriterijumi su postali široko rasprostranjeni u sociologiji, ekonomiji, psihologiji, prirodne nauke itd.

Hajde da uvedemo neke osnovne koncepte testiranja statističkih hipoteza. Testiranje hipoteze počinje nultom hipotezom. N 0, tj. neka pretpostavka istraživača, kao i konkurentna, alternativna hipoteza N 1, što je u suprotnosti sa glavnim. Na primjer: N 0: , N 1: ili N 0: , N 1: (gde A- opšti prosjek).

Glavni cilj istraživača prilikom testiranja hipoteze je da odbaci hipotezu koju postavlja. Kao što je napisao R. Fisher, svrha testiranja bilo koje hipoteze je da se ona odbaci. Testiranje hipoteza se zasniva na kontradikciji. Stoga, ako vjerujemo da se, na primjer, prosječna plata radnika dobijena iz određenog uzorka i jednaka 186 novčanih jedinica mjesečno ne poklapa sa stvarnim zaradama za cijelu populaciju, onda se prihvata nulta hipoteza da su te plate jednaka.

Konkurentna hipoteza N 1 se može formulirati na različite načine:

N 1: , N 1: , N 1: .

Zatim se utvrđuje Greška tipa I(a), koji navodi vjerovatnoću da će istinita hipoteza biti odbačena. Očigledno, ova vjerovatnoća bi trebala biti mala (obično od 0,01 do 0,1, najčešće je zadana vrijednost 0,05, ili tzv. nivo značajnosti od 5%). Ovi nivoi proizilaze iz metode uzorkovanja, prema kojoj dvostruka ili trostruka greška predstavlja granice preko kojih se slučajna varijacija karakteristika uzorka najčešće ne proteže. Greška tipa II(b) je vjerovatnoća da će netačna hipoteza biti prihvaćena. Po pravilu, greška tipa I je „opasnija“; upravo to bilježi statističar. Ako na početku studije želimo istovremeno snimiti a i b (na primjer, a = 0,05; b = 0,1), onda za to prvo moramo izračunati veličinu uzorka.

Kritična zona(ili područje) je skup vrijednosti kriterija na kojima je N 0 je odbijeno. Kritična tačka T kr je tačka koja odvaja područje prihvatanja hipoteze od područja odstupanja, odnosno kritične zone.

Kao što je već spomenuto, greška tipa I (a) je vjerovatnoća odbacivanja ispravne hipoteze. Što je manje a, manja je vjerovatnoća da ćete napraviti grešku tipa I. Ali u isto vrijeme, kada se a smanji (na primjer, sa 0,05 na 0,01), teže je odbaciti nultu hipotezu, što je, u stvari, ono što istraživač sam sebi postavlja. Naglasimo još jednom da će daljnje smanjenje a na 0,05 i dalje zapravo rezultirati da sve hipoteze, istinite i netačne, potpadaju u raspon prihvatanja nulte hipoteze, te će učiniti nemogućim razlikovanje između njih.

Greška tipa II (b) se javlja kada se prihvati N 0, ali je u stvari alternativna hipoteza tačna N 1 . Vrijednost g = 1 – b naziva se snaga kriterija. Greška tipa II (tj. pogrešno prihvatanje lažne hipoteze) opada sa povećanjem veličine uzorka i povećanjem nivoa značajnosti. Iz ovoga slijedi da je nemoguće istovremeno smanjiti a i b. To se može postići samo povećanjem veličine uzorka (što nije uvijek moguće).

Najčešće se zadaci testiranja hipoteza svode na upoređivanje dva uzorka srednjih vrijednosti ili proporcija; uporediti opšti prosjek (ili udio) sa uzorkom; poređenje empirijskih i teorijskih distribucija (kriterijumi dobrosti); poređenje dva uzorka varijanse (c 2 -kriterijum); poređenje dva koeficijenta korelacije uzorka ili koeficijenta regresije i neka druga poređenja.

Odluka o prihvatanju ili odbijanju nulte hipoteze sastoji se od poređenja stvarne vrednosti kriterijuma sa tabelarno (teoretskom) vrednošću. Ako je stvarna vrijednost manja od tabelarne vrijednosti, onda se zaključuje da je neusklađenost slučajna i beznačajna te se nulta hipoteza ne može odbaciti. Suprotna situacija (stvarna vrijednost je veća od vrijednosti u tabeli) dovodi do odbacivanja nulte hipoteze.

Prilikom testiranja statističkih hipoteza koriste se tablice normalne distribucije, distribucije c 2 (čitaj: hi-kvadrat), t-distribucije (Studentske distribucije) i F-distribucije (Fisher distribucije).

mob_info