Konstruirajte empirijsku funkciju za datu distribuciju uzorkovanja. Empirijska funkcija raspodjele, svojstva. Primjeri problema za pronalaženje empirijske funkcije raspodjele

Varijacijska serija. Poligon i histogram.

Raspon distribucije- predstavlja uređenu raspodjelu jedinica populacije koja se proučava u grupe prema određenoj varijabilnoj karakteristici.

Ovisno o karakteristikama na kojima se formira distribucijski niz, razlikuju se atributivne i varijacione redovi distribucije:

§ Redovi distribucije konstruisani uzlaznim ili silaznim redosledom vrednosti kvantitativne karakteristike nazivaju se varijacijski.

Varijaciona serija distribucije sastoji se od dva stupca:

Prva kolona daje kvantitativne vrijednosti varijabilnih karakteristika koje se nazivaju opcije i naznačeni su. Diskretna opcija - izražena kao cijeli broj. Opcija intervala se kreće od i do. U zavisnosti od tipa, opcije se mogu konstruisati diskretno ili intervalno varijantne serije.
Druga kolona sadrži broj određene opcije, izraženo u terminima frekvencija ili frekvencija:

Frekvencije- to su apsolutni brojevi, koji pokazuju koliko puta se data vrijednost neke karakteristike pojavljuje u agregatu, koji označava. Zbir svih frekvencija mora biti jednak broju jedinica u cijeloj populaciji.

Frekvencije() su frekvencije izražene kao procenat ukupnog broja. Zbir svih frekvencija izraženih u procentima mora biti jednak 100% u razlomcima od jedan.

Grafička slika distribucijske serije

Distribucijske serije su vizualno predstavljene pomoću grafičkih slika.

Serija distribucije je prikazana kao:

§ Poligon

§ Histogrami

§ Kumulira

Poligon

Prilikom konstruiranja poligona, vrijednosti varijabilne karakteristike se iscrtavaju na horizontalnoj osi (x-osa), a frekvencije ili frekvencije se crtaju na vertikalnoj osi (y-osa).

1. Poligon na sl. 6.1 je zasnovan na podacima mikropopisa stanovništva Rusije 1994. godine.


trakasti grafikon



Za konstruiranje histograma, vrijednosti granica intervala su naznačene duž osi apscise i na temelju njih se konstruiraju pravokutnici čija je visina proporcionalna frekvencijama (ili frekvencijama).

Na sl. 6.2. prikazuje histogram distribucije stanovništva Rusije 1997. godine starosne grupe.

Fig.1. Distribucija ruskog stanovništva po starosnim grupama

Empirijska funkcija distribucije, svojstva.

Neka je poznata statistička distribucija frekvencija kvantitativne karakteristike X. Označimo sa brojem opservacija u kojima je uočena vrijednost karakteristike manja od x i sa n – ukupan broj zapažanja. Očigledno, relativna učestalost događaja X

Empirijska funkcija distribucije (funkcija distribucije uzorkovanja) je funkcija koja za svaku vrijednost x određuje relativnu frekvenciju događaja X

Za razliku od empirijske funkcije distribucije uzorka, funkcija raspodjele populacije naziva se teorijska funkcija distribucije. Razlika između ovih funkcija je u tome što teorijska funkcija određuje vjerovatnoću događaja X

Kako n raste, relativna frekvencija događaja X

Osnovna svojstva

Neka je fiksan elementarni ishod. Tada je funkcija distribucije diskretne distribucije data sljedećom funkcijom vjerovatnoće:

gdje i - broj elemenata uzorka jednak . Konkretno, ako su svi elementi uzorka različiti, onda .

Matematičko očekivanje ove distribucije je:

.

Dakle, srednja vrijednost uzorka je teorijska sredina distribucije uzorka.

Slično, varijansa uzorka je teorijska varijansa distribucije uzorka.

Slučajna varijabla ima binomnu distribuciju:

Funkcija distribucije uzorka je nepristrasna procjena funkcije distribucije:

.

Varijanca funkcije distribucije uzorka ima oblik:

.

Prema jakom zakonu velikih brojeva, funkcija raspodjele uzorka gotovo sigurno konvergira teorijskoj funkciji distribucije:

gotovo sigurno u .

Funkcija raspodjele uzorka je asimptotski normalna procjena teorijske funkcije raspodjele. Ako onda

Prema distribuciji na .

Određivanje empirijske funkcije distribucije

Neka je $X$ slučajna varijabla. $F(x)$ je funkcija distribucije date slučajne varijable. Provešćemo $n$ eksperimente na datoj slučajnoj promenljivoj pod istim uslovima, nezavisno jedan od drugog. U ovom slučaju dobijamo niz vrijednosti $x_1,\ x_2\ $, ... ,$\ x_n$, koji se naziva uzorak.

Definicija 1

Svaka vrijednost $x_i$ ($i=1,2\ $, ... ,$ \ n$) naziva se varijanta.

Jedna procjena teorijske funkcije distribucije je empirijska funkcija distribucije.

Definicija 3

Empirijska funkcija distribucije $F_n(x)$ je funkcija koja za svaku vrijednost $x$ određuje relativnu frekvenciju događaja $X \

gdje je $n_x$ broj opcija manji od $x$, $n$ je veličina uzorka.

Razlika između empirijske funkcije i teorijske je u tome što teorijska funkcija određuje vjerovatnoću događaja $X

Svojstva empirijske funkcije distribucije

Razmotrimo sada nekoliko osnovnih svojstava funkcije distribucije.

    Opseg funkcije $F_n\left(x\right)$ je segment $$.

    $F_n\left(x\right)$ je neopadajuća funkcija.

    $F_n\left(x\right)$ je lijeva kontinuirana funkcija.

    $F_n\left(x\right)$ je konstantna funkcija po komadima i raste samo u tačkama vrijednosti slučajne varijable $X$

    Neka je $X_1$ najmanja, a $X_n$ najveća opcija. Tada je $F_n\left(x\right)=0$ za $(x\le X)_1$ i $F_n\left(x\right)=1$ za $x\ge X_n$.

Hajde da uvedemo teoremu koja povezuje teorijske i empirijske funkcije.

Teorema 1

Neka je $F_n\left(x\right)$ empirijska funkcija raspodjele, a $F\left(x\right)$ teorijska funkcija raspodjele općeg uzorka. Tada vrijedi jednakost:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Primjeri problema za pronalaženje empirijske funkcije raspodjele

Primjer 1

Neka distribucija uzorkovanja ima sljedeće podatke zabilježene pomoću tabele:

Slika 1.

Pronađite veličinu uzorka, kreirajte empirijsku funkciju distribucije i nacrtajte je.

Veličina uzorka: $n=5+10+15+20=50$.

Prema svojstvu 5, imamo da je za $x\le 1$ $F_n\left(x\right)=0$, a za $x>4$ $F_n\left(x\right)=1$.

$x vrijednost

$x vrijednost

$x vrijednost

Tako dobijamo:

Slika 2.

Slika 3.

Primjer 2

Iz gradova centralnog dela Rusije nasumično je odabrano 20 gradova za koje su dobijeni sledeći podaci o cenama prevoza: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

Kreirajte empirijsku funkciju distribucije za ovaj uzorak i nacrtajte je.

Zapišimo vrijednosti uzorka uzlaznim redoslijedom i izračunajmo učestalost svake vrijednosti. Dobijamo sledeću tabelu:

Slika 4.

Veličina uzorka: $n=20$.

Prema svojstvu 5, imamo da je za $x\le 12$ $F_n\left(x\right)=0$, a za $x>15$ $F_n\left(x\right)=1$.

$x vrijednost

$x vrijednost

$x vrijednost

Tako dobijamo:

Slika 5.

Nacrtajmo empirijsku distribuciju:

Slika 6.

Originalnost: $92,12\%$.

Kao što je poznato, zakon raspodjele slučajne varijable može se specificirati na različite načine. Diskretna slučajna varijabla se može specificirati korištenjem distribucijske serije ili integralne funkcije, a kontinuirana slučajna varijabla može se specificirati korištenjem integralne ili diferencijalne funkcije. Razmotrimo selektivne analoge ove dvije funkcije.

Neka postoji uzorak skupa vrijednosti neke slučajne varijable volumena i svaka opcija iz ovog skupa je povezana sa svojom frekvencijom. Neka dalje je neki realan broj, i – broj uzoraka vrijednosti slučajne varijable
, manji .Onda broj je učestalost kvantitetnih vrijednosti uočenih u uzorku X, manji , one. učestalost pojavljivanja događaja
. Kada se promeni x u opštem slučaju, vrednost će se takođe promeniti . To znači da je relativna frekvencija je funkcija argumenta . A budući da se ova funkcija nalazi iz uzoraka podataka dobivenih kao rezultat eksperimenata, naziva se selektivnim ili empirijski.

Definicija 10.15. Empirijska funkcija distribucije(funkcija distribucije uzorkovanja) je funkcija
, definiranje za svaku vrijednost x relativna učestalost događaja
.

(10.19)

Za razliku od empirijske funkcije distribucije uzorkovanja, funkcija distribucije F(x) opšte populacije naziva se teorijska funkcija distribucije. Razlika između njih je u teorijskoj funkciji F(x) određuje vjerovatnoću događaja
, a empirijski je relativna učestalost istog događaja. Iz Bernoullijeve teoreme slijedi

,
(10.20)

one. na slobodi vjerovatnoća
i relativnu učestalost događaja
, tj.
malo se razlikuju jedno od drugog. Iz ovoga slijedi da je preporučljivo koristiti empirijsku funkciju distribucije uzorka za aproksimaciju teorijske (integralne) funkcije raspodjele opće populacije.

Funkcija
I
imaju ista svojstva. Ovo slijedi iz definicije funkcije.

Svojstva
:


Primjer 10.4. Konstruirajte empirijsku funkciju na osnovu date distribucije uzorka:

Opcije

Frekvencije

Rješenje: Nađimo veličinu uzorka n= 12+18+30=60. Najmanja opcija
, dakle,
at
. Značenje
, naime
posmatrano 12 puta, dakle:

=
at
.

Značenje x< 10, naime
I
posmatrano 12+18=30 puta, dakle,
=
at
. At

.

Tražena empirijska funkcija distribucije:

=

Raspored
prikazano na sl. 10.2

R
je. 10.2

Kontrolna pitanja

1. Koje glavne probleme rješava matematička statistika? 2. Opća i uzorkovana populacija? 3. Definirajte veličinu uzorka. 4. Koji se uzorci nazivaju reprezentativnim? 5. Greške reprezentativnosti. 6. Osnovne metode uzorkovanja. 7. Koncepti frekvencije, relativne frekvencije. 8. Koncept statističkih serija. 9. Zapišite Sturgesovu formulu. 10. Formulirajte koncepte raspona uzorka, medijana i moda. 11. Frekvencijski poligon, histogram. 12. Koncept bodovne procjene populacije uzorka. 13. Pristrasna i nepristrasna procjena bodova. 14. Formulirajte koncept prosjeka uzorka. 15. Formulirajte koncept varijanse uzorka. 16. Formulirajte koncept standardne devijacije uzorka. 17. Formulirati koncept koeficijenta varijacije uzorka. 18. Formulirajte koncept uzorka geometrijske sredine.

Saznajte koja je empirijska formula. U hemiji, EP je najjednostavniji način da se opiše jedinjenje – u suštini lista elemenata koji čine jedinjenje, na osnovu njihovog procenta. Treba napomenuti da ova jednostavna formula ne opisuje red atoma u jedinjenju, jednostavno ukazuje od kojih se elemenata sastoji. Na primjer:

  • Jedinjenje koje se sastoji od 40,92% ugljika; 4,58% vodonika i 54,5% kiseonika imaće empirijsku formulu C 3 H 4 O 3 (primer kako pronaći EF ovog jedinjenja biće razmatran u drugom delu).
  • Shvatite pojam "procentualni sastav"."Procentualni sastav" je postotak svakog pojedinačnog atoma u cijelom spoju o kojem je riječ. Da biste pronašli empirijsku formulu jedinjenja, morate znati procentualni sastav jedinjenja. Ako tražite empirijsku formulu za domaći zadatak, tada će se najvjerovatnije dati procenti.

    • Da bi se u laboratoriji utvrdio procentualni sastav hemijskog jedinjenja, on se podvrgava nekim fizičkim eksperimentima, a zatim kvantitativnoj analizi. Osim ako niste u laboratoriji, ne morate raditi ove eksperimente.
  • Imajte na umu da ćete morati da se nosite sa gram atomima. Gram atom je određena količina supstance čija je masa jednaka njenoj atomskoj masi. Da biste pronašli gram atom, trebate koristiti sljedeću jednačinu: Postotak elementa u spoju podijeljen je s atomskom masom elementa.

    • Recimo, na primjer, da imamo spoj koji sadrži 40,92% ugljika. Atomska masa ugljenika je 12, tako da bi naša jednadžba bila 40,92 / 12 = 3,41.
  • Znati kako pronaći atomske omjere. Kada radite sa jedinjenjem, na kraju ćete dobiti više od jednog atoma grama. Nakon što pronađete sve gram atoma vašeg spoja, pogledajte ih. Da biste pronašli atomski omjer, morat ćete odabrati najmanju vrijednost gram-atoma koju ste izračunali. Tada ćete morati podijeliti sve gram atome na najmanji gram atom. Na primjer:

    • Recimo da radite sa jedinjenjem koje sadrži tri grama atoma: 1,5; 2 i 2.5. Najmanji od ovih brojeva je 1,5. Stoga, da biste pronašli omjer atoma, morate podijeliti sve brojeve sa 1,5 i staviti znak omjera između njih : .
    • 1,5 / 1,5 = 1, 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Dakle, odnos atoma je 1: 1,33: 1,66 .
  • Shvatite kako pretvoriti vrijednosti atomskog omjera u cijele brojeve. Kada pišete empirijsku formulu, morate koristiti cijele brojeve. To znači da ne možete koristiti brojeve poput 1,33. Nakon što pronađete omjer atoma, trebate pretvoriti razlomke (poput 1,33) u cijele brojeve (kao 3). Da biste to učinili, morate pronaći cijeli broj, množeći svaki broj atomskog omjera kojim ćete dobiti cijele brojeve. Na primjer:

    • Pokušajte 2. Pomnožite brojeve atomskog omjera (1, 1,33 i 1,66) sa 2. Dobićete 2, 2,66 i 3,32. Ovo nisu cijeli brojevi, tako da 2 nije prikladno.
    • Pokušajte 3. Ako pomnožite 1, 1,33 i 1,66 sa 3, dobićete 3, 4 i 5. Dakle, atomski omjer cijelih brojeva ima oblik 3: 4: 5 .
  • Određivanje empirijske funkcije distribucije

    Neka je $X$ slučajna varijabla. $F(x)$ je funkcija distribucije date slučajne varijable. Provešćemo $n$ eksperimente na datoj slučajnoj promenljivoj pod istim uslovima, nezavisno jedan od drugog. U ovom slučaju dobijamo niz vrijednosti $x_1,\ x_2\ $, ... ,$\ x_n$, koji se naziva uzorak.

    Definicija 1

    Svaka vrijednost $x_i$ ($i=1,2\ $, ... ,$ \ n$) naziva se varijanta.

    Jedna procjena teorijske funkcije distribucije je empirijska funkcija distribucije.

    Definicija 3

    Empirijska funkcija distribucije $F_n(x)$ je funkcija koja za svaku vrijednost $x$ određuje relativnu frekvenciju događaja $X \

    gdje je $n_x$ broj opcija manji od $x$, $n$ je veličina uzorka.

    Razlika između empirijske funkcije i teorijske je u tome što teorijska funkcija određuje vjerovatnoću događaja $X

    Svojstva empirijske funkcije distribucije

    Razmotrimo sada nekoliko osnovnih svojstava funkcije distribucije.

      Opseg funkcije $F_n\left(x\right)$ je segment $$.

      $F_n\left(x\right)$ je neopadajuća funkcija.

      $F_n\left(x\right)$ je lijeva kontinuirana funkcija.

      $F_n\left(x\right)$ je konstantna funkcija po komadima i raste samo u tačkama vrijednosti slučajne varijable $X$

      Neka je $X_1$ najmanja, a $X_n$ najveća opcija. Tada je $F_n\left(x\right)=0$ za $(x\le X)_1$ i $F_n\left(x\right)=1$ za $x\ge X_n$.

    Hajde da uvedemo teoremu koja povezuje teorijske i empirijske funkcije.

    Teorema 1

    Neka je $F_n\left(x\right)$ empirijska funkcija raspodjele, a $F\left(x\right)$ teorijska funkcija raspodjele općeg uzorka. Tada vrijedi jednakost:

    \[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

    Primjeri problema za pronalaženje empirijske funkcije raspodjele

    Primjer 1

    Neka distribucija uzorkovanja ima sljedeće podatke zabilježene pomoću tabele:

    Slika 1.

    Pronađite veličinu uzorka, kreirajte empirijsku funkciju distribucije i nacrtajte je.

    Veličina uzorka: $n=5+10+15+20=50$.

    Prema svojstvu 5, imamo da je za $x\le 1$ $F_n\left(x\right)=0$, a za $x>4$ $F_n\left(x\right)=1$.

    $x vrijednost

    $x vrijednost

    $x vrijednost

    Tako dobijamo:

    Slika 2.

    Slika 3.

    Primjer 2

    Iz gradova centralnog dela Rusije nasumično je odabrano 20 gradova za koje su dobijeni sledeći podaci o cenama prevoza: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

    Kreirajte empirijsku funkciju distribucije za ovaj uzorak i nacrtajte je.

    Zapišimo vrijednosti uzorka uzlaznim redoslijedom i izračunajmo učestalost svake vrijednosti. Dobijamo sledeću tabelu:

    Slika 4.

    Veličina uzorka: $n=20$.

    Prema svojstvu 5, imamo da je za $x\le 12$ $F_n\left(x\right)=0$, a za $x>15$ $F_n\left(x\right)=1$.

    $x vrijednost

    $x vrijednost

    $x vrijednost

    Tako dobijamo:

    Slika 5.

    Nacrtajmo empirijsku distribuciju:

    Slika 6.

    Originalnost: $92,12\%$.

    mob_info