Probabilističke i statističke metode istraživanja. Šta je “matematička statistika” Problem probabilističkih i statističkih metoda

Šta je "matematička statistika"

Ispod matematičke statistike razumjeti „granu matematike koja je posvećena matematičkim metodama prikupljanja, sistematizacije, obrade i tumačenja statističkih podataka, kao i njihovog korištenja za naučne ili praktične zaključke. Pravila i procedure matematičke statistike zasnivaju se na teoriji vjerovatnoće, što nam omogućava da na osnovu dostupnog statističkog materijala ocijenimo tačnost i pouzdanost zaključaka dobijenih u svakom problemu.” U ovom slučaju, statistički podaci se odnose na informaciju o broju objekata u bilo kojoj manje ili više obimnoj zbirci koji imaju određene karakteristike.

Na osnovu vrste problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteza.

Na osnovu vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

  • - jednodimenzionalna statistika (statistika slučajnih varijabli), u kojoj je rezultat posmatranja opisan realnim brojem;
  • - multivarijantna statistička analiza, gde se rezultat posmatranja objekta opisuje sa više brojeva (vektora);
  • - statistika slučajnih procesa i vremenskih serija, gdje je rezultat posmatranja funkcija;
  • - statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, skup ( geometrijska figura), naručivanjem ili dobijenim kao rezultat mjerenja prema kvalitativnom kriteriju.

Istorijski gledano, prve su se pojavile neke oblasti statistike objekata nenumeričke prirode (posebno problemi procjene udjela nedostataka i testiranja hipoteza o tome) i jednodimenzionalne statistike. Matematički aparat im je jednostavniji, pa se njihov primjer obično koristi za demonstriranje osnovnih ideja matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika je zasnovana na dokazima, koja je zasnovana na probabilističkim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, nastanku rizika, funkcionisanju tehnološke opreme, dobijanju eksperimentalnih rezultata, toku bolesti itd. Vjerovatni model realnog fenomena treba smatrati konstruiranim ako su veličine koje se razmatraju i veze između njih izražene u terminima teorije vjerovatnoće. Korespondencija sa probabilističkim modelom stvarnosti, tj. njegova adekvatnost se potkrepljuje, posebno, statističkim metodama za testiranje hipoteza.

Neverovatne metode obrade podataka su istraživačke, mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućavaju procenu tačnosti i pouzdanosti zaključaka dobijenih na osnovu ograničenog statističkog materijala.

Probabilističke i statističke metode primjenjive su gdje god je moguće konstruirati i opravdati vjerovatnostni model pojave ili procesa. Njihova upotreba je obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda).

U određenim oblastima primjene koriste se i probabilističke i statističke metode opće primjene i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama za upravljanje kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Koristeći njegove metode, vrši se statistička analiza tačnosti i stabilnosti tehnoloških procesa i statistička procjena kvaliteta. TO specifične metode To uključuje metode statističke kontrole prihvatljivosti kvaliteta proizvoda, statističku regulaciju tehnoloških procesa, procjenu i kontrolu pouzdanosti itd.

Primijenjene probabilističke i statističke discipline kao što su teorija pouzdanosti i teorija čekanja se široko koriste. Sadržaj prvog od njih je jasan iz naziva, drugi se bavi proučavanjem sistema kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevima pretplatnika koji biraju brojeve na svojim telefonskim aparatima. Trajanje servisiranja ovih zahtjeva, tj. trajanje razgovora je također modelirano slučajnim varijablama. Veliki doprinos Dopisni član Akademije nauka SSSR-a A.Ya. Khinčin (1894-1959), akademik Akademije nauka Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći naučnici.

Statističke metode

Statističke metode- metode statističke analize podataka. Postoje metode primijenjene statistike koje se mogu koristiti u svim oblastima naučna istraživanja i bilo koje sektore nacionalne privrede, i druge statističke metode, čija je primena ograničena na jednu ili drugu oblast. To se odnosi na metode kao što su statistička kontrola prihvatljivosti, statistička kontrola tehnoloških procesa, pouzdanost i ispitivanje, te planiranje eksperimenata.

Klasifikacija statističkih metoda

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i opravdati bilo kakve prosudbe o grupi (objekti ili subjekti) s nekom unutrašnjom heterogenošću.

Preporučljivo je razlikovati tri vrste naučnih i primenjenih aktivnosti u oblasti statističkih metoda analize podataka (prema stepenu specifičnosti metoda povezanih sa uranjanjem u specifične probleme):

a) razvoj i istraživanje metoda opšte namene, bez uzimanja u obzir specifičnosti oblasti primene;

b) razvoj i istraživanje statističkih modela stvarnih pojava i procesa u skladu sa potrebama određene oblasti djelatnosti;

c) primjena statističkih metoda i modela za statističku analizu specifičnih podataka.

Primijenjena statistika

Opis vrste podataka i mehanizma za njihovo generisanje je početak svakog statističko istraživanje. Za opisivanje podataka koriste se i determinističke i probabilističke metode. Koristeći determinističke metode, moguće je analizirati samo one podatke koji su dostupni istraživaču. Na primjer, uz njihovu pomoć dobijene su tabele koje su izračunali zvanični organi državne statistike na osnovu statističkih izvještaja preduzeća i organizacija. Dobijeni rezultati se mogu prenijeti na širu populaciju i koristiti za predviđanje i kontrolu samo na osnovu vjerovatno-statističkog modeliranja. Stoga su samo metode zasnovane na teoriji vjerovatnoće često uključene u matematičku statistiku.

Ne smatramo mogućim suprotstaviti determinističke i vjerovatno-statističke metode. Smatramo ih sekvencijalnim koracima statističke analize. U prvoj fazi potrebno je analizirati dostupne podatke i prikazati ih u lako čitljivom obliku pomoću tabela i grafikona. Tada je preporučljivo analizirati statističke podatke na osnovu određenih vjerovatnost i statističkih modela. Napominjemo da je mogućnost dubljeg uvida u suštinu realnog fenomena ili procesa osigurana razvojem adekvatnog matematičkog modela.

U najjednostavnijoj situaciji, statistički podaci su vrijednosti neke karakteristične karakteristike objekata koji se proučavaju. Vrijednosti mogu biti kvantitativne ili dati indikaciju kategorije u koju se predmet može klasificirati. U drugom slučaju govore o kvalitativnom znaku.

Prilikom mjerenja po nekoliko kvantitativnih ili kvalitativnih karakteristika, dobijamo vektor kao statistički podatak o objektu. Može se smatrati kao novi izgled podaci. U ovom slučaju, uzorak se sastoji od skupa vektora. Postoje dio koordinata - brojevi, a dio - kvalitativni (kategorizirani) podaci, tada govorimo o vektoru različitih vrsta podataka.

Jedan element uzorka, odnosno jedna dimenzija, može biti funkcija kao cjelina. Na primjer, opisivanje dinamike indikatora, odnosno njegove promjene tijekom vremena, je pacijentov elektrokardiogram ili amplituda otkucaja osovine motora. Ili vremenski niz koji opisuje dinamiku performansi određene kompanije. Tada se uzorak sastoji od skupa funkcija.

Elementi uzorka mogu biti i drugi matematički objekti. Na primjer, binarne veze. Tako, prilikom anketiranja stručnjaka, često koriste poređanje (rangiranje) objekata ispitivanja - uzoraka proizvoda, investicijskih projekata, opcija za donošenje upravljačkih odluka. U zavisnosti od propisa stručnog elaborata, elementi uzorkovanja mogu biti različite vrste binarnih odnosa (uređenje, particionisanje, tolerancija), skupovi, rasplinuti skupovi itd.

Dakle, matematička priroda elemenata uzorka u različitim problemima primijenjene statistike može biti vrlo različita. Međutim, mogu se razlikovati dvije klase statističkih podataka – numeričke i nenumeričke. Shodno tome, primijenjena statistika je podijeljena na dva dijela - numeričku statistiku i nenumeričku statistiku.

Numerička statistika su brojevi, vektori, funkcije. Mogu se sabirati i množiti koeficijentima. Stoga u numerička statistika velika vrijednost imaju različite količine. Matematički aparat za analizu suma nasumičnih elemenata uzorka su (klasični) zakoni veliki brojevi i centralne granične teoreme.

Nenumerički statistički podaci su kategorizirani podaci, vektori različitih tipova karakteristika, binarne relacije, skupovi, rasplinuti skupovi, itd. Ne mogu se sabirati i množiti koeficijentima. Stoga, nema smisla govoriti o zbiru nenumeričke statistike. Oni su elementi nenumeričkih matematičkih prostora (skupova). Matematički aparat za analizu nenumeričkih statističkih podataka zasniva se na korištenju udaljenosti između elemenata (kao i mjera blizine, indikatora razlike) u takvim prostorima. Uz pomoć udaljenosti određuju se empirijski i teorijski prosjeci, dokazuju zakoni velikih brojeva, konstruiraju se neparametarske procjene gustine raspodjele vjerovatnoće, rješavaju dijagnostički problemi i klaster analiza itd. (vidi).

Primijenjena istraživanja koriste različite vrste statističkih podataka. To je posebno zbog metoda njihovog dobivanja. Na primjer, ako se ispitivanje nekih tehničkih uređaja nastavi do određenog vremena, onda se dobija tzv. cenzurirani podaci koji se sastoje od skupa brojeva - trajanje rada određenog broja uređaja prije kvara i informacija da su preostali uređaji nastavili da rade na kraju testa. Cenzurisani podaci se često koriste u proceni i praćenju pouzdanosti tehničkih uređaja.

Obično se statističke metode za analizu podataka prve tri vrste razmatraju odvojeno. Ovo ograničenje je uzrokovano gore navedenom činjenicom da je matematički aparat za analizu podataka nenumeričke prirode značajno drugačiji nego za podatke u obliku brojeva, vektora i funkcija.

Probabilističko-statističko modeliranje

Primenom statističkih metoda u određenim oblastima znanja i sektorima nacionalne privrede dobijamo naučne i praktične discipline kao što su „statističke metode u industriji“, „statističke metode u medicini“ itd. Sa ovog stanovišta, ekonometrija je „statistička metode u ekonomiji”. Ove discipline grupe b) obično se zasnivaju na vjerovatno-statističkim modelima izgrađenim u skladu sa karakteristikama područja primjene. Vrlo je poučno usporediti vjerovatno-statističke modele koji se koriste u različitim oblastima, otkriti njihove sličnosti i istovremeno uočiti neke razlike. Tako se može uočiti sličnost iskaza problema i statističkih metoda koje se koriste za njihovo rješavanje u oblastima kao što su naučna medicinska istraživanja, specifična sociološka istraživanja i marketinška istraživanja, ili, ukratko, u medicini, sociologiji i marketingu. One se često grupišu pod nazivom "uzorak studija".

Razlika između studija uzorka i ekspertskih studija očituje se, prije svega, u broju ispitanih objekata ili subjekata - u uzornim studijama obično govorimo o stotinama, a u stručnim studijama - o desetinama. Ali tehnologija ekspertskog istraživanja je mnogo sofisticiranija. Specifičnost je još izraženija u demografskim ili logističkim modelima, pri obradi narativnih (tekst, hronika) informacija ili pri proučavanju međusobnog uticaja faktora.

Pitanja pouzdanosti i sigurnosti tehničkih uređaja i tehnologija, teorija čekanja detaljno su obrađena u velikom broju naučnih radova.

Statistička analiza specifičnih podataka

Primjena statističkih metoda i modela za statističku analizu konkretnih podataka usko je vezana za probleme relevantne oblasti. Rezultati trećeg od identifikovanih vidova naučne i primenjene delatnosti nalaze se na preseku disciplina. Mogu se smatrati primjerima praktične primjene statističkih metoda. Ali nema manje razloga da ih pripišemo odgovarajućem polju ljudske aktivnosti.

Na primjer, rezultati istraživanja potrošača instant kafe prirodno se pripisuju marketingu (što oni rade kada drže predavanja o marketinškom istraživanju). Proučavanje dinamike rasta cijena korišćenjem indeksa inflacije izračunatih iz nezavisno prikupljenih informacija je od interesa prvenstveno sa stanovišta ekonomije i upravljanja nacionalnom ekonomijom (kako na makro nivou, tako i na nivou pojedinačnih organizacija).

Perspektive razvoja

Teorija statističkih metoda usmjerena je na rješavanje stvarnih problema. Stoga se u njemu stalno pojavljuju nove produkcije. matematički problemi analize statističkih podataka, razvijaju se i opravdavaju nove metode. Opravdanje se često provodi matematičkim sredstvima, odnosno dokazivanjem teorema. Veliku ulogu igra metodološka komponenta – kako tačno postaviti probleme, koje pretpostavke prihvatiti u svrhu daljeg matematičkog proučavanja. Uloga modernog informacione tehnologije, posebno kompjuterski eksperiment.

Hitan zadatak je analiza istorije statističkih metoda kako bi se identifikovali trendovi razvoja i primenili ih za predviđanje.

Književnost

2. Naylor T. Eksperimenti simulacije mašina s modelima ekonomskih sistema. - M.: Mir, 1975. - 500 str.

3. Kramer G. Matematičke metode statistika. - M.: Mir, 1948 (1. izd.), 1975 (2. izd.). - 648 str.

4. Bolshev L. N., Smirnov N. V. Tabele matematičke statistike. - M.: Nauka, 1965 (1. izd.), 1968 (2. izd.), 1983. (3. izd.).

5. Smirnov N. V., Dunin-Barkovsky I. V. Kurs teorije vjerovatnoće i matematičke statistike za tehničke primjene. Ed. 3., stereotipno. - M.: Nauka, 1969. - 512 str.

6. Norman Draper, Harry Smith Primijenjeno regresiona analiza. Višestruka regresija = Primijenjena regresijska analiza. - 3. izd. - M.: "Dijalektika", 2007. - P. 912. - ISBN 0-471-17082-8

Vidi također

Wikimedia Foundation.

  • 2010.
  • Yat-Kha

amalgam (višeznačna odrednica)

    Pogledajte šta su "Statističke metode" u drugim rječnicima: STATISTIČKE METODE - STATISTIČKE METODE naučne metode opise i studije masovnih pojava koje omogućavaju kvantitativno (numeričko) izražavanje. Riječ “statistika” (od igal. stato stanje) ima zajednički korijen sa riječju "država". U početku je ... ...

    Philosophical Encyclopedia STATISTIČKE METODE – sa riječju "država". U početku je ... ...

    - naučne metode opisivanja i proučavanja masovnih pojava koje omogućavaju kvantitativno (numeričko) izražavanje. Reč „statistika“ (od italijanskog stato – država) ima zajednički koren sa rečju „država“. U početku se odnosio na nauku o menadžmentu i... Statističke metode - (u ekologiji i biocenologiji) metode statistika varijacija , omogućavajući proučavanje cjeline (na primjer, fitocenozu, populaciju, produktivnost) po njenim parcijalnim agregatima (na primjer, prema podacima dobijenim na istraživanjima) i procjenu stepena tačnosti... ...

    Ekološki rječnik- (u psihologiji) (od latinskog status status) određene metode primijenjene matematičke statistike, koje se u psihologiji koriste uglavnom za obradu eksperimentalnih rezultata. Glavna svrha korištenja S. m je povećanje valjanosti zaključaka u ... ... Odlična psihološka enciklopedija

    - naučne metode opisivanja i proučavanja masovnih pojava koje omogućavaju kvantitativno (numeričko) izražavanje. Reč „statistika“ (od italijanskog stato – država) ima zajednički koren sa rečju „država“. U početku se odnosio na nauku o menadžmentu i...- 20.2. Statističke metode Specifične statističke metode koje se koriste za organizaciju, regulaciju i testiranje aktivnosti uključuju, ali nisu ograničene na sljedeće: a) dizajn eksperimenata i faktorsku analizu; b) analiza varijanse i... Rječnik-priručnik pojmova normativne i tehničke dokumentacije

    Pogledajte šta su "Statističke metode" u drugim rječnicima:- metode za proučavanje veličina. aspekte masovnih društava. pojavama i procesima. S. m omogućavaju da se u digitalnom smislu okarakterišu tekuće promjene u društvima. procese, proučavanje raznih. oblici socio-ekonomskih. obrasci, promjena...... Poljoprivredni enciklopedijski rječnik

    Pogledajte šta su "Statističke metode" u drugim rječnicima:- neke metode primijenjene matematičke statistike koje se koriste za obradu eksperimentalnih rezultata. Određeni broj statističkih metoda je razvijen posebno za ispitivanje kvaliteta psihološki testovi, za upotrebu u profesionalnim...... Stručno obrazovanje. Rječnik

    Pogledajte šta su "Statističke metode" u drugim rječnicima:- (u inženjerskoj psihologiji) (od latinskog status status) neke metode primijenjene statistike koje se koriste u inženjerskoj psihologiji za obradu eksperimentalnih rezultata. Glavna svrha korištenja S. m je povećanje valjanosti zaključaka u ... ... Encyclopedic Dictionary u psihologiji i pedagogiji

U skladu sa tri glavne mogućnosti – donošenje odluka u uslovima potpune izvesnosti, rizika i neizvesnosti – metode i algoritmi za odlučivanje se mogu podeliti u tri glavna tipa: analitičke, statističke i zasnovane na fazi formalizacije. U svakom konkretnom slučaju, metod odlučivanja se bira na osnovu zadatka koji je u pitanju, dostupnih izvornih podataka, dostupnih modela problema, okruženja za donošenje odluka, procesa odlučivanja, potrebne tačnosti odluke i ličnih preferencija analitičara.

U nekim informacionim sistemima proces izbora algoritma se može automatizovati:

Odgovarajući automatizovani sistem ima mogućnost da koristi mnogo različitih tipova algoritama (biblioteka algoritama);

Sistem interaktivno traži od korisnika da odgovori na brojna pitanja o glavnim karakteristikama zadatka koji se razmatra;

Na osnovu rezultata odgovora korisnika, sistem nudi najpogodniji (u skladu sa kriterijumima navedenim u njemu) algoritam iz biblioteke.

2.3.1 Probabilističke i statističke metode donošenja odluka

Probabilističko-statističke metode odlučivanja (PSD) koriste se u slučaju kada efikasnost donesenih odluka zavisi od faktora koji su slučajne varijable za koje su poznati zakoni distribucije vjerovatnoće i druge statističke karakteristike. Štaviše, svaka odluka može dovesti do jednog od mnogih mogućih ishoda, a svaki ishod ima određenu vjerovatnoću nastanka, koja se može izračunati. Indikatori koji karakterišu problemsku situaciju takođe se opisuju korišćenjem verovatnosnih karakteristika. Kod takvog ZPR-a donosilac odluke uvek rizikuje da dobije rezultat koji nije onaj na koji se orijentiše pri izboru optimalnog rešenja na osnovu prosečnih statističkih karakteristika slučajnih faktora. , odnosno odluka se donosi pod uslovima rizika.

U praksi se često koriste probabilističke i statističke metode kada se zaključci izvučeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda). Međutim, u svakoj konkretnoj situaciji prvo treba procijeniti temeljnu mogućnost dobijanja dovoljno pouzdanih vjerovatnostnih i statističkih podataka.

Kada se pri donošenju odluka koriste ideje i rezultati teorije vjerovatnoće i matematičke statistike, osnova je matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje slučajnosti koja se mora uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“).

Suština probabilističko-statističkih metoda donošenja odluka je upotreba probabilističkih modela zasnovanih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka..

Naglašavamo da je logika korištenja karakteristika uzorka za donošenje odluka na osnovu teorijskih modela uključuje istovremenu upotrebu dvije paralelne serije koncepata– vezano za teoriju (vjerovatni model) i vezano za praksu (uzorkovanje rezultata posmatranja). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Tipično, karakteristike uzorka su procjene teorijskih karakteristika.

Prednosti korištenja ovih metoda uključuju mogućnost uzimanja u obzir različitih scenarija razvoja događaja i njihove vjerovatnoće. Nedostatak ovih metoda je što je vrijednosti vjerovatnoće za scenarije korištene u proračunima obično vrlo teško dobiti u praksi.

Primjena specifične probabilističko-statističke metode odlučivanja sastoji se od tri faze:

Prelazak sa ekonomske, menadžerske, tehnološke stvarnosti na apstraktnu matematičku i statističku shemu, tj. izgradnja vjerovatnog modela sistema upravljanja, tehnološkog procesa, postupka odlučivanja, posebno na osnovu rezultata statističke kontrole, itd.

Izvođenje proračuna i izvođenje zaključaka koristeći čisto matematička sredstva u okviru vjerovatnog modela;

Tumačenje matematičkih i statističkih zaključaka u odnosu na realno stanje i donošenje odgovarajuće odluke (npr. o usklađenosti ili neusklađenosti kvaliteta proizvoda sa utvrđenim zahtjevima, potrebi prilagođavanja tehnološkog procesa i sl.), posebno zaključci (o udjelu neispravnih jedinica proizvoda u seriji, o specifičnom obliku zakona raspodjele kontrolisanih parametara tehnološkog procesa i dr.).

Vjerovatni model realnog fenomena treba smatrati konstruiranim ako su veličine koje se razmatraju i veze između njih izražene u terminima teorije vjerovatnoće. Adekvatnost probabilističkog modela potkrepljena je, posebno, statističkim metodama za testiranje hipoteza.

Na osnovu vrste problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteze. Na osnovu vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

Univarijantna statistika (statistika slučajnih varijabli), u kojoj je rezultat posmatranja opisan realnim brojem;

Multivarijantna statistička analiza, gde se rezultat posmatranja objekta opisuje sa nekoliko brojeva (vektora);

Statistika slučajnih procesa i vremenskih serija, gde je rezultat posmatranja funkcija;

Statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, to je skup (geometrijska figura), poredak ili dobiven kao rezultat mjerenja zasnovanog na kvalitativni kriterijum.

Primjer kada je preporučljivo koristiti vjerovatno-statističke modele.

Prilikom kontrole kvaliteta bilo kojeg proizvoda, iz njega se odabire uzorak kako bi se odlučilo da li serija proizvoda koja se proizvodi ispunjava utvrđene zahtjeve. Na osnovu rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju je vrlo važno izbjeći subjektivnost prilikom formiranja uzorka, odnosno potrebno je da svaka jedinica proizvoda u kontrolisanoj seriji ima istu vjerovatnoću da bude odabrana za uzorak. Odabir na osnovu lota u takvoj situaciji nije dovoljno objektivan. Stoga se u proizvodnim uvjetima odabir jedinica proizvoda za uzorak obično ne vrši putem lota, već pomoću posebnih tablica slučajnih brojeva ili korištenjem kompjuterskih senzora slučajnih brojeva.

U statističkoj regulaciji tehnoloških procesa, na osnovu metoda matematičke statistike, izrađuju se pravila i planovi za statističko upravljanje procesima, koji imaju za cilj pravovremeno otkrivanje problema u tehnološkim procesima i preduzimanje mjera za njihovo prilagođavanje i sprečavanje puštanja u promet proizvoda koji ne rade. ispunjavaju utvrđene zahtjeve. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabavke nekvalitetnih jedinica. Prilikom statističke kontrole prijema, na osnovu metoda matematičke statistike, izrađuju se planovi kontrole kvaliteta analizom uzoraka iz serija proizvoda. Poteškoća je u tome da se pravilno izgrade vjerovatno-statistički modeli odlučivanja, na osnovu kojih se može odgovoriti na postavljena pitanja. U matematičkoj statistici su u tu svrhu razvijeni probabilistički modeli i metode za testiranje hipoteza3.

Osim toga, u nizu upravljačkih, proizvodnih, ekonomskih i nacionalno-ekonomskih situacija javljaju se problemi drugačijeg tipa – problemi procjene karakteristika i parametara distribucije vjerovatnoće.

Ili, kada se statistički analizira tačnost i stabilnost tehnoloških procesa, potrebno je procijeniti takve pokazatelje kvaliteta kao što su prosječna vrijednost kontroliranog parametra i stepen njegovog raspršenosti u procesu koji se razmatra. Prema teoriji vjerovatnoće, preporučljivo je koristiti je kao prosječnu vrijednost slučajne varijable matematičko očekivanje, te kao statistička karakteristika raspršenosti - disperzija, standardna devijacija ili koeficijent varijacije. Ovo postavlja pitanje: kako vrednovati ove statističke karakteristike iz podataka uzorka i sa kojom tačnošću se to može učiniti? U literaturi ima mnogo sličnih primjera. Svi oni pokazuju kako se teorija vjerovatnoće i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u oblasti statističkog upravljanja kvalitetom proizvoda.

U određenim oblastima primjene koriste se i probabilističke i statističke metode opće primjene i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Koristeći njegove metode, vrši se statistička analiza tačnosti i stabilnosti tehnoloških procesa i statistička procjena kvaliteta. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvaliteta proizvoda, statističke regulacije tehnoloških procesa, procjene i kontrole pouzdanosti itd.

U upravljanju proizvodnjom, posebno kada se optimizira kvalitet proizvoda i osigurava usklađenost sa zahtjevima standarda, posebno je važno koristiti statističke metode u početnoj fazi životni ciklus proizvodi, tj. u fazi istraživačke pripreme razvoja eksperimentalnog projekta (izrada perspektivnih zahtjeva proizvoda, idejni projekt, tehničke specifikacije za izradu eksperimentalnog projekta). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost.

Najčešće probabilističke statističke metode su regresiona analiza, faktorska analiza, analiza varijanse, statističke metode za procjenu rizika, metoda scenarija itd. Područje statističkih metoda posvećeno analizi statističkih podataka nenumeričke prirode, odnosno postaje sve važnije. rezultati merenja zasnovani na kvalitativnim i različitim tipovima karakteristika. Jedna od glavnih primjena statistike objekata nenumeričke prirode je teorija i praksa stručnih procjena vezanih za teoriju statistička rješenja i problemi sa glasanjem.

Uloga osobe pri rješavanju problema metodama teorije statističkih rješenja je da postavi problem, odnosno da realni problem svede na odgovarajući standardni, da na osnovu statističkih podataka odredi vjerovatnoće događaja, kao i da odobriti dobijeno optimalno rješenje.

Slanje vašeg dobrog rada u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Objavljeno na http://www.allbest.ru/

Uvod

1. Hi-kvadrat raspodjela

Zaključak

Aplikacija

Uvod

Kako se pristupi, ideje i rezultati teorije vjerovatnoće koriste u našim životima? matematička teorija kvadrata

Osnova je probabilistički model realne pojave ili procesa, tj. matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“). Ponekad se slučajnost namjerno uvodi u situaciju, na primjer, prilikom izvlačenja ždrijeba, nasumičnog odabira jedinica za kontrolu, provođenja lutrije ili provođenja anketa potrošača.

Teorija vjerovatnoće dozvoljava da se jedna vjerovatnoća koristi za izračunavanje drugih od interesa za istraživača.

Vjerovatni model pojave ili procesa je osnova matematičke statistike. Koriste se dvije paralelne serije koncepata - oni koji se odnose na teoriju (vjerovatni model) i oni koji se odnose na praksu (uzorkovanje rezultata posmatranja). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Po pravilu, karakteristike uzorka su procjene teorijskih. Istovremeno, količine koje se odnose na teorijske serije „su u glavama istraživača“, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za direktno mjerenje. Istraživači imaju samo uzorke podataka pomoću kojih pokušavaju utvrditi svojstva teorijskog vjerojatnosnog modela koji ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da se samo uz njegovu pomoć svojstva utvrđena analizom konkretnog uzorka mogu prenijeti na druge uzorke, kao i na cjelokupnu tzv. opštu populaciju. Termin "populacija" se koristi kada se odnosi na veliku, ali konačnu kolekciju jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kafe u Moskvi. Cilj marketinških ili socioloških istraživanja je prenošenje izjava dobijenih sa uzorka od stotina ili hiljada ljudi na populaciju od nekoliko miliona ljudi. U kontroli kvaliteta, serija proizvoda djeluje kao opća populacija.

Za prenošenje zaključaka sa uzorka na veću populaciju potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke su zasnovane na odgovarajućem vjerovatnostnom modelu.

Naravno, moguće je obraditi podatke uzorka bez korištenja jednog ili drugog vjerovatnostnog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, izbrojati učestalost ispunjenja određenih uslova itd. Međutim, rezultati proračuna će se odnositi samo na konkretan uzorak, prenošenje zaključaka dobijenih uz njihovu pomoć na bilo koju drugu populaciju je netačno; Ova aktivnost se ponekad naziva "analiza podataka". U poređenju sa probabilističkim statističkim metodama, analiza podataka ima ograničenu edukativnu vrijednost.

Dakle, upotreba probabilističkih modela zasnovanih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka predstavlja suštinu vjerovatno-statističkih metoda donošenja odluka.

1. Hi-kvadrat raspodjela

Normalna distribucija definira tri distribucije koje se sada često koriste statistička obrada podaci. To su Pirsonova („hi-kvadrat”), Studentova i Fišerova distribucija.

Fokusiraćemo se na distribuciju („hi-kvadrat“). Ovu raspodjelu je prvi proučavao astronom F. Helmert 1876. godine. U vezi s teorijom Gaussove greške, proučavao je sume kvadrata n nezavisnih standardno normalno distribuiranih slučajnih varijabli. Kasnije je Karl Pearson ovoj funkciji distribucije dao naziv "hi-kvadrat". I sada distribucija nosi njegovo ime.

Zbog svoje bliske veze sa normalnom distribucijom, distribucija h2 igra važnu ulogu u teoriji vjerovatnoće i matematičkoj statistici. h2-distribucija, i mnoge druge distribucije koje su određene pomoću h2-distribucije (na primjer, Studentova raspodjela), opisuju uzorke distribucije različitih funkcija od normalne distribuirani rezultati zapažanja i koriste se za konstruisanje intervala pouzdanosti i statističkih testova.

Pirsonova distribucija (chi - kvadrat) - raspodela slučajne varijable, gde su X1, X2,..., Xn normalne nezavisne slučajne varijable, a matematičko očekivanje svake od njih je nula, a standardna devijacija jedan.

Zbir kvadrata

distribuiraju u skladu sa zakonom (“chi - kvadrat”).

U ovom slučaju, broj pojmova, tj. n se naziva "broj stepeni slobode" hi-kvadrat distribucije. Kako se broj stupnjeva slobode povećava, distribucija se polako približava normalnoj.

Gustina ove distribucije

Dakle, distribucija h2 zavisi od jednog parametra n - broja stepeni slobode.

Funkcija distribucije h2 ima oblik:

ako je h2?0. (2.7.)

Slika 1 prikazuje graf gustine vjerovatnoće i funkcije raspodjele h2 za različitih stepeni sloboda.

Slika 1. Zavisnost gustine vjerovatnoće q (x) u distribuciji h2 (hi - kvadrat) za različite brojeve stupnjeva slobode

Trenuci hi-kvadrat distribucije:

Hi-kvadrat distribucija se koristi u procjeni varijanse (koristeći interval povjerenja), testiranju hipoteza slaganja, homogenosti, nezavisnosti, prvenstveno za kvalitativne (kategorizirane) varijable koje uzimaju konačan broj vrijednosti, te u mnogim drugim zadacima statističke analize podataka. .

2. "Hi-kvadrat" u problemima statističke analize podataka

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i opravdati bilo kakve prosudbe o grupi (objektima ili subjektima) s nekom unutrašnjom heterogenošću.

Savremeni stupanj razvoja statističkih metoda može se računati od 1900. godine, kada je Englez K. Pearson osnovao časopis "Biometrika". Prva trećina dvadesetog veka. prošla pod znakom parametarske statistike. Metode su proučavane na osnovu analize podataka iz parametarskih porodica distribucija opisanih krivuljama Pearsonove porodice. Najpopularnija je bila normalna distribucija. Za provjeru hipoteza korišteni su Pirsonov, Studentov i Fišerov test. Predložena je metoda maksimalne vjerovatnoće i analiza varijanse, te su formulirane osnovne ideje planiranja eksperimenta.

Hi-kvadrat distribucija je jedna od najčešće korištenih u statistici za testiranje statističkih hipoteza. Na osnovu hi-kvadrat distribucije, konstruisan je jedan od najmoćnijih testova dobrote uklapanja - Pirsonov hi-kvadrat test.

Kriterijum slaganja je kriterijum za proveru hipoteze o pretpostavljenom zakonu nepoznate raspodele.

Test h2 ("hi-kvadrat") se koristi za testiranje hipoteze različitih distribucija. Ovo je njegovo dostojanstvo.

Proračunska formula kriterija je jednaka

gdje su m i m" empirijske i teorijske frekvencije, respektivno

dotična distribucija;

n je broj stepeni slobode.

Da bismo provjerili, moramo uporediti empirijske (opažene) i teorijske (izračunate pod pretpostavkom normalne distribucije) frekvencije.

Ako se empirijske frekvencije potpuno poklapaju sa frekvencijama izračunatim ili očekivanim, S (E - T) = 0 i kriterij h2 će također biti jednaka nuli. Ako S (E - T) nije jednako nuli, to će ukazati na neslaganje između izračunatih frekvencija i empirijskih frekvencija serije. U takvim slučajevima potrebno je procijeniti značajnost kriterija h2, koji teoretski može varirati od nule do beskonačnosti. Ovo se radi upoređivanjem stvarne vrijednosti h2f s njegovom kritičnom vrijednošću (h2st). Null hipoteza, tj. pretpostavka da je neslaganje između empirijske i teorijske ili očekivane frekvencije nasumično, pobija se ako je h2f veći ili jednak h2st. za prihvaćeni nivo značajnosti (a) i broj stepena slobode (n).

Distribucija vjerojatnih vrijednosti slučajne varijable h2 je kontinuirana i asimetrična. Zavisi od broja stupnjeva slobode (n) i približava se normalnoj raspodjeli kako se broj opažanja povećava. Dakle, primjena kriterija h2 na ocjenu diskretne distribucije je povezan s nekim greškama koje utiču na njegovu vrijednost, posebno u malim uzorcima. Da bi se dobile preciznije procjene, uzorak raspoređen u niz varijacija mora imati najmanje 50 opcija. Pravilna primjena kriterija h2 također zahtijeva da frekvencije varijanti u ekstremnim klasama ne budu manje od 5; ako ih je manje od 5, onda se kombinuju sa frekvencijama susjednih klasa tako da je ukupan iznos veći ili jednak 5. U skladu sa kombinacijom frekvencija, broj klasa (N) se smanjuje. Broj stupnjeva slobode utvrđuje se sekundarnim brojem klasa, uzimajući u obzir broj ograničenja slobode varijacije.

Budući da tačnost određivanja h2 kriterija u velikoj mjeri zavisi od tačnosti izračunavanja teoretskih frekvencija (T), za dobijanje razlike između empirijske i izračunate frekvencije treba koristiti nezaokružene teorijske frekvencije.

Kao primjer, uzmimo studiju objavljenu na web stranici posvećenoj primjeni statističkih metoda u humanističkim naukama.

Hi-kvadrat test vam omogućava da uporedite distribuciju frekvencija bez obzira na to da li su normalno raspoređene ili ne.

Učestalost se odnosi na broj pojavljivanja događaja. Obično se učestalost pojavljivanja događaja bavi kada se varijable mjere na skali imena i njihove druge karakteristike, osim učestalosti, nije moguće ili problematično odabrati. Drugim riječima, kada varijabla ima kvalitativne karakteristike. Takođe, mnogi istraživači imaju tendenciju da konvertuju rezultate testova u nivoe (visoki, prosečni, niski) i prave tabele distribucije rezultata kako bi saznali broj ljudi na ovim nivoima. Da bi se dokazalo da je na jednom od nivoa (u jednoj od kategorija) broj ljudi zaista veći (manji) koristi se i hi-kvadrat koeficijent.

Pogledajmo najjednostavniji primjer.

Proveden je test među mlađim adolescentima kako bi se utvrdilo samopoštovanje. Rezultati testova su konvertovani u tri nivoa: visok, srednji, nizak. Frekvencije su raspoređene na sljedeći način:

Visoka (B) 27 osoba.

Prosjek (C) 12 osoba.

Niska (L) 11 osoba

Očigledno je da djeca sa visoko samopoštovanje većina, ali to treba statistički dokazati. Da bismo to učinili, koristimo Hi-kvadrat test.

Naš zadatak je provjeriti da li se dobijeni empirijski podaci razlikuju od teorijski jednako vjerovatnih. Da biste to učinili, morate pronaći teorijske frekvencije. U našem slučaju, teorijske frekvencije su jednako vjerovatne frekvencije, koje se nalaze sabiranjem svih frekvencija i dijeljenjem sa brojem kategorija.

u našem slučaju:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Formula za izračunavanje hi-kvadrat testa:

h2 = ?(E - T)I / T

Izrađujemo sto:

Empirijski (E)

Teorijski (T)

(E - T)I / T

Pronađite zbir zadnje kolone:

Sada morate pronaći kritičnu vrijednost kriterija koristeći tablicu kritičnih vrijednosti (Tablica 1 u Dodatku). Za to nam je potreban broj stupnjeva slobode (n).

n = (R - 1) * (C - 1)

gdje je R broj redova u tabeli, C je broj kolona.

U našem slučaju postoji samo jedna kolona (što znači originalne empirijske frekvencije) i tri reda (kategorije), pa se formula mijenja - izuzimamo kolone.

n = (R - 1) = 3-1 = 2

Za vjerovatnoću greške p?0,05 i n = 2, kritična vrijednost je h2 = 5,99.

Dobijena empirijska vrijednost je veća od kritične vrijednosti – razlike u frekvencijama su značajne (h2 = 9,64; p? 0,05).

Kao što vidite, izračunavanje kriterija je vrlo jednostavno i ne oduzima puno vremena. Praktična vrijednost hi-kvadrat testa je ogromna. Ova metoda je najvrednija kada se analiziraju odgovori na upitnike.

Pogledajmo složeniji primjer.

Na primjer, psiholog želi da zna da li je istina da su nastavnici pristrasniji prema dječacima nego prema djevojčicama. One. verovatnije će pohvaliti devojke. Da bi to uradila, psiholog je analizirao karakteristike učenika koje su napisali nastavnici na učestalost pojavljivanja tri reči: „aktivan“, „marljiv“, „disciplinovan“, a takođe su prebrojani i sinonimi reči.

Podaci o učestalosti pojavljivanja riječi uneseni su u tabelu:

Za obradu dobijenih podataka koristimo hi-kvadrat test.

Da bismo to uradili, napravićemo tabelu raspodele empirijskih frekvencija, tj. one frekvencije koje opažamo:

Teoretski, očekujemo da će frekvencije biti podjednako raspoređene, tj. učestalost će biti raspoređena proporcionalno između dječaka i djevojčica. Napravimo tabelu teoretskih frekvencija. Da biste to učinili, pomnožite zbir reda sa zbrojem kolone i podijelite rezultirajući broj sa ukupan iznos(s).

Konačna tabela za proračun će izgledati ovako:

Empirijski (E)

Teorijski (T)

(E - T)I / T

Momci

"aktivan"

"Marljiv"

"disciplinovan"

"aktivan"

"Marljiv"

"disciplinovan"

Iznos: 4.21

h2 = ?(E - T)I / T

gdje je R broj redova u tabeli.

U našem slučaju, hi-kvadrat = 4,21; n = 2.

Koristeći tablicu kritičnih vrijednosti kriterija, nalazimo: sa n = 2 i nivoom greške od 0,05, kritična vrijednost h2 = 5,99.

Rezultirajuća vrijednost je manja od kritične vrijednosti, što znači da je nulta hipoteza prihvaćena.

Zaključak: nastavnici ne pridaju značaj polu djeteta kada mu pišu karakteristike.

Zaključak

Na kraju kursa studiraju studenti gotovo svih specijalnosti višu matematiku odeljak „teorija verovatnoće i matematička statistika“, u stvarnosti se upoznaju samo sa nekim osnovnim pojmovima i rezultatima, koji očigledno nisu dovoljni za praktičan rad. Studenti se u posebnim predmetima upoznaju sa nekim matematičkim metodama istraživanja (npr. „Prognoziranje i tehničko-ekonomsko planiranje“, „Tehnička i ekonomska analiza“, „Kontrola kvaliteta proizvoda“, „Marketing“, „Kontroliranje“, „Matematičke metode predviđanja“. ”)“, „Statistika“ itd. - u slučaju studenata ekonomske specijalnosti), međutim, prezentacija je u većini slučajeva vrlo skraćena i formulaične prirode. Kao rezultat toga, znanje stručnjaka za primijenjenu statistiku je nedovoljno.

Stoga je od velike važnosti predmet „Primijenjena statistika“ na tehničkim fakultetima, a predmet „Ekonometrija“ na ekonomskim fakultetima, jer je ekonometrija, kao što je poznato, statistička analiza konkretnih ekonomskih podataka.

Teorija vjerovatnoće i matematička statistika pružaju osnovna znanja za primijenjenu statistiku i ekonometriju.

Potrebni su specijalistima za praktičan rad.

Pogledao sam kontinuirani probabilistički model i pokušao na primjerima pokazati njegovu upotrebu.

I na kraju svog rada došao sam do zaključka da je kompetentna implementacija osnovnih postupaka matematičko-statičke analize podataka i statičkog testiranja hipoteza nemoguća bez poznavanja hi-kvadrat modela, kao i sposobnosti korištenja njegovog sto.

Spisak korišćene literature

1. Orlov A.I. Primijenjena statistika. M.: Izdavačka kuća "Ispit", 2004.

2. Gmurman V.E. Teorija vjerojatnosti i matematička statistika. M.: postdiplomske škole, 1999. - 479 str.

3. Ayvozyan S.A. Teorija vjerovatnoće i primijenjena statistika, knj. M.: Jedinstvo, 2001. - 656 str.

4. Khamitov G.P., Vedernikova T.I. Vjerovatnoće i statistika. Irkutsk: BGUEP, 2006 - 272 str.

5. Ezhova L.N. Ekonometrija. Irkutsk: BGUEP, 2002. - 314 str.

6. Mosteller F. Pedeset zabavnih probabilističkih problema s rješenjima. M.: Nauka, 1975. - 111 str.

7. Mosteller F. Vjerojatnost. M.: Mir, 1969. - 428 str.

8. Yaglom A.M. Vjerovatnoća i informacija. M.: Nauka, 1973. - 511 str.

9. Čistjakov V.P. Teorija vjerovatnoće. M.: Nauka, 1982. - 256 str.

10. Kremer N.Sh. Teorija vjerojatnosti i matematička statistika. M.: JEDINSTVO, 2000. - 543 str.

11. Matematička enciklopedija, vol.1. M.: Sovjetska enciklopedija, 1976. - 655 str.

12. http://psystat.at.ua/ - Statistika u psihologiji i pedagogiji. Članak Hi-kvadrat test.

Aplikacija

Kritične tačke distribucije h2

Tabela 1

Objavljeno na Allbest.ru

...

Slični dokumenti

    Vjerovatni model i aksiomatika A.N. Kolmogorov. Slučajne varijable i vektori, klasični granični problem teorije vjerovatnoće. Primarna obrada statističkih podataka. Tačkaste procjene numeričkih karakteristika. Statističko testiranje hipoteza.

    priručnik, dodano 03.02.2010

    Pravila za implementaciju i registraciju testovi za dopisno odeljenje. Zadaci i primjeri rješavanja zadataka iz matematičke statistike i teorije vjerojatnosti. Tabele referentnih podataka distribucija, gustina standardne normalne distribucije.

    priručnik za obuku, dodan 29.11.2009

    Osnovne metode formalizovanog opisa i analize slučajnih pojava, obrada i analiza rezultata fizičkih i numeričkih eksperimenata u teoriji verovatnoće. Osnovni pojmovi i aksiomi teorije vjerovatnoće. Osnovni koncepti matematičke statistike.

    kurs predavanja, dodato 08.04.2011

    Određivanje zakona distribucije vjerovatnoća rezultata mjerenja u matematičkoj statistici. Provjera usklađenosti empirijska distribucija teorijski. Određivanje intervala pouzdanosti u kojem se nalazi vrijednost mjerene veličine.

    kurs, dodan 02.11.2012

    Konvergencija nizova slučajnih varijabli i distribucije vjerovatnoće. Metoda karakterističnih funkcija. Testiranje statističkih hipoteza i izvođenje središnje granične teoreme za date nizove nezavisnih slučajnih varijabli.

    kurs, dodan 13.11.2012

    Glavne faze obrade podataka iz prirodnih posmatranja metodom matematičke statistike. Vrednovanje dobijenih rezultata, njihova upotreba u donošenju upravljačkih odluka u oblasti zaštite prirode i upravljanja životnom sredinom. Testiranje statističkih hipoteza.

    praktični rad, dodato 24.05.2013

    Suština zakona o distribuciji i njegova praktična primjena za rješavanje statističkih problema. Određivanje varijanse slučajne varijable, matematičko očekivanje i standardna devijacija. Osobine jednosmjerne analize varijanse.

    test, dodano 12.07.2013

    Vjerovatnoća i njena opšta definicija. Teoreme sabiranja i množenja vjerovatnoće. Diskretne slučajne varijable i njihove numeričke karakteristike. Zakon velikih brojeva. Statistička distribucija uzorka. Elementi korelacione i regresione analize.

    kurs predavanja, dodato 13.06.2015

    Program predmeta, osnovni pojmovi i formule teorije vjerovatnoće, njihovo obrazloženje i značaj. Mjesto i uloga matematičke statistike u disciplini. Primjeri i objašnjenja za rješavanje najčešćih problema na različite teme u ovim akademskim disciplinama.

    priručnik za obuku, dodan 15.01.2010

    Teorija vjerovatnoće i matematička statistika su nauke o metodama kvantitativne analize masovnih slučajnih pojava. Skup vrijednosti slučajne varijable naziva se uzorak, a elementi skupa se nazivaju vrijednosti uzorka slučajne varijable.

Probabilističke i statističke metode za modeliranje ekonomskih sistema


Uvod


Problem identifikacije zakona distribucije posmatrane slučajne varijable (strukturno-parametrijska identifikacija), po pravilu, shvata se kao problem izbora parametarskog modela zakona raspodele verovatnoće koji najbolje odgovara rezultatima eksperimentalnih posmatranja. Slučajne greške u mjernim instrumentima često se ne pridržavaju normalnog zakona, tačnije, nisu tako često dobro opisane modelom normalnog zakona. Merni instrumenti i sistemi zasnovani su na različitim fizičkim principima, različitim metodama merenja i različitim konverzijama mernih signala. Greške mjerenja kao veličine posljedica su utjecaja mnogih faktora, slučajnih i neslučajnih, koji djeluju stalno ili epizodično. Stoga je jasno da samo ako su ispunjeni određeni preduslovi (teorijski i tehnički), greške mjerenja su prilično dobro opisane modelom normalnog zakona.

Uopšteno govoreći, treba shvatiti da pravi zakon raspodele (ako postoji, naravno), koji opisuje greške određenog mernog sistema, ostaje (ostaće) nepoznat, uprkos svim našim pokušajima da ga identifikujemo. Na osnovu mjernih podataka i teorijskih razmatranja, možemo odabrati samo vjerojatnostni model koji, u nekom smislu, najbolje aproksimira ovaj pravi zakon. Ako je konstruisani model adekvatan, odnosno primenjeni kriterijumi ne daju osnovu za njegovo odbacivanje, onda na osnovu ovog modela možemo izračunati sve verovatnoće karakteristike slučajne komponente greške mernog instrumenta koje su od interesa. nama, koje će se razlikovati od pravih vrijednosti samo zbog moguće sistematske (neuočljive ili neregistrirane) komponente greške mjerenja. Njegova malenkost karakteriše ispravnost mjerenja. Skup mogućih zakona raspodjele vjerovatnoće koji se mogu koristiti za opisivanje posmatranih slučajnih varijabli je neograničen. Nema smisla postavljati cilj problema identifikacije da se pronađe pravi zakon raspodjele posmatrane veličine. Možemo samo riješiti problem odabira najboljeg modela iz određenog skupa. Na primjer, iz tog skupa parametarskih zakona i porodice distribucija koje se koriste u aplikacijama, a reference na koje se mogu naći u literaturi.

Klasični pristup strukturno-parametarskoj identifikaciji zakona raspodjele. Pod klasičnim pristupom podrazumijevamo algoritam za izbor zakona raspodjele, u potpunosti zasnovan na aparatu matematičke statistike.


1. Osnovni pojmovi o slučajni događaji, količine i funkcije


Već smo vidjeli da za mnoge eksperimente nema razlike u izračunavanju vjerovatnoća događaja, dok su elementarni ishodi u ovim eksperimentima vrlo različiti. Ali treba da nas zanimaju upravo verovatnoće događaja, a ne struktura prostora elementarnih ishoda. Stoga je vrijeme da se u svim takvim „sličnim“ eksperimentima umjesto raznih elementarnih ishoda koriste, na primjer, brojevi. Drugim riječima, svaki elementarni ishod dodijelite određenom realnom broju i radite samo s brojevima.

Neka je dat prostor vjerovatnoće.

Definicija 26.Funkcija pozvao slučajna varijabla, ako za bilo koji Borelov skup mnogi je događaj, tj. pripada - algebra .

Mnogi , koji se sastoji od tih elementarnih ishoda , za koje pripada , naziva se kompletna predslika skupa.

Napomena 9 . Općenito, neka funkcija djeluje iz seta u mnoštvo , i dato -algebre I podskupovi I respektivno. Funkcija pozvao mjerljivo, ako za bilo koji set njegov kompletan prototip pripada .

Napomena 10. Čitalac koji ne želi da se zamara apstrakcijama koje se povezuju sa -algebre događaja i sa mjerljivošću, može sa sigurnošću pretpostaviti da je bilo koji skup elementarnih ishoda događaj, pa je, prema tome, slučajna varijabla besplatnofunkcija od V . U praksi to ne dovodi do problema, tako da možete preskočiti sve dalje u ovom odeljku.

Sada, nakon što smo se riješili radoznalih čitatelja, pokušajmo razumjeti zašto je slučajnoj varijabli potrebna mjerljivost.

Ako je data slučajna varijabla , možda ćemo morati izračunati vjerovatnoće oblika , , , (i općenito vrlo različite vjerovatnoće ulaska u Borel skupove na liniji). To je moguće samo ako su skupovi pod znakom vjerovatnoće događaji – ipak vjerovatnoćapostoji funkcija definirana samo na -algebra događaja. Zahtjev mjerljivosti je ekvivalentan činjenici da za bilo koji Borelov skup vjerovatnoća je određena.

Možete zahtijevati nešto drugo u definiciji 26. Na primjer, da bi događaj bio pogodak u bilo kojem intervalu: , ili u bilo kojem poluintervalu: .

Uvjerimo se, na primjer, da su definicije 26 i 27 ekvivalentne:

Definicija 27. Funkcija naziva se slučajna varijabla ako je za bilo koju realnu mnogi pripada -algebri .

Dokaz ekvivalencija definicija 26, 27.

Ako je slučajna varijabla u smislu Definicije 26, onda će to biti slučajna varijabla u smislu Definicije 27, budući da svaki interval je Borelov set.

Dokažimo da je tačno i suprotno. Neka za bilo koji interval završeno . Moramo dokazati da isto vrijedi za sve Borelove skupove.

Skupljajmo u izobilju svi podskupovi realne linije čiji su prototipovi događaji. Mnogi već sadrži sve intervale . Pokažimo sada da je skup je -algebra. po definiciji, ako i samo ako je skup pripada .

1. Hajde da se uverimo u to . Ali i stoga .

2. Hajde da se uverimo u to za bilo koga . Neka . Onda , jer - -algebra.

3. Hajde da se uverimo u to za bilo koji . Neka za svakoga . Ali - -algebra, dakle

To smo dokazali - -algebra i sadrži sve intervale na pravoj. Ali - najmanji od -algebre koje sadrže sve intervale na pravoj. dakle, sadrži: .

Navedimo primjere mjerljivih i nemjerljivih funkcija.

Primjer 25. Baci kocku. Neka , i dvije funkcije iz V dati su ovako: , . Još nije navedeno -algebra , ne možemo govoriti o mjerljivosti. Funkcija mjerljiva u odnosu na neke -algebre možda neće biti isto za drugog.

Ako postoji skup svih podskupova , To I su slučajne varijable, pošto bilo koji skup elementarnih ishoda pripada , uključujući ili . Možete zapisati korespondenciju između vrijednosti slučajnih varijabli I a vjerovatnoće uzimaju ove vrijednosti u obliku "tabele raspodjele vjerovatnoće"ili, ukratko, "tablice distribucije":

Evo.


2. Neka -algebra događaja sastoji se od četiri seta:



one. Događaj je, pored pouzdanih i nemogućih događaja, gubitak parnog ili neparnog broja bodova. Uvjerimo se u to sa takvim relativno siromašnim -algebra ili , ni jedno ni drugo nisu slučajne varijable jer su nemjerljive. recimo, . Vidimo to


2. Numeričke karakteristike slučajnih varijabli


Matematičko očekivanje.Matematičko očekivanje diskretne slučajne varijable X, koja uzima konačan broj vrijednosti xi sa vjerovatnoćama pi, je zbir:


(6a)


Matematičko očekivanje kontinuirane slučajne varijable X je integral proizvoda njenih vrijednosti x i gustine distribucije vjerovatnoće f(x):


(6b)


Pretpostavlja se da je nepravilan integral (6b) apsolutno konvergentan (inače kažemo da matematičko očekivanje M(X) ne postoji). Matematičko očekivanje karakteriše prosečnu vrednost slučajne varijable X. Njena dimenzija se poklapa sa dimenzijom slučajne varijable. Svojstva matematičkog očekivanja:



Disperzija.Varijanca slučajne varijable X je broj:



Disperzija je karakteristika disperzije vrijednosti slučajne varijable X u odnosu na njenu prosječnu vrijednost M (X). Dimenzija varijanse jednaka je kvadratu dimenzije slučajne varijable. Na osnovu definicija varijanse (8) i matematičkog očekivanja (5) za diskretnu slučajnu varijablu i (6) za kontinuiranu slučajnu varijablu, dobijamo slične izraze za varijansu:



Ovdje je m = M (X).

Svojstva disperzije:


(10)


standardna devijacija:


(11)


Budući da standardna devijacija ima istu dimenziju kao slučajna varijabla, češće se koristi kao mjera disperzije nego varijanse.

Trenuci distribucije.Koncepti matematičkog očekivanja i disperzije su posebni slučajevi više opšti koncept za numeričke karakteristike slučajnih varijabli - momente distribucije. Trenuci distribucije slučajne varijable su predstavljeni kao matematička očekivanja nekih jednostavnih funkcija slučajne varijable. Dakle, trenutak reda k u odnosu na tačku x0 naziva se matematičko očekivanje M (X - x0) k. Momenti u odnosu na ishodište x = 0 nazivaju se početni momenti i označavaju se:


(12)


Početni trenutak prvog reda je centar distribucije slučajne varijable koja se razmatra:


(13)


Momenti u odnosu na centar distribucije x = m nazivaju se centralni momenti i označavaju se:


(14)


Iz (7) slijedi da je centralni moment prvog reda uvijek jednak nuli:


(15)


Centralni momenti ne ovise o porijeklu vrijednosti slučajne varijable, jer kada se pomakne za konstantnu vrijednost C, njen centar distribucije se pomiče na istu vrijednost C, a odstupanje od centra se ne mijenja:


X - m = (X - C) - (m - C).


Sada je jasno da je varijansa centralni moment drugog reda:


(16)


Asimetrija.Centralni trenutak trećeg reda:


(17)


služi za procjenu asimetrije distribucije. Ako je raspodjela simetrična u odnosu na tačku x = m, tada će središnji moment trećeg reda biti jednak nuli (kao i svi centralni momenti neparnog reda). Stoga, ako je centralni moment trećeg reda različit od nule, tada raspodjela ne može biti simetrična. Veličina asimetrije se procjenjuje korištenjem bezdimenzionalnog koeficijenta asimetrije:


(18)


Znak koeficijenta asimetrije (18) ukazuje na desnu ili lijevu asimetriju (slika 2).


Rice. 1. Vrste asimetrije distribucije


Višak.Centralni trenutak četvrtog reda:


(19)


služi za procjenu takozvanog kurtosisa, koji određuje stepen strmine (vršnosti) krive distribucije blizu centra distribucije u odnosu na krivu normalne distribucije. Pošto za normalnu distribuciju , tada je vrijednost uzeta kao eksces:


(20)


Na sl. 3 prikazuje primjere krivulja distribucije sa različita značenja višak. Za normalnu distribuciju, E = 0. Krive koje imaju više vrhova od normalnih imaju pozitivnu ekscesiju, one sa ravnijim vrhom imaju negativnu ekscesiju.


Rice. 2. Krive distribucije sa različitim stepenima strmine (kurtosis)


Momenti višeg reda se obično ne koriste u inženjerskim aplikacijama matematičke statistike.

Modadiskretne slučajne varijable je njena najvjerovatnija vrijednost. Mod kontinuirane slučajne varijable je njena vrijednost pri kojoj je gustina vjerovatnoće maksimalna (slika 2). Ako kriva distribucije ima jedan maksimum, tada se raspodjela naziva unimodalna. Ako kriva distribucije ima više od jednog maksimuma, tada se distribucija naziva multimodalnom. Ponekad postoje distribucije čije krive imaju minimum, a ne maksimum. Takve distribucije se nazivaju antimodalne. U opštem slučaju, mod i matematičko očekivanje slučajne varijable se ne poklapaju. U konkretnom slučaju, za modalni, tj. imaju mod, simetričnu distribuciju i pod uslovom da postoji matematičko očekivanje, potonje se poklapa sa modom i centrom simetrije distribucije.

Medijanslučajna varijabla X je njena vrijednost Me, za koju vrijedi jednakost: one. Jednako je vjerovatno da će slučajna varijabla X biti manja ili veća od Me. Geometrijski, medijana je apscisa tačke u kojoj je površina ispod krivulje raspodjele podijeljena na pola. U slučaju simetrične modalne distribucije, medijan, mod i matematičko očekivanje su isti.


. Statistička procjena zakona raspodjele slučajnih varijabli


Opća populacija- naziva se ukupnost svih objekata koji se proučavaju ili mogući rezultati svih opservacija izvršenih pod istim uslovima na jednom objektu.

Populacija uzorka ili uzorak je kolekcija objekata ili rezultata posmatranja objekta, nasumično odabranih iz opće populacije.

Veličina uzorkaje broj objekata ili zapažanja u uzorku.

Specifične vrijednosti uzorci se nazivaju opažene vrijednosti slučajne varijable X. Uočene vrijednosti se bilježe u protokolu. Protokol je tabela. Sastavljeni protokol je primarni oblik evidentiranja obrade primljenog materijala. Da bi se dobili pouzdani, pouzdani zaključci, uzorak mora biti dovoljno reprezentativan po veličini. Veliki uzorak je neuređen skup brojeva. Za istraživanje, uzorak se dovodi u vizuelno uređen oblik. Da bi to učinio, protokol pronalazi najveću i najmanju vrijednost slučajne varijable. Uzorak, sortiran uzlaznim redoslijedom, prikazan je u tabeli 1.

Tabela 1. Protokol

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Raspon uzorkanaziva se razlika između najvećeg i najniža vrijednost slučajna varijabla X:

Opseg uzorka je podijeljen na k intervala - cifara. Broj cifara se podešava u zavisnosti od opsega uzorka od 8 do 25, u ovom slučaju rad na kursu uzmimo k = 10.

Tada će dužina intervala biti jednaka:

U protokolu brojimo broj uočenih vrijednosti koje spadaju u svaki interval, označavajući ih m1, m2,…, m10. .

Pozovimo mi frekvencija udaraslučajna varijabla u intervalu i. Ako se bilo koja uočena vrijednost slučajne varijable poklapa sa krajem intervala, tada se ta vrijednost slučajne varijable pripisuje jednom od intervala po dogovoru.

Nakon što smo odredili frekvencije mi, odredimo frekvencijeslučajna varijabla, tj. hajde da pronađemo omjer frekvencija mi to ukupan broj uočene vrijednosti n.

Učestalost, stanje kompletnosti -

Nađimo sredinu svakog intervala: .

Napravimo tabelu 2

Tabela vrijednosti granica intervala i odgovarajuće frekvencije , gdje je i = 1, 2, 3, …, k, naziva se statistički niz. Grafičko predstavljanje statistički niz naziva se histogram. Konstruira se na sljedeći način: intervali se crtaju duž apscisne ose i na svakom takvom intervalu, kao na bazi, konstruiše se pravokutnik čija je površina jednaka odgovarajućoj frekvenciji.

, - visina pravougaonika, .


Tabela 2

Broj intervalaLjeva granica intervalaDesna granica intervalaIntervalSredina intervalaInterval frekvencijaVisina pravokutnika1-8.66-7.352(-8.66; -7.352)-8.00640.040.03062-7.352-6.045; 30.02293-6.044-4.736 (-6.044; -4.736)-5.3940.040.03064-4.736-3.428(-4.736; -3.428)-4.082200.20.15295-3.428-2.12(- 3.4274) - 3.4286; 2,12-0,812(-2,12; - 0,812)-1,466180,180,13767-0,8120,496(-0,812; 0,496) -0,158140,140,107080,4961,804(0,496 1,80940,1081); .804; 3.112)2.45810.010.0076103.1124.42(3.112; 4.42 )3.76610.010.0076; Iznos1001

Slika 3


Funkcija statističke distribucije je frekvencija slučajne varijable koja ne prelazi datu vrijednost X:

Za diskretnu slučajnu varijablu X, statistička funkcija distribucije se nalazi po formuli:

Zapišimo funkciju statističke distribucije u proširenom obliku:

Gdje je sredina intervala i, i su odgovarajuće frekvencije, gdje je i=1, 2,…, k.

Grafikon funkcije statističke distribucije je stepenasta linija, čije su tačke prekida sredine intervala, a konačni skokovi su jednaki odgovarajućim frekvencijama.


Slika 3


Proračun numeričkih karakteristika statističke serije

Statističko matematičko očekivanje,

Statistička varijansa,

Statistička standardna devijacija.

Statističko matematičko očekivanjeili statistički prosjeknaziva se aritmetička sredina posmatranih vrednosti slučajne varijable X.

Statistička varijansanaziva se aritmetička srednja vrijednost veličine ili

Uz veliku veličinu uzorka, proračuni pomoću formula dovode do glomaznih proračuna. Da biste pojednostavili proračune, koristite statističku seriju s granicama i frekvencije , gdje je i = 1, 2, 3, …, k, pronađite sredine intervala , a zatim i sve elemente selekcije , koji je upao u interval , zamijenjen jednom vrijednošću , onda će postojati takve vrijednosti u svakom intervalu.

Gdje - prosječna vrijednost odgovarajućeg intervala ;- frekvencija intervala

Tabela 4. Numeričke karakteristike

Frekvencija PiXiPi(Xi-m)^2(Xi-m)^2*Pi1-8.0060.04-0.320231.486911.25952-6.6980.03-0.200918.518560.555063-5.394 -5.394 4.0820.20-0.81642.847050.56945 -2.7740.26-0.72120.143880.03746-1.4660.18-0.26390.862450.15527 -0.1580.14-0.02215.002740.7004081.0004031.501.401.501.501.26-0.72120.143880.03746. .4580.010.024623.548500.2355103.7660.010.037737.953980.3795Sta statističko očekivanje -2,3947Statistička varijansa 5,3822 Statistička standardna devijacija 2,3200

Određuje poziciju centra grupiranja posmatranih vrednosti slučajne varijable.

, karakteriziraju raspršivanje promatranih vrijednosti slučajne varijable okolo

Svaka statistička distribucija neizbježno sadrži elemente slučajnosti. Međutim, sa vrlo veliki broj Zapažanja, ove nesreće su izglađene, a slučajni fenomeni otkrivaju inherentni obrazac.

Prilikom obrade statističkog materijala potrebno je odlučiti o tome kako odabrati teorijsku krivu za datu statističku seriju. Ova teorijska kriva distribucije treba da izrazi bitne karakteristike statističke distribucije - ovaj zadatak se zove problem izravnavanja ili nivelisanja statističke serije.

Ponekad opći oblik distribucije slučajne varijable X slijedi iz same prirode ove slučajne varijable.

Neka je slučajna varijabla X rezultat mjerenja neke fizičke veličine uređaja.

X = tačna vrijednost fizičke veličine + greška instrumenta.

Slučajna greška uređaja tokom merenja ima totalnu prirodu i raspoređuje se prema normalnom zakonu. Prema tome, slučajna varijabla X ima istu distribuciju, tj. normalna distribucija sa gustinom verovatnoće:


gdje, , .


Opcije I određuju se tako da su numeričke karakteristike teorijske distribucije jednake odgovarajućim numeričkim karakteristikama statističke distribucije. Uz normalnu distribuciju pretpostavlja se da ,,, tada će funkcija normalne distribucije imati oblik:

Tabela 5. Kriva niveliranja

Broj intervala Srednja tačka intervala Xi Tabelarna funkcija Normalna kriva 1-8.0060-2.41870.02140.00922-6.6980-1.85490.07140.03083-5.3900-1.29110.17340.07474-4.0820-0.32073-4.0820-0.32017,4 350,39360,1697M-2,394700,39890,17206-1,46600, 40030,36820,15877-0,15800,96410,25070,108081,15001,52790,12420,05 3592.45802, 09170.04480.0196600.051510.051510.

Iz tačaka konstruišemo teorijsku normalnu krivu na istom grafikonu sa histogramom statističke serije (Greška! Referentni izvor nije pronađen).


Slika 6


Usklađivanje funkcije statističke distribucije

Statistička funkcija raspodjele usklađeno s normalnom funkcijom distribucije:



Gdje ,,- Laplaceova funkcija.


Tabela 7. Funkcija distribucije

Broj intervala Srednja tačka intervala Xi Laplaceova funkcija Funkcija distribucije 1-8.0060-2.4187-0.49220.00782-6.6980-1.8549-0.46820.03183-5.3900-1.2911-0.40170.09834-4.0820-270-270, 0,1635-0,06490,4351m-2,3947000,50006-1,46600, 40030,15550,65557-0.15800,96410,33250,832581,15001, 52790,43670,936792,45802,09170,48180,9818606,9818604

Gradimo graf teorijske funkcije distribucije u tačkama / zajedno sa grafikom funkcije statističke distribucije.


Slika 6


Hajde da proučavamo slučajnu varijablu X sa matematičkim očekivanjem i varijansu , oba parametra su nepoznata.

Neka je x1, x2, x3, …, xn uzorak dobijen kao rezultat n nezavisnih opažanja slučajne varijable X. Da bismo naglasili slučajnu prirodu veličina x1, x2, x3, …, xn, prepisujemo ih u oblik:

X1, X2, X3, …, Xn, gdje je Xi vrijednost slučajne varijable X u i-tom eksperimentu.

Na osnovu ovih eksperimentalnih podataka potrebno je procijeniti matematičko očekivanje i disperziju slučajne varijable. Takve procjene se nazivaju tačkastim procjenama, statističko očekivanje može se uzeti kao procjena m i D i statistička varijansa, gdje



Prije eksperimenta, uzorak X1, X2, X3, ..., Xn je skup nezavisnih slučajnih varijabli koje imaju matematičko očekivanje i varijansu, što znači da je distribucija vjerovatnoće ista kao i sama slučajna varijabla X.


Gdje je i = 1, 2, 3, …, n.


Na osnovu toga nalazimo matematičko očekivanje i varijansu slučajne varijable (koristeći svojstva matematičkog očekivanja).

Dakle, matematičko očekivanje statističkog prosjeka jednaka je tačnoj vrijednosti matematičkog očekivanja m izmjerene vrijednosti, a disperzija statističkog prosjeka n puta manje od varijanse pojedinačnih rezultata mjerenja.


at


To znači da je sa velikom veličinom uzorka N statistički prosjek je gotovo neslučajna veličina samo malo odstupa od tačne vrijednosti slučajne varijable m. Ovaj zakon se naziva Čebiševljev zakon velikih brojeva.

Tačkaste procjene nepoznatih vrijednosti matematičkog očekivanja i varijanse su od velike važnosti u početnoj fazi obrade statičkih podataka. Njihov nedostatak je što se ne zna sa kojom tačnošću daju procenjeni parametar.

Neka se dati uzorak X1, X2, X3, …, Xn koristi za dobijanje tačnosti statističke procjeneI , tada će numeričke karakteristike slučajne varijable X biti približno jednake . Za malu veličinu uzorka, pitanje tačnosti procjene je značajno, jer između m i , D i odstupanja neće biti dovoljno velika. Osim toga, prilikom rješavanja praktičnih problema potrebno je ne samo pronaći približne vrijednosti m i D, već i procijeniti njihovu točnost i pouzdanost. Neka , tj. je tačka procjene za m. Očigledno je da što je m preciznije određeno, to je manji modul razlike . Neka , Gdje ?>0, onda manje ?, što je tačnija procjena m. dakle, ?>0 karakterizira tačnost procjene parametara. Međutim, statističke metode nam ne dozvoljavaju da kategorički tvrdimo da procjena prave vrijednosti m zadovoljava , možemo govoriti samo o vjerovatnoći ?, s kojom vrijedi ova nejednakost:

dakle, ?- Ovo verovatnoća poverenjaili pouzdanost procjene, značenje ? se biraju unapred u zavisnosti od problema koji se rešava. Pouzdanost ? uobičajeno je izabrati 0,9; 0,95; 0,99; 0.999. Događaji sa takvom vjerovatnoćom su praktično izvjesni. Koristeći datu vjerovatnoću pouzdanosti, možete pronaći broj ?>0 od .

Tada dobijamo interval , koji pokriva sa vjerovatnoćom ? prava vrijednost matematičkog očekivanja m, dužina ovog intervala je 2 ?. Ovaj interval se zove interval poverenja. A ova metoda procjene nepoznatog parametra m je interval.



Neka je dat uzorak X1, X2, X3, ..., Xn, i neka se nađe iz ovog uzorka, ,.

Moramo pronaći interval povjerenja za matematičko očekivanje m sa pouzdanom vjerovatnoćom ?. Magnituda je slučajna veličina sa matematičkim očekivanjem, .

Slučajna varijabla ima sumarnu prirodu sa velikom veličinom uzorka, distribuira se prema zakonu bliskom normalnom. Tada će vjerovatnoća da će slučajna varijabla pasti u interval biti jednaka:


Gdje


Gdje - Laplaceova funkcija.

Iz formule (3) i tabela Laplaceove funkcije nalazimo broj ?>0 i zapišite interval pouzdanosti za tačnu vrijednost slučajna varijabla X sa pouzdanošću ?.

U ovom predmetnom radu značenje ? mi ćemo zameniti , i tada će formula (3) poprimiti oblik:

Nađimo interval povjerenja , koji sadrži matematičko očekivanje. At ? = 0,99, n = 100, ,.

Koristeći Laplaceove tablice nalazimo:

Odavde? = 0,5986.

Interval pouzdanosti u kojem se sa vjerovatnoćom od 99% nalazi tačna vrijednost matematičkog očekivanja.


Zaključak

slučajna varijabla distribucija ekonomska

Rješavanje problema strukturno-parametarske identifikacije uz ograničene veličine uzorka, koje metrolozi obično imaju, pogoršava problem. U ovom slučaju je još važnija pravilna primjena statističkih metoda analize, korištenje korištenje procjena koje imaju najbolja statistička svojstva i kriterija koji imaju najveću snagu.

Prilikom rješavanja problema identifikacije poželjno je osloniti se na klasičan pristup. Prilikom identifikacije, preporučuje se razmatranje šireg spektra zakona distribucije, uključujući modele u obliku mješavine zakona. U ovom slučaju, za bilo koju empirijsku distribuciju uvijek možemo konstruirati adekvatnu, statistički značajno opravdaniju matematički model.

Treba se fokusirati na upotrebu i razvoj softverskih sistema koji daju rješenja za probleme strukturalne i parametarske identifikacije zakona distribucije za bilo koji oblik snimljenih opservacija (mjerenja), uključujući savremenim metodama statistika analitičke analize, fokus na raširenu, ali ispravnu upotrebu metoda kompjuterskog modeliranja u istraživanju. Već smo vidjeli da za mnoge eksperimente nema razlike u izračunavanju vjerovatnoća događaja, dok su elementarni ishodi u ovim eksperimentima vrlo različiti. Ali treba da nas zanimaju upravo verovatnoće događaja, a ne struktura prostora elementarnih ishoda. Stoga je vrijeme da se u svim takvim „sličnim“ eksperimentima umjesto raznih elementarnih ishoda koriste, na primjer, brojevi. Drugim riječima, svaki elementarni ishod dodijelite određenom realnom broju i radite samo s brojevima.

mob_info