Probabilističke statističke metode. Probabilističko-statističke metode istraživanja i metoda sistemske analize. Probabilističko-statističke metode odlučivanja

Prilikom izvođenja psihološko-pedagoških istraživanja značajna uloga se pridaje matematičkim metodama modeliranja procesa i obrade eksperimentalnih podataka. Ove metode uključuju, prije svega, tzv statističke metode istraživanja. To je zbog činjenice da na ponašanje pojedinca u procesu njegove aktivnosti i osobe u timu značajno utiču mnogi slučajni faktori. Slučajnost nam ne dozvoljava da opišemo pojave u okviru determinističkih modela, jer se manifestuje kao nedovoljna pravilnost u masovnim pojavama i stoga ne omogućava pouzdano predviđanje nastanka određenih događaja. Međutim, kada se proučavaju takvi fenomeni, otkrivaju se određeni obrasci. Nepravilnost svojstvena slučajnim događajima, sa velikim brojem testova, obično se nadoknađuje pojavom statističkog obrasca, stabilizacijom učestalosti pojavljivanja slučajnih događaja. Dakle, podaci slučajni događaji imaju određenu vjerovatnoću. Postoje dvije fundamentalno različite probabilističko-statističke metode psihološkog i pedagoškog istraživanja: klasična i neklasična. Hajde da izvedemo komparativna analiza ove metode.

Klasična probabilističko-statistička metoda. Klasična probabilističko-statistička metoda istraživanja zasniva se na teoriji vjerovatnoće i matematičkoj statistici. Ova metoda se koristi u proučavanju masovnih pojava slučajne prirode, uključuje nekoliko faza, od kojih su glavne sljedeće.

1. Izgradnja vjerovatnog modela stvarnosti na osnovu analize statističkih podataka (određivanje zakona raspodjele slučajne varijable). Naravno, obrasci masovnih nasumičnih pojava su izraženiji jasnije što je veći obim statističkog materijala. Podaci uzorka dobijeni tokom eksperimenta uvijek su ograničeni i, strogo govoreći, slučajne prirode. U tom smislu, značajna uloga se daje generalizaciji uzoraka dobijenih iz uzorka i njihovom proširenju na cjelokupnu populaciju objekata. Da bi se riješio ovaj problem, prihvaća se određena hipoteza o prirodi statističkog obrasca koji se manifestira u fenomenu koji se proučava, na primjer, hipoteza da se proučavani fenomen pokorava zakonu normalne distribucije. Ova hipoteza se naziva nultom hipotezom, koja se može pokazati lažnom, pa se uz nultu hipotezu postavlja i alternativna ili konkurentska hipoteza. Provjera koliko dobro dobiveni eksperimentalni podaci odgovaraju određenoj statističkoj hipotezi provodi se korištenjem takozvanih neparametarskih statističkih testova ili testova dobrosti. Trenutno se široko koriste kriterijumi dobrog uklapanja Kolmogorov, Smirnov, omega-kvadrat itd. Glavna ideja ovih kriterija je mjerenje udaljenosti između funkcija empirijska distribucija i funkcija potpuno poznate teorijske distribucije. Metodologija testiranja statističke hipoteze je rigorozno razvijena i predstavljena u velikom broju radova o matematičkoj statistici.

2. Izvođenje potrebnih proračuna korištenjem matematičkih sredstava u okviru vjerovatnog modela. U skladu sa uspostavljenim probabilističkim modelom pojave, vrše se proračuni karakterističnih parametara, npr. očekivanu vrijednost ili srednja vrijednost, varijansa, standardna devijacija, mod, medijan, indeks zakrivljenosti, itd.

3. Interpretacija probabilističkih i statističkih zaključaka u odnosu na realno stanje.

Trenutno je klasična probabilističko-statistička metoda dobro razvijena i široko se koristi u istraživanjima u različitim oblastima prirodnih, tehničkih i društvenih nauka. Detaljan opis suština ove metode i njena primjena na rješenje specifične zadatke može se naći u velikom broju književnih izvora, na primjer u.

Neklasična probabilističko-statistička metoda. Neklasična probabilističko-statistička metoda istraživanja razlikuje se od klasične po tome što se primjenjuje ne samo na masovne događaje, već i na pojedinačne događaje koji su u osnovi slučajni po prirodi. Ova metoda se može efikasno koristiti u analizi ponašanja pojedinca u procesu obavljanja određene aktivnosti, na primjer, u procesu asimilacije znanja od strane učenika. Razmotrićemo karakteristike neklasične probabilističko-statističke metode psihološko-pedagoškog istraživanja na primjeru ponašanja učenika u procesu sticanja znanja.

U radu je po prvi put predložen probabilističko-statistički model ponašanja učenika u procesu sticanja znanja. U radu je izvršen dalji razvoj ovog modela. Nastava kao vrsta aktivnosti, čija je svrha sticanje znanja, vještina i sposobnosti od strane osobe, zavisi od stepena razvoja svijesti učenika. Struktura svijesti uključuje kognitivne procese kao što su osjet, percepcija, pamćenje, mišljenje, mašta. Analiza ovih procesa pokazuje da ih karakterišu elementi slučajnosti, zbog nasumične prirode psihičkih i somatskih stanja pojedinca, kao i fiziološke, psihološke i informacione buke tokom rada mozga. Potonje je dovelo, kada se opisuju misaoni procesi, do napuštanja upotrebe determinističkog modela dinamičkog sistema u korist modela slučajnog dinamičkog sistema. To znači da se determinizam svijesti ostvaruje kroz slučaj. Iz ovoga možemo zaključiti da ljudsko znanje, koje je zapravo proizvod svijesti, ima i slučajnu prirodu, te se stoga vjerovatno-statističkom metodom može opisati ponašanje svakog pojedinog učenika u procesu sticanja znanja.

U skladu sa ovom metodom, student se identifikuje pomoću funkcije distribucije (gustine verovatnoće), koja određuje verovatnoću da se nađe u jednom delu informacionog prostora. Tokom procesa učenja, funkcija distribucije sa kojom se učenik identifikuje kreće se u informacionom prostoru kako se razvija. Svaki student ima individualna svojstva i dozvoljena je nezavisna lokalizacija (prostorna i kinematička) pojedinaca u odnosu na druge.

Sistem je napisan na osnovu zakona održanja vjerovatnoće diferencijalne jednadžbe, koje su jednadžbe kontinuiteta koje povezuju promjenu gustoće vjerovatnoće po jedinici vremena u faznom prostoru (prostor koordinata, brzina i ubrzanja različitih redova) sa divergencijom toka gustoće vjerovatnoće u faznom prostoru koji se razmatra. Provedena je analiza analitičkih rješenja niza jednačina kontinuiteta (funkcija distribucije) koje karakteriziraju ponašanje pojedinih učenika u procesu učenja.

Prilikom dirigovanja eksperimentalno istraživanje ponašanja učenika u procesu sticanja znanja, koristi se vjerovatno-statističko skaliranje prema kojem je mjerna skala uređen sistem. , gdje je A neki potpuno uređen skup objekata (pojedinaca) koji posjeduju karakteristike koje nas zanimaju (empirijski sistem sa relacijama); Ly - funkcionalni prostor (prostor funkcija distribucije) sa relacijama; F je operacija homomorfnog preslikavanja A u podsistem Ly; G - grupa dozvoljenih transformacija; f je operacija preslikavanja funkcija distribucije iz Ly podsistema u numeričke sisteme sa relacijama n-dimenzionalnog prostora M. Vjerovatno-statističko skaliranje se koristi za pronalaženje i obradu eksperimentalnih funkcija raspodjele i uključuje tri faze.

1. Pronalaženje eksperimentalnih funkcija raspodjele na osnovu rezultata kontrolnog događaja, na primjer, ispita. Tipičan oblik pojedinačnih funkcija distribucije pronađen na skali od dvadeset tačaka prikazan je na Sl. 1. Metoda za pronalaženje takvih funkcija je opisana u.

2. Preslikavanje funkcija distribucije u brojevni prostor. U tu svrhu izračunavaju se momenti pojedinih funkcija raspodjele. U praksi je, po pravilu, dovoljno da se ograničimo na određivanje momenata prvog reda (matematičko očekivanje), drugog reda (varijansa) i trećeg reda, koji karakterišu asimetriju funkcije raspodele.

3. Rangiranje učenika po nivou znanja na osnovu poređenja momenata različitih redova njihovih pojedinačnih funkcija raspodele.

Rice. 1. Tipični oblik individualnih funkcija raspodjele učenika koji su dobili različite ocjene na ispitu iz opšte fizike: 1 - tradicionalna ocjena “2”; 2 - tradicionalna ocjena “3”; 3 - tradicionalna ocjena “4”; 4 - tradicionalna ocjena “5”

Na osnovu aditivnosti pojedinačnih funkcija raspodjele, pronađene su eksperimentalne funkcije raspodjele za protok studenata (slika 2).


Rice. 2. Evolucija kompletne funkcije distribucije studentskog toka, aproksimirana glatkim linijama: 1 - nakon prve godine; 2 - nakon druge godine; 3 - nakon treće godine; 4 - nakon četvrte godine; 5 - nakon pete godine

Analiza podataka prikazanih na sl. 2 pokazuje da kako se krećemo kroz informacijski prostor, funkcije distribucije postaju zamagljene. To se događa zbog činjenice da se matematička očekivanja funkcija distribucije pojedinaca kreću različitim brzinama, a same funkcije zamagljuju zbog disperzije. Dalja analiza ovih funkcija distribucije može se izvršiti u okviru klasične probabilističko-statističke metode.

Diskusija o rezultatima. Analiza klasičnih i neklasičnih probabilističko-statističkih metoda psiholoških i pedagoških istraživanja pokazala je da između njih postoji značajna razlika. Kao što se iz navedenog može shvatiti, klasična metoda je primjenjiva samo na analizu masovnih događaja, a neklasična metoda je primjenjiva i na analizu masovnih i pojedinačnih događaja. S tim u vezi, klasična metoda se uslovno može nazvati masovnom vjerovatnoćom-statističkom metodom (MPSM), a neklasična metoda - individualnom vjerovatnoćom-statističkom metodom (IPSM). U 4] je pokazano da se nijedna od klasičnih metoda za procjenu znanja studenata u okviru vjerovatno-statističkog modela pojedinca ne može primijeniti u ove svrhe.

Razmotrimo karakteristike MVSM i IVSM metoda na primjeru mjerenja potpunosti znanja učenika. U tu svrhu, izvršimo misaoni eksperiment. Pretpostavimo da postoji veliki broj učenika koji su apsolutno identični po psihičkim i fizičkim karakteristikama i imaju istu pozadinu, i neka, bez interakcije jedni s drugima, istovremeno učestvuju u istom kognitivnom procesu, doživljavajući apsolutno isto striktno određeno uticaj. Zatim, u skladu sa klasičnim idejama o objektima merenja, svi učenici treba da dobiju iste ocene o potpunosti znanja sa bilo kojom tačnošću merenja. Međutim, u stvarnosti, uz dovoljno visoku tačnost mjerenja, ocjene kompletnosti znanja učenika će se razlikovati. Ovaj rezultat mjerenja nije moguće objasniti u okviru MVSM-a, jer se inicijalno pretpostavlja da je utjecaj na apsolutno identične učenike koji nisu u interakciji jedni s drugima strogo determinističke prirode. Klasična probabilističko-statistička metoda ne uzima u obzir činjenicu da se determinizam procesa spoznaje ostvaruje kroz slučajnost, koja je svojstvena svakom pojedincu koji spoznaje svijet oko sebe.

Nasumična priroda ponašanja učenika u procesu sticanja znanja uzima u obzir IVSM. Upotreba individualne probabilističko-statističke metode za analizu ponašanja idealizovane grupe učenika koja se razmatra pokazala bi da je nemoguće naznačiti tačan položaj svakog studenta u informacionom prostoru, već se može reći samo verovatnoća da se on nađe u jedno ili drugo područje informacionog prostora. Zapravo, svaki učenik je identificiran individualnom funkcijom distribucije, a njeni parametri, kao što su matematičko očekivanje, varijansa, itd., individualni su za svakog učenika. To znači da će pojedinačne funkcije distribucije biti locirane u različitim područjima informacionog prostora. Razlog ovakvog ponašanja učenika leži u nasumičnoj prirodi procesa učenja.

Međutim, u određenom broju slučajeva rezultati istraživanja dobijeni u okviru IVSM mogu se tumačiti u okviru IVSM. Pretpostavimo da nastavnik koristi petostepenu skalu kada ocjenjuje znanje učenika. U ovom slučaju greška u ocjenjivanju znanja iznosi ±0,5 bodova. Dakle, kada student dobije ocjenu od, na primjer, 4 boda, to znači da je njegovo znanje u rasponu od 3,5 do 4,5 bodova. Naime, položaj pojedinca u informacionom prostoru u ovom slučaju je određen pravokutnom funkcijom raspodjele, čija je širina jednaka mjernoj grešci od ±0,5 bodova, a procjena je matematičko očekivanje. Ova greška je toliko velika da nam ne dozvoljava da uočimo pravi oblik funkcije distribucije. Međutim, uprkos ovako gruboj aproksimaciji funkcije distribucije, proučavanje njene evolucije nam omogućava da dobijemo važne informacije kako o ponašanju pojedinca tako i o grupi učenika u cjelini.

Na rezultat mjerenja kompletnosti znanja učenika direktno ili indirektno utiče svijest nastavnika (mjeritelja), koju također karakteriše slučajnost. U procesu pedagoških mjerenja zapravo dolazi do interakcije između dva slučajna dinamička sistema koji identifikuju ponašanje učenika i nastavnika u ovom procesu. Razmatra se interakcija studentskog podsistema sa nastavnim podsistemom i pokazuje da je brzina kretanja matematičkog očekivanja pojedinih funkcija distribucije učenika u informacionom prostoru proporcionalna funkciji uticaja nastavnog osoblja i obrnuto. proporcionalno funkciji inercije, koja karakteriše neuhvatljivost promjene položaja matematičkog očekivanja u prostoru (analog Aristotelovog zakona u mehanici).

U ovom trenutku, uprkos značajnim dostignućima u razvoju teorijskih i praktičnih osnova za mjerenja pri izvođenju psihološko-pedagoških istraživanja, problem mjerenja u cjelini još uvijek je daleko od rješenja. To je prije svega zbog činjenice da još uvijek nema dovoljno informacija o utjecaju svijesti na proces mjerenja. Slična situacija je nastala i pri rješavanju mjernog problema u kvantnoj mehanici. Tako se u radu, kada se razmatraju konceptualni problemi kvantne teorije mjerenja, kaže da je rješavanje nekih paradoksa mjerenja u kvantnoj mehanici „... teško moguće bez direktnog uključivanja svijesti posmatrača u teorijski opis kvantno mjerenje.” Dalje se kaže da „... dosljedno je pretpostaviti da svijest može učiniti neki događaj vjerovatnim, čak i ako je, prema zakonima fizike (kvantne mehanike), vjerovatnoća ovog događaja mala. Napravimo važno pojašnjenje formulacije: svest datog posmatrača može učiniti verovatnim da će on videti ovaj događaj.”

U skladu sa tri glavne mogućnosti – donošenje odluka u uslovima potpune izvesnosti, rizika i neizvesnosti – metode i algoritmi za odlučivanje se mogu podeliti u tri glavna tipa: analitičke, statističke i zasnovane na fazi formalizacije. U svakom konkretnom slučaju, metod odlučivanja se bira na osnovu zadatka koji je u pitanju, dostupnih izvornih podataka, dostupnih modela problema, okruženja za donošenje odluka, procesa odlučivanja, potrebne tačnosti odluke i ličnih preferencija analitičara.

U nekim informacionim sistemima proces izbora algoritma se može automatizovati:

Odgovarajući automatizovani sistem ima mogućnost da koristi mnogo različitih tipova algoritama (biblioteka algoritama);

Sistem interaktivno traži od korisnika da odgovori na brojna pitanja o glavnim karakteristikama zadatka koji se razmatra;

Na osnovu rezultata odgovora korisnika, sistem nudi najpogodniji (u skladu sa kriterijumima navedenim u njemu) algoritam iz biblioteke.

2.3.1 Probabilističke i statističke metode donošenja odluka

Probabilističko-statističke metode odlučivanja (PSD) koriste se u slučaju kada efikasnost donesenih odluka zavisi od faktora koji su slučajne varijable za koje su poznati zakoni distribucije vjerovatnoće i druge statističke karakteristike. Štaviše, svaka odluka može dovesti do jednog od mnogih mogućih ishoda, a svaki ishod ima određenu vjerovatnoću nastanka, koja se može izračunati. Pokazatelji koji karakteriziraju problemsku situaciju također se opisuju korištenjem probabilističkih karakteristika.Takvim ZPR-om donosilac odluke uvijek riskira da dobije rezultat koji nije onaj na koji se orijentiše pri izboru optimalnog rješenja na osnovu prosječnih statističkih karakteristika slučajnih faktora. , odnosno odluka se donosi pod uslovima rizika.

U praksi se često koriste probabilističke i statističke metode kada se zaključci izvučeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda). Međutim, u svakoj konkretnoj situaciji prvo treba procijeniti temeljnu mogućnost dobijanja dovoljno pouzdanih vjerovatnostnih i statističkih podataka.

Kada se pri donošenju odluka koriste ideje i rezultati teorije vjerovatnoće i matematičke statistike, osnova je matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje slučajnosti koja se mora uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“).

Suština probabilističko-statističkih metoda odlučivanja je upotreba vjerovatnog modela zasnovanog na procjeni i testiranju hipoteza korištenjem karakteristika uzorka..

Naglašavamo da je logika korištenja karakteristika uzorka za donošenje odluka na temelju teorijskih modela uključuje istovremenu upotrebu dvije paralelne serije koncepata– vezano za teoriju (vjerovatni model) i vezano za praksu (uzorkovanje rezultata posmatranja). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Tipično, karakteristike uzorka su procjene teorijskih karakteristika.

Prednosti korištenja ovih metoda uključuju mogućnost uzimanja u obzir različitih scenarija razvoja događaja i njihove vjerovatnoće. Nedostatak ovih metoda je što je vrijednosti vjerovatnoće za scenarije korištene u proračunima obično vrlo teško dobiti u praksi.

Primjena specifične probabilističko-statističke metode odlučivanja sastoji se od tri faze:

Prelazak sa ekonomske, menadžerske, tehnološke stvarnosti na apstraktnu matematičku i statističku shemu, tj. izgradnja vjerovatnog modela sistema upravljanja, tehnološkog procesa, postupka odlučivanja, posebno na osnovu rezultata statističke kontrole, itd.

Izvođenje proračuna i izvođenje zaključaka koristeći čisto matematička sredstva u okviru vjerovatnog modela;

Tumačenje matematičkih i statističkih zaključaka u odnosu na realno stanje i donošenje odgovarajuće odluke (npr. o usklađenosti ili neusklađenosti kvaliteta proizvoda sa utvrđenim zahtjevima, potrebi prilagođavanja tehnološkog procesa i sl.), posebno zaključci (o udjelu neispravnih jedinica proizvoda u seriji, o specifičnom obliku zakona raspodjele kontrolisanih parametara tehnološkog procesa i dr.).

Vjerovatni model realnog fenomena treba smatrati konstruiranim ako su veličine koje se razmatraju i veze između njih izražene u terminima teorije vjerovatnoće. Adekvatnost probabilističkog modela potkrepljena je, posebno, statističkim metodama za testiranje hipoteza.

Na osnovu vrste problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteze. Na osnovu vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

Univarijantna statistika (statistika slučajnih varijabli), u kojoj je rezultat posmatranja opisan realnim brojem;

Multivarijantna statistička analiza, gde se rezultat posmatranja objekta opisuje sa nekoliko brojeva (vektora);

Statistika slučajnih procesa i vremenskih serija, gde je rezultat posmatranja funkcija;

Statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, to je skup (geometrijska figura), poredak ili dobiven kao rezultat mjerenja zasnovanog na po kvalitativnom kriterijumu.

Primjer kada je preporučljivo koristiti vjerovatno-statističke modele.

Prilikom kontrole kvaliteta bilo kojeg proizvoda, iz njega se odabire uzorak kako bi se odlučilo da li serija proizvoda koja se proizvodi ispunjava utvrđene zahtjeve. Na osnovu rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju je vrlo važno izbjeći subjektivnost prilikom formiranja uzorka, odnosno potrebno je da svaka jedinica proizvoda u kontrolisanoj seriji ima istu vjerovatnoću da bude odabrana za uzorak. Odabir na osnovu lota u takvoj situaciji nije dovoljno objektivan. Stoga se u proizvodnim uvjetima odabir jedinica proizvoda za uzorak obično ne vrši putem lota, već pomoću posebnih tablica slučajnih brojeva ili korištenjem kompjuterskih senzora slučajnih brojeva.

U statističkoj regulaciji tehnoloških procesa, na osnovu metoda matematičke statistike, izrađuju se pravila i planovi za statističko upravljanje procesima, koji imaju za cilj pravovremeno otkrivanje problema u tehnološkim procesima i preduzimanje mjera za njihovo prilagođavanje i sprečavanje puštanja u promet proizvoda koji nisu ispunjavaju utvrđene zahtjeve. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabavke nekvalitetnih jedinica. Prilikom statističke kontrole prijema, na osnovu metoda matematičke statistike, izrađuju se planovi kontrole kvaliteta analizom uzoraka iz serija proizvoda. Poteškoća je u tome da se pravilno izgrade vjerovatno-statistički modeli odlučivanja, na osnovu kojih se može odgovoriti na postavljena pitanja. U matematičkoj statistici su u tu svrhu razvijeni probabilistički modeli i metode za testiranje hipoteza3.

Osim toga, u nizu upravljačkih, proizvodnih, ekonomskih i nacionalno-ekonomskih situacija javljaju se problemi drugačijeg tipa – problemi procjene karakteristika i parametara distribucije vjerovatnoće.

Ili, kada se statistički analizira tačnost i stabilnost tehnoloških procesa, potrebno je procijeniti takve pokazatelje kvaliteta kao što su prosječna vrijednost kontroliranog parametra i stepen njegovog raspršenosti u procesu koji se razmatra. Prema teoriji vjerovatnoće, preporučljivo je koristiti njeno matematičko očekivanje kao prosječnu vrijednost slučajne varijable, a disperziju, standardnu ​​devijaciju ili koeficijent varijacije kao statističku karakteristiku širenja. Ovo postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom tačnošću se to može učiniti? U literaturi ima mnogo sličnih primjera. Svi oni pokazuju kako se teorija vjerovatnoće i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u oblasti statističkog upravljanja kvalitetom proizvoda.

U određenim oblastima primjene koriste se i probabilističke i statističke metode opće primjene i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Koristeći njegove metode, vrši se statistička analiza tačnosti i stabilnosti tehnoloških procesa i statistička procjena kvaliteta. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvaliteta proizvoda, statističke regulacije tehnoloških procesa, procjene i kontrole pouzdanosti itd.

U upravljanju proizvodnjom, posebno pri optimizaciji kvaliteta proizvoda i osiguravanju usklađenosti sa zahtjevima standarda, posebno je važna primjena statističkih metoda u početnoj fazi životnog ciklusa proizvoda, tj. u fazi istraživačke pripreme razvoja eksperimentalnog projekta (izrada perspektivnih zahtjeva proizvoda, idejni projekt, tehničke specifikacije za izradu eksperimentalnog projekta). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost.

Najčešće probabilističke statističke metode su regresiona analiza, faktorska analiza, analiza varijanse, statističke metode za procjenu rizika, metoda scenarija itd. Područje statističkih metoda posvećeno analizi statističkih podataka nenumeričke prirode, odnosno postaje sve važnije. rezultati merenja zasnovani na kvalitativnim i različitim tipovima karakteristika. Jedna od glavnih primjena statistike objekata nenumeričke prirode je teorija i praksa stručnih procjena vezanih za teoriju statističkih odluka i problema glasanja.

Uloga osobe pri rješavanju problema metodama teorije statističkih rješenja je da postavi problem, odnosno da realni problem svede na odgovarajući standardni, da na osnovu statističkih podataka odredi vjerovatnoće događaja, kao i da odobriti dobijeno optimalno rješenje.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Objavljeno na http://www.allbest.ru/

Uvod

1. Hi-kvadrat raspodjela

Zaključak

Aplikacija

Uvod

Kako se pristupi, ideje i rezultati teorije vjerovatnoće koriste u našim životima? matematička teorija kvadrata

Osnova je probabilistički model realne pojave ili procesa, tj. matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“). Ponekad se slučajnost namjerno uvodi u situaciju, na primjer, prilikom izvlačenja ždrijeba, nasumičnog odabira jedinica za kontrolu, provođenja lutrije ili provođenja anketa potrošača.

Teorija vjerovatnoće dozvoljava da se jedna vjerovatnoća koristi za izračunavanje drugih od interesa za istraživača.

Vjerovatni model pojave ili procesa je osnova matematičke statistike. Koriste se dvije paralelne serije koncepata - oni koji se odnose na teoriju (vjerovatni model) i oni koji se odnose na praksu (uzorkovanje rezultata posmatranja). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Po pravilu, karakteristike uzorka su procjene teorijskih. Istovremeno, količine koje se odnose na teorijske serije „su u glavama istraživača“, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za direktno mjerenje. Istraživači imaju samo uzorke podataka pomoću kojih pokušavaju utvrditi svojstva teorijskog vjerojatnosnog modela koji ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da se samo uz njegovu pomoć svojstva utvrđena analizom konkretnog uzorka mogu prenijeti na druge uzorke, kao i na cjelokupnu tzv. opštu populaciju. Termin "populacija" se koristi kada se odnosi na veliku, ali konačnu kolekciju jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kafe u Moskvi. Cilj marketinških ili socioloških istraživanja je prenošenje izjava dobijenih sa uzorka od stotina ili hiljada ljudi na populaciju od nekoliko miliona ljudi. U kontroli kvaliteta, serija proizvoda djeluje kao opća populacija.

Za prenošenje zaključaka sa uzorka na veću populaciju potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke su zasnovane na odgovarajućem vjerovatnostnom modelu.

Naravno, moguće je obraditi podatke uzorka bez korištenja jednog ili drugog vjerovatnostnog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, izbrojati učestalost ispunjenja određenih uslova itd. Međutim, rezultati proračuna odnosit će se samo na određeni uzorak, a prenošenje zaključaka dobivenih uz njihovu pomoć na bilo koju drugu populaciju nije ispravno. Ova aktivnost se ponekad naziva "analiza podataka". U poređenju sa probabilističko-statističkim metodama, analiza podataka ima ograničenu edukativnu vrijednost.

Dakle, upotreba probabilističkih modela zasnovanih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka predstavlja suštinu vjerovatno-statističkih metoda donošenja odluka.

1. Hi-kvadrat raspodjela

Koristeći normalnu distribuciju, definirane su tri distribucije koje se danas često koriste u statističkoj obradi podataka. To su Pirsonova („hi-kvadrat”), Studentova i Fišerova distribucija.

Fokusiraćemo se na distribuciju („hi-kvadrat“). Ovu distribuciju prvi je proučavao astronom F. Helmert 1876. godine. U vezi sa teorijom Gaussove greške, proučavao je sume kvadrata n nezavisnih standardno normalno distribuiranih slučajnih varijabli. Kasnije je Karl Pearson ovoj funkciji distribucije dao naziv "hi-kvadrat". I sada distribucija nosi njegovo ime.

Zbog svoje bliske veze sa normalnom distribucijom, distribucija h2 igra važnu ulogu u teoriji vjerovatnoće i matematičkoj statistici. Distribucija h2 i mnoge druge distribucije koje su određene distribucijom h2 (na primjer, Studentova raspodjela), opisuju uzorke distribucije različitih funkcija iz normalno raspoređenih rezultata posmatranja i koriste se za konstruiranje intervala povjerenja i statističkih testova.

Pirsonova distribucija (chi - kvadrat) - raspodela slučajne varijable, gde su X1, X2,..., Xn normalne nezavisne slučajne varijable, a matematičko očekivanje svake od njih je nula, a standardna devijacija jedan.

Zbir kvadrata

distribuiraju u skladu sa zakonom (“chi - kvadrat”).

U ovom slučaju, broj pojmova, tj. n se naziva "broj stepeni slobode" hi-kvadrat distribucije. Kako se broj stupnjeva slobode povećava, distribucija se polako približava normalnoj.

Gustina ove distribucije

Dakle, distribucija h2 zavisi od jednog parametra n - broja stepeni slobode.

Funkcija distribucije h2 ima oblik:

ako je h2?0. (2.7.)

Na slici 1 prikazan je graf gustoće vjerovatnoće i funkcija raspodjele h2 za različite stupnjeve slobode.

Slika 1. Zavisnost gustine vjerovatnoće q (x) u distribuciji h2 (hi - kvadrat) za različite brojeve stupnjeva slobode

Trenuci distribucije hi-kvadrat:

Hi-kvadrat distribucija se koristi u procjeni varijanse (koristeći interval povjerenja), testiranju hipoteza slaganja, homogenosti, nezavisnosti, prvenstveno za kvalitativne (kategorizirane) varijable koje uzimaju konačan broj vrijednosti, te u mnogim drugim zadacima statističke analize podataka. .

2. "Hi-kvadrat" u problemima statističke analize podataka

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i opravdati bilo kakve prosudbe o grupi (objekti ili subjekti) s nekom unutrašnjom heterogenošću.

Savremeni stupanj razvoja statističkih metoda može se računati od 1900. godine, kada je Englez K. Pearson osnovao časopis "Biometrika". Prva trećina dvadesetog veka. prošla pod znakom parametarske statistike. Metode su proučavane na osnovu analize podataka iz parametarskih porodica distribucija opisanih krivuljama Pearsonove porodice. Najpopularnija je bila normalna distribucija. Za testiranje hipoteza korišćeni su Pirsonov, Studentov i Fišerov test. Predložena je metoda maksimalne vjerovatnoće i analiza varijanse, te su formulirane osnovne ideje planiranja eksperimenta.

Hi-kvadrat distribucija je jedna od najčešće korištenih u statistici za testiranje statističkih hipoteza. Na osnovu hi-kvadrat distribucije, konstruisan je jedan od najmoćnijih testova dobrote uklapanja - Pirsonov hi-kvadrat test.

Kriterijum slaganja je kriterijum za proveru hipoteze o pretpostavljenom zakonu nepoznate raspodele.

Test h2 ("hi-kvadrat") se koristi za testiranje hipoteze različitih distribucija. Ovo je njegovo dostojanstvo.

Proračunska formula kriterija je jednaka

gdje su m i m" empirijske i teorijske frekvencije, respektivno

dotična distribucija;

n je broj stepeni slobode.

Da bismo provjerili, moramo uporediti empirijske (opažene) i teorijske (izračunate pod pretpostavkom normalne distribucije) frekvencije.

Ako se empirijske frekvencije u potpunosti poklapaju sa frekvencijama izračunatim ili očekivanim, S (E - T) = 0 i kriterij h2 će također biti jednak nuli. Ako S (E - T) nije jednako nuli, to će ukazati na neslaganje između izračunatih frekvencija i empirijskih frekvencija serije. U takvim slučajevima potrebno je procijeniti značajnost kriterija h2, koji teoretski može varirati od nule do beskonačnosti. Ovo se radi upoređivanjem stvarne vrijednosti h2f sa njegovom kritičnom vrijednošću (h2st).Nulta hipoteza, tj. pretpostavka da je neslaganje između empirijske i teorijske ili očekivane frekvencije nasumično, pobija se ako je h2f veći ili jednak h2st za prihvaćeni nivo značajnosti (a) i broj stepena slobode (n).

Distribucija vjerojatnih vrijednosti slučajne varijable h2 je kontinuirana i asimetrična. Zavisi od broja stupnjeva slobode (n) i približava se normalnoj raspodjeli kako se broj opažanja povećava. Stoga je primjena h2 kriterija na procjenu diskretnih distribucija povezana sa nekim greškama koje utiču na njegovu vrijednost, posebno na malim uzorcima. Da bi se dobile preciznije procjene, uzorak raspoređen u niz varijacija mora imati najmanje 50 opcija. Pravilna primjena kriterija h2 također zahtijeva da frekvencije varijanti u ekstremnim klasama ne budu manje od 5; ako ih je manje od 5, onda se kombinuju sa frekvencijama susjednih klasa tako da je ukupan iznos veći ili jednak 5. U skladu sa kombinacijom frekvencija, broj klasa (N) se smanjuje. Broj stupnjeva slobode utvrđuje se sekundarnim brojem klasa, uzimajući u obzir broj ograničenja slobode varijacije.

Budući da tačnost određivanja h2 kriterija u velikoj mjeri zavisi od tačnosti izračunavanja teoretskih frekvencija (T), za dobijanje razlike između empirijske i izračunate frekvencije treba koristiti nezaokružene teorijske frekvencije.

Kao primjer, uzmimo studiju objavljenu na web stranici posvećenoj primjeni statističkih metoda u humanističkim naukama.

Hi-kvadrat test vam omogućava da uporedite distribuciju frekvencija bez obzira na to da li su normalno raspoređene ili ne.

Učestalost se odnosi na broj pojavljivanja događaja. Obično se učestalost pojavljivanja događaja bavi kada se varijable mjere na skali imena i njihove druge karakteristike, osim učestalosti, nije moguće ili problematično odabrati. Drugim riječima, kada varijabla ima kvalitativne karakteristike. Takođe, mnogi istraživači imaju tendenciju da konvertuju rezultate testova u nivoe (visoki, prosečni, niski) i prave tabele distribucije rezultata kako bi saznali broj ljudi na ovim nivoima. Da bi se dokazalo da je na jednom od nivoa (u jednoj od kategorija) broj ljudi zaista veći (manji) koristi se i hi-kvadrat koeficijent.

Pogledajmo najjednostavniji primjer.

Proveden je test među mlađim adolescentima kako bi se utvrdilo samopoštovanje. Rezultati testova su konvertovani u tri nivoa: visok, srednji, nizak. Frekvencije su raspoređene na sljedeći način:

Visoka (B) 27 osoba.

Prosjek (C) 12 osoba.

Niska (L) 11 osoba

Očigledno je da većina djece ima visoko samopoštovanje, ali to treba statistički dokazati. Da bismo to učinili, koristimo Hi-kvadrat test.

Naš zadatak je provjeriti da li se dobijeni empirijski podaci razlikuju od teorijski jednako vjerovatnih. Da biste to učinili, morate pronaći teorijske frekvencije. U našem slučaju, teorijske frekvencije su jednako vjerovatne frekvencije, koje se nalaze sabiranjem svih frekvencija i dijeljenjem sa brojem kategorija.

u našem slučaju:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Formula za izračunavanje hi-kvadrat testa:

h2 = ?(E - T)I / T

Izrađujemo sto:

Empirijski (E)

Teorijski (T)

(E - T)I / T

Pronađite zbir zadnje kolone:

Sada morate pronaći kritičnu vrijednost kriterija koristeći tablicu kritičnih vrijednosti (Tablica 1 u Dodatku). Za to nam je potreban broj stupnjeva slobode (n).

n = (R - 1) * (C - 1)

gdje je R broj redova u tabeli, C je broj kolona.

U našem slučaju postoji samo jedna kolona (što znači originalne empirijske frekvencije) i tri reda (kategorije), pa se formula mijenja - izuzimamo kolone.

n = (R - 1) = 3-1 = 2

Za vjerovatnoću greške p?0,05 i n = 2, kritična vrijednost je h2 = 5,99.

Dobijena empirijska vrijednost je veća od kritične vrijednosti – razlike u frekvencijama su značajne (h2 = 9,64; p? 0,05).

Kao što vidite, izračunavanje kriterija je vrlo jednostavno i ne oduzima puno vremena. Praktična vrijednost hi-kvadrat testa je ogromna. Ova metoda je najvrednija kada se analiziraju odgovori na upitnike.

Pogledajmo složeniji primjer.

Na primjer, psiholog želi da zna da li je istina da su nastavnici pristrasniji prema dječacima nego prema djevojčicama. One. verovatnije je da hvali devojke. Da bi to uradila, psiholog je analizirao karakteristike učenika koje su napisali nastavnici na učestalost pojavljivanja tri reči: „aktivan“, „marljiv“, „disciplinovan“, a takođe su prebrojani i sinonimi reči.

Podaci o učestalosti pojavljivanja riječi uneseni su u tabelu:

Za obradu dobijenih podataka koristimo hi-kvadrat test.

Da bismo to uradili, napravićemo tabelu raspodele empirijskih frekvencija, tj. one frekvencije koje opažamo:

Teoretski, očekujemo da će frekvencije biti podjednako raspoređene, tj. učestalost će biti raspoređena proporcionalno između dječaka i djevojčica. Napravimo tabelu teoretskih frekvencija. Da biste to učinili, pomnožite zbir reda sa zbirom kolone i podijelite rezultirajući broj sa ukupnim zbrojem (s).

Konačna tabela za proračun će izgledati ovako:

Empirijski (E)

Teorijski (T)

(E - T)I / T

Momci

"aktivan"

"Marljiv"

"disciplinovan"

"aktivan"

"Marljiv"

"disciplinovan"

Iznos: 4.21

h2 = ?(E - T)I / T

gdje je R broj redova u tabeli.

U našem slučaju, hi-kvadrat = 4,21; n = 2.

Koristeći tablicu kritičnih vrijednosti kriterija, nalazimo: sa n = 2 i nivoom greške od 0,05, kritična vrijednost h2 = 5,99.

Rezultirajuća vrijednost je manja od kritične vrijednosti, što znači da je nulta hipoteza prihvaćena.

Zaključak: nastavnici ne pridaju značaj polu djeteta kada mu pišu karakteristike.

Zaključak

Studenti gotovo svih specijalnosti na kraju kursa više matematike izučavaju sekciju „teorija vjerovatnoće i matematička statistika“, a u stvarnosti se upoznaju samo sa nekim osnovnim pojmovima i rezultatima, koji očigledno nisu dovoljni za praktičan rad. Studenti se u posebnim predmetima upoznaju sa nekim matematičkim metodama istraživanja (npr. „Prognoziranje i tehničko-ekonomsko planiranje“, „Tehnička i ekonomska analiza“, „Kontrola kvaliteta proizvoda“, „Marketing“, „Kontroliranje“, „Matematičke metode predviđanja“. ”) “, „Statistika” itd. - u slučaju studenata ekonomskih specijalnosti), međutim, prikaz je u većini slučajeva vrlo štur i formularne prirode. Kao rezultat toga, znanje stručnjaka za primijenjenu statistiku je nedovoljno.

Stoga je od velike važnosti predmet „Primijenjena statistika“ na tehničkim fakultetima, a predmet „Ekonometrija“ na ekonomskim fakultetima, jer je ekonometrija, kao što je poznato, statistička analiza konkretnih ekonomskih podataka.

Teorija vjerovatnoće i matematička statistika pružaju osnovna znanja za primijenjenu statistiku i ekonometriju.

Potrebni su specijalistima za praktičan rad.

Pogledao sam kontinuirani probabilistički model i pokušao na primjerima pokazati njegovu upotrebu.

I na kraju svog rada došao sam do zaključka da je kompetentna implementacija osnovnih postupaka matematičko-statičke analize podataka i statičkog testiranja hipoteza nemoguća bez poznavanja hi-kvadrat modela, kao i sposobnosti korištenja njegovog sto.

Bibliografija

1. Orlov A.I. Primijenjena statistika. M.: Izdavačka kuća "Ispit", 2004.

2. Gmurman V.E. Teorija vjerojatnosti i matematička statistika. M.: Viša škola, 1999. - 479 str.

3. Ayvozyan S.A. Teorija vjerovatnoće i primijenjena statistika, tom 1. M.: Jedinstvo, 2001. - 656 str.

4. Khamitov G.P., Vedernikova T.I. Vjerovatnoće i statistika. Irkutsk: BGUEP, 2006 - 272 str.

5. Ezhova L.N. Ekonometrija. Irkutsk: BGUEP, 2002. - 314 str.

6. Mosteller F. Pedeset zabavnih probabilističkih problema s rješenjima. M.: Nauka, 1975. - 111 str.

7. Mosteller F. Vjerovatnoća. M.: Mir, 1969. - 428 str.

8. Yaglom A.M. Vjerovatnoća i informacija. M.: Nauka, 1973. - 511 str.

9. Čistjakov V.P. Kurs teorije vjerovatnoće. M.: Nauka, 1982. - 256 str.

10. Kremer N.Sh. Teorija vjerojatnosti i matematička statistika. M.: JEDINSTVO, 2000. - 543 str.

11. Matematička enciklopedija, vol.1. M.: Sovjetska enciklopedija, 1976. - 655 str.

12. http://psystat.at.ua/ - Statistika u psihologiji i pedagogiji. Članak Hi-kvadrat test.

Aplikacija

Kritične tačke distribucije h2

Tabela 1

Objavljeno na Allbest.ru

...

Slični dokumenti

    Vjerovatni model i aksiomatika A.N. Kolmogorov. Slučajne varijable i vektori, klasični granični problem teorije vjerovatnoće. Primarna obrada statističkih podataka. Tačkaste procjene numeričkih karakteristika. Statističko testiranje hipoteza.

    priručnik za obuku, dodan 03.02.2010

    Pravila za izvođenje i ispunjavanje testova za dopisni odjel. Zadaci i primjeri rješavanja zadataka iz matematičke statistike i teorije vjerojatnosti. Tabele referentnih podataka distribucija, gustina standardne normalne distribucije.

    priručnik za obuku, dodan 29.11.2009

    Osnovne metode formalizovanog opisa i analize slučajnih pojava, obrada i analiza rezultata fizičkih i numeričkih eksperimenata u teoriji verovatnoće. Osnovni pojmovi i aksiomi teorije vjerovatnoće. Osnovni pojmovi matematičke statistike.

    kurs predavanja, dodato 08.04.2011

    Određivanje zakona distribucije vjerovatnoća rezultata mjerenja u matematičkoj statistici. Provjera usklađenosti empirijske distribucije sa teoretskom. Određivanje intervala pouzdanosti u kojem se nalazi vrijednost mjerene veličine.

    kurs, dodan 02.11.2012

    Konvergencija nizova slučajnih varijabli i distribucije vjerovatnoće. Metoda karakterističnih funkcija. Testiranje statističkih hipoteza i izvođenje središnje granične teoreme za date nizove nezavisnih slučajnih varijabli.

    kurs, dodan 13.11.2012

    Glavne faze obrade podataka iz prirodnih posmatranja metodom matematičke statistike. Vrednovanje dobijenih rezultata, njihova upotreba u donošenju upravljačkih odluka u oblasti zaštite prirode i upravljanja životnom sredinom. Testiranje statističkih hipoteza.

    praktični rad, dodato 24.05.2013

    Suština zakona distribucije i njegova praktična primjena za rješavanje statističkih problema. Određivanje varijanse slučajne varijable, matematičko očekivanje i standardna devijacija. Osobine jednosmjerne analize varijanse.

    test, dodano 12.07.2013

    Vjerovatnoća i njena opšta definicija. Teoreme sabiranja i množenja vjerojatnosti. Diskretne slučajne varijable i njihove numeričke karakteristike. Zakon velikih brojeva. Statistička distribucija uzorka. Elementi korelacione i regresione analize.

    kurs predavanja, dodato 13.06.2015

    Program predmeta, osnovni pojmovi i formule teorije vjerovatnoće, njihovo obrazloženje i značaj. Mjesto i uloga matematičke statistike u disciplini. Primjeri i objašnjenja za rješavanje najčešćih problema na različite teme u ovim akademskim disciplinama.

    priručnik za obuku, dodan 15.01.2010

    Teorija vjerovatnoće i matematička statistika su nauke o metodama kvantitativne analize masovnih slučajnih pojava. Skup vrijednosti slučajne varijable naziva se uzorak, a elementi skupa se nazivaju vrijednosti uzorka slučajne varijable.

Od posebnog interesa je kvantitativna procjena poslovnog rizika korištenjem metoda matematičke statistike. Glavni alati ove metode procjene su:

§ vjerovatnoća pojave slučajne varijable,

§ matematičko očekivanje ili prosječna vrijednost slučajne varijable koja se proučava,

§ disperzija,

§ standardna (srednja kvadratna) devijacija,

§ koeficijent varijacije,

§ raspodjela vjerovatnoće slučajne varijable koja se proučava.

Da biste doneli odluku, morate znati veličinu (stepen) rizika koji se meri pomoću dva kriterijuma:

1) prosječna očekivana vrijednost (matematičko očekivanje),

2) fluktuacije (varijabilnost) mogućeg rezultata.

Prosječna očekivana vrijednost ovo je ponderisani prosjek slučajne varijable, koja je povezana s neizvjesnošću situacije:

,

gdje je vrijednost slučajne varijable.

Prosječna očekivana vrijednost mjeri rezultat koji u prosjeku očekujemo.

Prosječna vrijednost je generalizirana kvalitativna karakteristika i ne dozvoljava da se donese odluka u korist bilo koje posebne vrijednosti slučajne varijable.

Za donošenje odluke potrebno je izmjeriti fluktuacije indikatora, odnosno odrediti mjeru varijabilnosti mogućeg rezultata.

Varijacija u mogućem ishodu je stepen do kojeg očekivana vrijednost odstupa od prosječne vrijednosti.

U tu svrhu se u praksi obično koriste dva blisko povezana kriterija: „disperzija“ i „standardna devijacija“.

Disperzija – ponderisani prosek kvadrata stvarnih rezultata od očekivanog proseka:

Standardna devijacija je kvadratni korijen varijanse. To je dimenzionalna veličina i mjeri se u istim jedinicama u kojima se mjeri slučajna varijabla koja se proučava:

.

Varijanca i standardna devijacija daju mjeru apsolutne varijacije. Za analizu se obično koristi koeficijent varijacije.

Koeficijent varijacije predstavlja omjer standardne devijacije i prosječne očekivane vrijednosti, pomnožen sa 100%

ili .

Apsolutne vrijednosti proučavanog indikatora ne utiču na koeficijent varijacije.

Koristeći koeficijent varijacije, možete čak uporediti fluktuacije karakteristika izraženih u različitim mjernim jedinicama. Koeficijent varijacije može varirati od 0 do 100%. Što je veći koeficijent, to su veće fluktuacije.


U ekonomskoj statistici utvrđuje se sljedeća procjena različitih vrijednosti koeficijenta varijacije:

do 10% - slaba fluktuacija, 10 – 25% - umjerena, preko 25% - visoka.

Shodno tome, što su fluktuacije veće, to je veći rizik.

Primjer. Vlasnik male radnje na početku svakog dana kupuje neki kvarljivi proizvod za prodaju. Jedinica ovog proizvoda košta 200 UAH. Prodajna cijena – 300 UAH. za jedinicu. Iz zapažanja je poznato da potražnja za ovim proizvodom tokom dana može biti 4, 5, 6 ili 7 jedinica sa odgovarajućom vjerovatnoćom od 0,1; 0,3; 0,5; 0.1. Ako se proizvod ne proda tokom dana, onda će se na kraju dana uvijek kupiti po cijeni od 150 UAH. za jedinicu. Koliko jedinica ovog proizvoda bi vlasnik trgovine trebao kupiti na početku dana?

Rješenje. Hajde da napravimo matricu profita za vlasnika prodavnice. Izračunajmo dobit koju će vlasnik dobiti ako, na primjer, kupi 7 jedinica proizvoda, a proda jednu jedinicu tokom 6. dana i na kraju dana. Svaka jedinica prodanog proizvoda tijekom dana daje dobit od 100 UAH, a na kraju dana - gubitak od 200 - 150 = 50 UAH. Dakle, dobit će u ovom slučaju biti:

Proračuni se vrše na sličan način za druge kombinacije ponude i potražnje.

Očekivani profit se izračunava kao matematičko očekivanje mogućih vrednosti profita za svaki red konstruisane matrice, uzimajući u obzir odgovarajuće verovatnoće. Kao što vidite, među očekivanim profitom najveći je 525 UAH. Odgovara kupovini predmetnog proizvoda u količini od 6 jedinica.

Da bismo opravdali konačnu preporuku za kupovinu potrebnog broja jedinica proizvoda, izračunavamo varijansu, standardnu ​​devijaciju i koeficijent varijacije za svaku moguću kombinaciju ponude i potražnje za proizvodom (svaki red matrice profita):

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Što se tiče vlasnika prodavnice koji kupuje 6 jedinica proizvoda u odnosu na 5 i 4 jedinice, to nije očigledno, jer je rizik pri kupovini 6 jedinica proizvoda (19,2%) veći nego kod kupovine 5 jedinica (9,3%) i još više nego pri kupovini 4 jedinice (0%).

Tako imamo sve informacije o očekivanim profitima i rizicima. A vlasnik prodavnice odlučuje koliko jedinica proizvoda treba da kupi svakog jutra, uzimajući u obzir svoje iskustvo i apetit za rizikom.

Po našem mišljenju, vlasniku radnje treba preporučiti da kupi 5 jedinica proizvoda svakog jutra i njegov prosječni očekivani profit će biti 485 UAH. a ako to uporedite sa kupovinom 6 jedinica proizvoda, pri čemu je prosječna očekivana dobit 525 UAH, što je 40 UAH. više, ali će rizik u ovom slučaju biti 2,06 puta veći.

Kako se koriste teorija vjerovatnoće i matematička statistika? Ove discipline su osnova probabilističkih i statističkih metoda odlučivanje. Da biste koristili njihov matematički aparat, potrebni su vam problemi odlučivanje izraziti u terminima vjerovatno-statističkih modela. Primjena specifičnog vjerovatno-statističkog metoda odlučivanje sastoji se od tri faze:

  • prelazak sa ekonomske, menadžerske, tehnološke stvarnosti na apstraktnu matematičku i statističku shemu, tj. konstrukcija vjerovatnog modela upravljačkog sistema, tehnološkog procesa, procedure donošenja odluka, posebno na osnovu rezultata statističke kontrole, itd.;
  • izvođenje proračuna i dobijanje zaključaka koristeći čisto matematička sredstva u okviru vjerovatnog modela;
  • tumačenje matematičkih i statističkih zaključaka u odnosu na realnu situaciju i donošenje odgovarajuće odluke (npr. o usklađenosti ili neusklađenosti kvaliteta proizvoda sa utvrđenim zahtjevima, potrebi prilagođavanja tehnološkog procesa i sl.), posebno, zaključci (o udjelu neispravnih jedinica proizvoda u seriji, o specifičnom obliku zakona o distribuciji kontrolisanih parametara tehnološki proces itd.).

Matematička statistika koristi koncepte, metode i rezultate teorije vjerovatnoće. Razmotrimo glavna pitanja konstruisanja vjerovatnostnih modela odlučivanje u ekonomskim, menadžerskim, tehnološkim i drugim situacijama. Za aktivnu i ispravnu upotrebu regulatornih, tehničkih i instruktivnih dokumenata o probabilističkim i statističkim metodama odlučivanje potrebno je prethodno znanje. Dakle, potrebno je znati pod kojim uslovima treba koristiti određeni dokument, koje početne informacije je potrebno imati za njegov odabir i primjenu, koje odluke treba donijeti na osnovu rezultata obrade podataka itd.

Primjeri primjene teorije vjerovatnoće i matematičke statistike. Razmotrimo nekoliko primjera gdje su vjerovatno-statistički modeli dobar alat za rješavanje upravljačkih, proizvodnih, ekonomskih i nacionalnih ekonomskih problema. Tako, na primjer, u romanu A.N. Tolstojev „Hod kroz muku” (tom 1) kaže: „radionica proizvodi dvadeset tri posto nedostataka, držite se ove brojke”, rekao je Strukov Ivanu Iljiču.

Postavlja se pitanje kako razumjeti ove riječi u razgovoru direktora fabrike, jer jedna proizvodna jedinica ne može biti 23% neispravna. Može biti dobar ili neispravan. Strukov je vjerovatno mislio da velika serija sadrži otprilike 23% neispravnih jedinica proizvodnje. Postavlja se onda pitanje šta znači "otprilike"? Neka se 30 od 100 testiranih jedinica proizvodnje pokaže neispravnim, ili od 1000-300, ili od 100 000-30 000 itd., treba li optužiti Strukova za laž?

Ili drugi primjer. Novčić koji se koristi kao lot mora biti „simetričan“, tj. pri bacanju, u prosjeku, u pola slučajeva grb bi trebao ispasti, au pola slučajeva - heš (repovi, broj). Ali šta znači "u prosjeku"? Ako izvodite mnogo serija od 10 bacanja u svakoj seriji, onda ćete često naići na serije u kojima novčić slijeće kao grb 4 puta. Za simetričan novčić, to će se dogoditi u 20,5% serija. A ako nakon 100.000 bacanja ima 40.000 grbova, može li se novčić smatrati simetričnim? Procedura odlučivanje zasniva se na teoriji vjerovatnoće i matematičkoj statistici.

Primjer koji je u pitanju možda ne izgleda dovoljno ozbiljan. Međutim, nije. Žreb se široko koristi u organizaciji industrijskih tehničkih i ekonomskih eksperimenata, na primjer, prilikom obrade rezultata mjerenja indikatora kvalitete (momenta trenja) ležajeva u zavisnosti od različitih tehnoloških faktora (utjecaj okoliša očuvanja, metode pripreme ležajeva prije mjerenja). , uticaj opterećenja ležaja tokom procesa merenja itd.). P.). Recimo da je potrebno uporediti kvalitet ležajeva u zavisnosti od rezultata njihovog skladištenja u različitim konzervacionim uljima, tj. u uljima sastava i. Prilikom planiranja ovakvog eksperimenta postavlja se pitanje koje ležajeve treba staviti u ulje kompozicije, a koje - u ulje kompozicije, ali na način da se izbegne subjektivnost i obezbedi objektivnost donete odluke.

Odgovor na ovo pitanje može se dobiti žrijebom. Sličan primjer može se dati s kontrolom kvalitete bilo kojeg proizvoda. Da bi se odlučilo da li kontrolisana serija proizvoda ispunjava utvrđene uslove, pravi se uzorak. Na osnovu rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju je veoma važno izbjeći subjektivnost prilikom formiranja uzorka, tj. potrebno je da svaka jedinica proizvoda u kontrolisanoj seriji ima istu vjerovatnoću da bude odabrana za uzorak. U proizvodnim uvjetima, odabir jedinica proizvoda za uzorak obično se ne vrši putem lota, već pomoću posebnih tablica slučajnih brojeva ili korištenjem kompjuterskih senzora slučajnih brojeva.

Slični problemi obezbeđivanja objektivnosti poređenja javljaju se prilikom poređenja različitih šema organizacija proizvodnje, naknade, na tenderima i konkursima, izbor kandidata za upražnjena radna mjesta i dr. Svugdje nam treba žrijeb ili slične procedure. Objasnimo na primjeru identifikacije najjače i druge najjače ekipe pri organizaciji turnira po olimpijskom sistemu (poraženi je eliminisan). Neka jača ekipa uvijek pobjeđuje slabiju. Jasno je da će najjača ekipa sigurno postati šampion. Druga po snazi ​​ekipa će u finale samo ako nema utakmica sa budućim šampionom prije finala. Ako je takva utakmica planirana, druga po snazi ​​ekipa neće proći u finale. Onaj ko planira turnir može ili "nokautirati" drugu najjaču ekipu sa turnira prije roka, suprotstaviti je lideru u prvom susretu, ili joj obezbijediti drugo mjesto, osiguravajući susrete sa slabijim ekipama sve do finala. . Kako bi se izbjegla subjektivnost, izvodi se ždrijeb. Za turnir sa 8 ekipa, vjerovatnoća da će se dvije najbolje ekipe sastati u finalu je 4/7. Shodno tome, sa vjerovatnoćom od 3/7, drugi najjači tim će rano napustiti turnir.

Svako mjerenje jedinica proizvoda (pomoću čeljusti, mikrometra, ampermetra, itd.) sadrži greške. Da bi se utvrdilo da li postoje sistematske greške, potrebno je izvršiti ponovljena mjerenja jedinice proizvoda čije su karakteristike poznate (na primjer, standardni uzorak). Treba imati na umu da pored sistematske greške postoji i slučajna greška.

Stoga se postavlja pitanje kako iz rezultata mjerenja saznati da li postoji sistemska greška. Ako samo zapazimo da li je greška dobijena prilikom sljedećeg mjerenja pozitivna ili negativna, onda se ovaj zadatak može svesti na prethodni. Zaista, usporedimo mjerenje s bacanjem novčića, pozitivnu grešku s gubitkom grba, a negativnu grešku s mrežom (nulta greška s dovoljnim brojem podjela ljestvice gotovo se nikada ne pojavljuje). Tada je provjera odsustva sistematske greške ekvivalentna provjeri simetrije novčića.

Svrha ovih razmatranja je da se problem provjere odsustva sistematske greške svede na problem provjere simetrije novčića. Gornje rezonovanje vodi do takozvanog „kriterijuma predznaka“ u matematičkoj statistici.

U statističkoj regulaciji tehnoloških procesa, na osnovu metoda matematičke statistike, izrađuju se pravila i planovi za statističko upravljanje procesima, koji imaju za cilj blagovremeno otkrivanje problema u tehnološkim procesima, preduzimanje mjera za njihovo prilagođavanje i sprečavanje puštanja u promet proizvoda koji ne rade. ispunjavaju utvrđene zahtjeve. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabavke nekvalitetnih jedinica. Prilikom statističke kontrole prijema, na osnovu metoda matematičke statistike, izrađuju se planovi kontrole kvaliteta analizom uzoraka iz serija proizvoda. Poteškoća leži u tome da se pravilno izgradi vjerovatnost statističkih modela odlučivanje, na osnovu čega se može odgovoriti na gornja pitanja. U matematičkoj statistici su u tu svrhu razvijeni probabilistički modeli i metode za provjeru hipoteza, posebno hipoteza da je udio neispravnih jedinica proizvodnje jednak određenom broju, na primjer (sjetite se riječi Strukova iz romana od A.N. Tolstoj).

Ciljevi ocjenjivanja. U nizu upravljačkih, proizvodnih, ekonomskih i nacionalno-ekonomskih situacija javljaju se problemi drugačijeg tipa - problemi procene karakteristika i parametara distribucije verovatnoće.

Pogledajmo primjer. Neka serija od N električnih lampi stigne na pregled. Iz ove serije nasumično je odabran uzorak od n električnih lampi. Postavlja se niz prirodnih pitanja. Kako odrediti prosječni vijek trajanja električnih svjetiljki na osnovu rezultata ispitivanja elemenata uzorka i s kojom se tačnošću može procijeniti ova karakteristika? Kako će se promijeniti tačnost ako uzmemo veći uzorak? Za koji broj sati se može garantovati da će najmanje 90% električnih lampi trajati duže od sati?

Pretpostavimo da se prilikom testiranja zapremine uzorka električnih lampi pokazalo da su električne lampe neispravne. Tada se postavljaju sljedeća pitanja. Koje granice se mogu odrediti za broj neispravnih električnih lampi u seriji, za nivo neispravnosti itd.?

Ili kada se statistički analizira tačnost i stabilnost tehnoloških procesa, potrebno je vrednovati takve indikatori kvaliteta, kao prosječna vrijednost kontrolisanog parametra i stepen njegove raspršenosti u procesu koji se razmatra. Prema teoriji vjerovatnoće, preporučljivo je koristiti njeno matematičko očekivanje kao prosječnu vrijednost slučajne varijable, a disperziju, standardnu ​​devijaciju ili koeficijent varijacije. Ovo postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom tačnošću se to može učiniti? Postoji mnogo sličnih primjera koji se mogu navesti. Ovdje je bilo važno pokazati kako se teorija vjerovatnoće i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u oblasti statističkog upravljanja kvalitetom proizvoda.

Šta je "matematička statistika"? Matematička statistika je „grana matematike posvećena matematičkim metodama prikupljanja, sistematizacije, obrade i tumačenja statističkih podataka, kao i njihovog korišćenja za naučne ili praktične zaključke. Pravila i procedure matematičke statistike zasnivaju se na teoriji verovatnoće, koja omogućava nam da procenimo tačnost i pouzdanost zaključaka dobijenih u svakom zadatku na osnovu dostupnog statističkog materijala“ [[2.2], str. 326]. U ovom slučaju, statistički podaci se odnose na informaciju o broju objekata u bilo kojoj manje ili više obimnoj zbirci koji imaju određene karakteristike.

Na osnovu vrste problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteza.

Na osnovu vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

  • univarijantna statistika (stat slučajne varijable), u kojem je rezultat posmatranja opisan realnim brojem;
  • multivarijantna statistička analiza, gdje se rezultat posmatranja objekta opisuje s nekoliko brojeva (vektora);
  • statistika slučajnih procesa i vremenskih serija, gdje je rezultat posmatranja funkcija;
  • statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, skup ( geometrijska figura), naručivanjem ili dobijenim kao rezultat mjerenja prema kvalitativnom kriteriju.

Istorijski gledano, prve su se pojavile neke oblasti statistike objekata nenumeričke prirode (posebno problemi procjene proporcije defekata i testiranja hipoteza o tome) i jednodimenzionalne statistike. Za njih je matematički aparat jednostavniji, pa se na njihovom primjeru obično demonstriraju osnovne ideje matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika je zasnovana na dokazima, koja je zasnovana na probabilističkim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, nastanku rizika, funkcionisanju tehnološke opreme, dobijanju eksperimentalnih rezultata, toku bolesti itd. Vjerovatni model realnog fenomena treba smatrati konstruiranim ako su veličine koje se razmatraju i veze između njih izražene u terminima teorije vjerovatnoće. Korespondencija sa probabilističkim modelom stvarnosti, tj. njegova adekvatnost se potkrepljuje, posebno, korištenjem statističkih metoda za testiranje hipoteza.

Neverovatnostne metode obrade podataka su istraživačke i mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućavaju procenu tačnosti i pouzdanosti zaključaka dobijenih na osnovu ograničenog statističkog materijala.

Vjerovatni i statističke metode primjenjiv svuda gdje je moguće izgraditi i opravdati vjerovatnostni model pojave ili procesa. Njihova upotreba je obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda).

U specifičnim područjima primjene oni se koriste kao probabilistički statističke metodeširoka primena i specifična. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Koristeći njegove metode, to se provodi Statistička analiza tačnost i stabilnost tehnoloških procesa i statistička evaluacija kvaliteta. Specifične metode uključuju statističku kontrolu prihvatljivosti kvaliteta proizvoda, statističku regulaciju tehnoloških procesa, procjenu i kontrolu pouzdanosti itd.

Primijenjene probabilističke i statističke discipline kao što su teorija i teorija pouzdanosti imaju široku primjenu. queuing. Sadržaj prvog od njih je jasan iz naziva, drugi se bavi proučavanjem sistema kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevima pretplatnika koji biraju brojeve na svojim telefonskim aparatima. Trajanje servisiranja ovih zahtjeva, tj. trajanje razgovora je također modelirano slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije nauka SSSR-a A.Ya. Khinčin (1894-1959), akademik Akademije nauka Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći naučnici.

Ukratko o istoriji matematičke statistike. Matematička statistika kao nauka počinje radovima poznatog njemačkog matematičara Carla Friedricha Gaussa (1777-1855), koji je na osnovu teorije vjerovatnoće istraživao i potkrijepio metoda najmanjih kvadrata , koju je kreirao 1795. godine i korišten za obradu astronomskih podataka (kako bi se razjasnila orbita male planete Ceres). Jedna od najpopularnijih distribucija vjerovatnoće, normalna, često se naziva po njemu, a u teoriji slučajnih procesa glavni predmet proučavanja su Gausovi procesi.

IN kasno XIX V. - početkom 20. veka Veliki doprinos matematičkoj statistici dali su engleski istraživači, prvenstveno K. Pearson (1857-1936) i R.A. Fischer (1890-1962). Konkretno, Pearson je razvio hi-kvadrat test za testiranje statističkih hipoteza, a Fisher - analiza varijanse, teorija eksperimentalnog dizajna, metoda maksimalne vjerovatnoće procjene parametara.

Tridesetih godina dvadesetog veka. Poljak Jerzy Neumann (1894-1977) i Englez E. Pearson su razvili opšta teorija testiranje statističkih hipoteza, a sovjetski matematičari akademik A.N. Kolmogorov (1903-1987) i dopisni član Akademije nauka SSSR-a N.V. Smirnov (1900-1966) je postavio temelje neparametarske statistike. Četrdesetih godina dvadesetog veka. Rumun A. Wald (1902-1950) izgradio je teoriju sekvencijalne statističke analize.

Matematička statistika se u današnje vrijeme ubrzano razvija. Tako se u proteklih 40 godina mogu izdvojiti četiri fundamentalno nova područja istraživanja [[2.16]]:

  • razvoj i implementacija matematičke metode planiranje eksperimenata;
  • razvoj statistike objekata nenumeričke prirode kao samostalnog pravca u primijenjenoj matematičkoj statistici;
  • razvoj statističkih metoda otpornih na mala odstupanja od korišćenog verovatnosnog modela;
  • raširen razvoj rada na kreiranju računalnih programskih paketa dizajniranih za statističku analizu podataka.

Probabilističko-statističke metode i optimizacija. Ideja optimizacije prožima savremenu primijenjenu matematičku statistiku i drugo statističke metode. Naime, metode planiranja eksperimenata, statistička kontrola prihvatljivosti, statistička regulacija tehnoloških procesa itd. S druge strane, optimizacijske formulacije u teoriji odlučivanje, Na primjer, primijenjena teorija optimizirajući kvalitet proizvoda i zahtjeve standarda, omogućavaju široku upotrebu probabilističkih statističkih metoda, prvenstveno primijenjene matematičke statistike.

U upravljanju proizvodnjom, posebno kada se optimizira kvalitet proizvoda i zahtjevi standarda, posebno je važna primjena statističke metode on početna faza životni ciklus proizvodi, tj. u fazi istraživačke pripreme razvoja eksperimentalnog projekta (izrada perspektivnih zahtjeva proizvoda, idejni projekt, tehničke specifikacije za izradu eksperimentalnog projekta). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost. Statističke metode treba koristiti u svim fazama rješavanja problema optimizacije - pri skaliranju varijabli, razvoju matematički modeli funkcionisanje proizvoda i sistema, izvođenje tehničkih i ekonomskih eksperimenata itd.

U problemima optimizacije, uključujući optimizaciju kvaliteta proizvoda i standardne zahtjeve, koriste se sva područja statistike. Naime, statistika slučajnih varijabli, višedimenzionalna Statistička analiza, statistika slučajnih procesa i vremenskih serija, statistika objekata nenumeričke prirode. Preporučljivo je odabrati statističku metodu za analizu specifičnih podataka prema preporukama [

mob_info