Rješavanje problema u ekonometriji. Rješenje i analiza Kako pronaći prosjek u ekonometriji

Pretpostavimo da smo pronašli ove procjene i možemo napisati jednačinu:

ŷ = a + bX,

Gdje A- konstanta regresije, tačka preseka linije regresije sa osom OY;

b- koeficijent regresije, nagib linije regresije koja karakteriše odnos DY¤DX;

ŷ - teorijska vrijednost objašnjene varijable.

Kao što je poznato u parnoj regresiji, izbor tipa matematički model može se izvesti na tri načina:

1. Grafički.

2. Analitički.

3. Eksperimentalno.

Za odabir funkcije koja opisuje promatrane vrijednosti može se koristiti grafička metoda. Početni podaci su ucrtani koordinatna ravan. Vrijednosti faktorske karakteristike su iscrtane na osi apscise, a vrijednosti rezultirajuće karakteristike na osi ordinata. Lokacija tačaka će pokazati približan oblik veze. Po pravilu, ovaj odnos je krivolinijski. Ako je zakrivljenost ove linije mala, onda možemo prihvatiti hipotezu o postojanju prave linearna veza.

Opišimo funkciju potrošnje kao dijagram raspršenja. Da bismo to uradili, u koordinatnom sistemu iscrtavamo vrednost dohotka na osi apscise, a na osi ordinate troškove potrošnje uslovnog proizvoda. Lokacija tačaka koje odgovaraju skupovima vrijednosti "prihodi - rashodi potrošnje" pokazat će približni oblik odnosa (slika 1).

Vizuelno, na osnovu dijagrama, gotovo nikada nije moguće nedvosmisleno identificirati najbolju ovisnost.

Prijeđimo na procjenu parametara odabrane funkcije a I b način najmanjih kvadrata.

Problem procjene se može svesti na “klasični” problem nalaženja minimuma. Varijable su sada ocjene A I b nepoznati parametri predložene veze at I X. Naći najniža vrijednost Za bilo koju funkciju, prvo morate pronaći parcijalne izvode prvog reda. Zatim izjednačite svaku od njih sa nulom i riješite rezultirajući sistem jednačina u odnosu na varijable. U našem slučaju, takva funkcija je zbir kvadrata odstupanja - S, a varijable su A I b. To jest, moramo pronaći = 0 i = 0 i riješiti rezultirajući sistem jednačina u odnosu na A I b.

Izvedemo procjene parametara koristeći metodu najmanjih kvadrata, uz pretpostavku da jednačina spajanja ima oblik ŷ = a + bX. Zatim funkcija S izgleda kao

. Razlikovanje funkcije S By A, dobijamo prvu normalnu jednačinu diferenciranjem u odnosu na b- druga normalna jednačina. , ,

Nakon odgovarajućih transformacija dobijamo:

(*)

Postoje pojednostavljena pravila za konstruisanje sistema normalnih jednačina. Primijenimo ih na linearna funkcija:

1) Pomnožite svaki član jednačine ŷ = a + bX po koeficijentu za prvi parametar ( A), odnosno po jedan.

2) Prije svake varijable stavljamo znak za sumiranje.

3) Pomnožite slobodni član jednačine sa n.

4) Dobijamo prvu normalnu jednačinu

5) Pomnožite svaki član originalne jednačine sa koeficijentom drugog parametra ( b), odnosno na X.

6) Ispred svake varijable stavljamo znak za sumiranje.

7) Dobijamo drugu normalnu jednačinu

Koristeći ova pravila, sastavlja se sistem normalnih jednačina za bilo koju linearnu funkciju. Pravila je prvi formulisao engleski ekonomista R. Pearl.

Parametri jednadžbi se izračunavaju pomoću sljedećih formula:

, ,

Napravimo, koristeći početne podatke u tabeli 1, sistem normalnih jednačina (*) i riješimo ga s obzirom na nepoznate A I b:


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7,6923

Jednačina regresije je:

ŷ = -3309 + 7,6923 x ,

Uporedimo stvarne i procijenjene troškove potrošnje proizvoda A (tabela 2).

Tabela 2 Poređenje stvarnih i procijenjenih vrijednosti troškova za potrošnju dobara A sa linearnim odnosom:

Broj grupe

Troškovi potrošnje

robe A

Odstupanje stvarnih troškova od obračunatih

stvarni(e)

naselje

apsolutno

(y – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
Ukupno - - 0

Nacrtajmo rezultujuću funkciju ŷ i dijagram rasipanja koristeći stvarne vrijednosti (y) i izračunate vrijednosti ( ŷ) .

Izračunate vrijednosti odstupaju od stvarnih zbog činjenice da je odnos između karakteristika korelacijski.

Koeficijent korelacije se koristi kao mjera bliskosti veze:

=

Dobijamo, koristeći početne podatke iz tabele 1:

σ x =158;

σ y = 20,76;

r = 0,990.

Koeficijent linearne korelacije može imati bilo koju vrijednost u rasponu od minus 1 do plus 1. Što je koeficijent korelacije u apsolutnoj vrijednosti bliži 1, to je bliža veza između karakteristika. Predznak koeficijenta linearne korelacije ukazuje na smjer odnosa - direktni odnos odgovara predznaku plus, a inverzni odnos odgovara znaku minus.

zaključak: odnos između vrijednosti X i odgovarajuće vrijednosti at

bliska, direktna zavisnost.

U našem primjeru d = 0,9801

To znači da se mijenjaju troškovi proizvoda A može se 98,01% objasniti promjenama prihoda.

Preostalih 1,99% može biti rezultat:

1) nedovoljno dobro odabran oblik komunikacije;

2) uticaj bilo kojih drugih neuračunatih faktora na zavisnu varijablu.

Statističko testiranje hipoteza.

Postavili smo nultu hipotezu da je koeficijent regresije statistički beznačajan:

H 0 : b = 0.

Statistička značajnost koeficijenta regresije se provjerava pomoću t- Studentov t-test. Da biste to učinili, prvo odredite preostali zbir kvadrata

s 2 ost= å (y i – ŷ i) 2

s 2 ost = 1,3689.

i njegovu standardnu ​​devijaciju

s = 0,39. se ( b ) = 0,018.

Stvarna vrijednost t- Studentov test za koeficijent regresije:

.

t b = 427,35.

Vrijednost |t b |>t cr (t cr =2,26 za 95% nivo značajnosti) nam omogućava da izvučemo zaključak o tome da je koeficijent regresije različit od nule (na odgovarajućem nivou značajnosti) i, prema tome, o prisutnosti uticaja (veza) X I u.

zaključak: stvarna vrijednost t-Studentov t-test prelazi vrijednost tabele, što znači da se nulta hipoteza odbacuje i sa vjerovatnoćom od 95% prihvata se alternativna hipoteza o statističkoj značajnosti koeficijenta regresije.

[b– t cr *se( b), b+ t cr *se( b)]- 95% interval pouzdanosti za b.

Interval pouzdanosti pokriva pravu vrijednost parametra b c data verovatnoća(V u ovom slučaju 95%).

7,6516 < b < 7,7329.

Pređimo na provjeru statističke značajnosti koeficijenata korelacije i determinacije:

r = 0,990;

d = r 2 = 0,9801.

Postavili smo nultu hipotezu da je jednadžba regresije u cjelini statistički beznačajna:

H 0 : r 2 = 0.

Procjena statističke značajnosti konstruiranog regresijskog modela u cjelini vrši se korištenjem F-Fišerov kriterijum. Stvarna vrijednost F-kriterijumi za uparene regresione jednadžbe linearne po parametrima definirani su kao:

gdje je s 2 faktor disperzija za teorijske vrijednosti ŷ (objašnjena varijacija);

s 2 ostatak - rezidualni zbir kvadrata;

r 2 - koeficijent odlučnosti.

Stvarna vrijednost F-Fišerov kriterijum:

F f = 443,26

zaključak: odbacujemo nultu hipotezu i sa vjerovatnoćom od 95% prihvatamo alternativnu hipotezu o statističkom značaju regresione jednačine.

Disperzija u statistici nalazi se kao pojedinačne vrijednosti karakteristike na kvadrat iz . Ovisno o početnim podacima, određuje se korištenjem jednostavnih i ponderiranih formula varijanse:

1. (za negrupirane podatke) se izračunava pomoću formule:

2. Ponderirana varijansa (za serije varijacija):

gdje je n frekvencija (ponovljivost faktora X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge probleme za njeno pronalaženje

Primjer 1. Za grupu od 20 dopisnih studenata dostupni su sljedeći podaci. Potrebno je konstruirati intervalni niz distribucije karakteristike, izračunati prosječnu vrijednost karakteristike i proučiti njenu disperziju

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala koristeći formulu:

gdje je X max– maksimalna vrijednost karakteristika grupisanja;
X min – minimalna vrijednost karakteristike grupisanja;
n – broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Kreirajmo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 – 165,6 = 162,3)

Određujemo prosječnu visinu učenika koristeći ponderiranu formulu aritmetičkog prosjeka:

Odredimo varijansu koristeći formulu:

Formula disperzije se može transformirati na sljedeći način:

Iz ove formule slijedi da varijansa je jednaka razlika između prosjeka kvadrata opcija i kvadrata i prosjeka.

Varijanca u varijantne serije sa jednakim intervalima pomoću metode momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Određivanje varijanse, izračunato metodom momenata, koristeći sljedeću formulu je manje naporno:

gdje je i vrijednost intervala;
A je konvencionalna nula, za koju je prikladno koristiti sredinu intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji karakteristika mijenja na takav način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati pomoću formule:

Zamena u ovu formulu varijansa q =1- p, dobijamo:

Vrste varijanse

Ukupna varijansa mjeri varijaciju neke karakteristike u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Ona je jednaka srednjem kvadratu odstupanja individualne vrednosti karakteristika x iz ukupne srednje vrednosti x i može se definisati kao jednostavna varijansa ili ponderisana varijansa.

karakterizira slučajnu varijaciju, tj. dio varijacije koji je posljedica uticaja neuračunatih faktora i ne zavisi od faktora-atributa koji čini osnovu grupe. Takva disperzija jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar grupe X od aritmetičke sredine grupe i može se izračunati kao jednostavna disperzija ili kao ponderirana disperzija.

dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radionici pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima (tehničko stanje opreme, dostupnost opreme). alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kategoriji kvalifikacija (unutar grupe svi radnici imaju iste kvalifikacije).

Prosjek varijansi unutar grupe odražava nasumičan, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se pomoću formule:

Karakterizira sistematsku varijaciju rezultirajuće karakteristike, koja je posljedica utjecaja faktora-znaka koji čini osnovu grupe. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava pomoću formule:

Pravilo za dodavanje varijanse u statistici

Prema pravilo za dodavanje varijansi ukupna varijansa je jednaka zbroju prosjeka varijansi unutar grupe i između grupa:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za sabiranje varijansi, možete odrediti treću nepoznatu varijansu iz dvije poznate varijanse, a također procijeniti jačinu utjecaja karakteristike grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti konstantni iznos, tada se disperzija neće promijeniti.
2. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.

Ekonometrija je nauka koja daje kvantitativni izraz međuodnosa ekonomskih pojava i procesa. On ovog trenutka Rješenja za sljedeće ekonometrijske probleme su dostupna na internetu:

Korelaciono-regresijska metoda analize

Neparametarske mjere asocijacije

Heteroskedastičnost slučajne komponente

Autokorelacija

  1. Autokorelacija nivoa vremenskih serija. Testiranje autokorelacije sa konstrukcijom korelograma;

Ekonometrijske metode za provođenje stručnih istraživanja

  1. Koristeći metodu analize varijanse, testirajte nultu hipotezu o utjecaju faktora na kvalitetu objekta.

Rezultirajuće rješenje je predstavljeno u Word formatu. Odmah nakon rješenja nalazi se link za preuzimanje predloška u Excelu, koji omogućava provjeru svih dobijenih indikatora. Ako zadatak zahtijeva rješenje u Excelu, tada možete koristiti statističke funkcije u Excelu.

Komponente vremenske serije

  1. Usluga Analytical Smoothing se može koristiti za analitičko izglađivanje vremenske serije (duž prave linije) i za pronalaženje parametara jednačine trenda. Da biste to učinili, morate odrediti količinu izvornih podataka. Ako ima puno podataka, možete ih zalijepiti iz Excela.
  2. Proračun parametara jednadžbe trenda.
    Prilikom odabira tipa funkcije trenda, možete koristiti metodu konačnih razlika. Ako je opšta tendencija izražena parabolom drugog reda, onda dobijamo stalne konačne razlike drugog reda. Ako su stope rasta približno konstantne, tada se za izravnavanje koristi eksponencijalna funkcija.
    Prilikom odabira oblika jednadžbe treba poći od količine dostupnih informacija. Što više parametara sadrži jednačina, to bi trebalo imati više zapažanja sa istim stepenom pouzdanosti procjene.
  3. Izglađivanje pomoću metode pokretnog prosjeka. Koristeći

    Korelaciona zavisnost između faktora x (prosječni životni nivo po stanovniku po danu jedne radno sposobne osobe) i rezultirajuće karakteristike y (prosječna dnevna plata). Parametri jednačine linearne regresije, ekonomska interpretacija koeficijenta regresije.

y=f(x)+E,y t =f(x) – teorijska funkcija, E=y-y t

y t =a+bx – korelacija zavisnost prosječne dnevne zarade (y) od prosječnog egzistencijalnog nivoa po stanovniku po danu jedne radno sposobne osobe (x)

a+b =

a +b =

b=
- koeficijent regresije.

Pokazuje za koliko se jedinica mijenja prosječna plata (Y) kada se egzistencijalni nivo po glavi stanovnika dnevno jedne radno sposobne osobe (X) poveća za 1 jedinicu.

b=
= 0,937837482

To znači da će povećanjem prosječnog egzistencijalnog nivoa po stanovniku dnevno jednog radno sposobnog lica (x) za 1 jedinicu, prosječna dnevna plata porasti u prosjeku za 0,937 jedinica.

a= -b , a=135.4166667-0.937837482 86.75=54.05926511

3) Koeficijent varijacije

Koeficijent varijacije pokazuje koliki je udio prosječne vrijednosti SV njegova prosječna širina.

υ x = δh/x = 0,144982838, υ y = δy/y = 0,105751299

4) Koeficijent korelacije

Koeficijent korelacije se koristi za procjenu bliskosti linearne veze između prosječnog egzistencijalnog nivoa po stanovniku po danu jedne radno sposobne osobe i prosječne dnevne zarade.

rxy = b δh/δy = 0,823674909 jer rxy ˃0 , tada se korelacija između varijabli naziva direktna

Sve ovo pokazuje zavisnost prosječne dnevne zarade od prosječnog egzistencijalnog nivoa po danu jednog radno sposobnog lica.

5) Koeficijent determinacije

Koeficijent determinacije se koristi za procjenu kvaliteta uklapanja jednačina linearne regresije.

Koeficijent determinacije karakteriše udio varijanse efektivnog atributa Y (prosječna dnevna plata) objašnjen regresijom u ukupnoj varijansi efektivnog atributa.

R 2 xy = (∑(y t - y avg) 2) / (∑(y - y avg) 2) = 0,678440355, 0,5< R 2 < 0,7 ,

To znači da je jačina veze uočljiva, blizu visoke, a jednačina regresije je dobro odabrana.

6) Procjena tačnosti modela, odnosno procjena aproksimacije.

=1/n ∑ ׀(y i - y t)/y i ׀ 100% - prosječna greška aproksimacije.

Greška manja od 5-7% ukazuje na dobro uklapanje modela.

Ako je greška veća od 10%, trebali biste razmisliti o odabiru druge vrste jednadžbe modela.

Greška aproksimacije =0,015379395 100%=1,53%, što ukazuje na dobro uklapanje modela u originalne podatke

7) Analiza šeme varijanse.

∑(y - y avg) 2 =∑(y t - y avg) 2 +∑(y i - y t) 2 n – broj opservacija, m – broj parametara za varijablu x

Komponente varijance

Zbir kvadrata

Broj stepeni slobode

Disperzija po stepenu slobode

∑(y - y prosječno) 2

S 2 ukupno =(∑(y - y avg) 2)/(n-1)

Faktorski

∑(y t - y av) 2

S 2 činjenica =(∑(y t - y av) 2)/m

Ostatak

∑(y i - y t) 2

S 2 odmor =(∑(y i - y t) 2)/ (n-m-1)

Analiza varijanse

Komponente

Zbir kvadrata

Broj stepeni slobode

Disperzija

general

faktorijel

rezidualni

8) Provjera adekvatnosti modela premaF-Fišerov kriterijum (α=0,05).

Procjena statističke značajnosti regresione jednačine u cjelini vrši se korištenjemF-Fišerov kriterijum.

H 0 – hipoteza o statističkoj značajnosti regresione jednačine.

H 1 – statistička značajnost regresione jednačine.

F izračunati određuje se iz omjera vrijednosti faktora i rezidualnih varijansi izračunatih po stupnju slobode.

F izračunato = S 2 činjenica / S 2 ostatak = ((∑(y t - y av) 2)/m) / ((∑(y i - y t) 2)/ (n-m-1)) =1669,585177 / 79,13314895 = 21,06842

F tabelarni - maksimalna moguća vrijednost kriterijuma koja bi se mogla formirati pod uticajem slučajnih faktora sa datim stepenima slobode, tj. TO 1 = m, TO 2 = n- m-1, i nivo značajnosti α (α=0,05)

F tabela (0,05; 1; n-2), F tabela (0,05; 1; 10), F tabela = 4,964602701

AkoF sto < F proračun , zatim hipotezaH 0 odbacuje se slučajna priroda procijenjenih karakteristika, a njihova statistički značaj i pouzdanost jednadžbe regresije. InačeH 0 se ne odbacuje, a priznaje se statistička beznačajnost i nepouzdanost jednačine regresije. U našem slučaju F tabela< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Procjena statističke značajnosti koeficijenata regresije i korelacije premat-Studentov t-test (α=0,05).

Procjena značaja koeficijenta. regresija., t – Studentov kriterij Provjerimo statističku značajnost parametra b.

Hipoteza H 0: b=0, t b (kalc) = ׀b ׀/ m b, m b = S odmor / (δ x
) , gdje je n broj zapažanja

m b = 79,13314895 / (12,57726123
) = 0,204174979

t b (izračunato) = 0,937837482 / 0,204174979 = 4,593302697

t tabela je maksimalna moguća vrijednost kriterijuma pod uticajem slučajnih faktora sa datim stepenom slobode (K=n-2), i nivoom značajnosti α (α=0,05). t tablica = 2.2281, ako je t (kalc) > t tablica, hipoteza H 0 se odbacuje i prepoznaje se značaj parametara jednadžbe.

U našem slučaju, t b (izračunato) > t tabela, stoga se hipoteza H 0 odbacuje, a prepoznaje se statistička značajnost parametra b.

Provjerimo statističku značajnost parametra a. Hipoteza H 0: a=0 t a (izračunato) = ׀a ׀/ m a

m a = (S odmor
)/(n δ x), m a = (79,13314895
)/(12 12,57726123)= 17,89736655, t a (izračunato) = 54,05926511 / 17,89736655=3,020515055

t a (izračunato) > t tabela stoga se hipoteza H 0 odbacuje i priznaje se statistička značajnost parametra a.

Procjena značaja korelacije. Provjerimo statističku značajnost koeficijenta korelacije.

mrxy =
, mrxy =
=0,179320842, trxy = 0,823674909/ 0,179320842 = 4,593302697

tr = t b , tr > t tabela, stoga se prepoznaje statistička značajnost koeficijenta korelacije.

1. Suština korelaciono-regresijske analize i njeni zadaci.

2. Definicija regresije i njeni tipovi.

3. Karakteristike specifikacije modela. Razlozi postojanja slučajne varijable.

4. Metode za odabir uparene regresije.

5. Metoda najmanjih kvadrata.

6. Indikatori za mjerenje nepropusnosti i čvrstoće spoja.

7. Procjene statističkog značaja.

8. Predviđena vrijednost varijable y i intervali povjerenja prognoze.

1. Suština korelaciono-regresijske analize i njeni zadaci. Ekonomske pojave, kao veoma raznolike, karakterišu mnoge karakteristike koje odražavaju određena svojstva ovih procesa i pojava i podložne su međuzavisnim promenama. U nekim slučajevima se ispostavlja da je veza između karakteristika vrlo bliska (na primjer, satnica zaposlenika i njegova plata), dok u drugim slučajevima takav odnos uopće nije izražen ili je izrazito slab (npr. spol studenata i njihov akademski uspjeh). Što je bliža veza između ovih karakteristika, to su odluke koje se donose tačnije.

Postoje dvije vrste zavisnosti između pojava i njihovih karakteristika:

    funkcionalna (deterministička, kauzalna) zavisnost . Specificira se u obliku formule koja svaku vrijednost jedne varijable povezuje sa strogo definiranom vrijednošću druge varijable (uticaj slučajnih faktora se zanemaruje). Drugim riječima, funkcionalna zavisnost je odnos u kojem svaka vrijednost nezavisne varijable x odgovara precizno definiranoj vrijednosti zavisne varijable y. U ekonomiji, funkcionalni odnosi između varijabli su izuzeci od opšteg pravila;

    statistička (stohastička, nedeterministička) zavisnost – radi se o povezanosti varijabli, na koju utiču slučajni faktori, tj. Ovo je odnos u kojem svaka vrijednost nezavisne varijable x odgovara skupu vrijednosti zavisne varijable y, a nije unaprijed poznato koju će vrijednost y uzeti.

Poseban slučaj statističke zavisnosti je zavisnost od korelacije.

Korelaciona zavisnost je odnos u kojem svaka vrijednost nezavisne varijable x odgovara određenom matematičkom očekivanju (prosječnoj vrijednosti) zavisne varijable y.

Korelaciona zavisnost je „nepotpuna“ zavisnost, koja se ne pojavljuje u svakom pojedinačnom slučaju, već samo u prosečnim vrednostima sa dovoljnim veliki broj slučajevima. Na primjer, poznato je da poboljšanje kvalifikacija zaposlenog dovodi do povećanja produktivnosti rada. Ova tvrdnja se često potvrđuje u praksi, ali ne znači da će dva ili više radnika iste kategorije/nivoa uključenih u sličan proces imati istu produktivnost rada.

Korelaciona zavisnost se proučava primenom metoda korelacione i regresione analize.

Korelaciona i regresiona analiza omogućava vam da utvrdite bliskost, smjer veze i oblik ove veze između varijabli, tj. njegov analitički izraz.

Glavni zadatak korelacione analize sastoji se od kvantitativnog utvrđivanja bliskosti veze između dvije karakteristike u parnoj vezi i između efektivnih i više faktorskih karakteristika u multifaktorskoj vezi i statističke procjene pouzdanosti uspostavljene veze.

2. Definicija regresije i njeni tipovi. Regresiona analiza je glavni matematički i statistički alat u ekonometriji. Regresija Uobičajeno je da se zavisnost prosječne vrijednosti veličine (y) naziva od neke druge veličine ili od nekoliko veličina (x i).

U zavisnosti od broja faktora uključenih u jednadžbu regresije, uobičajeno je razlikovati jednostavnu (uparnu) i višestruku regresiju.

Jednostavna (parna) regresija je model u kojem se prosječna vrijednost zavisne (objašnjene) varijable y smatra funkcijom jedne nezavisne (objašnjavajuće) varijable x. Implicitno, parna regresija je model oblika:

eksplicitno:

,

gdje su a i b procjene koeficijenata regresije.

Višestruka regresija je model u kojem se prosječna vrijednost zavisne (objašnjene) varijable y razmatra kao funkcija nekoliko nezavisnih (objašnjavajućih) varijabli x 1, x 2, ... x n. Implicitno, parna regresija je model oblika:

.

eksplicitno:

gdje su a i b 1, b 2, b n procjene koeficijenata regresije.

Primjer takvog modela je ovisnost plaće zaposlenika o njegovoj dobi, obrazovanju, kvalifikacijama, radnom stažu, djelatnosti itd.

Što se tiče oblika zavisnosti, postoje:

      linearna regresija;

      nelinearna regresija, koja pretpostavlja postojanje nelinearnih odnosa između faktora izraženih odgovarajućom nelinearnom funkcijom. Često nelinearni in izgled modeli se mogu svesti na linearni oblik, što im omogućava da se klasifikuju kao linearni.

3. Karakteristike specifikacije modela. Razlozi postojanja slučajne varijable. Svaka ekonometrijska studija počinje sa specifikacije modela , tj. od formulacije tipa modela, zasnovanog na odgovarajućoj teoriji odnosa između varijabli.

Prije svega, iz čitavog niza faktora koji utiču na efektivni atribut, potrebno je identifikovati faktore koji značajno utiču. Parna regresija je dovoljna ako postoji dominantni faktor, koji se koristi kao varijabla koja objašnjava. Jednostavna regresijska jednadžba karakterizira odnos između dvije varijable, koji se manifestuje kao određeni obrazac samo u prosjeku za ukupno posmatranje. U jednadžbi regresije, korelacioni odnos je predstavljen u obliku funkcionalne zavisnosti, izražene odgovarajućom matematičkom funkcijom. U gotovo svakom pojedinačnom slučaju, vrijednost y se sastoji od dva člana:

,

gdje je y stvarna vrijednost rezultirajuće karakteristike;

– teorijska vrijednost rezultantne karakteristike, pronađena na osnovu jednačine regresije;

slučajna vrijednost, karakterizirajući odstupanje stvarne vrijednosti rezultirajuće karakteristike od teorijske pronađene pomoću regresione jednadžbe.

Slučajna vrijednost naziva se i poremećaj. Uključuje uticaj faktora koji nisu uzeti u obzir u modelu, slučajne greške i karakteristike merenja. Prisustvo slučajne varijable u modelu generiraju tri izvora:

    specifikacija modela,

    selektivna priroda izvornih podataka,

    karakteristike mernih varijabli.

Greške specifikacije će uključivati ​​ne samo pogrešan izbor određene matematičke funkcije, već i potcjenjivanje bilo kojeg značajnog faktora u jednadžbi regresije (koristeći uparene regresije umjesto višestruke).

Uz greške specifikacije mogu se pojaviti i greške uzorkovanja, budući da se istraživač najčešće bavi podacima uzorka prilikom uspostavljanja obrazaca odnosa između karakteristika. Greške uzorkovanja se javljaju i zbog heterogenosti podataka u izvornoj statističkoj populaciji, što se obično dešava prilikom proučavanja ekonomskih procesa. Ako je populacija heterogena, onda regresijska jednadžba nema praktično značenje. Da bi se dobio dobar rezultat, jedinice s anomalnim vrijednostima proučavanih karakteristika obično se isključuju iz populacije. Opet, rezultati regresije predstavljaju karakteristike uzorka. Izvorni podaci

Međutim, najveća opasnost u praktičnoj upotrebi regresijskih metoda su greške mjerenja. Ako se greške specifikacije mogu smanjiti promjenom oblika modela (vrsta matematičke formule), a greške uzorkovanja povećanjem volumena početnih podataka, onda greške mjerenja praktično poništavaju sve napore da se kvantifikuje odnos između karakteristika.

4. Metode za odabir uparene regresije. Pod pretpostavkom da su greške mjerenja svedene na minimum, fokus ekonometrijskog istraživanja je na greškama specifikacije modela. U parnoj regresiji, odabir vrste matematičke funkcije
može se uraditi na tri načina:

    grafički;

    analitički, tj. zasnovano na teoriji odnosa koji se proučava;

    eksperimentalni.

Prilikom proučavanja odnosa između dvije karakteristike grafička metoda odabir vrste regresione jednadžbe je sasvim jasan. Zasnovan je na polju korelacije. Osnovne vrste krivulja koje se koriste u kvantificiranju odnosa




Klasa matematičkih funkcija za opisivanje odnosa između dvije varijable je prilično široka; koriste se i druge vrste krivulja.

Analitička metoda izbor vrste regresione jednačine zasniva se na proučavanju materijalne prirode povezanosti karakteristika koje se proučavaju, kao i na vizuelnoj proceni prirode veze. One. ako govorimo o Lafferovoj krivulji, koja pokazuje odnos između porezne progresivnosti i budžetskih prihoda, onda govorimo o paraboličnoj krivulji, a u mikroanalizi izokvante su hiperbole.

mob_info