Mendelova
zemědělská a lesnická univerzita Brno - Ekonometrie
Ekonometrie
Semestrální práce
Úvod
Během zkoumaného období byly zjištěny údaje zapsané v tabulce 1s. Jedná se o množství prodeje zboží při různých cenách za jednotku. Řádek X vyjadřuje cenu zboží v Kč, řádek Y prodané množství při této ceně.
Tabulka 1: poptávka po zboží
Dané údaje lze rovněž zobrazit graficky a tím lze získat lepší přehled o průběhu závislosti množství na ceně. Toto grafické znázornění je zobrazeno v grafu 1. Osa X představuje cenu zboží a osa Y množství prodaného zboží.
Graf 1: výchozí údaje
Vyrovnání údajů lineární funkcí
Nyní výchozí údaje vyrovnám lineární funkcí. Obecný tvar lineární funkce je y=b0+b1x. Pro vyrovnání údajů lineární funkcí byla použita rovnice y = 141,76 - 2,7269x. Tuto rovnici jsem zjistil z grafu 2, který zobrazuje výchozí data a vyrovnávací regresní přímku. Index determinace je možné vyčíst z grafu 2 a jeho hodnota je 0,7846. Jak rovnici lineární regrese, tak i index determinace jsem zjistil pomocí přidání spojnice lineárního trendu do grafu 1.
Graf 2: vyrovnání lineární funkcí
Rovnice lineární funkce je y = 141,76 - 2,7269x.
Index determinace je 0,7846, tzn., že lineární funkce vystihuje data z 78,46%.
Vyrovnání hodnot nelineární funkcí
S ohledem na průběh dat jsem se rozhodl pro lomenou funkci. Její rovnice je y = b0+b1/x. K výpočtu použiji metodu nejmenších čtverců.
určení normálních rovnic
Z rovnice lomené funkce, která je y = b0+b1/x, poté určím normální rovnice
nb0 + b1a(1/x) = ay
b0a(1/x) + b1a(1/x2) = a(y/x)
b) Výpočet parametrů regresní funkce
Tabulka 2: Tabulka výpočtů lomené funkce
Pomocné výpočty jsou uvedeny v tabulce 2. Spodní řádek obsahuje součet příslušného sloupce. Poté tyto údaje dosadím do normálních rovnic a vypočítám parametry.
14*b0 + 0,86*b1 = 1052 è b0 = 75,14 – 0,06*b1
0,86*b0 + 0,086*b1 = 89,8
———————————
0,86*(75,14 – 0,06*b1) + 0,086*b1 = 89,9
64,78 – 0,053*b1 + 0,086*b1 = 89,9
0,03*b1 = 25,01
b1 = 760,61
b0 = 75,14 –0,06*760,61 = 28,31
Rovnice lomené funkce tedy je y = 28,31 + 760,61/x.
Tuto funkci jsem poté zobrazil do grafu 3. Zde se nalézají výchozí hodnoty (y) a také křivka vyrovnání lomenou funkcí (y’).
Graf 3: Vyrovnání lomeno funkcí
V grafu 3: y … původní hodnoty
y’… hodnoty vyrovnané lomenou funkcí
c) Výpočet indexu determinace
Tabulka 3: Vyrovnané hodnoty lomené funkce
Index determinace určím jako podíl rozptylu vyrovnaných hodnot (s2y’) a rozptylu hodnot skutečných (s2y). Hodnoty vyrovnané lomenou funkcí jsou zobrazeny v tabulce 3. Jsou tam také zobrazeny původní hodnoty x a y. Rozptyly jsem určil pomocí funkce programu a jejich hodnoty jsou s2y’ = 1 359,01 a s2y = 1 453,69. Index determinace poté vyšel 0,94.
Index determinace při vyrovnání lomenou funkcí vyšel 0,9349 a to znamená, že lomená funkce vystihuje původní data z 93,49%.
Další údaje pro lineární model
a) 95% interval spolehlivosti funkce
Tato charakteristika určuje interval, ve kterém se s 95% pravděpodobností nalézá funkce. Určí se z následujícího vztahu
kde Sy je směrodatná chyba a určí se:
S je reziduální směrodatná chyba a určí se:
K výpočtu jsou potřeba následující údaje
n = 14
`x = 342 / 14 = 24,43
`y = 1052 / 14 = 75,14
n-k-1 = 14-1-1 = 12
t0,975 = 2,179
Tabulka 4: výpočet intervalu spolehlivosti lineární funkce
V tabulce 4 jsou následující údaje
y^… hodnoty vyrovnání přímkou
(y-y^)^2 … druhá mocnina rozdílu y a y vyrovnané
(x-xp)^2… druhá mocnina rozdílu x a x průměr
Sy^… směrodatná chyba
Y^d… dolní mez intervalu spolehlivosti
Y^h… horní mez intervalu spolehlivosti
Ve spodním řádku tabulky jsou sumy jednotlivých sloupců.
Pro větší přehlednost jsem zobrazil dolní a horní mez intervalu spolehlivosti spolu s lineární funkcí do grafu 4.
Graf 4: interval spolehlivosti lineární funkce
Jednotlivé křivky znamenají
Y^d … dolní mez intervalu spolehlivosti
Y^h … dolní mez intervalu spolehlivosti
Y… původní hodnoty
Lineární … lineární vyrovnání
Tento graf zobrazuje původní hodnoty a jejich vyrovnání přímkou. Prostor mezi křivkami Y^d a Y^h vyjadřuje prostor, ve kterém se s 95% pravděpodobností nalézá přímka při lineárním vyrovnání.
b) 95% intervalový odhad koeficientu korelace
Tabulka 5: výpočet koeficientu korelace
Nejprve jsem vypočítal koeficient korelace. Vycházel jsem z následujícího vztahu
Pomocné výpočty jsou uvedeny v tabulce 5, značky kde xp a yp znamená průměr dané veličiny. Koeficient korelace tedy po dosazení vyšel -0,88. Protože nemám více než 100 hodnot, ale jen 14 a protože hodnota korelačního koeficientu se neblíží k nule, musím použít Fisherovu transformaci. Ta je ve tvaru
.
Poté interval je
.
Zr je -1,402, u0,975 je 1,96. potom Zr leží v intervalu (-1,99; -0,81). Poté následuje zpětná Fisherova transformace , z čehož vyplývá, že interval je (-0,96; -0,67).
S pravděpodobností 95% leží koeficient korelace v intervalu (-0,96; -0,67).
c) 95% intervalový odhad koeficientu regrese
V tomto bodě budu dělat intervalový odhad koeficientu regrese. K tomu použiji následujícího vztahu , kde
r mám již vypočítán z bodu 4.b a je -0,88 a r2 je potom 0,78. Rovněž další údaje jsou uvedeny v tabulce 5. Po dosazení tedy Sb=0,04. Z tabulky jsem zjistil u0,975=1,96. B je koeficient z rovnice a jeho hodnota je –2,73.
S pravděpodobností 95% leží koeficient regrese v intervalu (-2,80; -2,65)
Další údaje pro nelineární model
a) 95% pás spolehlivosti funkce
Tento pás se určí podle vztahu
, kde
Tabulka 6: výpočet pásu spolehlivosti
V tabulce 6 jsou následující údaje
y^… vyrovnané hodnoty
(y-y^)^2 … druhá mocnina rozdílu skutečných a vyrovnaných hodnot
Yd… dolní hranice pásu spolehlivosti
Yh… horní hranice pásu spolehlivosti
Další údaje potřebné pro výpočet
S = 10,51n-k-1 = 12t = 2,179
Pro větší přehlednost jsem zobrazil dolní a horní mez pásu spolehlivosti spolu s lineární funkcí do grafu 5.
Graf 5: pás spolehlivosti lomené funkce
Jednotlivé křivky znamenají
Yd … dolní mez pásu spolehlivosti
Yh … dolní mez pásu spolehlivosti
Y… původní hodnoty
Y^… křivka lomené funkce
Tento graf zobrazuje původní hodnoty a jejich vyrovnání lomenou funkcí. Prostor mezi křivkami Yd a Yh vyjadřuje prostor, ve kterém se s 95% pravděpodobností nalézá křivka lomené funkce.
b) test průkaznosti modelu na 5% hladině významnosti
H0 º ekonometrický model je neprůkazný
H1 º ekonometrický model je průkazný
Testové kriterium
Potřebné hodnoty jsou (některé již byly vypočítány dříve):
SR = 19 026,14Se = 1 325,58k = 1n-k-1 = 12
S2R = 19 026,14S2e = 110,46
Fvyp = 172,24Ftab = 4,747
Ftab < Fvyp à zamítám nulovou hypotézu, že na hladině významnosti 5% je ekonometrický model neprůkazný a příjmám alternativní hypotézu, že ekonometrický model průkazný a je statisticky významný.
c) test parametrů modelu na 5% hladině významnosti
H0: bj = 0daný regresní parametr je nevýrazný
H1: bj ¹ 0daný regresní parametr je výrazný
Testuje se na základě testového kriteria t = bj/Sbj.
b0 = 28,3 b1 = 760,61t = 2,179S = 10,51 = 2 147,43
Po dosazení Sb0 = 17,27Sb1 = 0,23 atb0 = 1,63tb1 = 44,23
t > tb0 à nezamítám nulovou hypotézu, že regresní koeficient je nevýrazný
t < tb1 à zamítám nulovou hypotézu, že regresní koeficient je nevýrazný na hladině významnosti 5% a příjmám alternativní hypotézu, že regresní koeficient je statisticky významný.
d) test indexu korelace na 5% hladině významnosti
H0: I yx = 0mezi x a y není závislost
H1: I yx > 0mezi x a y je závislost
Testové kriterium:
Ftab(1,12) = 4,747Iyx2 = 0,9349 (viz bod 3.C)
Poté Fvyp = 172,24
Ftab < Fvyp à zamítám nulovou hypotézu, že mezi x a y není závislost na hladině významnosti 5% a příjmám alternativní hypotézu, že mezi x a y je závislost a je statisticky významná.
Shrnutí
Výchozí údaje jsem vyrovnal pomocí přímky a pomocí lomené funkce.
Rovnice lineární funkce y = 141,76 - 2,7269x
lomená funkcey = 28,31 + 760,61/x
Index determinace lineární funkce 0,7846
lomené funkce0,9349
Lineární funkce vystihuje původní data ze 78,46%, zatímco lomená funkce z 93,49%. Je tedy patrné, že lomená funkce je daleko vhodnější k vyrovnání původních hodnot.
Další údaje lineárního modelu
a) 95% interval spolehlivosti funkce je graficky zobrazen v grafu 4.
b) 95% intervalový odhad koeficientu korelace
koeficient korelace leží s 95% pravděpodobností v intervalu (-0,96; -0,67)
c) 95% intervalový odhad koeficientu regrese
s pravděpodobností 95% leží koeficient regrese v intervalu (-2,80; -2,65)
Další údaje nelineárního modelu – lomené funkce
a) 95% pás spolehlivosti funkce
Tento pás je zobrazen v grafu 15. Jsou tam zobrazeny původní hodnoty a jejich vyrovnání lomenou funkcí. Prostor mezi křivkami Yd a Yh vyjadřuje prostor, ve kterém se s 95% pravděpodobností nalézá křivka lomené funkce.
b) test průkaznosti modelu na 5% hladině významnosti
zamítám nulovou hypotézu, že na hladině významnosti 5% je ekonometrický model neprůkazný a příjmám alternativní hypotézu, že ekonometrický model průkazný a je statisticky významný.
c) test parametrů modelu na 5% hladině významnosti
b0 - nezamítám nulovou hypotézu, že regresní koeficient je nevýrazný
b1 - zamítám nulovou hypotézu, že regresní koeficient je nevýrazný na hladině významnosti 5% a příjmám alternativní hypotézu, že regresní koeficient je statisticky významný.
d) test indexu korelace na 5% hladině významnosti
zamítám nulovou hypotézu, že mezi x a y není závislost na hladině významnosti 5% a příjmám alternativní hypotézu, že mezi x a y je závislost a je statisticky významná.