Zajęcia 19

Łączna estymacja modeli wielorównaniowych o równaniach współzależnych: trójstopniowa MNK (3MNK)

 

0.     Wstęp

 

Z łączną estymacją modeli wielorównaniowych zetknęliśmy się już w przypadku systemów SURE. Staraliśmy się tam zapisać model wielorównaniowy jako jednorównaniowy (wykorzystując strukturę „kroneckerowską”), a następnie zastosować znane metody estymacji modeli jednorównaniowych. W ten sposób stosujemy twierdzenie Aitkena i estymator EUMNK do systemu SURE (procedura Zellnera – zaj. 18) co pozwala uzyskać (asymptotycznie) efektywne oceny parametrów. Dotąd szacowaliśmy w ten sposób modele liniowe o prostej strukturze (jak SURE), dla których zgodne oceny można uzyskać z MNK. Teraz zajmiemy się metodami pozwalającymi na łączne (asymptotycznie efektywne) szacowanie całego układu równań (systemu) dla modeli o równaniach współzależnych. Przyjmujemy oczywiście standardowe założenia o składnikach losowych (patrz zaj. 18)

 

Jednak zanim przejdziemy do szczegółowego omawiania metod łącznej estymacji modeli wielorównaniowych, spróbujmy poświęcić trochę uwagi ich ogólnym własnościom. Chodzi o to, dlaczego stosujemy „łączną” estymację, jaka to jest „niełączna” estymacja i czym się one różnią. Ponieważ łączna estymacja jest bardziej skomplikowana, chcemy wiedzieć jaką odnosimy korzyść przechodząc z metod „równanie po równaniu” na metody systemowe (estymacji łącznej). W niektórych przypadkach nie możemy korzystać z metod „równanie po równaniu” – wtedy musimy odwołać się do estymacji łącznej – pokażemy, kiedy tak jest.

 

Rozważmy przykład estymacji systemu SURE. Możemy taki system szacować zwykłą MNK równanie po równaniu. Oczywiście nie jest to łączna estymacja, bo każde równanie szacujemy osobno. Estymator zwykłej MNK jest wtedy zgodny (lub nawet nieobciążony, jeśli w nie mamy do czynienia z opóźnieniami zmiennych endogenicznych). Jednak do systemu SURE stosowaliśmy procedurę Zellnera (czyli estymator EUMNK dla całego systemu zapisanego jako model jednorównaniowy). Robimy to, aby uzyskać większą efektywność – „bardziej dokładne” oszacowania parametrów. Różnica jest tu taka, jak między zwykłą MNK a estymatorem EUMNK w UMRL (por. zaj. 17). Procedura Zellnera poprawia (przynajmniej asymptotycznie) efektywność oszacowań parametrów (w porównaniu ze zwykłą MNK), ponieważ bierzemy pod uwagę kowariancje między równoczesnymi składnikami losowymi różnych równań. Wykorzystujemy więc informację o systemie jako całości – o zależnościach POMIĘDZY równaniami. Te zależności przy szacowaniu każdego równania osobno (metodami „niesystemowymi”, „niełącznymi”) są ignorowane.

 

Widzimy więc, że metody systemowe mają przewagę nad metodami „równanie po równaniu” polegającą na większej efektywności wynikającej z uwzględnienia pełniejszej informacji. Ponadto metody „równanie po równaniu” można stosować tylko wtedy, kiedy zależności pomiędzy równaniami da się pominąć bez naruszenia najistotniejszych problemów.

 

Teoretyczna przewaga metod systemowych nad metodami „równanie po równaniu” jest podobna, jak przewaga UMNK nad MNK w UMRL – tam jednak w praktyce stosujemy nie UMNK lecz EUMNK, więc szacujemy macierz W. Ponieważ możemy źle przyjąć strukturę W lub „źle trafić” w małej próbie z estymatorem j, przewaga EUMNK nad MNK nie jest już tak oczywista. Podobnie jest w tym przypadku – wraz z przejściem z warunków idealnych na praktyczne, przewaga metod systemowych nad metodami „równanie po równaniu” nie jest tak oczywista. Powody w tym przypadku mogą być dwa:

 

  1. W małej próbie oszacowanie macierzy równoczesnych kowariancji może być „źle trafione” – źle oddaje prawdziwą macierz równoczesnych kowariancji, przez co wnosi nieprawdziwą informację i może nawet pogorszyć efektywność w stosunku do metod „równanie po równaniu”.
  2. Błąd specyfikacji (np. w części systematycznej) w jednym równaniu „roznosi się” po całym systemie. W przypadku metod „równanie po równaniu” błąd specyfikacji jednego równania ma ograniczony wpływ na oszacowania parametrów innych równań.

 

Są jednak przypadki, gdy MUSIMY stosować metody systemowe. Przedstawione wyżej heurystyczne rozumowanie sugeruje, że jest tak wtedy, gdy zależności między równaniami są „niezaniedbywalne” w ramach rozpatrywanego problemu. Ma to miejsce gdy zachodzą związki między PARAMETRAMI różnych równań. Może np. interesować nas:

A) Wnioskowanie o funkcjach parametrów różnych równań Przykładowo, gdy chcemy testować restrykcje wiążące parametry różnych równań, gdy chcemy wnioskować o wielkości będącej funkcją parametrów różnych równań – w tym przypadku aby otrzymać np. odpowiedni błąd średni szacunku tej wielkości, musimy uwzględnić odpowiednie kowariancje estymatora oryginalnych parametrów, co wymaga łącznej estymacji.

B) Narzucenie restrykcji wiążących parametry różnych równań. Jeżeli chcemy narzucić (a priori lub w celu testowania) restrykcję mówiącą np. że jeden parametr w pewnym równaniu jest równy innemu parametrowi w innym równaniu, to musimy te dwa równania szacować równocześnie, czyli właśnie łącznie.

 

Związki pomiędzy parametrami różnych równań mogą mieć charakter restrykcji równościowych (liniowych bądź nieliniowych). Poznamy później metody pozwalające na NARZUCANIE lub TESTOWANIE takich (równościowych) restrykcji (wymagające np. by suma pewnych parametrów z różnych równań wynosiła 1). Można rozważać także restrykcje nierównościowe, jednak tu sprawa jest trudniejsza i nie będziemy się nimi zajmowali. Problem komplikuje się ponadto w przypadku, gdy restrykcje są zależne od danych. Podsumowując, metody systemowe pozwalają nam uwzględnić:

 

Ø      równoczesne kowariancje składników losowych różnych równań

Ø      zależności pomiędzy parametrami różnych równań na użytek estymacji i wnioskowania

 

W tych zajęciach:

W niniejszych zajęciach zajmiemy się omówieniem trójstopniowej MNK (3MNK) dla estymacji liniowych modeli wielorównaniowych o równaniach współzależnych

 

Uwagi terminologiczne: Trójstopniowa MNK to po ang. Three-stage Least Squares, (3SLS); metody systemowe czasem nazywa się metodami „z pełną informacją” ang. Full-information

 

Trójstopniowa MNK jest rozwinięciem dwustopniowej MNK w sposób pozwalający uwzględnić równoczesne kowariancje składników losowych postaci strukturalnej. Powtórzmy, chodzi o uwzględnienie kowariancji między składnikami losowymi różnych równań postaci strukturalnej (dla tego samego numeru obserwacji). Kowariancje pomiędzy składnikami losowymi dla różnych numerów obserwacji są tu zerowe (wykluczamy autokorelację). Podobnie zakładamy stałość wariancji składnika losowego jednego równania dla wszystkich obserwacji. Założenia o strukturze stochastycznej są więc tu analogiczne jak w systemie SURE. Zapiszmy więc przykładowy n-równaniowy (dla n = 3) model liniowy o równaniach współzależnych:

;   , ,

ponadto

   dla i, j = 1,2,...n ORAZ t ¹ s ( t,s = 1,...,T )

 

UWAGA: notacja i problematyka w tych zajęciach jest kontynuacją notacji i problematyki zajęć 14, proszę więc upewnić się że znają Państwo zajęcia 14

 

S, czyli macierz równoczesnych kowariancji składników losowych et, to macierz stopnia n symetryczna (a więc i kwadratowa), dodatnio określona [S jako macierz kowariancji musi być nieujemnie określona, ale będziemy ją odwracać – wymagamy jej nieosobliwości – czyli łącznie dodatniej określoności S; przypadek osobliwej macierzy S będzie specjalnie rozważany]. Ponadto S nie zależy od t – jest taka sama dla każdego numeru obserwacji. Oznacza to, że wariancje składników losowych różnych równań są takie same dla każdej obserwacji, podobnie jak kowariancje pomiędzy składnikami losowymi różnych równań (dla tej samej obserwacji czyli tego samego t). Kowariancje między składnikami losowymi dla różnych obserwacji są zerowe. W przykładzie powyżej, s22 to wariancja składników losowych drugiego równania, s13 to kowariancja pomiędzy składnikami losowymi pierwszego i trzeciego równania DLA TEJ SAMEJ OBSERWACJI (dla różnych obserwacji wynosi ona zero).

 

Takiej postaci strukturalnej nie możemy wprost szacować ani zwykłą MNK równanie po równaniu ani korzystając z procedury Zellnera, ponieważ bieżące zmienne łącznie współzależne yti będące zmiennymi objaśniającymi (w równaniach po prawej stronie) – są „silnie zależne” [funkcyjnie] od bieżących składników losowych tego samego równania, więc estymator MNK lub Zellnera nieznanych parametrów będzie NIEZGODNY.

W celu uzyskania zgodnych oszacowań parametrów postaci strukturalnej stosowaliśmy 2MNK. Polegała ona na tym, że:

I) w pierwszym kroku szacowaliśmy zwykłą MNK postać zredukowaną bez restrykcji (URF), czyli Y = XP+V. Ponieważ w każdym równaniu występują tu te same zmienne objaśniające (X), procedura Zellnera dla estymacji P (bez uwzględnienia restrykcji wynikających z P=-GB-1) sprowadza się do zwykłej MNK równanie po równaniu. Mogliśmy sobie pozwolić na pominięcie tych restrykcji, ponieważ celem było uzyskanie zmiennych instrumentalnych - teoretycznych wartości zmiennych łącznie współzależnych Y^ = XP^.

II) w drugim kroku wykorzystujemy uzyskane wartości teoretyczne zmiennych łącznie współzależnych Y^, wstawiając je po PRAWEJ stronie do postaci strukturalnej w miejsce yti. Ponieważ yti^ są „słabo zależne” od et, tak zmodyfikowaną postać strukturalną możemy szacować MNK równanie po równaniu, uzyskując ZGODNE oceny parametrów.

 

Dla celów estymacji przyjmowaliśmy następującą notację:

d(i) – nieznane parametry i-tego równania (czyli mi nieznanych elementów w i-tej kolumnie B oraz ki nieznanych elementów w i-tej kolumnie G)

– macierz zmodyfikowanych zmiennych objaśniających i-tego równania postaci strukturalnej, gdzie wartości yti zastąpiono przez odpowiednie wartości teoretyczne yti^,

Oceny 2MNK nieznanych parametrów i-tego równania to:

W tej procedurze nie uwzględniamy jednak równoczesnych kowariancji składników losowych et. Pamiętamy, że w przypadku modelu SURE przechodząc od estymacji MNK równanie po równaniu do procedury Zellnera (czyli uwzględniając równoczesne kowariancje składników losowych) uzyskujemy (asymptotycznie) poprawę efektywności oszacowań. W przypadku trójstopniowej MNK generalizujemy 2MNK w analogiczny sposób i w tym samym celu. Po wstawieniu do postaci strukturalnej wartości teoretycznych zmiennych łącznie współzależnych po PRAWEJ stronie, zmodyfikowany układ równań traktujemy jak model SURE i szacujemy stosując procedurę Zellnera. W ten sposób w 3MNK łączymy dwa aspekty:

 

 

[Estymator 3MNK łączy więc cechy estymatora IV oraz estymatora EUMNK/procedury Zellnera ]

Uwzględniając notację z Zajęć 14 i przystosowując ją do układu SURE, postać strukturalną liniowego modelu wielorównaniowego możemy łącznie zapisać jako:

gdzie:

;;;

Wtedy macierz kowariancji wektora wszystkich składników losowych e  ma postać:

 

Odpowiednik estymatora Aitkena w takim systemie (biorący pod uwagę macierz równoczesnych kowariancji) miałby postać:

,

taki estymator byłby niezgodny ze względu na obecność Yi w Z. Jeżeli jednak uwzględnimy dodatkowo przejście z Zi na Zi^, (czyli gdy zastosujemy zmienne instrumentalne Yi^ w miejsce Yi) oznaczając:

(por. oznaczenia w zajęciach 14),

 

uzyskamy estymator o postaci:

Zauważmy jednak, że ciągle posługujemy się tu znaną macierzą S (jak w UMNK), podczas gdy w praktyce musimy ją szacować. Ostatecznie szacowany estymator 3MNK, wykorzystywany w praktyce (analogicznie jak estymator EUMNK) ma postać:

,

gdzie macierz S (ocenę S) uzyskujemy analogicznie jak w procedurze Zellnera:

,

Pamiętamy jednak, że w celu estymacji macierzy równoczesnych kowariancji w SURE wykorzystywaliśmy reszty ZGODNEGO estymatora (w SURE estymator MNK jest zgodny). Tutaj podobnie musimy użyć reszt zgodnego estymatora, jednak estymator zwykłej MNK zgodny już nie jest. W związku z tym wykorzystane powyżej  to reszty (zgodnej) 2MNK (dla i-tego równania) – te same które w 2MNK wykorzystywane są do wyliczenia s2i .

Ocenę asymptotycznej macierzy kowariancji estymatora 3MNK uzyskujemy (analogicznie jak w procedurze Zellnera) jako:

W przypadku 3MNK (w przeciwieństwie do procedury Zellnera) iterowane wyliczanie kolejnych reszt, ocen S, ocen parametrów itd. nie prowadzi do uzyskania ocen MNW – w ogóle nie poprawia w żaden sposób własności estymatora. Intuicyjnie można się tego spodziewać, ponieważ cały czas wykorzystujemy te same Yi^ wyliczone z URF.

 

Własności estymatora 3MNK (tylko nieformalnie zarysowane):

1)      zgodność

2)      jest asymptotycznie najefektywniejszy w pewnej klasie estymatorów (do której należy 2MNK, więc jest bardziej efektywny od 2MNK) [w pewnej klasie estymatorów zmiennych instrumentalnych]

3)      jeżeli założymy normalność e, jest asymptotycznie normalny, co pozwala na wnioskowanie (testowanie hipotez etc).

 

Szczególne przypadki 3MNK:

1)      w sytuacji gdy wiemy a priori, że S jest macierzą diagonalną, czyli równoczesne kowariancje składników losowych są zerowe, metoda systemowa wykorzystująca „efekt SURE” oczywiście nie poprawia efektywności. W takim przypadku (analogicznie jak w SURE) 3MNK sprowadza się do 2MNK. Taki sąd a priori jest jednak dość mocny i w praktyce zakładamy raczej niezerowe równoczesne kowariancje.

2)      Kiedy wszystkie równania są jednoznacznie identyfikowalne, 3MNK sprowadza się do 2MNK. To jest własność mało intuicyjna i podamy pewne heurystyczne uzasadnienie przy okazji omawiania Metody Największej Wiarygodności.

 

Przypadek osobliwej macierzy równoczesnych kowariancji:

 

W niektórych przypadkach mamy do czynienia z osobliwą macierzą równoczesnych kowariancji S.

1. Może to mieć miejsce, gdy (jak w modelu Kleina) niektóre równania mają charakter tożsamości i są pozbawione składników losowych. Wtedy wymagamy dodatniej określoności tego bloku S, który odpowiada kowariancjom między równaniami rzeczywiście posiadającymi składniki losowe. Ponieważ równania będące tożsamościami (a więc spełnione dokładnie) nie posiadają zwykle nieznanych parametrów, w praktyce w takim przypadku w ostatnim kroku 3MNK rozważamy odpowiedni blok S i tylko te równania, które mają nieznane parametry.

Przykładowo, w modelu Kleina macierz rozważamy tylko 1,2 i 3 równanie, do wzorów podstawiamy Z^ zbudowane z Z1^, Z2^ i Z3^ oraz odpowiednio blok stopnia 3 macierzy S oraz jego oszacowanie uzyskane z reszt MNK pierwszych 3 równań.

2. W niektórych przypadkach wszystkie równania zawierają nieznane parametry oraz składniki losowe, lecz a priori zakładamy zależność pomiędzy składnikami losowymi która implikuje osobliwość S. Tak jest w przypadku systemów wydatków szacowanych w postaci równań udziału z addytywnymi składnikami losowymi. Udziały obserwowane sumują się do jedności (na mocy konstrukcji danych), udziały teoretyczne sumują się do jedności dzięki odpowiednim restrykcjom nałożonym na parametry, więc składniki losowe muszą się sumować do zera, aby zachodziły wszystkie równości. Oznacza to, tylko (n-1) równoczesnych składników losowych jest swobodnych, wobec czego S jest rzędu (n-1). W takim przypadku musimy tak przeformułować model, aby doprowadzić go do postaci z nieosobliwą macierzą równoczesnych kowariancji (zwykle mamy wtedy n-1 równań), ale musimy to zrobić tak, aby w zmodyfikowanym układzie identyfikowalne były wszystkie interesujące nas parametry.

 

Zauważmy, że powyżej w przypadku 2 wykraczamy nieco poza zakres stosowalności 3MNK tak jak to powyżej opisano. Systemy wydatków są zwykle nieliniowymi modelami typu SURE, lecz ponadto, co ważniejsze, omawiając 3MNK zakładaliśmy brak powiązań pomiędzy parametrami różnych równań.

3MNK tak jak opisana powyżej, pozwala na wnioskowanie o funkcjach parametrów różnych równań (patrz przykłady na końcu), nie pozwala jednak na narzucanie restrykcji na parametry (by uwzględnić je w estymacji lub testować).

W przypadku 3MNK można zastosować metody pozwalające np. narzucić liniowe restrykcje na parametry (analogicznie jak w przypadku zwykłej MNK o czym nie mówiliśmyJ) – zainteresowanych odsyłam do Zasad Ekonometrii Henri Theila (str. 516 i n.). Narzucanie restrykcji wiążących parametry różnych równań przedstawione zostanie później w kontekście MNW z pełną informacją.

 

 W praktyce więc najpierw cały model szacujemy 2MNK równanie po równaniu, uzyskujemy macierze Zi^ dla każdego równania oraz reszty 2MNK. Te ostatnie układamy w macierz E, tworzymy S. Następnie macierze Zi^ układamy w strukturę „kroneckerowską”, tworzymy długi wektor y i wyliczamy estymator 3MNK. Tu korzystamy ze struktury „kroneckerowskiej” .

 

ZADANIE:

1. Oszacować 3MNK model Kleina; otrzymać oceny parametrów i ich przybliżone błędy średnie szacunku.

Wyniki dla sprawdzenia (kolejność może być dziwna, ale pierwsze 4 są dla pierwszego równania itd..) Uwaga: model Kleina jest mniejszy niż szacowany przez nas model SURE, w tym przykładzie S ma wymiar 3 na 3, dlatego nie trzeba „bawić się” makrem – dla uzyskania estymatora 3MNK wystarczy funkcja „kron” w Dodatkach do Excela, Iloczyn Kroneckera podpunkt A. Instaluje się ją analogicznie jak funkcje używane w zajęciach 17. 

 

2. Przypomnijmy sobie strukturę modelu Kleina. Pierwsze dwa równania to:

Ct = a0+a1Pt+a2Pt-1+a3(Wpt + Wgt)+e1t

It = b0+b1Pt+b2Pt-1+b3Kt-1+e2t

zauważmy, że zmienna Pt (zysk w sektorze prywatnym) występuje po prawej stronie w równaniu konsumpcji oraz w równaniu inwestycji. Możemy się zastanawiać, jaka część zysku przeznaczona jest na konsumpcję i inwestycje, czyli ile wynosi suma a1 i b1. Aby testować czy dokonać estymacji przedziałowej tej sumy (zakładając oczywiście normalność składników losowych) musimy uwzględnić kowariancję estymatora a1 i b1, której nie da się uzyskać z 2MNK. Teraz dysponujemy oceną asymptotycznej macierzy kowariancji estymatora wszystkich parametrów łącznie, więc możemy testować hipotezę H0: a1 + b1 = x vs. H1: a1 + b1 < x (gdzie x to nasza hipoteza co do wartości tej sumy) [posługując się wartościami krytycznymi z rozkładu asymptotycznego (normalnego)]. Możemy też prowadzić estymację przedziałową:

 

Proszę dokonać estymacji przedziałowej (a1 + b1).

 

(poniżej znowu założono, że At ma wartości 1921 itd. ale to zmienia tylko ocenę wyrazu wolnego w 3 równaniu)

Oceny 3MNK

as bł śr

0.12489

0.108129

0.790081

0.037938

0.163144

0.100438

16.44079

1.304549

-0.01308

0.161896

0.755724

0.152933

-0.19485

0.032531

28.17785

6.79377

0.400492

0.031813

0.181291

0.034159

0.149674

0.027935

-287.223

53.44883