Liniowe modele wielorównaniowe

notacja, klasyfikacja

 

Wstęp

W poprzednich zajęciach przedstawiliśmy problem regresji z losowymi zmiennymi objaśniającymi. Przypomnijmy dwa aspekty:

-w pewnych przypadkach sama konstrukcja modelu wymusza na nas rozważanie losowych zmiennych objaśniających

-konsekwencje losowości zmiennych objaśniających mogą być poważne (pokazaliśmy, że może to prowadzić nawet do niezgodności estymatora MNK w przypadku 2c – kiedy bieżące zmienne objaśniające są skorelowane z bieżącymi składnikami losowymi.)

Ważnym rodzajem modeli, w których natykamy się na problem losowych zmiennych objaśniających, są modele wielorównaniowe. Mają one ważną i użyteczną interpretację ekonomiczną, występują w nich interesujące problemy statystyczne. Model wielorównaniowy opisuje „równoczesne” kształtowanie się wartości kilku zmiennych „objaśnianych” – opisujemy w ten sposób system – kilka zmiennych potencjalnie powiązanych zależnościami. Ponieważ opisujemy zachowanie kilku zmiennych objaśnianych, musimy mieć tyle właśnie równań. Przez „równoczesne kształtowanie” rozumiemy, że te same zmienne mogą występować w kilku równaniach – raz po lewej a raz po prawej stronie. Układem równań opisujemy zależności między rozważanymi zmiennymi dla każdej obserwacji t. Na użytek modeli wielorównaniowych inaczej klasyfikujemy zmienne, dlatego też określenie „objaśniana” jest w cudzysłowie. Będziemy rozważać zmienne:

endogeniczne – takie, których wartości kształtują się wewnątrz rozważanego układu. Są to zmienne, które mają swoje własne równania opisujące ich powstawanie. Zmienne endogeniczne zwykle są losowe na mocy konstrukcji modelu – ich równania mają zwykle składniki losowe lub mają po prawej stronie inne zmienne endogeniczne.

egzogeniczne – takie, które kształtują się na zewnątrz (procesu ich powstawania nie modelujemy) i wchodzą do układu równań tylko poprzez obserwowane wartości – dla zmiennych egzogenicznych nie specyfikujemy równań pokazujących jak powstają. Zmienne egzogeniczne możemy traktować tak, jakby były nielosowe.

W niniejszych zajęciach będziemy rozważać następujące problemy:

notacja-pokażemy notację, która będzie w dalszym ciągu wykorzystywana (notacja w ekonometrii to podstawa, więc proszę się przyłożyć)

klasyfikacja-wykorzystując notację, rozważymy różne rodzaje modeli wielorównaniowych według tego, jakie problemy statystyczne w nich występują.

 

 

Tu ograniczamy się tylko do liniowych zależności między zmiennymi. Przykładowy model to:, ogólnie mamy m równań.

 

, t = 1,2,...,T

 

mamy w modelu składniki losowe: , układamy je w wektor – wiersz et. To różnica w porównaniu z modelami jednorównaniowymi (jak KMRL), gdzie et był skalarem.

o parametrach zakładamy, że nie mogą zachodzić związki między parametrami różnych równań. Np. wykluczamy możliwość, że b1 = a1 – coś takiego mogłoby wynikać z np. teorii ekonomicznej. To WYKLUCZAMY.

o składnikach losowych:

-standardowo zakładamy, że mają zerową wartość oczekiwaną:

 

1.

w naszym przykładzie:

-o wariancjach i kowariancjach pomiędzy składnikami losowymi:

Ø      o kowariancjach pomiędzy składnikami losowymi RÓŻNYCH RÓWNAŃ, TEJ SAMEJ OBSERWACJI.

Kowariancje pomiędzy składnikami losowymi różnych równań dla tego samego t (indeksu obserwacji) są zebrane w tzw. macierzy równoczesnych kowariancji składników losowych oznaczonej jako V(et):

 

2.  oraz

założenie, że  oznacza, że macierz równoczesnych kowariancji nie zależy od t – jest taka sama dla każdej obserwacji (bo NIE zakładamy, że ). Wobec tego, wszystkie wariancje składników losowych są STAŁE, a kowariancje pomiędzy składnikami losowymi różnych równań są takie same dla każdej obserwacji. Zakładamy, że ta macierz jest nieosobliwa. Każda macierz kowariancji musi być kwadratowa, symetryczna i nieujemnie określona, a ponieważ dodatkowo zakładamy, że jest nieosobliwa, to w sumie jest dodatnio określona. Jeśli mamy do czynienia z przypadkiem, że macierz równoczesnych kowariancji jest diagonalna (macierz diagonalna to taka, że wszystkie elementy poza główną przekątną są zerowe), to oznacza, że składniki losowe różnych równań dla tej samej obserwacji są nieskorelowane.

 

Ø      o kowariancjach pomiędzy składnikami losowymi DLA RÓŻNYCH OBSERWACJI:

3.

 

Zakładamy tu, że wszystkie składniki losowe dla różnych obserwacji są nieskorelowane. Np. jeśli modelujemy gospodarkę w kolejnych latach i mamy równania konsumpcji oraz inwestycji, to zakładamy, że zakłócenie równania inwestycji w danym roku jest niezależne od zakłóceń tego samego równania w innych latach oraz zakłóceń innych równań w innych latach.

 

Rozważmy układ m równań opisujących kształtowanie się wartości m zmiennych endogenicznych. Możemy taki układ zapisać „rozpisując” dokładnie każde równanie, lub stosując notację macierzową. Na mocy konwencji po lewej stronie zapisujemy wartości zmiennych endogenicznych. Przykładowo:

 

(1)       ln vt= a0 + a1 ln zt + a2 kt + ht + ut1

ln zt= b0 + b1 ln vt-1 + b2 gt + ut2

 

Liczba równań m = 2

Tutaj zmienne endogeniczne to:

ln v, ln z

Zmienne egzogeniczne to:

            g, h, k

Zauważmy, że w modelu występuje opóźniona zmienna endogeniczna ln vt-1

ut1 ut2

to składniki losowe poszczególnych równań.

 

Na użytek modelowania wielorównaniowego klasyfikujemy zmienne w jeszcze jeden sposób, mianowicie na łącznie współzależne i z góry ustalone .

Zmienne łącznie współzależne to bieżące zmienne endogeniczne (czyli bez opóźnień). Wektor zmiennych łącznie współzależnych (wektor-wiersz) oznaczamy yt. W naszym przykładzie:

yt = ( ln vt    ln zt )

Zauważmy, że wektor y ma zawsze m elementów – tyle, ile jest równań, bo każda bieżąca wartość zmiennej endogenicznej ma swoje równanie.

 

Zmienne z góry ustalone to: opóźnione zmienne endogeniczne, zmienne egzogeniczne i zmienne sztuczne (takie jak 1-ka przy wyrazach wolnych). Wektor zmiennych z góry ustalonych oznaczamy xt. W naszym przykładzie:

xt = ( ln vt-1    kt   ht    gt    1)

liczbę zmiennych z góry ustalonych (czyli kolumn xt) oznaczmy przez k.

Podobnie możemy zgrupować w wektorze składniki losowe równań:

et = (ut1    ut2)

wektor et ma taki sam wymiar jak yt – czyli m na 1.

 

Układ równań (1) to przykład zapisu POSTACI STRUKTURALNEJ modelu wielorównaniowego. Postać kolejnych równań wynika z postulowanych przez badacza zależności między zmiennymi; parametry postaci strukturalnej mają interpretację. Równania postaci strukturalnej to np. funkcja konsumpcji, funkcja inwestycji itd. Ogólnie jest to odzwierciedlenie pewnej struktury zależności ekonomicznych. Postać strukturalna związana jest z konstrukcją i interpretacją ekonomiczną modelu. W odróżnieniu od niej będziemy rozpatrywać POSTAĆ ZREDUKOWANĄ – będzie ona miała istotne znaczenie w kontekście estymacji.

Postać strukturalną można zapisać „klamerkowo” – równanie po równaniu – jak w (1). Dla modelu liniowego można także rozważyć przedstawienie jej w postaci macierzowej. Wykorzystamy do tego zdefiniowane powyżej wektory yt i xt. Rozważmy zapis:

(2)     

dla pojedynczej obserwacji o numerze t, lub łącznie dla wszystkich T obserwacji:

Y to wektory yt ułożone jeden pod drugim, od y1 do yT

X to wektory xt ułożone jeden pod drugim, od x1 do xT

 

Aby zachowane były wymogi mnożenia i sumowania macierzy [patrz wymiary xt, yt i et] , B musi być macierzą kwadratową m na m, a G macierzą k na m. Zauważmy, że w zapisie (2) wszystko jest po lewej stronie znaku równości, a po prawej pozostają tylko składniki losowe. Trzeba tylko ustalić postać macierzy B i G - musimy w nich rozmieścić parametry postaci (1). Robimy to, pamiętając że:

            kolumny macierzy B i G (jest ich m) odpowiadają równaniom postaci klamerkowej (parametry 1-go równania będą w 1 kolumnie B i G)

            wiersze macierzy B i G odpowiadają kolejnym elementom odpowiednio yt i xt.

[czyli w i-tej kolumnie i j-tym wierszu G będzie parametr, który występuje w i-tym równaniu przy zmiennej, która jest na j-tym miejscu w wektorze xt.

            na mocy konwencji i-ta zmienna endogeniczna w wektorze yt jest objaśniana (po lewej stronie) w i-tym równaniu

[to znaczy, że i-ty y jest objaśniany (czyli już po lewej stronie, z parametrem 1) w i-tym równaniu. Czyli w macierzy B w i-tym wierszu i i-tej kolumnie [więc na przekątnej] będą jedynki.]

            ponieważ wszystkie parametry i zmienne przenosimy na lewą stronę, trzeba pozmieniać znaki parametrów.

Jeśli dana zmienna nie występuje w i-tym równaniu – wstawiamy do macierzy 0, jeśli występuje bez parametru – wstawiamy jedynkę.

 

Czyli wypełniając macierze B i G idziemy kolumnami (czyli rówaniami) i w każdej kolumnie idziemy wzdłuż yt i potem xt i patrzymy, czy w danym równaniu jest zmienna, i z jakim parametrem. Możemy sobie dla ułatwienia opisać kolumny – zmiennymi objaśnianymi lub numerem równania, i wiersze – elementami yt (w B) i elementami xt (w G) - trzeba pilnować kolejności!

W naszym przykładzie macierze B i G będą miały postać:

znaków nie zmieniamy tylko przy jedynkach w macierzy B bo zmienne objaśniane już są po lewej stronie.

Czyli ostatecznie układ (1) w zapisie macierzowym ma postać:

Są to po prostu dwa zapisy („klamerkowy” <bo równania zwykle łączy się klamrą> i macierzowy) postaci strukturalnej modelu wielorównaniowego. Żeby model zapisać w postaci macierzowej, trzeba prawidłowo sklasyfikować zmienne – czyli wyznaczyć wektory yt i  xt a następnie wypełnić macierze B i G parametrami z postaci „klamerkowej”, zerami i jedynkami.