• Nie Znaleziono Wyników

Testowanie globalnej autokorelacji przestrzennej

3. Autokorelacja przestrzenna

3.1. Testowanie globalnej autokorelacji przestrzennej

, i, j ∈ P .

W praktyce jednak nie stosuje się takiego podejścia. Zamiast macierzy współ-czynników przyjmuje się różne jednoparametrowe liczbowe mierniki autokore-lacji w zależności uszczegółowionej definicji autokoreautokore-lacji. Wszystkie są jednak oparte na pewnego rodzaju zależności wartości zmiennej xi, 16 i 6 N, od war-tości opóźnienia przestrzennego L[xi] =PN

j=1wijxj (patrz definicja na s. 24). Należy wyróżnić dwa rodzaje autokorelacji przestrzennej: dodatnią i ujemną. W przypadku autokorelacji dodatniej, wartości obserwowanej zmiennej z są-siednich jednostek są do siebie podobne. Mamy wówczas do czynienia z prze-strzennym grupowaniem się (w sensie lokalizacji) wysokich bądź niskich war-tości obserwowanej zmiennej. Z kolei w przypadku ujemnej autokorelacji prze-strzennej będziemy obserwować wysokie wartości zmiennej otoczone niskimi (i odwrotnie), układając się w ten sposób we wzór przypominający szachownicę. Badania empiryczne wskazują, że większość zjawisk ekonomicznych obserwo-wanych w przestrzeni charakteryzuje się dodatnimi oddziaływaniami, co jest zgodne z prawem Toblera. Autokorelacja ujemna jest obserwowana w praktyce dość rzadko.

Autokorelację przestrzenną możemy badać na poziomie lokalnym lub global-nym. Istnienie globalnej autokorelacji przestrzennej oznacza występowanie za-leżności przestrzennych w obrębie całego badanego obszaru, średnio dla wszyst-kich lokalizacji. Globalna autokorelacja przestrzenna uwidacznia się więc po-przez ogólną tendencję do grupowania się podobnych wartości w przestrzeni. Natomiast lokalną autokorelację przestrzenną definiuje się jako istnienie zależ-ności przestrzennych danego obiektu z jego otoczeniem. Zatem jej identyfikacja umożliwia wskazanie położenia lokalnych klastrów wartości podobnych. Mo-że też prowadzić do wychwycenia tzw. lokalizacji nietypowych (ang. outliers). W kolejnych podrozdziałach przedstawimy klasyczne metody testowania wystę-powania zjawisk, zarówno globalnej, jak i lokalnej autokorelacji przestrzennej procesu losowego.

3.1. Testowanie globalnej autokorelacji przestrzennej

Istnieje kilka rodzajów wskaźników testujących grupowanie się danych. Wszyst-kie przedstawione poniżej statystyki mierzą stopień współzależności przestrzen-nych. Do najpowszechniejszych należą statystyki: I Morana, Geary’ego oraz sta-tystyka G(d). Jak dotąd, najpopularniejszą klasą testów służących wykrywaniu

Autokorelacja przestrzenna 31

autokorelacji przestrzennej są te oparte na pracy Morana (1950). Test I Morana może być także użyty do weryfikacji trafności doboru macierzy wag W, reprezen-tującej przestrzenną strukturę zależności procesu losowego. Statystyka I Morana służy więc do oceny stopnia skorelowania przestrzennego pomiędzy sąsiadujący-mi lokalizacjasąsiadujący-mi. Zmodyfikowana przez Cliffa i Orda (1973) pod kątem potrzeb ekonometrii przestrzennej procedura testowania jest przestrzennym analogiem testu Durbina-Watsona (Durbin, Watson, 1950; 1951). Statystyka I Morana służy do testowania obecności globalnej autokorelacji przestrzennej według schematu opisanego macierzą wag W.

Definicja

Rozważmy proces przestrzenny x = (x1, . . . , xN)T. Wówczas wartość glo-balnej statystyki I Morana dla standaryzowanej wierszowo macierzy wag W = [wij]16i,j6N wyraża się wzorem

I = PN i=1 PN j=1wij(xi− ¯x)(xj− ¯x) PN i=1(xi− ¯x) , gdzie ¯x = N1 PN

i=1xioznacza średnią z realizacji badanego procesu. Ogólniej, jeśli przestrzenna macierz wag W nie jest wierszowo standaryzowana, a co za tym idzie PN

i=1

PN

j=1wij 6= N, wówczas statystyka I Morana przyjmuje

postać normalizowaną I = PN N i=1 PN j=1wij · PN i=1 PN j=1wij(xi− ¯x)(xj− ¯x) PN i=1(xi− ¯x)2 . (1.4) Jeżeli macierz W opisuje stan rzeczywisty, tj. duże wagi odpowiadają rzeczy-wistym korelacjom, to wartość statystyki I Morana będzie miała tendencję do przyjmowania wartości dużych, co do wartości bezwzględnej. Można więc po-wiedzieć, że statystyka I Morana jest w pewnym sensie ważonym przestrzennie współczynnikiem (auto)korelacji, służącym do wykrywania odchyleń w losowym rozkładzie przestrzennym procesu x.

Aby wykorzystać statystykę I Morana do ustalenia, czy sąsiadujące ze sobą wartości są bardziej do siebie podobne niż to wynika z losowości badanego zjawiska, rozpatrzmy następujące hipotezy testowe:

H0: brak autokorelacji przestrzennej, przy hipotezie alternatywnej,

H1: występowanie zależności przestrzennych.

Zwyczajowo, w przypadku, gdy statystyka I Morana przyjmuje wartości bli-skie I0=−1 / (N − 1), uważa się, że wartość I nie daje podstaw do odrzucenia

hipotezy zerowej. W przeciwnym przypadku zaś, odrzucając H0 wnioskujemy o istnieniu pewnych istotnych statystycznie zależności przestrzennych. Zakłada-jąc brak heterogeniczności przestrzennej danych, przyjmuje się, że gdy I > I0, obserwuje się autokorelację przestrzenną dodatnią, zaś dla I < I0 autokorelację ujemną. Zauważmy, że dla dostatecznie dużych N , w przypadku braku autokore-lacji przestrzennej, statystyka przyjmować będzie wartości bliskie zeru. Chociaż w praktyce wartość statystyki Morana często nie przekracza, co do modułu, war-tości jeden, należy zaznaczyć, że w odróżnieniu od klasycznego współczynnika korelacji Pearsona nie jest to regułą. W rzeczywistości, jak sugeruje Kossowski (2010), za de Jong i inni (1984), mamy nierówności

N · λmin 2PN i=1 PN j=1wij 6 I 6 N · λmax 2PN i=1 PN j=1wij,

gdzie λmin i λmax są odpowiednio najmniejszą i największą wartością własną iloczynu M(W + WT)M, a macierz M jest operatorem rzutu na przestrzeń ortogonalną do podprzestrzeni wektorów stałych. Co więcej, wskazywana tra-dycyjnie wartość I0 = −1(N − 1) nie zawsze jest poprawna, co wyjaśniamy

w rozdziale III.

Powyżej przedstawiono popularną w literaturze postać procedury testowej Morana. Można jednak zwrócić uwagę na fakt, że w zasadzie poprawna hipoteza zerową powinna brzmieć następująco:

H0: brak zależności przestrzennych w procesie x.

Odrzucenie hipotezy zerowej nie informuje nas bowiem, czy przyczyną zależno-ści przestrzennych jest autokorelacja przestrzenna procesu, czy heterogeniczność przestrzenna (por. Anselin, 1988a).

Poziom istotności testu Morana może być obliczony za pomocą standaryzo-wanej statystyki I Morana. Przy pewnych założeniach jej rozkład można przy-bliżyć standardowym rozkładem normalnym (patrz rozdział III), a dokładniej

I− E (I)

p

Var (I) ' N (0, 1).

W praktyce często stosuje się również tzw. test randomizacyjny oparty na warto-ści statystyki I Moran obliczanych dla generowanych losowo permutacjach pró-by przestrzennej. Mianowicie, w ramach tej procedury próbkuje się przestrzeń wszystkich permutacji π zbioru {1, . . . , N}. Dla każdego wylosowanego w ten

sposób π oblicza się wartość statystyki Morana I(π) dla procesu xπ = x◦π, gdzie

wartości procesu xπ = (xπ1, . . . , xπN) określone są przez równość xπ

i = xπ−1(i), dla wszystkich jednostek przestrzennych 1 6 i 6 N. Wówczas tzw. pseudowar-tość p (ang. pseudo p-value) określana jest jako iloraz liczby permutacji π, dla

Autokorelacja przestrzenna 33

których I(π)6 I(idπ), gdzie idπ jest permutacją identycznościową, przez liczbę wszystkich permutacji w próbce.

Podobne zastosowanie ma przestawiona poniższej statystyka Geary’ego. Definicja

Rozważmy proces przestrzenny x = (x1, . . . , xN)T oraz macierz wag prze-strzennych W = [wij]ij6N. Statystykę określoną wzorem

c = N − 1 2PN i=1 PN j=1wij · PN i=1 PN j=1wij(xi− xj)2 PN i=1(xi− ¯x)2 , gdzie ¯x = N1 PN

i=1xi, nazywamy globalną statystyką Geary’ego.

W przypadku, gdy wartość tej statystyki spełnia c < 1, mamy do czynienia z autokorelacją przestrzenną dodatnią, natomiast dla c > 1 wnioskujemy o wy-stępowaniu autokorelacji ujemnej. Wartość statystyki c ≈ 1 świadczy o braku

autokorelacji. Podobnie jak w przypadku statystyki I Morana, zakres możliwych wartości statystyki Geary’ego jest pewną funkcją macierzy W (patrz de Jong i inni, 1984), chociaż w praktyce mieszczą się w przedziałach: [0, 1) — dla auto-korelacji dodatniej oraz (1, 2] — dla autoauto-korelacji ujemnej.

Kolejną popularną statystyką przestrzenną jest opracowana przez Getisa i Or-da (1992) statystyka G(d), mierząca siłę przestrzennego skorelowania pomiędzy poszczególnymi lokalizacjami, będącymi w obrębie ustalonego otoczenia d. Sta-tystyka ta jest funkcją promienia d, a więc pozwala na ustalenie średniej siły zależności od przyjętego promienia oddziaływań.

Definicja

Niech x = (x1, . . . , xN)Tbędzie procesem przestrzennym oraz niech wij(d) oznacza elementy niestandaryzowanej przestrzennej macierzy wag dla ustalo-nego otoczenia d, tj. wij(d) = 1, gdy jednostki przestrzenne 16 i 6= j 6 N są odległe od siebie o nie więcej niż d, oraz wij(d) = 0 w przeciwnym wypadku. Statystykę postaci

G(d) = PN i=1 PN j=1wij(d)xixj PN i=1 PN j=1xixj , nazywamy globalną statystyką G(d).

Podobnie jak w przypadku statystki I Morana, wnioskowanie statystyczne opiera się na założeniu, że standaryzowana statystyka G(d) ma w przybliżeniu standardowy rozkład normalny

G(d)p − E (G(d))

Wartości dwóch pierwszych momentów statystyki G(d) mogą zostać wyznaczone przy dodatkowych założeniach dotyczących własności stochastycznych procesu x. Na przykład, przy pewnych założeniach można przyjąć, że wartość pierwszego momentu statystyki G(d) wyraża się wzorem

E (G(d)) = PN i=1 PN j=1wij(d) N (N − 1) .

Dodatnie wartości statystyki G(d)− E G(d) wskazują na przestrzenne

grupowa-nie się wysokich (ang. hot spots), ujemne zaś niskich wartości badanej zmiennej (ang. cold spots); patrz Suchecki [red.] (2010).

Powiązane dokumenty