• Nie Znaleziono Wyników

Uwagi wstępne

W dokumencie Rocznik Naukowy. T. 16 (1979) (Stron 101-108)

Application of regression function in the investigations of tourism

1. Uwagi wstępne

Celem każdej nauki jest wykrywanie i wyjaśnianie związków przy­ czynowych zachodzących między zjawiskami. Czasami związki te są sil­ nie i bezpośrednio widoczne, często jednak są one słabe, ukryte wśród wielu rozmaitych związków łączących badane zjawisko ze światem ze­ wnętrznym. W przypadku, gdy niemożliwa jest weryfikacja hipotezy o więzi przyczynowej między dwoma określonymi zjawiskami w drodze bezpośredniego eksperymentu, wówczas w tym celu można posłużyć się określonymi wyspecjalizowanymi metodami statystycznymi. Metody po­

zwalające w wielu przypadkach sprawdzić wyżej wspomnianą hipotezę wchodzą w zakres teorii korelacji i regresji1

1 Por. prace: Z. H e 11 w i g [4], Z. Pawłowski [7], 2 Por. pracę K. Zając [9],

8 Należy zaznaczyć, że jeśli dwuwymiarowy rozkład XY jest normalny, to funkcja drugiego rodzaju pokrywa się z funkcją regresji pieiwszego rodzaju i obie są funkcja­ mi liniowymi.

Do najczęściej stosowanych miar korelacji należy współczynnik ko­ relacji liniowej r i stosunek korelacyjny dla nieliniowej zależności. Współczynnik korelacji r jest miernikiem natężenia i kierunku korelacji. W przypadku, gdy zależność między dwoma badanymi cechami jest linio­ wa lub w przybliżeniu liniowa, wówczas miara ta wyraża się wzorem:

(1) COV (XY) SX Sy —y (x{ - x)2 n

v2

,

V

2.

Podstawowym pojęciem w teorii regresji jest funkcja regresji. W sta­ tystyce rozróżnia się jej dwa rodzaje, a mianowicie regresję pierwszego i drugiego rodzaju1 2. Funkcję regresji pierwszego rodzaju definiuje się jako wartość oczekiwaną warunkowego rozkładu jednej zmiennej, gdy druga zmienna przyjmuje ustaloną wartość.

E (Y/X = x) = f(x) (2)

czyli, że w dwuwymiarowym rozkładzie zmiennej (XY) warunkowa war­ tość oczekiwana E (Y/X = x) jest jakąś funkcją zmiennej X. Przez zmia­ nę liter X, Y w powyższym wyrażeniu otrzymuje się równanie regresji zmiennej X względem Y. Do wyznaczenia funkcji regresji pierwszego ro­ dzaju potrzebna jest więc znajomość dwuwymiarowego rozkładu bada­ nych funkcji zmiennych, czyli postaci funkcji f(x). W praktyce zdarza się stosunkowo rzadko, aby znana była postać analityczna tych funkcji, dlatego też najczęściej posługujemy się regresją drugiego rodzaju. Funk­ cja regresji drugiego rodzaju jest to funkcja określonego typu, której pa­ rametry wyznaczone zostały metodą najmniejszych kwadratów dla za­ obserwowanych w próbie wartości badanych zmiennych3.

Nieumiejętne posługiwanie się wyżej opisanymi miarami stwarza duże niebezpieczeństwo otrzymania błędnych informacji w wyniku ich nie­

101 właściwej interpretacji merytorycznej. Stąd też wnioski znajdujące po­ twierdzenie w weryfikacji hipotez muszą znaleźć potwierdzenie w opar­ ciu o analizę rzeczową danego zjawiska.

2. Analiza funkcji regresji

W niniejszej pracy zbadano za pomocą funkcji regresji kształtowanie się współzależności między ruchem turystycznym a wybranymi elemen­ tami bazy turystycznej. Szczególną uwagę zwrócono na zależność mię­ dzy ruchem turystycznym Y a zmiennymi4:

Xj — miejsca konsumpcyjne,

X2 — drogi o nawierzchni ulepszonej, X3 — miejsca noclegowe.

Należy zaznaczyć, że wybór ten został dokonany w oparciu o istnie­ jącą i możliwie dostępną statystykę turystyki. Przy czym należy pamię­ tać, że dane statystyczne dotyczące ruchu turystycznego są wielkościa­ mi szacunkowymi. Do badań posłużono się danymi obrazującymi wymie­ nione czynniki na przykładzie byłego powiatu limanowskiego, które za­ warte są w tabeli I.

Do analizy tych zjawisk zastosowano funkcję regresji liniowej w po­ staci:

Tabela I — Table I I

Kształtowanie się wielkości turystycznych w byłym powiecie limanowskim w latach 1962—1971

Formation of tourist ąuantities in the former Limanowa county in the years 1962—1971 Lata Wielkość ruchu turystycznego w osobach Yt Miejsca konsumpcyjne xtt Drogi o na­ wierzchni ulep­ szonej w km X,t Miejsca nocleęowe x3t 1962 90 000 316 102,2 6 379 1963 137 000 1 529 114,0 6 739 1964 170 000 1 736 131,6 7 100 1965 242 000 2 102 154,0 7 650 1966 282 000 2 205 154,0 8 100 1967 320 000 2 377 174,5 8 552 1968 480 000 2 419 183,9 9 461 1969 510 600 2 660 194,4 10 015 1970 581 300 3 022 240,1 10 281 1971 696 800 3 344 261,6 10 844

Źródło: dane PKPG, PKKFiT, PKS w Limanowej.

4 Badaniami tego typu dotychczas zajmowali się: A. Deja [2]; A. Deja, J. Pocie­ cha [3j; A. A. Inchausti [5]; J. Pociecha, K. Zając [8],

Yt ao + °i Xit + £t. (3) Analiza współzależności będzie przeprowadzona dla realizacji zmiennych mających postać szeregów czasowych, w związku z czym konieczne jest dokonanie eliminacji jednego z jego elementów, a mianowicie trendu. Eliminacji trendu dokonamy poprzez wprowadzenie zmiennej czasowej t i wtedy funkcja regresji wielorakiej przybierze postać:

Yt = ao + aj Xit + a2t + (4)

gdzie poszczególne symbole mają następujące znaczenia: Yt — zmienna endogeniczna,

Xtt — zmienna objaśniająca,

at — parametry strukturalne, t — zmienna czasowa t = 1,2,..., n,

— składnik losowy.

Analizę regresji rozpoczęto od zbadania wpływu miejsc konsumpcyj­ nych Xit na wielkość ruchu turystycznego. Na podstawie analizy graficz­ nej danych empirycznych przyjęto, iż funkcja regresji wielorakiej przy­ bierze postać:

Yt — a0 + aj. Xlt + a2t St, (5)

gdzie: Yt — zmienna endogeniczna charakteryzująca wielkość ruchu turystycznego, w tysiącach osób,

Xlt — zmienna objaśniająca (miejsca konsumpcyjne),

t — zmienna czasowa t — (1,2,..., n), at — parametry strukturalne,

— składnik losowy.

Estymacji parametrów strukturalnych funkcji (5) dokonano za pomocą metody najmniejszych kwadratów. Oznacza to wyznaczenie oszacowań

ao, aj w ten sposób, aby zminimalizować funkcję określoną równaniem:

t = (Y — aX)' (Y — aX) = minimum (6)

gdzie: Y — n-wymiarowy wektor kolumnowy obserwacji dokonanych w n-elementowej próbie zmiennej endogenicznej,

X — macierz obserwacji dokonanych w n-elementowej próbie na k-zmiennych objaśniających,

a — k-wymiar owy wektor kolumnowy ocen parametrów, zwa­ nych współczynnikami regresji wielorakiej.

Nie obciążonym estymatorem wektora a współczynników regresji jest

wektor a uzyskany z próby według wzoru:

a = (X' X)"1 XY. (7)

Macierz wariancji i kowariancji estymatora a określona jest wzorem:

(a) = o?f(X'X)-k (8)

Wektor ocen parametrów ao, ai, a2 zgodnie ze wzorem (7) jest więc równy:

103

— 10,86267 13,99249 69,74719

(9)

Wyniki estymacji modelu (5) można zapisać syntetycznie w postaci: yt = -10,8626 + 13,9924 xu + 69,7471 t + et,

(15,1147) (13,2524) (27,9950) (10)

gdzie pod ocenami parametrów strukturalnych zapisano ich błędy średnie szacunku.

Następnie przystąpiono do obliczania parametrów struktury stocha­ stycznej celem zbadania dobroci dopasowania funkcji regresji do danych empirycznych. Znając oszacowania funkcji (5) obliczamy ocenę warian­ cji składnika losowego z równania:

(U)

gdzie: n — liczba obserwacji,

k — liczba szacowanych parametrów,

— - 10,86 + 13,99 xit + 69,74 t.

Ponieważ w naszym przypadku n = 10, więc dla 10—3 = 7 stopni swo­ body ocena wariancji składnika losowego S| = 1510,14 oraz S£ = 38,86. Aby ustalić jaka część całkowitej zaobserwowanej wariancji zmiennej objaśniającej Yt nie jest wyjaśniana przez proponowany model regresji wielorakiej, posłużono się współczynnikiem zbieżności y2, który zdefi­ niowano w sposób następujący:

J=1 n (yt - yt)2 t=l (12) gdzie: yt = t=i

Otrzymany współczynnik zbieżności (p2 jest równy 0,02789. Jak widać, wariancja zmiennej endogenicznej Yt nie jest wyjaśniona przez model (5) w 2,8%. Znajomość współczynnika <p2 daje możliwość obliczenia współczynnika determinacji R2 i korelacji wielorakiej R. Współczynnik ten zdefiniowano następująco:

(13)

Wysoka wartość współczynnika korelacji R = 0,9721 pozwala sądzić, że zaproponowany model regresji dobrze opisuje badaną zależność między badanymi zmiennymi.

Z kolei oszacowano współczynnik zmienności przypadkowej V. Współ­ czynnik ten zdefiniowano w sposób następujący:

V = -^--100, (14)

yt

gdzie: Sff = odchylenie standardowe składnika resztkowego,

yt — wartość średnia zmiennej Yt.

Współczynnik V mówi jaki średni procent średniego poziomu zaobser­ wowanej zmienności zmiennej endogenicznej stanowi, średnio rzecz bio- rąc, odchylenia przypadkowe w danym modelu (5).

Wykorzystując podany wzór, otrzymamy V = 11,07%. Analiza otrzy­ manego wyniku pokazuje, że rząd zmienności tego typu przypadkowego nie jest duży5.

5 Por. K. Zając [9], 6 Por. M. Brown [1], 7 Por. M. Brown [1].

Ponadto zbadano autokorelację składnika losowego Korzystając ze statystyki Durbina Watsona6 sformułowano hipotezę Ho : = 0, to jest hipotezę głoszącą, że ciąg składników losowych {&} jest ciągiem nieza­ leżnym zmiennych losowych.

Statystyka, za pomocą której sprawdza się hipoteza Ho, ma postać:

n

\ (et — ót-i)2

Z—j

V

i=l

Jeżeli wartość statystyki d < di, wówczas należy odrzucić hipotezę

■ Qi — 0. Jeżeli natomiast di> d, wówczas można przyjąć sprawdzoną

hipotezę Ho. Wreszcie jeżeli zachodzi nierówność dL d du, nie moż­ na podjąć żadnej decyzji. W rozważanym przykładzie liczba obserwacji n=10, a dostępne tablice7 uwzględniają minimalną liczebność próby n = 15, więc z twierdzenia, które głosi, że jeżeli hipoteza Ho jest praw­ dziwa, to nadzieja matematyczna wyrażenia (15) jest równa w przybliże­ niu 2. Ponieważ otrzymano wartość statystyki d = l,78 (małe odchylenie wartości d od liczby 2), więc nie ma powodu do odrzucenia sformułowa­ nej hipotezy Ho, że kolejne wyrazy ciągu wartości {£t} omawianego rów­ nania nie są skorelowane.

Powyższe parametry struktury stochastycznej wskazują na dość do­ bre dostosowanie funkcji regresji do danych empirycznych. Warto zwró­ cić uwagę, że średni błąd szacunku (Dcg = 13,2524) i oceny parametru (cg = 13,9925) posiadają wartości zbliżone. Badanie istotności ati za po­

105

mocą testu t studenta wskazują, że ocena cą parametru oą jest nieistotna statystycznie. Z uwagi na to, że dysponujemy w dużej mierze danymi statystycznymi szacunkowymi, ewentualnie których wiarygodność budzi pewne wątpliwości (np. miejsca konsumpcyjne), analizę merytoryczną otrzymanych wyników powinniśmy przeprowadzać ostrożnie. Na podsta­ wie otrzymanych wyników nie możemy jednoznacznie stwierdzić wpływ miejsc konsumpcyjnych na wielkość ruchu turystycznego w byłym po­ wiecie limanowskim. Nie możemy też jednoznacznie odrzucić twierdze­ nie o braku zależności przyczynowo-skutkowej z tego względu, że ana­ liza rzeczowa badanego zjawiska wskazuje na istnienie zależności mię­ dzy wielkością ruchu turystycznego a bazą żywieniową (miejsca kon­ sumpcyjne). Dlatego też jakkolwiek jednoznaczna interpretacja otrzyma­ nych wyników może prowadzić do błędu. Ocena parametru c2 wskazuje, że wraz ze wzrostem zmiennej czasowej t o jeden rok — ruch turystycz­ ny wzrasta o 70 000 osób.

Następnie analizowano funkcję regresji między wielkością ruchu tu­ rystycznego Yt a wielkością dróg o nawierzchni ulepszonej X2t oraz bazą noclegową X3t. Przyjęto na podstawie analizy graficznej, że funkcje re­ gresji wielorakiej są dane wzorem:

Yf = ao + oą X2t + a2t + $t, (16)

Yt = ao + aj X3t + «3t + (17)

gdzie: Yt — wielkość ruchu turystycznego w tys. osób, X2t — drogi o nawierzchni ulepszonej w km, X3t — liczba miejsc noclegowych,

at — parametry strukturalne, ;t — składnik losowy.

Estymacji parametrów strukturalnych powyższych funkcji regresji doko­

nano za pomocą metody najmniejszych kwadratów. W wyniku oszaco­

wań parametrów strukturalnych funkcji (16) i (17) otrzymano:

Yt = -111,19 + 1,188 x2t + 47,086 t + (18) (92,156) (1,114) (18,954)

Yt = -948,014 + 164,445 x3t + 18,325 t + £t. (19) (331,413) (58,422) (30,393)

Oceny parametrów struktury stochastycznej modeli w postaci (18) i (19) przedstawiono w tabeli II.

Na podstawie otrzymanych wyników ogólnie można stwierdzić, że

oszacowanie funkcji z niezłym stopniem dokładności odzwierciedla wa­ hania zmiennych endogenicznych. Ponieważ błędy średnie szacunku kształtują się poniżej ocen parametrów strukturalnych, można stwier­ dzić:

1. Z analizy funkcji regresji (18), biorąc pod uwagę ocenę parametru

wię-Tabela II — Table II Zastosowanie oszacowań funkcji wraz z odpowiednimi zgodnościami Specification of the evaluations of functions together with respective

conformity measures Nr równania 5 Si c2 óSt <p2 V R2 d (18) 1 301,436 36,075 0,0240 0,1028 0,9759 2,06 (19) 709,502 26,636 0,0131 0,0758 0,9868 1,72

8 Autor pomija tutaj inne czynniki decydujące przy wyborze miejsca wypoczynku, jak walory krajoznawcze, położenie geograficzne, atrakcyjność terenu i inne, ze wzglę­ du na trudności ich kwantyfikacji.

zi przyczynowej między wielkościami ruchu turystycznego a wielkością dróg o nawierzchni ulepszonej. W tym przypadku jedynie analiza rze­ czowa badanej zależności wskazuje na więź przyczynową. Wiadomo, że na wielkość ruchu turystycznego będzie miała m. in. wpływ dostępność komunikacyjna, co przy rozwoju motoryzacji nabiera coraz większego znaczenia. Dlatego też nie można odrzucić stwierdzenia o zależności mię­ dzy wielkością ruchu turystycznego a wielkością dróg o nawierzchni ulepszonej.

2. Z analizy funkcji (19) wynika, że baza noclegowa ma wpływ na wielkość ruchu turystycznego w byłym powiecie limanowskim. Istotność oceny parametru a2 wskazuje na dość ścisły związek między ruchem tu­ rystycznym a bazą noclegową. Usługi noclegowe należą do najważniej­ szych w hierarchii potrzeb turysty8.

W pierwszej kolejności turysta decyduje się na wyjazd do określonej miejscowości i musi mieć zabezpieczony nocleg, a dopiero w dalszej ko­ lejności załatwia wyżywienie, najczęściej będąc już na miejscu.

Jak widać z powyższego, wyniki analizy funkcji regresji nie zawsze potwierdzają w pełni analizę rzeczową. Brak pełnych danych statystycz­ nych charakteryzujących usługi turystyczne w decydujący sposób ogra­ nicza możliwości zastosowania szerszych badań. Ponadto dane empirycz­ ne nie zawsze są wiarygodne, a w przypadku wielkości ruchu — tury­ stycznego — szacunkowe, co ma również ujemny wpływ na wyniki ba­ dań.

W dokumencie Rocznik Naukowy. T. 16 (1979) (Stron 101-108)