• Nie Znaleziono Wyników

RYC. 5.2: Proces modelowania danych podzielony na 6 podej´s´c - po jednym dla 3 form funkcyjnych (algorytmów uczenia maszynowego) i 2 zasi˛egów (modelu holistycznego dla całego miasta oraz odr˛ebnych

modeli dla ka ˙zdego z subrynków).

5.2. Metodyka wyboru zmiennych niezale˙znych

Dotychczasowe badania oparte o modelowanie hedoniczne wykorzystywały przewa ˙znie par˛ena´scie zmiennych maj ˛acych potencjalnie wpływ na ceny nierucho-mo´sci. Sytuacja taka podyktowana jest szeregiem problemów zwi ˛azanych z wybo-rem odpowiednich czynników, które szerzej zostały opisane w rozdziale 2.3, a po-legaj ˛a one przede wszystkim na współliniowo´sci zmiennych i formie analizowanej dost˛epno´sci.

Dla czytelno´sci pracy warto podzieli´c uwzgl˛edniane zmienne niezale ˙zne na od-powiednie kategorie. W literaturze naukowej istniej ˛a ró ˙zne klasyfikacje czynników wpływaj ˛acych na cen˛e m2 nieruchomo´sci. Zmienne przestrzenne dzielone s ˛a cza-sem na cechy ´srodowiskowe lub społeczno-ekonomiczne (Schläpfer i in., 2015), cho´c w wi˛ekszo´sci opracowa ´n dominuje podział na cechy lokalizacji oraz cechy s ˛ asiedz-twa (Tse, 2002). W kategorii lokalizacji mieszcz ˛a si˛e zarówno cechy wynikaj ˛ace bez-po´srednio z poło ˙zenia geograficznego (np. nachylenie terenu) jak i nawi ˛azuj ˛ace do relacji wzgl˛edem innych obiektów opisywanych miar ˛a dost˛epno´sci.

Cechy lokalizacji s ˛a zbiorem charakterystyk wynikaj ˛acych z lokalizacji nierucho-mo´sci w konkretnym miejscu, takie jak wysoko´s´c n.p.m., jako´s´c powietrza, kierunek nachylenia czy ekspozycja terenu. Do tej grupy zaliczy´c te ˙z mo ˙zna bardzo obszerny zbiór dost˛epno´sci do innych miejsc.

Nieraz trudno jest rozró ˙zni´c czy dan ˛a cech˛e zaliczy´c do kategorii lokalizacji, czy do s ˛asiedztwa. Obszary wodne mo ˙zna przykładowo analizowa´c w kontek´scie od-legło´sci do nich (Muller, 2009), ale równie ˙z wyst˛epowania w najbli ˙zszym s ˛ asiedz-twie lub w kontek´scie widoczno´sci (Yamagata i in., 2016). Podobnie zadrzewienia (lasy i parki) mog ˛a by´c analizowane w kontek´scie czasu dojazdu do lasu (Kong i in., 2007), jak równie ˙z udziału ro´slinno´sci rozproszonej w okolicy miejsca zamieszkania (Czembrowski i in., 2016). Tak ˙ze inne czynniki przestrzenne mog ˛a by´s powi ˛azane z ró ˙znymi kategoriami: wysoko´s´c nad poziomem morza jak i kierunek ekspozycji terenu wynikaj ˛a bezpo´srednio z lokalizacji, ale równie ˙z wpływaj ˛a na widok z okna, który mo ˙ze by´c traktowany w kategoriach najbli ˙zszego s ˛asiedztwa.

Podobne problemy wynikaj ˛a przy podziale elementów krajobrazu na struktu-ralne i funkcyjne. Czas dotarcia do centrum ma charakter stricte utylitarny, ale wy-nikaj ˛acy z infrastruktury i istniej ˛acych barier (jak np. rzeka). Łatwiejsze ju ˙z wy-daje si˛e rozró ˙znienie czynników ze wzgl˛edu na ich charakter jako ´srodowiskowe i społeczno-ekonomiczne, cho´c i tu mo ˙zna mie´c w ˛atpliwo´sci, czy odległo´s´c od ko-minów stanowi bardziej po´sredni ˛a miar˛e dost˛epno´sci miejsc pracy, czy jako´sci po-wietrza.

Podział ze wzgl˛edu na pochodzenie obiektów nie oddaje cz˛esto realnego wpływu wywieranego na otoczenie. Czy parki zasadzone i ukształtowane przez człowieka b˛ed ˛a miały odmienny wpływ na atrakcyjno´s´c miejsca zamieszkania ni ˙z obecno´s´c lasów? W obu przypadkach s ˛a to obiekty powierzchniowe o du ˙zym udziale drzew ró ˙zni ˛ace si˛e nieco sposobem zagospodarowania, ale ich funkcja rekreacyjno-u ˙zytkowa jest bardzo zbli ˙zona. Ze wzgl˛edu na wymienione wy ˙zej wody, prezentowane w niniejszej pracy elementy struktury krajobrazu zostały po-dzielone na grupy:

• cech strukturalnych nieruchomo´sci jak np. jej powierzchnia (w niniejszej pracy, dla poprawienia czytelno´sci w tabelach i rycinach poprzedzane przedrostkiem

„nier_“, zob. zał ˛acznik A),

• dost˛epno´s´c/odległo´s´c do innych obiektów (poprzedzane przedrostkiem

„dost_“),

• dost˛epno´sci po´sredniej - space syntax - szerzej opisanej w rozdziale 3 (poprze-dzane przedrostkiem „ssx_“),

• lokalizacji odnosz ˛acej si˛e do cech tego konkretnego miejsca (jak np. kierunek nachylenia terenu (poprzedzane przedrostkiem „lok_“),

• s ˛asiedztwa, okre´slaj ˛acego cechy zmierzone w najbli ˙zszej okolicy, jak np. udział drzew w promieniu 50 m (poprzedzane przedrostkiem „sasiedz_“).

W zał ˛aczniku A podano pełn ˛a list˛e czynników uwzgl˛ednianych w modelowaniu wraz z kategori ˛a, która informuje o aspekcie, w jakim jest brana pod uwag˛e w pracy (dost˛epno´s´c, lokalizacja, s ˛asiedztwo, cechy strukturalne nieruchomo´sci, inne).

5.2.1. Wybór rodzaju dost˛epno´sci

Je´sli we´zmiemy pod uwag˛e tylko jeden czynnik (a konkretnie dost˛epno´s´c

okre-´slonego pojedynczego obiektu w przestrzeni miejskiej) mog ˛acy mie´c potencjalny wpływ na ceny nieruchomo´sci (a przez to na atrakcyjno´s´c przestrzeni ˙zycia), np. od-legło´s´c od centrum miasta, na samym pocz ˛atku procedury dysponujemy a ˙z 8 pod-stawowymi wariantami: odległo´sci ˛a euklidesow ˛a, czasem dotarcia pieszo, czasem dotarcia samochodem, czasem dotarcia komunikacj ˛a publiczn ˛a oraz logarytmami wszystkich 4 wariantów, jak równie ˙z potencjalnymi innymi transformacjami.

Sprawdzenie wszystkich kombinacji wszystkich zmiennych, w celu znalezie-nia optymalnego modelu wymagałaby ka ˙zdorazowo przeprowadzeznalezie-nia olbrzymiej liczby modeli. Posiadaj ˛ac zaledwie 4 zmienne liczba mo ˙zliwych modeli to 4!, czyli 24 wariancje. Posiadaj ˛ac 50 zmiennych, uwzgl˛ednionych w niniejszej pracy, byłaby to liczba posiadaj ˛aca 64 cyfry. Dodaj ˛ac do tego wspomnianych 8 wariantów mamy jeszcze 8 krotnie wi˛eksz ˛a liczb˛e.

5.2. Metodyka wyboru zmiennych niezale ˙znych 95

W dalszej cz˛e´sci pracy zmienne dotycz ˛ace dost˛epno´sci prezentowane na ryci-nach b˛ed ˛a posiadały nazwy z przyrostkiem informuj ˛acym, czy zmienna została pod-dana logarytmizacji („_log”) oraz informacji na temat rodzaju uj˛etej dost˛epno´sci:

• odległo´s´c euklidesowa: „_euclid”,

• czas doj´scia pieszo: „_pieszo”,

• czas dojazdu samochodem: „_samochod”,

• czas dojazdu komunikacj ˛a publiczn ˛a: „_kom.pub”.

W celu poprawienia interpretacji zmiennych dotycz ˛acych dost˛epno´sci na wszystkich wykresach u ˙zyto ujemnych warto´sci odległo´sci (dost˛epno´sci pomno ˙zo-nej razy -1), dzi˛eki czemu dodatni wpływ zmien˙zo-nej oznacza zbli ˙zania si˛e do obiektu, a nie oddalanie si˛e od niego. Dzi˛eki temu zabiegowi zmienne ró ˙znych kategorii s ˛a lepiej porównywalne w kontek´scie wzrostu nat˛e ˙zenie danego zjawiska, intensyw-no´sci i wpływu obiektu na okolic˛e.

5.2.2. Wielko´s´c s ˛asiedztwa

Podobne problemy jak z parametrem odległo´sci/dost˛epno´sci do wybranych obiektów pojawiaj ˛a si˛e w przypadku parametru ’wielko´sci s ˛asiedztwa’

nieruchomo-´sci. Trudno jest zdefiniowa´c w sposób jednoznaczny ’s ˛asiedztwo’. W niniejszej pracy rozumiane jest ono jako najbli ˙zsza okolica, cho´c poj˛ecie ’blisko´sci’ (jak ju ˙z wykazano w cz˛e´sci dotycz ˛acej pomiaru dost˛epno´sci) samo w sobie mo ˙ze by´c rozumiane w nie-jednoznaczny sposób.

S ˛asiedztwo przewa ˙znie definiowane jest jako bufor odległo´sci euklidesowej od nieruchomo´sci, jednak w niektórych pracach ukazywane jest te ˙z jako obszar wyzna-czony czasem przej´scia pieszo (lub za pomoc ˛a innego ´srodka komunikacji) od nie-ruchomo´sci. Potencjalnym s ˛asiedztwem mo ˙ze by´c równie ˙z obszar widoczny z nie-ruchomo´sci (zwłaszcza w kontek´scie determinant widokowych lub widoku z okna).

Mimo wszystko, przy wyznaczaniu granic s ˛asiedztwa, przewa ˙za podej´scie

odległo-´sci euklidesowej ze wzgl˛edu na wygod˛e oblicze ´n i niewielki wpływ ró ˙znic mi˛edzy tak definiowanymi s ˛asiedztwami.

W niniejszej pracy promie ´n s ˛asiedztwa ustalony został na podstawie przegl ˛adu literatury (Tse, 2002; Roos-Klein Lankhorst i in., 2011). Poniewa ˙z jednak we

wcze-´sniejszych pracach zauwa ˙zy´c mo ˙zna pewne zró ˙znicowanie wielko´sci promienia, tak i w tym przypadku zmienne traktowane w relacji do s ˛asiedztwa obliczono dla 4 ró ˙znych zasi˛egów (50, 100, 250 i 500 m), a nast˛epnie do modelowania wybrano te, które tłumaczyły najwi˛ecej zmienno´sci cen m2 nieruchomo´sci. W dalszej cz˛e´sci pracy zmienne dotycz ˛ace s ˛asiedztwa prezentowane na rycinach b˛ed ˛a posiadały na-zwy z przyrostkiem informuj ˛acym o wielko´sci s ˛asiedztwa („_50”, „_100”, „_250”,

„_500”).

RYC. 5.3: Schemat doboru reprezentacji zmiennych

5.2. Metodyka wyboru zmiennych niezale ˙znych 97

W zaistniałej sytuacji konieczne jest opracowanie metodyki wyboru zmiennych, która pozwoliłaby skróci´c czas opracowywania modeli. Metodyk˛e wyboru wariantu zmiennej do przeprowadzenia modelowania przedstawiono na rycinie 5.3.

Procedura modelowania globalnego rynku nieruchomo´sci, tak jak modelowania poszczególnych subrynków ka ˙zdorazowo zaczyna si˛e od wst˛epnej selekcji zmien-nych. Ka ˙zda zmienna mierzona dost˛epno´sci ˛a analizowana jest samodzielnie pod k ˛atem wpływu na cen˛e m2 nieruchomo´sci. Tworzone jest 8 modeli regresji linio-wej w oparciu o 4 typy dost˛epno´sci oraz transformacj˛e logarytmiczn ˛a. Z 8 modeli do dalszej selekcji zmiennych brana jest tylko ta reprezentacja zmiennej, która była istotna statystycznie oraz tłumaczyła najwi˛ecej zmienno´sci ceny m2

nieruchomo-´sci. Dzi˛eki temu zabiegowi do dalszego kroku wyboru zmiennych przechodzi tylko jedna forma reprezentacji danej zmiennej.

Podobn ˛a procedur˛e przechodz ˛a zmienne charakteryzuj ˛ace s ˛asiedztwo. Tylko to s ˛asiedztwo jest brane do dalszej analizy, które tłumaczy najwi˛ecej zmienno´sci ceny.

5.2.3. Wybór zmiennych do modeli holistycznych

Na potrzeby modelowania holistycznego wewn ˛atrz miasta zastosowana została metoda przedstawiona na schemacie 5.3. W nast˛epnym kroku utworzony został mo-del regresji liniowej z u ˙zyciem regresji krokowej wstecznej, która polega na stop-niowym usuwaniu zmiennych silnie skorelowanych i nie wnosz ˛acych do modelu istotnej warto´sci dodanej. Zmienne usuwane s ˛a z uwzgl˛ednieniem kryterium infor-macyjnego Akaikego. Tak wybrane zmienne zostały wykorzystane do utworzenia wszystkich trzech modeli holistycznych (regresji liniowej, zgeneralizowanych mo-deli addytywnych oraz lasów losowych).

5.2.4. Wybór zmiennych do modeli subrynkowych

W przypadku modeli subrynków równie ˙z metoda wyboru zmiennych oparta jest o przedstawiony schemat 5.3, jednak w celu poprawy jako´sci modeli konieczna jest ekspercka weryfikacja. Wynika to z faktu, ˙ze w´sród zmiennych mog ˛a znale´z´c si˛e nieistotne z punktu widzenia danego subrynku - przykładowo wpływ logarytmu odległo´sci od katedry dla subrynku znajduj ˛acego si˛e na drugim ko ´ncu miasta. Zda-rzy´c si˛e mo ˙ze równie ˙z, ˙ze zostan ˛a uwzgl˛ednione równocze´snie wpływ odległo´sci od centrum i odległo´sci od rynku, dla których oszacowane warto´sci współczynnika kierunkowego b˛ed ˛a si˛e nawzajem znosi´c. W zwi ˛azku z powy ˙zszym w oparciu o wiedz˛e eksperck ˛a zmienne brane do modelowania atrakcyjno´sci zabudowy miesz-kalnej wewn ˛atrz subrynków zostaj ˛a okrojone z pierwotnie wybranych zmiennych niezale ˙znych tak, aby zmniejszy´c ich liczb˛e oraz poprawi´c (lub przynajmniej utrzy-ma´c na podobnym poziomie) współczynnik determinacji R2. Tak wybrane zmienne zostaj ˛a nast˛epnie wykorzystane w zgeneralizowanym modelowaniu addytywnym oraz lasów losowych.