Andrzej Muczyński
Podział zasobu nieruchomości
wspólnot mieszkaniowych z
wykorzystaniem drzewa
klasyfikacyjnego
Acta Scientiarum Polonorum. Administratio Locorum 9/4, 73-84
2010
Acta Sci. Pol., Administratio Locorum 9(4) 2010, 73-84
PO D Z IA Ł Z A SO B U N IE R U C H O M O Ś C I W SPÓ L N O T
M IE SZ K A N IO W Y C H Z W Y K O R Z Y S T A N IE M D R Z E W A
K L A SY FIK A C Y JN E G O
Andrzej Muczyński
Uniwersytet Warmińsko-Mazurski w Olsztynie
Streszczenie. W pracy przedstawiono wyniki badań dotyczące podziału zasobu nie
ruchomości wspólnot mieszkaniowych z wykorzystaniem metodyki tworzenia drzew
klasyfikacyjnych. Przedmiot badań stanowi populacja nieruchomości wspólnot miesz
kaniowych z udziałem miasta Olsztyna. Procedury badawcze zostały tak ukierunko
wane, aby wyniki klasyfikacji uwzględniały kryteria istotne z punktu widzenia racjo
nalnej gospodarki nieruchomościami komunalnymi. Uzyskane drzewo klasyfikacyjne
reprezentuje hierarchiczny układ maksymalnie jednorodnych podzbiorów obiektów
z minimalną liczbą węzłów generujących zbiór prostych reguł klasyfikacji. Z analiz
wynika, że w badanej populacji zdecydowanie dominują duże wspólnoty mieszka
niowe, co sprzyja poprawie efektywności gospodarowania. Stwierdzono ponadto, że
w przeważającej liczbie badanych wspólnot gmina utraciła większość udziałów wsku
tek rozproszonej prywatyzacji mieszkań komunalnych. Stan ten znacznie komplikuje
procesy decyzyjne w obszarze zarządzania nieruchomościami komunalnymi.
Słowa kluczowe: podział, wspólnoty mieszkaniowe, drzewa klasyfikacyjne, gospo
darka nieruchomościami komunalnymi
WPROWADZENIE
P o d z i a ł d a n e g o z b i o r u o b i e k t ó w c z y z j a w i s k n a w m i a r ę j e d n o r o d n e p o d z b i o r y z p u n k t u w i d z e n i a o k r e ś l o n e g o k r y t e r i u m o p a r t e g o n a c e c h a c h a n a l i z o w a n y c h p r z e d m i o t ó w n a z y w a s ię
k lasy fik acją
. D z i ę k i r e d u k c j i e n t r o p i i i m o ż l i w o ś c i f o r m u ł o w a n i a w n i o s k ó w u o g ó l n i a j ą c y c h p r o c e s t e n o d w z o r o w u j e p o d s t a w o w e c z y n n o ś c i p o z n a w c z e w y k o n y w a n e p r z e z c z ł o w i e k a . D o r o z w i ą z y w a n i a z a d a ń k l a s y f i k a c ji w y k o r z y s t y w a n e s ą m e t o d y t a k s o n o m i c z n e , t a k s o n o m i a j e s t b o w i e m d y s c y p l i n ą n a u k o w ą z a j m u j ą c ą s ię p r o b l e m a m i p o d z i a ł u , p o r z ą d k o w a n i a , g r u p o w a n i a lu b d y s k r y m i n a c j i . W r a m a c h te j d y s c y p l i n y w y r ó ż n i ć m o ż n ataksonom ię num eryczną
Adres do korespondencji - Corresponding author: Andrzej Muczyński, Katedra Gospo
darki Nieruchomościami i Rozwoju Regionalnego, Uniwersytet Warmińsko-Mazurski w Ol
sztynie, 10-724 Olsztyn, ul. Romana Prawocheńskiego 15, e-mail: amucz@uwm.edu.pl
74
( i l o ś c i o w ą ) isym boliczną
( j a k o ś c i o w ą ) . K l a s y c z n a t a k s o n o m i a n u m e r y c z n a ( t a k s o - n o m e t r i a ) p o s ł u g u j e s ię o b e c n i e p r a w i e w y ł ą c z n i e m e t o d a m i i l o ś c i o w y m i , w k t ó r y c h c e c h y o b i e k t ó w m i e r z o n e s ą n a s k a l a c h m o c n y c h , a m i a r y p o d o b i e ń s t w a o p a r t e n a o d l e g ł o ś c i w y r a ż o n e j z r e g u ł y f u n k c j a m i r z e c z y w i s t y m i . Z k o l e i t a k s o n o m i a s y m b o l i c z n a o b e j m u j e g r u p ę m e t o d k l a s y f i k a c j i c h a r a k t e r y z u j ą c y c h s i ę t y m , ż e i c h p r z e d m i o t e m s ą p r z e d e w s z y s t k i mobiekty sym boliczne
, k t ó r y c h c e c h y m a j ą c h a r a k t e r j a k o ś c i o w y i s ą r e p r e z e n t o w a n e p r z e z z m i e n n e m i e r z o n e w s k a l a c h s ł a b y c h : n o m i n a ln e j i p o r z ą d k o w e j . P o d e j ś c i e s y m b o l i c z n e p o z w a l a p o p r o s t u r o z s z e r z y ć p r z e d m i o t z a i n t e r e s o w a ń t a k s o n o m i i n a o b i e k t y o z ł o ż o n e j s t r u k t u r z e , d o k t ó r y c h z a l i c z y ć n a l e ż y n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h . W z b i o r z e m e t o d t a k s o n o m i i s y m b o l i c z n e j j e d n ą z p o d s t a w o w y c h m e t o d k l a s y f i k a c j i t a k i c h o b i e k t ó w j e s t m e t o d a o p a r t a n a b u d o w a n i u d r z e w k l a s y f i k a c y j n y c h ( d e c y z y j n y c h ) . C e l e m p r a c y j e s t d o k o n a n i e p o d z i a ł u z a s o b u n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z w y k o r z y s t a n i e m m e t o d y k i t w o r z e n i a d r z e w k l a s y f i k a c y j n y c h . O p r a c o w a n i e z a s a d h i e r a r c h i c z n e g o p o d z i a ł u b a d a n e g o z b i o r u m o ż e b y ć w y k o r z y s t a n e d o w s p o m a g a n i a d e c y z j i w p r o c e s a c h g o s p o d a r o w a n i a z a s o b a m i g m i n n y m i , w s z c z e g ó l n o ś c i w z a k r e s i e p o l i t y k i p r y w a t y z a c y j n e j i i n w e s t y c y j n e j . P r z e d m i o t b a d a ń s t a n o w i p o p u l a c j a n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m m i a s t a O l s z t y n a . P r o c e d u r y b a d a w c z e z o s t a ł y t a k u k i e r u n k o w a n e , a b y w y n i k i k l a s y f i k a c j i u w z g l ę d n i a ł y k r y t e r i a i s t o t n e z p u n k t u w i d z e n i a r a c j o n a l n e j g o s p o d a r k i n i e r u c h o m o ś c i a m i k o m u n a l n y m i . U z y s k a n e d r z e w o w i n n o r e p r e z e n t o w a ć h i e r a r c h i c z n y u k ł a d m a k s y m a l n i e j e d n o r o d n y c h p o d z b i o r ó w o b i e k t ó w - z p u n k t u w i d z e n i a p r z y j ę t y c h k r y t e r i ó w - p r z y m i n i m a l n e j l i c z b i e w ę z ł ó w d e c y z y j n y c h p r o w a d z ą c y c h d o z b i o r u m o ż l i w i e p r o s t y c h r e g u ł k l a s y f i k a c j i .DRZEWA KLASYFIKACYJNE JA K O M ETODA TAKSONOMII
SYM BOLICZNEJ
T a k s o n o m i a s y m b o l i c z n a d o s t a r c z a k o m p l e m e n t a r n y c h m e t o d k l a s y f i k a c j i w s t o s u n k u d o m e t o d k l a s y c z n e j t a k s o n o m e t r i i b ę d ą c y c h i c h r o z s z e r z e n i e m i u z u p e ł n i e n i e m . J e j m e t o d y s ą s t o s o w a n e w t e d y , g d y c h a r a k t e r d a n y c h s t a t y s t y c z n y c h n i e p o z w a l a n a w y k o r z y s t a n i e m e t o d n u m e r y c z n y c h . P o d o b i e ń s t w o p a r y o b i e k t ó w w t y m u j ę c i u u w z g l ę d n i a w ł a s n o ś c i p o z o s t a ł y c h o b i e k t ó w w z b i o r z e ( t z n . w y k o r z y s t u j e m i a r ę k o n t e k s t o w ą ) . W a ż n ą c e c h ą m e t o d s y m b o l i c z n y c h j e s t g e n e r o w a n i e i n f o r m a c j i w p o s t a c i d e k l a r a t y w n e j , a p o w s t a ł e w e f e k c i e p o d z i a ł u s k u p i e n i a s ą ł a t w i e j s z e d o i n t e r p r e t a c j i d z i ę k i z a s t o s o w a n i u d o i c h o p i s u w y r a ż e ń k o n i u n k c y j n y c h o p a r t y c h n a w a r t o ś c i a c h c e c h n a l e ż ą c y c h d o n i c h o b i e k t ó w . K l a s y o b i e k t ó w u z y s k a n e m e t o d a m i s y m b o l i c z n y m i m a j ą c h a r a k t e r n a t u r a l n y , g d y ż w i ę k s z o ś ć z n i c h o p i e r a s ię n a w y n i k a c h b a d a ń n a d k a t e g o r y z a c j ą d o k o n y w a n ą p r z e z l u d z i . M e t o d y s y m b o l i c z n e s ą p o z a t y m m n ie j w y m a g a j ą c e o d m e t o d n u m e r y c z n y c h , d o p u s z c z a j ą b o w i e m n i e z n a j o m o ś ć n i e k t ó r y c h c e c h l u b b r a k p r e c y z j i i c h p o m i a r u , j a k r ó w n i e ż s e k w e n c y j n e w ł ą c z a n i e o b i e k t ó w d o s t r u k t u r y k l a s . W p r z e c i w i e ń s t w i e d o t a k s o n o m i i n u m e r y c z n e j, k t ó r e j g ł ó w n e z a d a n i e p o l e g a n a z n a l e z i e n i u s t r u k t u r y k l a s , w r a m a c h t a k s o n o m i i s y m b o l i c z n e j r e a l i z o w a n e s ą j e d n o c z e ś n i e d w i e g r u p y c z y n n o ś c i [ G a t n a r 1 9 9 8 ] :75
podział na skupienia - wyodrębnienie jednorodnych grup obiektów (klas), i znale
zienie charakterystyki wydzielonych klas - opis klas za pom ocą odpowiednich pojęć
(zbiorów reguł przynależności obiektów do wyróżnionych klas).
Podstawy teoretyczne metodyki symbolicznego opisu obiektów opracowano na
początku lat osiemdziesiątych ubiegłego stulecia pod nazwą konceptualnej analizy
skupień [Michalski 1980]. Metodyka ta pozwala otrzymać zbiór skupień, z których
każde opisane jest przez koniunkcję wartości cech należących do nich obiektów.
Uzyskany zbiór reguł przynależności obiektów do klasy nazywany jest pojęciem.
Natomiast obiekty i klasy opisuje się za pom ocą wyrażeń koniunkcyjnych nazywa
nych kom pleksam i. Na przykład kompleks:
[typ nieruchomości = lokalowa] A [funkcja = mieszkalna] A [piętro = 2] A
[powierzchnia = 52]
reprezentuje nieruchomość lokalową o funkcji mieszkalnej położoną na drugim pię
trze o powierzchni 52 m2. W takim ujęciu nie muszą być znane wartości wszystkich
cech obiektu jak w przypadku taksonometrii, w której dane m ają postać macierzy.
Dodatkową zaletą tego podejścia jest stosowanie podobieństwa bardziej zrozum iałe
go przez ludzi.
Aktualnie znanych jest wiele algorytmów taksonomii symbolicznej w takich
dziedzinach, jak: sztuczna inteligencja, statystyka czy też teoria rozpoznawania
obrazów. Zostały one stworzone przez analogię do swoich odpowiedników opraco
wanych na gruncie taksonomii numerycznej. Algorytmy te dzielą się na trzy grupy
[Gatnar 1998]:
a) h ierarch iczn e - tworzące drzewo klas, w którym liście reprezentują poszcze
gólne obiekty, a węzły ich zbiory; klasy na wyższym poziomie drzewa zawierają
w sobie zbiory obiektów z poziomu niższego (np. algorytmy: EPAM, COBWEB,
CLASSIT, RUMMAGE itp.),
b) optym alizacyjno-iteracyjne - tworzące strukturę k klas, która jest optymalna ze
względu na pewne kryterium jakości podziału (np. algorytmy: CLUSTER, WITT),
c) tw orzące skupienia nierozłączne - w których klasy m ają części wspólne, tzn.
ten sam obiekt może należeć do więcej niż jednej kategorii (np. algorytmy:
UNIMEM i HIERARCH).
Większość metod taksonomii symbolicznej należy do metod hierarchicznych
związanych z tworzeniem drzew klas, w których konstruowanie reguł klasyfikacji
obiektów symbolicznych polega na dzieleniu w kolejnych krokach zbioru uczącego
na podzbiory tak długo, aż zostanie osiągnięta ich jednorodność ze względu na przy
należność do klas.
Pierwsze pomysły wykorzystania konstrukcji typu drzewo do reprezentowania
procesu tworzenia pojęć (reguł przynależności obiektów do klas) powstały w latach
sześćdziesiątych ubiegłego stulecia. Wówczas stworzono pierwszy algorytm budowy
drzew klasyfikacyjnych (decyzyjnych) o nazwie „Concept Learning System” (CLS),
w którym za pojęcie przyjęto regułę decyzyjną, która zastosowana do charaktery
styki obiektu mówi o tym, czy należy on do klasy o określonej nazwie [Hunt i in.
1966]. Kluczowym momentem w rozwoju tego typu metod było stworzenie algo
rytmu ID3 („Induction of Decision Trees”), którego udane zastosowania praktyczne
76
z w r ó c i ł y u w a g ę n a d r z e w a k l a s y f i k a c y j n e j a k o n a w y g o d n e n a r z ę d z i e k l a s y f i k a c j i d a n y c h [ Q u i n l a n 1 9 8 6 ] . I d e a d r z e w a k l a s y f i k a c y j n e g o p o l e g a n a s t o p n i o w y m p o d z i a l e z b i o r u o b i e k t ó w n a p o d z b i o r y t a k d ł u g o , a ż z o s t a n i e o s i ą g n i ę t a i c h j e d n o r o d n o ś ć z e w z g l ę d u n a p r z y n a l e ż n o ś ć d o k l a s . W y g l ą d d r z e w a j e s t z b l i ż o n y d o g r a f u . D r z e w o k l a s y f i k a c y j n e s k ł a d a s i ę zk o rz en ia
, z k t ó r e g o w y c h o d z ą c o n a j m n i e j d w i e k r a w ę d z i e d o w ę z ł ó w l e ż ą c y c h n a n i ż s z y m p o z i o m i e . Z k a ż d y m w ę z ł e m z w i ą z a n e j e s t p y t a n i e o w a r t o ś c i c e c h , j e ś l i p e w i e n o b i e k t j e p o s i a d a , t o p r z e n o s i s ię g o w d ó ł o d p o w i e d n i ą k r a w ę d z i ą . W ę z ły , z k t ó r y c h n i e w y c h o d z ą j u ż ż a d n e k r a w ę d z i e , s ą o k r e ś l a n e j a k o l i ś c i e , r e p r e z e n t u j ą k l a s y . W f o r m a l n y m u j ę c i u , d r z e w o j e s t g r a f e m b e z c y k l i ( p ę t l i ) , w k t ó r y m i s t n i e j e t y l k o j e d n a ś c i e ż k a m i ę d z y d w o m a r ó ż n y m i w ę z ł a m i . O z n a c z a t o , ż e d r z e w o j e s t g r a f e m s p ó j n y m , c z y l i n i e m o ż n a g o p r z e d s t a w i ć w p o s t a c i s u m y g r a f ó w . Z g o d n i e z d r u g ą d e f i n i c j ą :drzewo klasyfikacyjne je st drzew em rep rezen tu jącym
proces podziału zbioru obiektów n a jed n o ro d n e k lasy
. J e g o w e w n ę t r z n e w ę z ł y o p i s u j ą s p o s ó b d o k o n a n i a t e g o p o d z i a ł u w o p a r c i u o w a r t o ś c i c e c h o b i e k t ó w , a l iś c i e o d p o w i a d a j ą k l a s o m , d o k t ó r y c h n a l e ż ą o b i e k t y . Z k o l e i k r a w ę d z i e d r z e w a r e p r e z e n t u j ą w a r t o ś c i c e c h , n a p o d s t a w i e k t ó r y c h d o k o n a n o p o d z i a ł u [ G a t n a r 1 9 9 8 ] . Z g e o m e t r y c z n e g o p u n k t u w i d z e n i a d r z e w a k l a s y f i k a c y j n e s ą p o d o b n e d o l i n i o w y c h f u n k c j i d y s k r y m i n a c y j n y c h , p o n i e w a ż t a k ż e d z i e l ą w i e l o w y m i a r o w ą p r z e s t r z e ń c e c h h i p e r p ł a s z c z y z n a m i , p o t o b y w y o d r ę b n i ć h o m o g e n i c z n e s k u p i s k a o b i e k t ó w . N a p r z y k ł a d p o s i a d a j ą c z b i ó r o b i e k t ó w o p i s a n y c h p r z e z d w i e c e c h y i l o ś c i o w e x, y n a l e ż ą c e d o j e d n e j z t r z e c h k l a s : a , b , c , m o ż n a z b u d o w a ć j e d n o w y m i a r o w e d r z e w o k l a s y f i k a c y j n e . M o ż e o n o w y g l ą d a ć j a k n a r y s u n k u 1 ( o b o k d r z e w a z a z n a c z o n o d o d a t k o w o l i n i e o d d z i e l a j ą c e k l a s y w p r z e s t r z e n i c e c h ) . 3. 5 a a a a a a a a a b b b b b b b b b b b b b b b b b b b b b b c c c c c c c c 2. 1 2. 9 xRys.1. Geometryczna interpretacja drzewa klasyfikacyjnego
Fig. 1. Geometrical interpretation of classification tree
Źródło - Source: Gatnar E. 1998. Symboliczne metody klasyfikacji danych. PWN,
Warszawa
D r z e w a k l a s y f i k a c y j n e g e n e r u j ą w p r o s t y s p o s ó b r e g u ł y p r z y n a l e ż n o ś c i o b i e k t ó w d o k a ż d e j z k l a s . M o g ą b y ć p o s t r z e g a n e w p r o s t j a k o z b i ó r r e g u ł k l a s y f i k a c j i w d y s j u n k c y j n e j p o s t a c i n o r m a l n e j p o z w a l a j ą c e j n a ł ą c z e n i e r o z ł ą c z n y c h z b i o r ó w o b i e k t ó w w t y c h s a m y c h k l a s a c h . Ś c i e ż k a p r o w a d z ą c a o d k o r z e n i a d o l i ś c i a r e p r e z e n t u j e k o n i u n k c j ę t e s t ó w ( k o m p l e k s ) , n a t o m i a s t j e ś l i d o s a m e j k l a s y p r o w a d z i k i l k a ś c i e ż e k , to m o ż n a j e t r a k t o w a ć j a k o s k ł a d n i k i a l t e r n a t y w y . P r z y k ł a d o w e d r z e w o n a r y s u n k u 1 z a w i e r a t r z y r e g u ł y k l a s y f i k a c j i :77
y > 3,5
ax < 2,1 ::> a,
(y > 3,5
ax > 2,1)
v(y
<3,5
ax < 2,9) ::> b,
y < 3,5
ax > 2,9 ::> c.
Wykorzystanie stworzonego drzewa do sklasyfikowania nowego obiektu polega
na tym, że poczynając od korzenia przechodzi się od wierzchołka do wierzchołka
wzdłuż krawędzi drzewa odpowiadających wartościom cech klasyfikowanego obiek
tu. W takim ujęciu często nie jest wymagana znajomość wszystkich cech obiektu,
co znacznie podnosi praktyczną użyteczność tej metody klasyfikacji. Dotyczy to
w szczególności klasyfikacji nieruchomości, gdyż w analizach nie dysponujemy czę
sto kompletem informacji o badanym obiekcie oraz posiadamy informacje o zróżni
cowanym charakterze (jakościowo-ilościowym).
PROCEDURY TW ORZENIA DRZEW KLASYFIKACYJNYCH
Tworzenie drzew klasyfikacyjnych odbywa się poprzez rekurencyjny podział
zbioru uczącego na podzbiory aż do uzyskania ich jednorodności ze względu na
przynależność obiektów do klas. Głównym celem ich tworzenia je st uzyskanie m ak
symalnie jednorodnych podzbiorów obiektów z punktu widzenia zmiennej zależnej
[Łapczynski 2003]. W trakcie ich konstruowania chodzi również o to, by drzewo
było jak najmniejsze, a reguły klasyfikacji jak najprostsze. Większość znanych m e
tod tworzenia drzew klasyfikacyjnych ma podobną konstrukcję, gdyż wywodzi się
z trzech klasycznych algorytmów, do których zalicza się wspomniane algorytmy
CLS i ID3 oraz algorytm o nazwie „Classification and Regression Trees” (C&RT)
rozpropagowany przez Briemana i in. [1984]. Metody tworzenia drzew klasyfikacyj
nych mogą prowadzić do budowy drzew b in arn y ch i nieb in arn ych . W przypadku
drzew binarnych z jednego wewnętrznego węzła wychodzą tylko dwie krawędzie,
czyli każdy zbiór obiektów dzieli się na dwa rozłączne podzbiory. Drzewa takie
najczęściej występują w przypadku klasyfikacji obiektów o cechach ilościowych,
których wartości podlegają dyskretyzacji. Drzewa niebinarne w yróżniają się nato
miast tym, że z jednego węzła wychodzą więcej niż dwie krawędzie (zbiór obiektów
można podzielić na więcej niż dwa rozłączne podzbiory). Najczęściej występują one
w przypadku klasyfikacji obiektów o cechach jakościowych, które m ają odpowied
nio liczne zbiory wartości. W yróżnia się ponadto metody budowy drzew jednow y
miarowych (podział zbioru obiektów następuje na podstawie pojedynczych cech)
oraz wielowymiarowych, gdzie podział zbioru obiektów następuje na podstawie
kombinacji liniowych analizowanych cech.
Ogólna procedura tworzenia drzewa klasyfikacyjnego - w nawiązaniu do algo
rytmu C&RT - obejmuje następujące kroki [Gatnar 1998]:
a) sprawdzenie czy dany zbiór obiektów S należy do tej samej klasy, jeśli tak to na
tym etapie kończymy pracę, jeśli nie - przechodzimy do punktu nr b,
b) określenie wszelkich możliwych podziałów zbioru S na podzbiory S7, S2, ..., Sn,
tak aby podzbiory te były jak najbardziej jednorodne,
78
c ) p r z e p r o w a d z e n i e o c e n y j a k o ś c i k a ż d e g o z t y c h p o d z i a ł ó w z g o d n i e z p r z y j ę t y m k r y t e r i u m i w y b ó r n a j l e p s z e g o z n ic h , d ) d o k o n a n i e p o d z i a ł u z b i o r u S w w y b r a n y s p o s ó b , e ) w y k o n a n i e k r o k ó w 1 - 4 r e k u r e n c y j n i e d l a k a ż d e g o z p o d z b i o r ó w . P o d z i a ł z b i o r u S d o k o n y w a n y w c z w a r t y m k r o k u n a s t ę p u j e w o p a r c i u o w a r t o ś c i c e c h c h a r a k t e r y z u j ą c y c h o b i e k t y . J e d n a k c e c h y te n i e m o g ą b y ć w y b i e r a n e l o s o w o , p o n i e w a ż m o g ł o b y t o d o p r o w a d z i ć d o s y t u a c j i , w k t ó r e j l i c z b a l i ś c i d r z e w a k l a s y f i k a c y j n e g o r ó w n a ł a b y s ię l i c z b i e o b i e k t ó w . S t ą d t e ż p r z y w y b o r z e c e c h b ę d ą c y c h p o d s t a w ą p o d z i a ł u s t o s o w a n e s ą r ó ż n e m i a r y s t a t y s t y c z n e l u b m e t o d y o p a r t e n a t e o r i i i n f o r m a c j i . P o d c z a s b u d o w a n i a d r z e w a k l a s y f i k a c y j n e g o m o ż n a p o m i n ą ć f r a g m e n t y , k t ó r e m a j ą n i e w i e l k i e z n a c z e n i e d l a j a k o ś c i r e z u l t a t ó w k l a s y f i k a c j i ( p o r z ą d k o w a n i e d r z e w a ) . W a l g o r y t m i e C & R T n a j p i e r w t w o r z y s i ę p e ł n e d r z e w o k l a s y f i k a c y j n e , n i e z a l e ż n i e o d r o z m i a r ó w j a k i e b y o s i ą g n ę ł o , a n a s t ę p n i e d o k o n u j e s ię p o r z ą d k o w a n i a , c z y l i u s u w a n e s ą p e w n e f r a g m e n t y d r z e w a , w t a k i s p o s ó b , a b y w r a z z e z m n i e j s z a n i e m s i ę j e d n o r o d n o ś c i k l a s n i e w z r a s t a ł b ł ą d k l a s y f i k a c j i . S z c z e g ó ł o w e p r o b l e m y d o r o z w i ą z a n i a p r z e d k a ż d y m a l g o r y t m e m t w o r z e n i a d r z e w a k l a s y f i k a c y j n e g o o b e j m u j ą u d z i e l e n i e o d p o w i e d z i n a n a s t ę p u j ą c e p y t a n i a : - w j a k i s p o s ó b w y b r a ć j e d n ą l u b k i l k a c e c h , w o p a r c i u o k t ó r e n a s t ą p i p o d z i a ł z b i o r u o b i e k t ó w n a k l a s y ( p r o b l e m m i a r j a k o ś c i p o d z i a ł u - j e d n o r o d n o ś c i l u b z r ó ż n i c o w a n i a ) ? - w j a k i m m o m e n c i e z a p r z e s t a ć d a l s z e g o p o d z i a ł u p o d z b i o r ó w o b i e k t ó w , t a k a b y u z y s k a ć d r z e w o o m i n i m a l n e j l i c z b i e w ę z ł ó w , n i e o b n i ż a j ą c p r z y t y m j a k o ś c i k l a s y f i k a c j i ( p r o b l e m p o r z ą d k o w a n i a d r z e w a ) ? - w j a k i s p o s ó b p r z y d z i e l i ć o b i e k t y z n a j d u j ą c e s ię w l i ś c i u d r z e w a d o p e w n e j k l a s y ? P o r o z w i ą z a n i u t y c h p r o b l e m ó w p o w s t a ł e d r z e w o k l a s y f i k a c y j n e w i n n o c h a r a k t e r y z o w a ć s ię m a k s y m a l n ą j e d n o r o d n o ś c i ą u z y s k a n y c h p o d z b i o r ó w ( k l a s ) o b i e k t ó w i m i n i m a l n ą l i c z b ą w ę z ł ó w p r o w a d z ą c y c h d o z b i o r u m o ż l i w i e p r o s t y c h r e g u ł k l a s y f i k a c j i .MATERIAŁ, METODY I PR ZE B IEG BADAŃ
P r z e d m i o t k l a s y f i k a c j i s t a n o w i z a s ó b n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m m i a s t a O l s z t y n a . N a p o d s t a w i e i n f o r m a c j i w y j ś c i o w y c h - u z y s k a n y c h o d j e d n o s t k i z a r z ą d z a j ą c e j - s t w i e r d z o n o , ż e b a d a n y z a s ó b w s p ó l n o t m i e s z k a n i o w y c h s k ł a d a s ię z 6 8 6 o b i e k t ó w c h a r a k t e r y z u j ą c y c h s i ę z n a c z n y m z r ó ż n i c o w a n i e m t a k i c h a t r y b u t ó w , j a k : l i c z b a l o k a l i w p o s z c z e g ó l n y c h o b i e k t a c h , w i e l k o ś ć u d z i a ł u w ł a s n o ś c i k o m u n a l n e j , f u n k c j e i s p o s ó b w y k o r z y s t a n i a l o k a l i g m i n n y c h , j a k r ó w n i e ż w a l o r y l o k a l i z a c y j n e p o s z c z e g ó l n y c h o b i e k t ó w i s t a n t e c h n i c z n y z a b u d o w y . C e le m p r o c e d u r k l a s y f i k a c j i j e s t w y d z i e l e n i e w m i a r ę j e d n o r o d n y c h k l a s b a d a n y c h n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m g m in y z u w z g l ę d n i e n i e m k r y t e r i ó w i s t o t n y c h z p u n k t u w i d z e n i a r a c j o n a l n e j g o s p o d a r k i n i e r u c h o m o ś c i a m i . P o d z i a ł b a d a n e g o z a s o b u n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h p r z e p r o w a d z o n o z a p o m o c ą d r z e w a k l a s y f i k a c y j n e g o j a k o j e d n e j z h i e r a r c h i c z n y c h m e t o d k l a s y f i k a c j i w y r ó ż n i a n y c h w r a m a c h t a k s o n o m i i s y m b o l i c z n e j . A n a l i z y w y k o n a n o
79
z w y k o r z y s t a n i e m p r o g r a m u k o m p u t e r o w e g o S t a t i s t i c a . p l 8 . 0 F i r m y S t a t S o f t , w t y m s z c z e g ó l n i e a p l i k a c j i m e t o d y „ C & R T w y c z e r p u j ą c e g o p o s z u k i w a n i a p o d z i a ł ó w j e d n o w y m i a r o w y c h ” [ S t a t S o f t , 2 0 0 1 ] . P r o c e s b u d o w y d r z e w a k l a s y f i k a c y j n e g o p r z e p r o w a d z o n o m e t o d ą i n t e r a k t y w n ą p o l e g a j ą c ą n a p o ł ą c z e n i u w i e d z y e k s p e r c k i e j b a d a c z a z a u t o m a t y c z n y m i p r o c e d u r a m i a l g o r y t m u n u m e r y c z n e g o . W t r a k c i e b u d o w y d r z e w a k l a s y f i k a c y j n e g o p o c z ą t k o w y w y b ó r z m i e n n y c h i p i e r w s z e ( p o d z i a ł y ) g a ł ę z ie z o s t a ł y e k s p e r y m e n t a l n i e z a p r o j e k t o w a n e p r z e z b a d a c z a . D a l s z e p o d z i a ł y i g a ł ę z ie d r z e w a u z y s k a n o a u to m a t y c z n i e . W p i e r w s z y m e t a p i e b a d a ń d o b r a n o i o p i s a n o c e c h y d i a g n o s t y c z n e n i e z b ę d n e d o k l a s y f i k a c j i n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m m i a s t a O l s z t y n a . N a s t ę p n i e z e b r a n o n i e z b ę d n e d a n e ź r ó d ł o w e , w y k o r z y s t u j ą c i n f o r m a c j e z r e j e s t r ó w p r o w a d z o n y c h p r z e z j e d n o s t k i g m i n n e i z w y w i a d u t e r e n o w e g o . W y b i e r a j ą c c e c h y , w z i ę t o p o d u w a g ę c e l k l a s y f i k a c j i , w z g l ę d y m e r y t o r y c z n e w y n i k a j ą c e z g o s p o d a r k i n i e r u c h o m o ś c i a m i , p r z e s ł a n k i s t a t y s t y c z n e o r a z k o m p l e t n o ś ć i w i a r y g o d n o ś ć i n f o r m a c j i ź r ó d ł o w y c h . W e f e k c i e t y c h z a b i e g ó w s f o r m u ł o w a n o z e s t a w c e c h o p i s u j ą c y c h b a d a n y z b i ó r o b i e k t ó w o b e j m u j ą c y n a s t ę p u j ą c e z m i e n n e : a ) „ r o d z a j w s p ó l n o t y m i e s z k a n i o w e j ” - X i> b ) „ u d z i a ł w ł a s n o ś c i g m i n y w e w s p ó l n o c i e m i e s z k a n i o w e j ” - X 2! c ) „ t y p f u n k c j o n a l n y n i e r u c h o m o ś c i w s p ó l n o t y m i e s z k a n i o w e j ” - X 3. P r z y j ę t o , ż e c e c h a X j p r z y j m u j e d w i e w a r t o ś c i : „ m a ł a w s p ó l n o t a m i e s z k a n i o w a ” ( w p r z y p a d k u g d y ł ą c z n a l i c z b a l o k a l i l i w e w s p ó l n o c i e j e s t m n i e j s z a n i ż o s i e m ) o r a z „ d u ż a w s p ó l n o t a m i e s z k a n i o w a ” ( j e ś l i ł ą c z n a l i c z b a l o k a l i l i w e w s p ó l n o c i e w y n o s i o s i e m l u b w i ę c e j ) . C e c h a t a j e s t k l u c z o w ą z m i e n n ą k l a s y f i k a c y j n ą , g d y ż w o b u r o d z a j a c h w s p ó l n o t w y s t ę p u j ą o d m i e n n e p r o c e d u r y z a r z ą d z a n i a n i e r u c h o m o ś c i ą w s p ó l n ą . Z k o l e i c e s z e o p i s u j ą c e j „ u d z i a ł w ł a s n o ś c i g m in y w e w s p ó l n o c i e m i e s z k a n i o w e j ” - X 2 n a d a n o d w a g ł ó w n e p o z i o m y w a r t o ś c i : - m n i e j s z o ś c i o w y ( g d y u d z i a ł g m i n y w e w s p ó l n o c i e u t j e s t m n i e j s z y n i ż 5 0 % ) , - w i ę k s z o ś c i o w y ( g d y u d z i a ł g m i n y w e w s p ó l n o c i e u t w y n o s i 5 0 % lu b w i ę c e j) . P o z i o m w i ę k s z o ś c i o w y c e c h y X 2 n a p o t r z e b y k l a s y f i k a c j i d o d a t k o w o p o d z i e l o n o - w u j ę c i u h i e r a r c h i c z n y m - n a p o d p o z i o m p r z e w a ż a j ą c y ( g d y u d z i a ł g m i n y w e w s p ó l n o c i e u t w y n o s i 5 0 % l u b w i ę c e j , a le n i e p r z e k r a c z a 8 0 % ) i p o d p o z i o m d o m i n u j ą c y ( g d y u d z i a ł g m in y u t w y n o s i 8 0 % l u b w i ę c e j ) . T a k i s p o s ó b d y s k r e t y z a c j i c e c h y X 2 w y n i k a z e z r ó ż n i c o w a n i a r e g u ł p o d e j m o w a n i a d e c y z j i g o s p o d a r o w a n i a w e w s p ó l n o c i e m i e s z k a n i o w e j z p u n k t u w i d z e n i a g m i n y j a k o w s p ó ł w ł a ś c i c i e l a . O s t a t n i a c e c h a o p i s u j e „ t y p f u n k c j o n a l n y n i e r u c h o m o ś c i w s p ó l n o t y m i e s z k a n i o w e j ” . J e s t to k l a s y c z n a c e c h a j a k o ś c i o w a , k t ó r e j w a r t o ś c i n o m i n a l n e p r z y p i s a n o w z a l e ż n o ś c i o d u k ł a d u ( k o m b i n a c j i ) f u n k c j i l o k a l i g m i n n y c h w p o s z c z e g ó l n y c h n i e r u c h o m o ś c i a c h w s p ó l n o t . P r a k t y c z n i e c e c h a X 3 m o ż e p r z y j m o w a ć w n i e r u c h o m o ś c i a c h w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m m i a s t a O l s z t y n a d z i e s i ę ć p o z i o m ó w w a r t o ś c i : 1) „ l o k a l e m i e s z k a l n e g m i n y ” - t y p m ; 2 ) „ l o k a l e u ż y t k o w e g m in y o f u n k c j a c h k o m e r c y j n y c h ” - t y p k ; 3 ) „ l o k a l e u ż y t k o w e g m in y o f u n k c j a c h u ż y t e c z n o ś c i p u b l i c z n e j ” - t y p p ; 4 ) „ l o k a l e m i e s z k a l n e z l o k a l a m i s o c j a l n y m i ” - t y p m s ; 5 ) „ l o k a l e m i e s z k a l n e z l o k a l a m i u ż y t k o w y m i o f u n k c j a c h k o m e r c y j n y c h ” - t y p m k ;80
6 ) „ l o k a l e m i e s z k a l n e z l o k a l a m i u ż y t k o w y m i o f u n k c j a c h u ż y t e c z n o ś c i p u b l i c z n e j ” - t y p m p ; 7 ) „ l o k a l e u ż y t k o w e o f u n k c j a c h k o m e r c y j n y c h i u ż y t e c z n o ś c i p u b l i c z n e j ” - t y p k p ; 8 ) „ l o k a l e m i e s z k a l n e , s o c j a l n e i u ż y t k o w e o f u n k c j a c h k o m e r c y j n y c h ” - t y p m s k ; 9 ) „ l o k a l e m i e s z k a l n e , s o c j a l n e i u ż y t k o w e o f u n k c j a c h u ż y t e c z n o ś c i p u b l i c z n e j -t y p ” m s p ; 1 0 ) „ l o k a l e m i e s z k a l n e , u ż y t k o w e o f u n k c j a c h k o m e r c y j n y c h i u ż y t e c z n o ś c i p u b -l i c z . ” - t y p m k p . I n f o r m a c j e o w a r t o ś c i a c h c e c h y - t y p a c h f u n k c j o n a l n y c h l o k a l i s t a n o w i ą c y c h w ł a s n o ś ć g m in y w p o s z c z e g ó l n y c h w s p ó l n o t a c h - s ą i s t o t n e z p u n k t u w i d z e n i a c e l u p r z e p r o w a d z o n e j k l a s y f i k a c j i , g d y ż r z u t u j ą n a s p o ł e c z n o - e k o n o m i c z n e a s p e k t y g o s p o d a r k i n i e r u c h o m o ś c i a m i , w t y m n a p o l i t y k ę c z y n s z o w ą i p r y w a t y z a c y j n ą w z a s o b a c h g m i n n y c h . W d r u g i m e t a p i e b a d a ń p r z e p r o w a d z o n o w ł a ś c i w ą k l a s y f i k a c j ę z a s o b u n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m m i a s t a O l s z t y n a , b u d u j ą c d o t e g o c e l u o d p o w i e d n i e d r z e w o k l a s y f i k a c y j n e . P r o c e s t w o r z e n i a t e g o d r z e w a p r z e p r o w a d z o n o m e t o d ą i n t e r a k t y w n ą p o l e g a j ą c ą n a p o ł ą c z e n i u w i e d z y e k s p e r c k i e j ( w p i e r w s z e j f a z i e p o d z i a ł u ) z a u t o m a t y c z n y m i p r o c e d u r a m i a l g o r y t m u C & R T w y c z e r p u j ą c e g o p o s z u k i w a n i a p o d z i a ł ó w j e d n o w y m i a r o w y c h . P r o c e s p o d z i a ł u k o n t y n u o w a n o d o m o m e n t u u z y s k a n i a j e d n o r o d n o ś c i w s z y s t k i c h w ę z ł ó w k o ń c o w y c h . T e w ę z ł y k o ń c o w e , k t ó r y c h l i c z e b n o ś ć n i e p r z e k r a c z a ł a p i ę c i u p r z y p a d k ó w ( n i e r u c h o m o ś c i ) z o s t a ł y z a a g r e g o w a n e w w ę z ł a c h k o ń c o w y c h n i e j e d n o r o d n y c h o n a z w i e „ i n n e ” . D o o k r e ś l e n i a p o ż ą d a n e j m i n i m a l n e j l i c z b y p r z y p a d k ó w j a k o k r y t e r i u m z a t r z y m a n i a p r o c e s u p o d z i a ł ó w w y k o r z y s t a n o w a l g o r y t m i e C & R T o p c j ę „ m i n i m a l n e ” n . W y k o r z y s t u j ą c p r o c e s b u d o w y i u p o r z ą d k o w a n i a d r z e w a k l a s y f i k a c y j n e g o , u z y s k a n o m a k s y m a l n i e j e d n o r o d n e p o d z b i o r y n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z p u n k t u w i d z e n i a p r z y j ę t y c h k r y t e r i ó w p o d z i a ł u . S t w o r z o n e d r z e w o u m o ż l i w i a o p r a c o w a n i e w ł a t w y s p o s ó b z b i o r u m o ż l i w i e p r o s t y c h r e g u ł k l a s y f i k a c j i w p o s t a c i k o n i u n k c j i k i l k u w a r u n k ó w l o g i c z n y c h .W YNIKI BADAŃ I DYSKUSJA
Z a s t o s o w a n e p r o c e d u r y b a d a w c z e d o p r o w a d z i ł y d o u z y s k a n i a d r z e w a k l a s y f i k a c y j n e g o n i e r u c h o m o ś c i w s p ó l n o t m i e s z k a n i o w y c h z u d z i a ł e m m i a s t a O l s z t y n a ( r y s . 2 ). A n a l i z u j ą c a r c h i t e k t u r ę t e g o d r z e w a , m o ż n a o g ó l n i e s t w i e r d z i ć , ż e j e s t o n o n i e b i n a r - n e . W y n i k a t o s t ą d , ż e o s t a t n i e k r y t e r i u m p o d z i a ł u - o p i s a n e c e c h ą X 3 - m ia ł o c h a r a k t e r j a k o ś c i o w y o l i c z e b n o ś c i z b i o r u w a r t o ś c i p r z e k r a c z a j ą c e j l i c z b ę 2 . P o p r a w n i e p r z e p r o w a d z o n a k l a s y f i k a c j a b a d a n e g o z b i o r u o b i e k t ó w d o p r o w a d z i ł a d o p o w s t a n i a d r z e w a s k ł a d a j ą c e g o s i ę z j e d n e g o w ę z ł a ź r ó d ł o w e g o n a p o c z ą t k u d r z e w a ( n a r y s u n k u o z n a c z o n e g o n r 1), d z i e s i ę c i u w ę z ł ó w ( p o d z i a ł ó w ) w e w n ę t r z n y c h ( n r : 2 , 3 , 4 , 5 , 6 , 7 , 1 4 , 1 5 , 1 6 i 1 7 ) o r a z d z i e w i ę t n a s t u w ę z ł ó w k o ń c o w y c h ( l i ś c i ) - n r : 8 , 9 , 10, 1 1 , 1 2 , 1 3 , 1 8 , 1 9 , 2 0 , 2 1 , 2 2 , 2 3 , 2 4 , 2 5 , 2 6 , 2 7 , 2 8 , 2 9 i 3 0 . W ę z e ł ź r ó d ł o w y ( n a d r z ę d n y o l i c z e b n o ś c i 6 8 6 o b i e k t ó w ) d z i e l i z a s ó b n i e r u c h o m o ś c i w s p ó l n o t n a d w a w ę z ł y p o d r z ę d n e ( p o t o m k ó w ) , z k t ó r y c h l e w y ( n r 2 ) r e p r e z e n t u j e p o d z b i ó r m a ł y c h