NR 508 STUDIA INFORMATICA NR 22 2008
WALDEMAR WOLSKI
KLASYFIKACJA ROZMYTA
W OCENIE POZIOMU ZAAWANSOWANIA ORGANIZACJI DO DZIAàANIA W INTERNECIE
Wprowadzenie
Próba oceny zdolnoĞci i poziomu zaawansowania organizacji do dziaáania w sieci oraz planowanie przyszáych dziaáaĔ, które pozwoliáyby na gáadkie prze-chodzenie do internetowego biznesu, wymaga okreĞlenia zakresu podstawo-wych badaĔ. W tym celu dokonano klasyfikacji przedsiĊbiorstw, rozpatrując cztery grupy czynników diagnostycznych jako zmienne1, i skonstruowano tak-sonomiczny miernik rozwoju2 do ich oceny. Miernik ten jest wielkoĞcią synte-tyczną bĊdącą wypadkową wszystkich cech (zmiennych) z poszczególnych firm i organizacji dziaáających w róĪnych sektorach gospodarki, pozwala on okreĞliü poziom ich zaawansowania w realizacji przedsiĊwziĊü e-biznesowych. Nato-miast te same czynniki analizowane na poziomie firmy i organizacji umoĪliwią okreĞlenie stopnia zaawansowania do dziaáaĔ w sieci i poziomu sprawnoĞci w planowaniu przedsiĊwziĊü w nowej gospodarce.
1
Dane Ĩródáowe do badaĔ pozyskano, dziĊki internetowej aplikacji, którą moĪna urucho-miü pod adresem http://szafir.univ.szczecin.pl/~wwolski/ankieta/ankieta.html.
2
Proces analizy przeprowadzono za pomocą metody klasyfikacji rozmytej, stosując wa-riant algorytmu ISODATA, por. G.H. Ball, D.J. Hall, A clustering technique for summarizing multivariate data, „Behavioral Science” 1987, nr 12.
1. Klasyfikacja sektorów gospodarki metodą rozmytą
Proces konstruowania taksonomicznego miernika rozwoju w klasyfikacji rozmytej sprowadza siĊ do grupowania obiektów w sytuacji, gdy granice miĊ-dzy wydzielonymi grupami obiektów mogą byü „nieostre”, to znaczy rozmyte. JeĪeli mamy macierz obserwacji obiektów3, w której kaĪdy z obiektów
x
i jestopisany przez wartoĞci cech diagnostycznych
x
k (k = 1..., n), to moĪemy okreĞ-liü rodzinĊ zbiorów rozmytych K1... KP, gdzie liczba P jest z góry okreĞlona w przedziale 1 < P < N, oraz funkcjĊ fK(xi) : U- > [0,1], gdziex
i U,odwzo-rowującą przynaleĪnoĞü kaĪdego obiektu do zbioru rozmytego, przy czym K speánia nastĊpujące zaáoĪenia:
1 0d fip d , dla i = (1, ..., n), p = (1, ..., N) 1 1 ¦N p ip f , dla i = (1, ..., n) (1) 0 1 ! ¦n i ip f , dla p = (1, ..., N), gdzie:
p – liczba klas rozmytych,
ip
f
– funkcja (stopieĔ) przynaleĪnoĞci i-tego obiektu do p-tej klasy roz-mytej.Dokonanie klasyfikacji przynaleĪnoĞci obiektów do klas rozmytych mo-Īemy dokonaü, stosując iteracyjną metodĊ opartą na pojĊciu waĪonego Ğrodka ciĊĪkoĞci. Punktem wyjĞcia tej metody jest okreĞlenie liczby klas rozmytych oraz wartoĞci początkowych funkcji przynaleĪnoĞci speániającej warunek (1), pozwalającej iteracyjnie wyznaczyü waĪony Ğrodek ciĊĪkoĞci kaĪdej nowej klasy rozmytej nastĊpująco:
3
Obiekty reprezentowane są przez przedsiĊbiorstwa/firmy naleĪące do wybranych sekto-rów gospodarki.
K ..., 2, 1, k P ..., 2, 1, p dla ) ( ) ( 1 2 1 1 2 1 ¦ ¦ N i r ip N i ik r ip r pk f z f g gdzie: ip
f – funkcja (stopieĔ) przynaleĪnoĞci i-tego obiektu do p-tej klasy rozmytej,
ik
z
– znormalizowana wartoĞü k-tej zmiennej w i-tym obiekcie,r pk
g – znormalizowana wartoĞü k-tej cechy dla rozmytego Ğrodka ciĊĪ-koĞci p-tej klasy w r-tym kroku algorytmu.
Mając wyliczone rozmyte Ğrodki ciĊĪkoĞci w r-tej iteracji, moĪemy wy-znaczyü odlegáoĞci i-tego obiektu od Ğrodka ciĊĪkoĞci p-tej klasy rozmytej na-stĊpująco: 2 1 2 1
)
(
»
¼
º
«
¬
ª
¦
r pk K k ik r ipz
g
d
gdzie: r ipd – odlegáoĞü i-tego obiektu od Ğrodka ciĊĪkoĞci p-tej klasy w r-tym kroku.
NastĊpnie wyznaczamy nową wartoĞü funkcji przynaleĪnoĞci dla nowej kasy rozmytej, zakáadając:
jeĞli wyliczona odlegáoĞü dipr z , to 0
K ..., 2, 1, k P ..., 2, 1, p dla ) ( ) ( 1 1 1 ¦ N i r ip r ip r ip d d f (4) (2) (3)
jeĞli wyliczona odlegáoĞü dipr = 0, to ¯ ® zk p gdy k p gdy fr ip , , 0 , , 1 (5)
JeĞli obliczone wartoĞci (co do wartoĞci bezwzglĊdnej) z nastĊpnej i po-przedniej funkcji przynaleĪnoĞci bĊdą siĊ róĪniü nieznacznie o wartoĞü bliską
zeru, speániając nierównoĞü
^
r`
d Hip r ip f f p i 1 max , , dla
H
> 0, to koĔczymy iteracjĊ, w przeciwnym razie obliczamy wartoĞü funkcji przynaleĪ-noĞci nowej klasy rozmytej.2. Klasyfikacja obiektów do klas rozmytych
KlasyfikacjĊ przynaleĪnoĞci obiektów do klas rozmytych wykonano, sto-sując iteracyjną metodĊ wedáug algorytmu ISODATA. Punktem wyjĞcia dla tej metody jest okreĞlenie początkowej liczby klas rozmytych – naturalnym mier-nikiem klasyfikacji jest wspóáczynnik korelacji liniowej. Im jest wiĊkszy, tym klasyfikacja jest lepsza, i na odwrót, im jest mniejszy, tym klasyfikacja jest gorsza. JakoĞü klasyfikacji TMZS -0,1 -0,05 0 0,05 0,1 0,15 0,2 0,25 1 3 5 7 9 11 13 15 17 19 21 Liczba klas Ws p ó áczynnik kor elacji
Rys. 1. JakoĞü klasyfikacji firm z wybranych sektorów ħródáo: opracowanie wáasne.
Klasyfikacje wykonano, opierając siĊ na wartoĞciach taksonomicznego miernika rozwoju policzonego metodą klasyczną4. JakoĞü klasyfikacji przed-stawiono na rysunku 1. Jak widaü, maksymalna wartoĞü wspóáczynnika korela-cji przypada dla trzech klas. Udziaá iloĞciowy poszczególnych firm do klas przedstawiono na rysunku 2. 0 10 20 30 40 50 60 Lic zba f irm Ğrednio zaawansowane dobrze zaawansowane nieprzygotowane Grupy I II III
Rys. 2. Klasyfikacja rozmyta przy uĪyciu jako cechy wskaĨnika TMSZ ħródáo: opracowanie wáasne.
Natomiast w tabeli 1 pokazano udziaá procentowy sektorów5 (branĪ) w po-szczególnych klasach.
4
Metoda zaproponowana przez Z. Hellwiga, por. W. Pluta, Wielowymiarowa analiza po-równawcza w badaniach ekonomicznych, PWE, Warszawa 1997.
5
1 – Budownictwo, 2 – Dom i Biuro, 3 – Doradztwo i badania, 4 Edukacja i nauka, 5 – Ekologia, 6 – Hurtownie, 7 – Informatyka i komputery, 8 – Motoryzacja, 9 – Prawo, ubezpie-czenia i finanse, 10 – Produkcja, 11 – Biura maklerskie, 12 – Reklama, 13 – Sklepy, 14 – Ubez-pieczenia, 15 – Sport, 16 – Telekomunikacja, 17 – Traking, 18 – Transport, 19 – Turystyka, 20 – Usáugi dla ludnoĞci, 21 – Usáugi dla firm, 22 – Zdrowie, 23 – Poligrafia, 99 – Inne.
Tabela 1 Udziaá procentowy branĪ wedáug TMZS w klasyfikacji rozmytej
dla trzech klas
Grupa pierwsza Grupa druga
BranĪa Liczba firm Udziaá % fi1 BranĪa Liczba firm Udziaá % fi2 7 4 20,00 0,8815 6 2 8,70 0,74843 1 2 10,00 0,5746 9 2 8,70 0,97774 12 2 10,00 0,5736 99 2 8,70 0,99811 22 2 10,00 0,9858 13 1 5,00 0,9953 Grupa trzecia
BranĪa Liczba firm Udziaá % fi3
1 5 10,20 0,7578
6 4 8,16 0,6499
4 3 6,12 0,4961
5 2 4,08 0,6222
ħródáo: opracowanie wáasne.
W tabeli 1 przedstawiono wartoĞci funkcji przynaleĪnoĞci
f
ip sektorów,które naleĪą do poszczególnych grup rozmytych. BranĪe charakteryzujące siĊ najwyĪszymi stopniami funkcji przynaleĪnoĞci są reprezentantami klas. W gru-pie gru-pierwszej znalazáy siĊ wszystkie firmy, które w ujĊciu klasycznym miaáy wiĊksze wartoĞci TMZS od 0,344 i mniejsze od 0,201. Pozostaáa czĊĞü firm, których wartoĞci TMZS byáy mniejsze niĪ 0,201, znalazáy siĊ w nowej grupie trzeciej. Porównując wyniki klasyfikacji klasycznej z metodą porządkowania rozmytego (na podstawie wskaĨnika TMZS), moĪna zauwaĪyü, Īe granice, jakie wystĊpowaáy pomiĊdzy firmami bardzo dobrze zaawansowanymi i dobrze za-awansowanymi, byáy bardzo maáe, stąd w klasyfikacji rozmytej wszystkie zna-lazáy siĊ w jednej grupie. Natomiast czĊĞü branĪ z grupy drugiej przesunĊáa siĊ do grupy ostatniej, znacznie powiĊkszając liczbĊ firm nieprzygotowanych do prowadzenia dziaáalnoĞci w Internecie.
Literatura
Hartman A., Sifonis J., E-biznes. Strategie sukcesu w gospodarce internetowej, KE Liber, Warszawa 2001.
Jajuga K., O sposobach okreĞlania liczby klas w zagadnieniach klasyfikacji i klasyfika-cji rozmytej, AE, Wrocáaw 1984.
Pluta W., Wielowymiarowa analiza porównawcza w badaniach ekonomicznych, PWE, Warszawa 1997.
CLASSIFICATION IN FUZZY OF ADVANCING ORGANIZATION FOR OPERATION IN INTERNET
Summary
The companies began to think on how applying the new informatics technologies may strengthen their strategic competitiveness on the market of goods and services. Therefore, it became necessary to work out the strategy of the best possible organiza-tion structure, informatics systems, and of the choice of economic condiorganiza-tions relating to outlays (costs) in connection with the expected profits (income) of the planned under-taking.