Podsumowanie serii testów

W dokumencie Index of /rozprawy2/10722 (Stron 97-116)

Po przeprowadzeniu serii testów, w oparciu o ich rezultaty mo»na stwierdzi¢, »e sys-tem charakteryzuje si¦ wysok¡ skuteczno±ci¡ dziaªania. Warto±ci dokªadno±ci w pierwszym scenariuszu na poziomie 0,91, precyzji na poziomie 0,89 i miary-F na poziomie 0,90 po-twierdzaj¡ jego wysok¡ zgodno±¢ z ocenami grupy ludzkich arbitrów, jaka jest stosowana do oceny tego typu danych i przypadków.

Dodatkowo, sposób prezentacji informacji w systemie pozwala ludzkim arbitrom za-uwa»y¢ dodatkowe elementy, których przy standardowej, bezpo±redniej eksploracji ¹ródªa czªowiek nie byªby w stanie zauwa»y¢. S¡ one cz¦sto elementami kluczowymi, wskazuj¡cymi na u»ycie multito»samo±ci przez jedn¡ zyczn¡ osob¡.

Drugi scenariusz, oraz 8 miejsce jednej pary, spo±ród prawie 370 tysi¦cy par, oraz wy-niki podobie«stw wy»sze ni» 98,81% dla wszystkich badanych par, równie» potwierdzaj¡ wysok¡ skuteczno±¢ systemu. Dodatkowo scenariusz ten opieraª si¦ o realne wirtualne mul-tito»samo±ci, wykryte przez administratorów serwisów na podstawie dost¦pnych jedynie dla nich danych (adresów IP i email).

W oparciu o uzyskane rezultaty mo»na stwierdzi¢, »e prezentowany system jest skutecz-nym narz¦dziem wspomagaj¡cym eksploracje sieci spoªecznych o charakterze tekstowym, w celu wykrycia ukrywaj¡cych si¦ multito»samo±ci. Fizyczna analiza ilo±ci danych, jakie zwykle zawieraj¡ takie ¹ródªa, jest czynno±ci¡ niewykonaln¡ zarówno dla pojedynczego czªowieka, jak i dla grupy osób.

Dodatkowo, poprzez odpowiednie zamodelowanie charakterystyk, system pozwala za-obserwowa¢ podobie«stwa pomi¦dzy niektórymi cechami, które nie s¡ widoczne przy bez-po±redniej, standardowej eksploracji danych przez czªowieka.

9 Wnioski ko«cowe

Powstanie ±wiata wirtualnego w dynamicznie rozwijaj¡cej si¦ sieci Internet ª¡czy si¦ z wyst¦powaniem szeregu procesów i zjawisk, które przenosz¡ si¦, nieraz w sposób zu-peªnie nieoczekiwany, do ±wiata rzeczywistego, wywoªuj¡c skutki niejednokrotnie bardzo pozytywne, lecz czasem wywoªuj¡ce pewne obawy, a nawet stwarzaj¡ce zagro»enia.

Do pierwszej grupy mo»na zaliczy¢ powstanie sieci spoªeczno±ciowych, opisanych sze-rzej w rozdziale 2.1, które umo»liwiaj¡ nawi¡zywanie kontaktów, wymian¦ pogl¡dów i opinii, podejmowanie wspólnych dziaªa«. Do drugiej za±, pojawienie si¦ wirtualnych multi-to»samo±ci pozwalaj¡cych na ukrywanie swej osobowo±ci, a w konsekwencji zwolnienie od odpowiedzialno±ci za podejmowane dziaªania.

Zamierzeniem niniejszej rozprawy byªo stworzenie metod i narz¦dzi umo»liwiaj¡cych identykacj¦ pewnej grupy wirtualnych multi-to»samo±ci, a co za tym idzie, ograniczenie niepo»¡danych efektów i zagro»e«, zwi¡zanych z ich wyst¦powaniem.

Prowadzone badania obejmowaªy opracowanie koncepcji modelu, a nast¦pnie architek-tury systemu oraz rozwi¡za« algorytmicznych, skªadaj¡cych si¦ na nowatorskie rozwi¡za-nie, pozwalaj¡ce na wyszukiwanie multito»samo±ci ukrywaj¡cych si¦ w sieciach spoªecz-nych. W celu zwerykowania efektywno±ci proponowanych rozwi¡za« zaprojektowano i zaimplementowano system, pozwalaj¡cy przetestowa¢ prezentowan¡ na wst¦pie hipotez¦.

System zawiera komponenty, które pozwoliªy na pobranie z otwartych ¹ródeª sieci In-ternet informacji o wirtualnych to»samo±ciach, dziaªaj¡cych w ramach sieci spoªeczno±cio-wych.

W toku prowadzonych prac zaimplementowano i przetestowano: • architektur¦ systemu pod k¡tem skuteczno±ci i wydajno±ci dziaªania,

• komponent crawlu i przechowywania danych pod k¡tem pobierania danych z dost¦p-nych ¹ródeª i pó¹niejszego ich udost¦pniania,

• algorytmy generowania charakterystyk, stanowi¡cych podstaw¦ wyszukiwania podo-bie«stwa wirtualnych to»samo±ci,

• algorytmy wyznaczania podobie«stw cech, charakteryzuj¡cych poszczególne to»sa-mo±ci wirtualne,

• algorytmy wyznaczania podobie«stw to»samo±ci wirtualnych, pod k¡tem ich skutecz-no±ci przy wyszukiwaniu multito»samo±ci ukrywaj¡cych si¦ w sieciach spoªecznych. Najwa»niejszymi oryginalnymi wªa±ciwo±ciami prezentowanego rozwi¡zania s¡ : • okre±lenie nowatorskich zestawów cech to»samo±ci wirtualnych, umo»liwiaj¡cych

• mo»liwo±¢ dziaªania systemu bez konieczno±ci wykorzystania danych osobowych, • zdolno±¢ utrzymania wysokiej efektywno±ci dziaªania wraz ze wzrostem liczby

wirtu-alnych to»samo±ci.

Wyniki testów dziaªania systemu, opisane szczegóªowo w rozdziale 8, potwierdziªy prak-tyczn¡ skuteczno±¢ rozwi¡zania. System jest wi¦c efektywnym narz¦dziem, mog¡cym sªu-»y¢ w rozwi¡zywaniu problemów dotycz¡cych identykacji wirtualnych to»samo±ci, w tym mi¦dzy innymi wykrywania pªatnych opinii w sieciach spoªeczno±ciowych.

Oszacowania parametrów "dokªadno±ci" i "miary-F" osi¡gaªy w testach warto±ci zbli-»one do 90%, co wskazuje na wysok¡ skuteczno±¢ diagnoz zwracanych przez system.

Dodatkowo, ilo±¢ informacji jakie mo»e przetworzy¢ i przeanalizowa¢ system znacznie przekracza mo»liwo±ci pojedynczego czªowieka, a nawet grupy osób. Liczba wirtualnych to»samo±ci, które mog¡ by¢ analizowane przez system, przewy»sza znacznie aktualnie spo-tykane rozwi¡zania z dziedziny analizy autorstwa tekstów. Tak»e efektywno±¢ systemu przy du»ej liczbie autorów jest lepsza od tej, jak¡ zapewniaj¡ znane w tej dziedzinie rozwi¡zania (opisane szczegóªowo w rozdziale 3.4.3).

Zaprezentowane rozwi¡zanie mo»e zosta¢ wykorzystane w szerokiej gamie bada« w dziedzinie wykrywania cyberprzest¦pczo±ci i analizy sieci spoªecznych. Wykrywanie han-dlu nielegalnymi towarami i substancjami, pod»eganie do nienawi±ci rasowej, wyªudzenia, dzieci¦ca pornograa oraz wykrywanie grup przest¦pczych lub terrorystycznych, to tylko wybrane przykªady zada« z obszaru bezpiecze«stwa publicznego, do rozwi¡zania których zastosowany mo»e zosta¢ system, po odpowiedniej adaptacji poszczególnych komponentów. Równocze±nie, system mo»e zosta¢ wykorzystany jako platforma do prowadzenia testów nowych algorytmów generowania charakterystyk, wyznaczania ich indywidualnych cech oraz wyszukiwania podobie«stw to»samo±ci wirtualnych.

Warto przy tym wspomnie¢, »e istotn¡ trudno±¢, jak¡ napotkano przy realizacji prowa-dzonych bada«, stanowiªo pozyskanie rzeczywistych danych umo»liwiaj¡cych jednoznaczne potwierdzenie wyniku testu. Potwierdzenie takie uzyskuje si¦ dopiero w oparciu o dane osobowe internautów, które w ogólnym przypadku s¡ niedost¦pne z mocy prawa. W kon-kretnych sytuacjach dane te mog¡ by¢ udost¦pniane przy uzasadnionych podejrzeniach o popeªnieniu przest¦pstwa.

W perspektywie przewiduje si¦ dalsze doskonalenie realizowanego systemu, zarówno przez wprowadzenie nowych charakterystyk wirtualnych to»samo±ci, oraz modykacji al-gorytmów wykrywania podobie«stw, jak te» rozbudow¦ interfejsu, m.in. przez stworzenie gracznej prezentacji uzyskanych rezultatów, uªatwiaj¡cej u»ytkownikowi ich interpreta-cj¦.


