• Nie Znaleziono Wyników

Index of /rozprawy2/10722

N/A
N/A
Protected

Academic year: 2021

Share "Index of /rozprawy2/10722"

Copied!
2
0
0

Pełen tekst

(1)

Rozprawa dotyczy problemu wyszukiwania tożsamości wirtualnych, ukrywających się w ramach internetowych sieci społecznych. Rozwój sieci WEB i opartych o nią sieci społecznych, oraz charakteryzujące je wysoka anonimowość, przyniosły zarówno pozytywne jak i negatywne skutki społeczne. Jednym z negatywnych skutków jest zjawisko płatnego spamu opiniotwórczego w ramach portali rekomendacyjnych i forów dyskusyjnych. Takie opinie, generowane są zwykle przez osoby, używające w tym celu wielu tożsamości wirtualnych.

Niniejsza rozprawa wykazuje, że istnieje możliwość zbudowania modelu, który pozwoli wyszukiwać takie przypadki. Prezentowane podejście oparte jest o otwarte zasoby sieci Internet, agregujące cechy wirtualnych tożsamości z dziedzin: przetwarzania tekstu, sentymentu wypowiedzi, analizy aktywności czasowej użytkownika i powiązań elementów wspólnych. Algorytm wyznaczania podobieństwa wirtualnych tożsamości oparty jest o miary podobieństwa cech, rozszerzony o wagi cech ustalane w procesie uczenia z nadzorem. System zbudowany w oparciu o taki model nie traci skuteczności wraz ze wzrostem ilości badanych tożsamości i nie wymaga stosowania danych osobowych. W ramach eksperymentów przeszukano źródła różnych typów i wskazano przykłady ukrywających się multitożsamości, generujące fałszywy spam opiniotwórczy.

(2)

Dissertation concerns issue of detecting multi-identities hidden on WEB social networks. Evolution of social networks based on WEB results brought with both positive and negative social aspects. One of a negative aspects is a phenomenon of paid opinion spam published on recommendation portals and internet forums. Those opinions are edited by individuals, who use multiple virtual identities in order to spread numerous recommendations. The work proves, that it's possible to build a model, which is able to provide mechanisms that detects such cases. Presented approach bases on open WEB resources, aggregating features from several domains ex. natural language processing, emotional sentiment, user's time activity and common objects connections. Virtual multi-identities detection algorithm is based on similarity measures, extended by features weights established during supervised learning process. The system built on the basis of the model does not require any personal information and maintains effectiveness while number of virtual identities increase. Within the scope of experiments, various sources were processed, and as a result there were detected examples of hidden multi- identities generating opinion spam.

Cytaty

Powiązane dokumenty

Z podręcznika „Biologia na czasie 3” zapoznajcie się z metodami datowania, które są stosowane w paleontologii i krót- ko je scharakteryzujcie.. 1–6) i opisy

1. Zapis taki powinien się składać z następujących elementów ujętych w nawiasie kwadratowym: nazwisko autora cytowanej pracy, rok wydania publikacji i strona / strony, np.

W poniższej tabeli przedstawiono rozkład procentowy ich odpowiedzi (gwiazdką oznaczono od- powiedź poprawną). Naj- częściej wybieranym dystraktorem była odpowiedź A –

Uczestnicy przedsięwzięcia – dzieci, młodzież i ich ro- dzice i opiekunowie – będą mogli wziąć udział w krót- kich wykładach, warsztatach praktycznych, zajęciach

Ufam, że wyniki naszych badań choć w niewielkim stopniu przyczynią się do poznania wspaniałego daru języka, który dany jest człowiekowi i wspólnocie dla realizacji

Dysfunctions of the mitochondrial proteins lead to the mitochondrial diseases, which can be caused by muta- tions in mtDNA as well as in the nuclear genes.. Clinical features of

Obawy przed marginalizacją języka, jak i próby wyjaśniania, że będzie on jednym z języków urzędowych w Unii, to najczęściej pojawiające się tematy, które można odnaleźć

Only those countries whose average were significantly lower than the OECD average (Kazakhstan, Turkey, Qatar and the United Arab Emir- ates) showed a higher rate of change then