• Nie Znaleziono Wyników

Modelowanie i analiza sieci złożonych X. Algorytmy wykrywania społeczności.

N/A
N/A
Protected

Academic year: 2021

Share "Modelowanie i analiza sieci złożonych X. Algorytmy wykrywania społeczności."

Copied!
34
0
0

Pełen tekst

(1)

Modelowanie i analiza sieci złożonych

X. Algorytmy wykrywania społeczności.

Grzegorz Siudem

Politechnika Warszawska

(2)

MASZ 1

(3)

Przed zajęciami

(4)

Przypomnienie

Przypomnienie z innych zajęć:

• Jak metody wykorzystuje się do wykrywania skupień w Rn?

Przypomnienie z MASZ_9:

• Procesy Markowa - błądzenie na grafach.

MASZ 2

(5)

Wykład

(6)

Empiryczne uzasadnienie

MASZ 3

(7)

Empiryczne uzasadnienie

MASZ 3

(8)

Empiryczne uzasadnienie

MASZ 3

(9)

Empiryczne uzasadnienie

Dlaczego wykrywamy skupienia/społeczności?

• poszukujemy istotnych cech elementów składowych,

• pytamy o liczbę tych składowych,

• szukamy hierarchii w analizowanym układzie.

MASZ 3

(10)

Problem z właściwym postawieniem problemu

• brak jednoznacznej i uniwersalnej definicji czym są społeczności,

• brak (w ogólności) apriorycznej metody ustalenia liczby społeczności dla danej sieci.

• trudnodostępne (niemożliwe w ogólności?) są benchmarki metod detekcji.

A jednak intuicyjnie problem jest zrozumiały

Beak

Beescratch

Bumper CCL Cross

DN21DN16 DN63 Double

Feather Fish

Five

Fork

Gallatin

Grin Haecksel

Hook

Jet Jonah

Knit

Kringel

MN105 MN23

MN60

MN83

NotchMus Number1 Oscar Patchback

PL

Quasi

Ripplefluke

Scabs Shmuddel SMN5

SN100

SN4

SN63

SN89 SN9

SN90 SN96

Stripes Thumper Topless

TR120

TR77

TR82

TR88 TR99 Trigger

TSN103 TSN83

Upbang Vau

Wave Web

Whitetip Zap

Zig

Zipfel

MASZ 4

(11)

Problem z właściwym postawieniem problemu

• brak jednoznacznej i uniwersalnej definicji czym są społeczności,

• brak (w ogólności) apriorycznej metody ustalenia liczby społeczności dla danej sieci.

• trudnodostępne (niemożliwe w ogólności?) są benchmarki metod detekcji.

A jednak intuicyjnie problem jest zrozumiały

Beak

Beescratch

Bumper CCL Cross

DN21DN16 DN63 Double

Feather Fish

Five

Fork

Gallatin

Grin Haecksel

Hook

Jet Jonah

Knit

Kringel

MN105 MN23

MN60

MN83

NotchMus Number1 Oscar Patchback

PL

Quasi

Ripplefluke

Scabs Shmuddel SMN5

SN100

SN4

SN63

SN89 SN9

SN90 SN96

Stripes Thumper Topless

TR120

TR77

TR82

TR88 TR99 Trigger

TSN103 TSN83

Upbang Vau

Wave Web

Whitetip Zap

Zig

Zipfel

MASZ 4

(12)

Problem z właściwym postawieniem problemu

• brak jednoznacznej i uniwersalnej definicji czym są społeczności,

• brak (w ogólności) apriorycznej metody ustalenia liczby społeczności dla danej sieci.

• trudnodostępne (niemożliwe w ogólności?) są benchmarki metod detekcji.

A jednak intuicyjnie problem jest zrozumiały

Beak

Beescratch

Bumper CCL Cross

DN21DN16 DN63 Double

Feather Fish

Five

Fork

Gallatin

Grin Haecksel

Hook

Jet Jonah

Knit

Kringel

MN105 MN23

MN60

MN83

NotchMus Number1 Oscar Patchback

PL

Quasi

Ripplefluke

Scabs Shmuddel SMN5

SN100

SN4

SN63

SN89 SN9

SN90 SN96

Stripes Thumper Topless

TR120

TR77

TR82

TR88 TR99 Trigger

TSN103 TSN83

Upbang Vau

Wave Web

Whitetip Zap

Zig

Zipfel

MASZ 4

(13)

Problem z właściwym postawieniem problemu

• brak jednoznacznej i uniwersalnej definicji czym są społeczności,

• brak (w ogólności) apriorycznej metody ustalenia liczby społeczności dla danej sieci.

• trudnodostępne (niemożliwe w ogólności?) są benchmarki metod detekcji.

A jednak intuicyjnie problem jest zrozumiały

Beak

Beescratch

Bumper CCL Cross

DN21DN16 DN63 Double

Feather Fish

Five

Fork

Gallatin

Grin Haecksel

Hook

Jet Jonah

Knit

Kringel

MN105 MN23

MN60

MN83

NotchMus Number1 Oscar Patchback

PL

Quasi

Ripplefluke

Scabs Shmuddel SMN5

SN100

SN4

SN63

SN89 SN9

SN90 SN96

Stripes Thumper Topless

TR120

TR77

TR82

TR88 TR99 Trigger

TSN103 TSN83

Upbang Vau

Wave Web

Whitetip Zap

Zig

Zipfel

MASZ 4

(14)

Typowe metody detekcji społeczności

W dalszej części korzystam z

• S. Fortunato, D. Hric, Phys. Rep., 659, 1, (2016).

• poza siecią akademicką pracę można znaleźć na arxiv-ie:

arXiv:1608.00163.

Osoby zainteresowane zachęcam do

• przejrzenia obfitej bibliografi ibid.

• ze szczególnym uwzględnieniem pracy https://arxiv.org/abs/0906.0612

Osobom bardzo zainteresowanym proponuję

• lekturę społeczności prac cytujących te monografie.

MASZ 5

(15)

Typowe metody detekcji społeczności

W dalszej części korzystam z

• S. Fortunato, D. Hric, Phys. Rep., 659, 1, (2016).

• poza siecią akademicką pracę można znaleźć na arxiv-ie:

arXiv:1608.00163.

Osoby zainteresowane zachęcam do

• przejrzenia obfitej bibliografi ibid.

• ze szczególnym uwzględnieniem pracy https://arxiv.org/abs/0906.0612

Osobom bardzo zainteresowanym proponuję

• lekturę społeczności prac cytujących te monografie.

MASZ 5

(16)

Typowe metody detekcji społeczności

W dalszej części korzystam z

• S. Fortunato, D. Hric, Phys. Rep., 659, 1, (2016).

• poza siecią akademicką pracę można znaleźć na arxiv-ie:

arXiv:1608.00163.

Osoby zainteresowane zachęcam do

• przejrzenia obfitej bibliografi ibid.

• ze szczególnym uwzględnieniem pracy https://arxiv.org/abs/0906.0612

Osobom bardzo zainteresowanym proponuję

• lekturę społeczności prac cytujących te monografie.

MASZ 5

(17)

Czym są społeczności?

• klasycznie: rozbiciem zbioru wierzchołków.

• czasami dopuszczamy jednak przykrywanie się zbiorów.

• praktycznie: zbiorami, w których połączenia do wewnątrz są liczniejsze niż na zewnątrz.

Przypomnienie – prosty model sieci ze społecznościami Uogólniamy grafy Erdösa-Rényi do modelu blokowego (ang. stochastic block model).





p11 p12 . . . p1K

p21 p22 . . . p2K

... ... . .. ... pK1 pK2 . . . pKK





• K - liczba społeczności,

• N > K liczba wierzchołków.

MASZ 6

(18)

Czym są społeczności?

• klasycznie: rozbiciem zbioru wierzchołków.

• czasami dopuszczamy jednak przykrywanie się zbiorów.

• praktycznie: zbiorami, w których połączenia do wewnątrz są liczniejsze niż na zewnątrz.

Przypomnienie – prosty model sieci ze społecznościami Uogólniamy grafy Erdösa-Rényi do modelu blokowego (ang. stochastic block model).





p11 p12 . . . p1K

p21 p22 . . . p2K

... ... . .. ... pK1 pK2 . . . pKK





• K - liczba społeczności,

• N > K liczba wierzchołków.

MASZ 6

(19)

Czym są społeczności?

• klasycznie: rozbiciem zbioru wierzchołków.

• czasami dopuszczamy jednak przykrywanie się zbiorów.

• praktycznie: zbiorami, w których połączenia do wewnątrz są liczniejsze niż na zewnątrz.

Przypomnienie – prosty model sieci ze społecznościami Uogólniamy grafy Erdösa-Rényi do modelu blokowego (ang. stochastic block model).





p11 p12 . . . p1K

p21 p22 . . . p2K

... ... . .. ... pK1 pK2 . . . pKK





• K - liczba społeczności,

• N > K liczba wierzchołków.

MASZ 6

(20)

Czym są społeczności?

• klasycznie: rozbiciem zbioru wierzchołków.

• czasami dopuszczamy jednak przykrywanie się zbiorów.

• praktycznie: zbiorami, w których połączenia do wewnątrz są liczniejsze niż na zewnątrz.

Przypomnienie – prosty model sieci ze społecznościami Uogólniamy grafy Erdösa-Rényi do modelu blokowego (ang. stochastic block model).





p11 p12 . . . p1K

p21 p22 . . . p2K

... ... . .. ... pK1 pK2 . . . pKK





• K - liczba społeczności,

• N > K liczba wierzchołków.

MASZ 6

(21)

Czym są społeczności?

• klasycznie: rozbiciem zbioru wierzchołków.

• czasami dopuszczamy jednak przykrywanie się zbiorów.

• praktycznie: zbiorami, w których połączenia do wewnątrz są liczniejsze niż na zewnątrz.

Przypomnienie – prosty model sieci ze społecznościami Uogólniamy grafy Erdösa-Rényi do modelu blokowego (ang.

stochastic block model).





p11 p12 . . . p1K

p21 p22 . . . p2K

... ... . .. ... pK1 pK2 . . . pKK





• K - liczba społeczności,

• N > K liczba wierzchołków.

MASZ 6

(22)

Stochastic block model (z monografii Fortunato i Hrica)

MASZ 7

(23)

Metody spektralne

Ogólny opis

• Poszukujemy wartości własnych macierzy sąsiedztwa (lub innych powiązanych).

• Wyszukujemy skupień tych wartości własnych wR2.

• Wektory własne odpowiadające tym skupieniom powinny wyznaczać podział na klastry w grafie.

Wady:

• metoda zawodzi dla rzadkich sieci.

Polecam lekturę: rozdział VII w https://arxiv.org/pdf/0906.0612.

MASZ 8

(24)

Metody spektralne

Ogólny opis

• Poszukujemy wartości własnych macierzy sąsiedztwa (lub innych powiązanych).

• Wyszukujemy skupień tych wartości własnych wR2.

• Wektory własne odpowiadające tym skupieniom powinny wyznaczać podział na klastry w grafie.

Wady:

• metoda zawodzi dla rzadkich sieci.

Polecam lekturę: rozdział VII w https://arxiv.org/pdf/0906.0612.

MASZ 8

(25)

Metody oparte o wnioskowanie statystyczne

Ogólny opis

• Zakładamy, że rozważaną sieć można opisać modelem blokowym.

• Poszukujemy estymatora największej wiarogodności dla parametrów modelu.

Wady:

• metoda wymaga znajomości liczby społeczności.

Polecam lekturę: https://arxiv.org/abs/1008.3926.

MASZ 9

(26)

Metody oparte o wnioskowanie statystyczne

Ogólny opis

• Zakładamy, że rozważaną sieć można opisać modelem blokowym.

• Poszukujemy estymatora największej wiarogodności dla parametrów modelu.

Wady:

• metoda wymaga znajomości liczby społeczności.

Polecam lekturę: https://arxiv.org/abs/1008.3926.

MASZ 9

(27)

Metody oparte o dyfuzję

Ogólny opis

• Generujemy ścieżkę błądzenia losowego na zadanej sieci.

• Próbujemy ją optymalnie zakodować, co jest równoważne poszukiwaniu podziału na społeczności.

Wady:

• wymaga zwiedzania całej sieci.

Polecam lekturę: https://arxiv.org/pdf/0707.0609.pdf.

MASZ 10

(28)

Metody oparte o dyfuzję

Ogólny opis

• Generujemy ścieżkę błądzenia losowego na zadanej sieci.

• Próbujemy ją optymalnie zakodować, co jest równoważne poszukiwaniu podziału na społeczności.

Wady:

• wymaga zwiedzania całej sieci.

Polecam lekturę: https://arxiv.org/pdf/0707.0609.pdf.

MASZ 10

(29)

Inne metody

• metody oparte o dynamikę spinów,

• metody optymalizacyjne (wybór funkcji celu),

• każda z przedstawionych metod posiada liczne wariacje!

MASZ 11

(30)

Inne metody

• metody oparte o dynamikę spinów,

• metody optymalizacyjne (wybór funkcji celu),

• każda z przedstawionych metod posiada liczne wariacje!

MASZ 11

(31)

Inne metody

• metody oparte o dynamikę spinów,

• metody optymalizacyjne (wybór funkcji celu),

• każda z przedstawionych metod posiada liczne wariacje!

MASZ 11

(32)

Inne metody

• metody oparte o dynamikę spinów,

• metody optymalizacyjne (wybór funkcji celu),

• każda z przedstawionych metod posiada liczne wariacje!

MASZ 11

(33)

Dziękuję za uwagę!

MASZ 11

(34)

MASZ 12

Cytaty

Powiązane dokumenty

P7.3 Sprawdź symulacyjnie powyższy wynik rysując wykres rozmiaru największego klastra w funkcji ⟨k⟩ =

• grupa osób sprawująca władzę, zwłaszcza w Kościołach!. Oba mogą mieć

P8.4 Oblicz podstawowe charakterystyki każdej z warstw, a następnie wybrane do sieci

• Każda taka grupa implementuje wybraną metodę wykrywania społeczności!. • Na kolejnych zajęciach przetestujemy te metody na zestawie

Modelowanie i analiza sieci

P11.4 Zmodyfikuj klasyczny voter model, żeby uwzględniał dodatkowe efekty (np. propagandę, ”zacietrzewienie” agentów, etc.).. Dziękuję

Państwa zadaniem jest przygotowanie infografiki zawierającej najciekawsze Państwa zdaniem wnioski z analizy wyników zadania P12.1.. Dziękuję

Narysuj sieci ilustrujące relacje pomiędzy nimi.