• Nie Znaleziono Wyników

Modelowanie i analiza sieci złożonych

N/A
N/A
Protected

Academic year: 2022

Share "Modelowanie i analiza sieci złożonych"

Copied!
34
0
0

Pełen tekst

(1)

Modelowanie i analiza sieci złożonych

III. Cechy sieci rzeczywistych i wizualizacja grafów.

Grzegorz Siudem

Politechnika Warszawska

(2)
(3)

Przed zajęciami

(4)

Przypomnij sobie – stopień wierzchołka

Stopień wierzchołka (sieci nieskierowane) Liczba krawędzi podłączonych do wierzchołka

k ={1, 2, 2, 3, 2},

1 2

3

4

5

(5)

Przypomnij sobie – rozkłady o grubych ogonach

Powtórka z probabilistyki i statystyki:

• Czy rozkład prawdopodobieństwa może nie mieć wartości oczekiwanej? Wariancji?

• Jakie są przykłady takich rozkładów?

• Co wiadomo o nośniku rozkładu, który nie ma skończonych momentów?

• Jaką interpretację ma średnia (dobry estymator wartości oczekiwanej) gdy ta wartość oczekiwana nie istnieje? Do jakiej wartości zbiega wraz ze zwiększaniem próbki?

MASZ 3

(6)

Wykład

(7)

Jakie są rzeczywiste sieci złożone?

Co nie wyróżnia sieci rzeczywistych?

• Rozmiar (małe i duże).

• Planarność (por. wizualizacja).

• Stopień regularności (choć dominują mniej regularne).

• Typ grafu.

• ...

Przykłady?

MASZ 4

(8)

Jakie są sieci rzeczywiste?

Co wyróżnia sieci rzeczywiste?

• Rozkłady stopni wierzchołków o grubych ogonach

• Zjawisko małych światów.

• Korelacje pomiędzy wierzchołkami.

• Obecność hierarchii (często).

• Samopodobieństwo (czasami).

Uwaga!

Powyższe obserwacje są wynikami empirycznymi, a nie

matematycznymi. Nie jest tak, każda sieć złożona posiada każdą z powyższych cech.

(9)

Co to są grube ogony?

Przypomnienie z probabilistyki EXp=

−∞

xpf(x)dx =∞

analogicznie dla rozkładów dyskretnych EXp=

k=0

kpP(k) =∞

Uwaga!

Warunkiem koniecznym rozbiegania całek jest nieograniczony nośnik gęstości (funkcji masy p-stwa).

Co jednak z sieciami rzeczywistymi?

Skończone czy nieskończone?

MASZ 6

(10)

Dygresja o matematycznej precyzji

Jak sobie poradzić z tym problemem?

Typowo uznajemy, że rozkład stopni wierzchołków ma gruby ogon, jeśli odpowiednie całki rozbiegają się w granicy N→ ∞.

Przecież to niezgodne z matematyką! :(

Zła wiadomość:

Takim stopniem precyzji cechuje się prawie cała sieciologia.

Dobra wiadomość:

Jest to bardzo skuteczne podejście.

Bardziej matematyczno-precyzyjni będziemy na Wykładzie 7.

(11)

Czym skutkują grube ogony?

Źródło: wikipednia

Reguła Pareto (80/20)

Jaka część zasobów należy do jakiej części populacji?

Czy (oba) to prawda dla dowolnych rozkładów?

Sprawdźmy!

MASZ 8

(12)

Przypadek normalny

Zadanie 1.

Narysuj histogram z zaznaczonymi przedziałami sigm dla zmiennych losowanych z rozkładu normalnego

f(x) = 1

√2π exp (−x2

2 )

.

Zadanie 2.

Sprawdź regułę Pareto dla zmiennych z rozkładu geometrycznego pk= (1− p)k−1p.

(13)

Przypadek grubych ogonów

Zadanie 1.

Narysuj histogram z zaznaczonymi przedziałami sigm dla zmiennych losowanych z ciągłego rozkładu potęgowego

f(x) = α− 1 xmin

( x xmin

)−α .

Zadanie 2.

Sprawdź regułę Pareto dla zmiennych z rozkładu zeta pk= 1

ζ(s)k−s.

MASZ 10

(14)

Przypomnieine o braku matematycznej precyzji

Jak sobie poradzić z tym problemem?

Typowo uznajemy, że rozkład stopni wierzchołków ma gruby ogon, jeśli odpowiednie całki rozbiegają się w granicy N→ ∞.

Przecież to niezgodne z matematyką! :(

Zła wiadomość:

Takim stopniem precyzji cechuje się prawie cała sieciologia.

Dobra wiadomość:

Jest to bardzo skuteczne podejście.

(15)

Grube ogony dla ograniczonego nośnika

Zadanie

Powtórz wcześniejsze ćwiczenia dla rozkładu Zipfa pk = 1/ks

N n=1

(1/ns) .

Wniosek dla sieci:

Istnieją huby (bogacze, celebryci), a to zmienia wszystko!

MASZ 12

(16)

Dlaczego sieci potęgowe są bezskalowe?

Uzasadnienie empiryczne

6 8 10 12

10 15 20 25

(17)

Dlaczego sieci potęgowe są bezskalowe?

Uzasadnienie empiryczne

• wygeneruj przy pomocy wbudowanych funkcji sieć BA i graf ER.

• zaobserwuj występowanie hubów.

• narysuj histogram stopni wierzchołków.

• oblicz estymatory wartości oczekiwanej i wariancji dla stopni wierzchołków.

• czym różnią się te dwa przypadki?

MASZ 14

(18)

Dlaczego sieci potęgowe są bezskalowe?

Uzasadnienie matematyczne

Rozkładami o grubych ogonach nazywamy takie, dla których nie istnieje wartość oczekiwana lub któryś z wyższych momentów.

EXk =

f(x)xkdx =∞

Załóżmy, że nie istnieje drugi moment EX2=∞,

a zatem

E [X − EX]2=∞,

Zatem nie mamy skali!

(19)

Sieci o rozkładach potęgowych

M.E.J. Newman, Power laws, Pareto distributions and Zipf’s law, Contemporary Physics, 46, 323-351 (2005).

MASZ 16

(20)

Reguła św. Mateusza

Albowiem wszelkiemu mającemu będzie dano, i obfitować będzie, a temu, który nie ma, i to, co się zda mieć, będzie wzięto od niego.

Mt 25:29.

• Reguła św. Mateusza,

• rich get richer rule,

• magnetyzm sławy,

• reguła preferencyjnego dołączania,

• zasada pieniądz robi pieniądz,

• …

(21)

Czy rozkład wystarczy?

Zadanie

Należy rozstrzygnąć (udowodnić lub znaleźć kontrprzykład) czy rozkład stopni wierzchołków jednoznacznie charakteryzuje sieć/graf.

MASZ 18

(22)

Czym mogą różnić się sieci o tym samym rozkładzie?

Asortatywność vs dysasortatywność P(ki|kj) = P(ki,kj)

kjP(kj)/⟨k⟩

• Sieć dysasortatywna to taka, gdzie prawdopodobieństwo połączenia węzłów o bardzo różnym stopniu jest duże.

• Sieć asortatywna to taka, gdzie prawdopodobieństwo połączenia węzłów o zbliżonym stopniu jest duże

Pytanie

Jakie są przykłady rzeczywiste takich sieci?

(23)

Czym mogą różnić się sieci o tym samym rozkładzie?

Korelacje

P(ki,kj)- prawdopodobieństwo, że losowo wybrana krawędź łączy węzły o stopniach kii kj

R(ki,kj) = P(ki,kj) Pu(i,kj),

a Puodpowiada sieci nieskorelowanej o tym samym rozkładzie WyprowadzeniePu

• Losowe przełączanie – ilustracja.

Pu(ki,kj) =kikjP(k⟨k⟩i)2P(kj)

MASZ 20

(24)

Inne cechy sieci rzeczywistych – małe światy

Przypomnijmy:

Ile uścisków dłoni dzieli dwóch dowolnych mieszkańców Ziemi?

(eksperyment Milgrama) Jak zmierzyć małość świata?

ℓ = 1

N(N− 1)

i̸=j

d(i, j)

Ile wynosi średnia droga w wybranych modelach sieci?

• dla grafów przypadkowych ℓ∼ lnln N⟨k⟩,

• dla siatki kwadratowej ℓ∼√ N,

• dla sieci bezskalowych z α = 3 ℓ∼ ln ln Nln N ,

• dla sieci bezskalowych z α∈ (2, 3) ℓ ∼ ln ln N.

(25)

Inne cechy wybranych sieci rzeczywistych

• fraktalne sieci dystrybucyjne,

• sieci hierarchiczne,

• sieci ze strukturą społeczną.

Zadanie:

Znajdź rzeczywisty przykład powyższych sieci.

MASZ 22

(26)

Metody wizualizacji grafow

Cechy dobrej wizualizacji:

• odpowiednia odległość pomiędzy wierzchołkami,

• odpowiednie kąty pomiędzy krawędziami,

• minimalna liczba przecięć,

• symetrie!

• jest przyjemna dla oka.

Uwaga

Optymalizacja powyższych cech (zwłaszcza ostatniej!) jest wymagająca algorytmicznie.

Wniosek:

Wizualizacja to w dużej mierze sztuka... lub wykorzystanie gotowych narzędzi.

(27)

Metody wizualizacji grafow

Zadanie 1.

Przeczytaj dokumentację funkcji GraphLayout[] w środowisku Wolfram Mathematica.

Zadanie 2.

Do wybranego grafu z dzisiejszych zajęć przetestuj kilka metod wizualizacji.

Zadanie 3.

Przepisz swój kod do wersji fukncyjnej.

MASZ 24

(28)

Metody wizualizacji grafow

Metoda fizyczna

• W każdym wierzchołku umieszczamy ten sam ładunek elektryczny,

• każdą krawędź zastępujemy sprężynka,

• umieszczamy układ w przypadkowej konfiguracji,

• siły minimalizując energię elektrostatyczną i potencjalną sprężystości wykonują za nas pracę.

(29)

Projekt

(30)

Zadania

Mathematica/Python/R

• Zapisz energię sprężynkowego układu

• Narysuj graf w pewnej konfiguracji.

• Zastosuj symulowane wyżarzanie i znajdź optymalną konfigurację.

• Wykonaj animację.

(31)

Podsumowanie

(32)

Na następne zajęcia:

Przeczytaj

• M.E.J. Newman, Power laws, Pareto distributions and Zipf’s law, Contemporary Physics, 46, 323-351 (2005).

i/lub

• rozdziały 3.1-3.3 w A. Fronczak, P. Fronczak, Świat sieci złożonych PWN (2009).

(33)

Dziękuję za uwagę!

MASZ 27

(34)

Cytaty

Powiązane dokumenty

wierzchoków, które mierz ich pewne cechy charakterystyczne, jednoczenie okrelajc, który wierzchoek jest najwaniejszy w sieci z punktu widzenia okrelonej miary.. Znormalizowany

• Dołaczamy go krawędziami do istniejących węzłów zgodnie z regułą preferencyjnego dołączania. • Powtarzamy dwa

P2.1 Przy pomocy funkcji morfologicznych w środowisku Mathematica odtwórz z pliku graficznego mapy siatkę ulic albo sieć

Wczytaj pierwszy plik z danymi, narysuj ich histogram..

Porównaj przewidywania uzyskanego wzoru z empirycznymi przewidywaniami teoretycznymi z

Państwa zadaniem jest przygotowanie infografiki zawierającej najciekawsze Państwa zdaniem wnioski z analizy wyników zadania P12.1.. Dziękuję

Narysuj sieci ilustrujące relacje pomiędzy nimi.

• neighborhood-based, gdzie poszukujemy użytkowników podobnych do analizowanego, a następnie na podstawie ich wyborów opracowujemy predykcję według schematu:. • Obliczamy wagi