Modelowanie i analiza sieci złożonych
III. Cechy sieci rzeczywistych i wizualizacja grafów.
Grzegorz Siudem
Politechnika Warszawska
Przed zajęciami
Przypomnij sobie – stopień wierzchołka
Stopień wierzchołka (sieci nieskierowane) Liczba krawędzi podłączonych do wierzchołka
k ={1, 2, 2, 3, 2},
1 2
3
4
5
Przypomnij sobie – rozkłady o grubych ogonach
Powtórka z probabilistyki i statystyki:
• Czy rozkład prawdopodobieństwa może nie mieć wartości oczekiwanej? Wariancji?
• Jakie są przykłady takich rozkładów?
• Co wiadomo o nośniku rozkładu, który nie ma skończonych momentów?
• Jaką interpretację ma średnia (dobry estymator wartości oczekiwanej) gdy ta wartość oczekiwana nie istnieje? Do jakiej wartości zbiega wraz ze zwiększaniem próbki?
MASZ 3
Wykład
Jakie są rzeczywiste sieci złożone?
Co nie wyróżnia sieci rzeczywistych?
• Rozmiar (małe i duże).
• Planarność (por. wizualizacja).
• Stopień regularności (choć dominują mniej regularne).
• Typ grafu.
• ...
Przykłady?
MASZ 4
Jakie są sieci rzeczywiste?
Co wyróżnia sieci rzeczywiste?
• Rozkłady stopni wierzchołków o grubych ogonach
• Zjawisko małych światów.
• Korelacje pomiędzy wierzchołkami.
• Obecność hierarchii (często).
• Samopodobieństwo (czasami).
Uwaga!
Powyższe obserwacje są wynikami empirycznymi, a nie
matematycznymi. Nie jest tak, każda sieć złożona posiada każdą z powyższych cech.
Co to są grube ogony?
Przypomnienie z probabilistyki EXp=
∫ ∞
−∞
xpf(x)dx =∞⋆
analogicznie dla rozkładów dyskretnych EXp=
∑∞ k=0
kpP(k) =∞⋆
Uwaga!
Warunkiem koniecznym rozbiegania całek jest nieograniczony nośnik gęstości (funkcji masy p-stwa).
Co jednak z sieciami rzeczywistymi?
Skończone czy nieskończone?
MASZ 6
Dygresja o matematycznej precyzji
Jak sobie poradzić z tym problemem?
Typowo uznajemy, że rozkład stopni wierzchołków ma gruby ogon, jeśli odpowiednie całki rozbiegają się w granicy N→ ∞.
Przecież to niezgodne z matematyką! :(
Zła wiadomość:
Takim stopniem precyzji cechuje się prawie cała sieciologia.
Dobra wiadomość:
Jest to bardzo skuteczne podejście.
Bardziej matematyczno-precyzyjni będziemy na Wykładzie 7.
Czym skutkują grube ogony?
Źródło: wikipednia
Reguła Pareto (80/20)
Jaka część zasobów należy do jakiej części populacji?
Czy (oba) to prawda dla dowolnych rozkładów?
Sprawdźmy!
MASZ 8
Przypadek normalny
Zadanie 1.
Narysuj histogram z zaznaczonymi przedziałami sigm dla zmiennych losowanych z rozkładu normalnego
f(x) = 1
√2π exp (−x2
2 )
.
Zadanie 2.
Sprawdź regułę Pareto dla zmiennych z rozkładu geometrycznego pk= (1− p)k−1p.
Przypadek grubych ogonów
Zadanie 1.
Narysuj histogram z zaznaczonymi przedziałami sigm dla zmiennych losowanych z ciągłego rozkładu potęgowego
f(x) = α− 1 xmin
( x xmin
)−α .
Zadanie 2.
Sprawdź regułę Pareto dla zmiennych z rozkładu zeta pk= 1
ζ(s)k−s.
MASZ 10
Przypomnieine o braku matematycznej precyzji
Jak sobie poradzić z tym problemem?
Typowo uznajemy, że rozkład stopni wierzchołków ma gruby ogon, jeśli odpowiednie całki rozbiegają się w granicy N→ ∞.
Przecież to niezgodne z matematyką! :(
Zła wiadomość:
Takim stopniem precyzji cechuje się prawie cała sieciologia.
Dobra wiadomość:
Jest to bardzo skuteczne podejście.
Grube ogony dla ograniczonego nośnika
Zadanie
Powtórz wcześniejsze ćwiczenia dla rozkładu Zipfa pk = 1/ks
∑N n=1
(1/ns) .
Wniosek dla sieci:
Istnieją huby (bogacze, celebryci), a to zmienia wszystko!
MASZ 12
Dlaczego sieci potęgowe są bezskalowe?
Uzasadnienie empiryczne
6 8 10 12
10 15 20 25
Dlaczego sieci potęgowe są bezskalowe?
Uzasadnienie empiryczne
• wygeneruj przy pomocy wbudowanych funkcji sieć BA i graf ER.
• zaobserwuj występowanie hubów.
• narysuj histogram stopni wierzchołków.
• oblicz estymatory wartości oczekiwanej i wariancji dla stopni wierzchołków.
• czym różnią się te dwa przypadki?
MASZ 14
Dlaczego sieci potęgowe są bezskalowe?
Uzasadnienie matematyczne
Rozkładami o grubych ogonach nazywamy takie, dla których nie istnieje wartość oczekiwana lub któryś z wyższych momentów.
EXk =
∫
f(x)xkdx =∞⋆
Załóżmy, że nie istnieje drugi moment EX2=∞,
a zatem
E [X − EX]2=∞,
Zatem nie mamy skali!
Sieci o rozkładach potęgowych
M.E.J. Newman, Power laws, Pareto distributions and Zipf’s law, Contemporary Physics, 46, 323-351 (2005).
MASZ 16
Reguła św. Mateusza
Albowiem wszelkiemu mającemu będzie dano, i obfitować będzie, a temu, który nie ma, i to, co się zda mieć, będzie wzięto od niego.
Mt 25:29.
• Reguła św. Mateusza,
• rich get richer rule,
• magnetyzm sławy,
• reguła preferencyjnego dołączania,
• zasada pieniądz robi pieniądz,
• …
Czy rozkład wystarczy?
Zadanie
Należy rozstrzygnąć (udowodnić lub znaleźć kontrprzykład) czy rozkład stopni wierzchołków jednoznacznie charakteryzuje sieć/graf.
MASZ 18
Czym mogą różnić się sieci o tym samym rozkładzie?
Asortatywność vs dysasortatywność P(ki|kj) = P(ki,kj)
kjP(kj)/⟨k⟩
• Sieć dysasortatywna to taka, gdzie prawdopodobieństwo połączenia węzłów o bardzo różnym stopniu jest duże.
• Sieć asortatywna to taka, gdzie prawdopodobieństwo połączenia węzłów o zbliżonym stopniu jest duże
Pytanie
Jakie są przykłady rzeczywiste takich sieci?
Czym mogą różnić się sieci o tym samym rozkładzie?
Korelacje
P(ki,kj)- prawdopodobieństwo, że losowo wybrana krawędź łączy węzły o stopniach kii kj
R(ki,kj) = P(ki,kj) Pu(i,kj),
a Puodpowiada sieci nieskorelowanej o tym samym rozkładzie WyprowadzeniePu
• Losowe przełączanie – ilustracja.
• Pu(ki,kj) =kikjP(k⟨k⟩i)2P(kj)
MASZ 20
Inne cechy sieci rzeczywistych – małe światy
Przypomnijmy:
Ile uścisków dłoni dzieli dwóch dowolnych mieszkańców Ziemi?
(eksperyment Milgrama) Jak zmierzyć małość świata?
ℓ = 1
N(N− 1)
∑
i̸=j
d(i, j)
Ile wynosi średnia droga w wybranych modelach sieci?
• dla grafów przypadkowych ℓ∼ lnln N⟨k⟩,
• dla siatki kwadratowej ℓ∼√ N,
• dla sieci bezskalowych z α = 3 ℓ∼ ln ln Nln N ,
• dla sieci bezskalowych z α∈ (2, 3) ℓ ∼ ln ln N.
Inne cechy wybranych sieci rzeczywistych
• fraktalne sieci dystrybucyjne,
• sieci hierarchiczne,
• sieci ze strukturą społeczną.
Zadanie:
Znajdź rzeczywisty przykład powyższych sieci.
MASZ 22
Metody wizualizacji grafow
Cechy dobrej wizualizacji:
• odpowiednia odległość pomiędzy wierzchołkami,
• odpowiednie kąty pomiędzy krawędziami,
• minimalna liczba przecięć,
• symetrie!
• jest przyjemna dla oka.
Uwaga
Optymalizacja powyższych cech (zwłaszcza ostatniej!) jest wymagająca algorytmicznie.
Wniosek:
Wizualizacja to w dużej mierze sztuka... lub wykorzystanie gotowych narzędzi.
Metody wizualizacji grafow
Zadanie 1.
Przeczytaj dokumentację funkcji GraphLayout[] w środowisku Wolfram Mathematica.
Zadanie 2.
Do wybranego grafu z dzisiejszych zajęć przetestuj kilka metod wizualizacji.
Zadanie 3.
Przepisz swój kod do wersji fukncyjnej.
MASZ 24
Metody wizualizacji grafow
Metoda fizyczna
• W każdym wierzchołku umieszczamy ten sam ładunek elektryczny,
• każdą krawędź zastępujemy sprężynka,
• umieszczamy układ w przypadkowej konfiguracji,
• siły minimalizując energię elektrostatyczną i potencjalną sprężystości wykonują za nas pracę.
Projekt
Zadania
Mathematica/Python/R
• Zapisz energię sprężynkowego układu
• Narysuj graf w pewnej konfiguracji.
• Zastosuj symulowane wyżarzanie i znajdź optymalną konfigurację.
• Wykonaj animację.
Podsumowanie
Na następne zajęcia:
Przeczytaj
• M.E.J. Newman, Power laws, Pareto distributions and Zipf’s law, Contemporary Physics, 46, 323-351 (2005).
i/lub
• rozdziały 3.1-3.3 w A. Fronczak, P. Fronczak, Świat sieci złożonych PWN (2009).
Dziękuję za uwagę!
MASZ 27