Generatory liczb pseudolosowych

(1)

Generatory liczb pseudolosowych

Plan wykładu:

1.Generatory o rozkładzie równomiernym a) liniowe

b) kombinowane – generator uniwersalny c) nieliniowe

2. Generatory o dowolnym rozkładzie prawdopodobieństwa a) metoda odwracania dystrybuanty

b) metoda eliminacji

c) superpozycja rozkładów d) rozkład dyskretny

3.Generatory o rozkładach wielowymiarowych a) Rozkład równomierny na sferze i kuli w R^M b) Dwuwymiarowy rozkład normalny

4.Testowanie generatorów

a) Testy zgodności z rozkładem: ^, OPSO

b) Testy zgodności z rozkładem statystyk: pozycyjne, test sum c) Testy kombinatoryczne

(2)

2 Generatory o rozkładzie równomiernym

Najprostsze generatory liczb losowych to generatory fizyczne wykorzystujące:

1) szumy układów elektronicznych 2) Promieniotwórczość

Zalety: dostajemy ciągi liczb losowych (niezależne, nieskorelowane)

Wady: wymagana ciągła kalibracja (testowanie parametrów), kłopoty techniczne z obsługą, brak powtarzalności serii.

Własności generatorów komputerowych a) łatwość obsługi

b) możliwość generowania dowolnego rozkładu c) dowolna liczba wymiarów

d) Powtarzalność ciągów generowanych liczb generatory

liczb losowych

fizyczne programowe

(komputerowe)

Jak pracują komputerowe generatory liczby?

1) Tworzony jest ciąg liczb nieujemnych (naturalnych)

o rozkładzie równomiernym według wybranego algorytmu. Liczby ograniczone są od góry przez reprezentację, np. dla k=32 bitowej reprezentacji liczby całkowitej bez znaku, kres górny

T_a – okres aperiodyczności ciągu T₀ – okres ciągu

2) Aby uzyskać liczby „rzeczywiste” dokonujemy przekształcenia

3) Dokonujemy kolejnej transformacji ciągu aby uzyskać ciąg o zadanym rozkładzie

prawdopodobieństwa (normalny, wielomianowy, etc.)

X

0

; X

1

; X

2

; : : : ; X

n

m = 2

³²

U = X

m ) U

ⁱ

2 (0; 1]

X

₀

; : : : ; X

_º_¡1

| {z }

Ta

X

_º

; X

_º+1

; : : : ; X

_º+P_¡1

| {z }

To

; X

_º+P

; : : :

(3)

3 Generatory liniowe

Generatory liniowe tworzą ciąg liczb według schematu:

gdzie:

a₁, a₂,...,a_k, c, m – parametry generatora (ustalone liczby)

Operację

nazywamy dzieleniem modulo a jej wynikiem jest reszta z dzielenia liczb całkowitych a i b.

Lub inaczej: r jest kongruentne do A modulo n jeśli n jest dzielnikiem a-r.

Generatory wykorzystujące operację dzielenia modulo to generatory kongruentne lub

kongruencyjne.

Przykład

19 mod 6 =1 15 mod 6 =3 18 mod 6 =0 14 mod 6 =2 17 mod 6 =5 13 mod 6 =1 16 mod 6 =4 12 mod 6 =0

X

_n+1

= (a

₁

X

_n

+ a

₂

X

_n_¡1

+ : : : +a

k

X

n¡k+1

+ c) mod m

r = (a mod n); a; n; r 2 Z

a ´ r mod n ) r = a ¡ j a n

k n

Aby wygenerować ciąg liczb pseudolosowych należy zdefiniować jego parametry.

Liczby

nazywamy ziarnem generatora (seed). Dla bardziej rozbudowanych generatorów liczby te otrzymujemy z innego generatora lub np. używając zegara

systemowego (X₀).

Najprostszy generator liniowy ma dwie odmiany a) generator multiplikatywny gdy

b) generator mieszany gdy

Maksymalny okres generatora liniowego to (m-1) Generator multiplikatywny

c 6= 0 c = 0

X

0

; X

1

; X

2

; : : : ; X

k

X

i+1

= aX

i¡1

mod m k

_i

=

¹ aX

_i_¡1

m

º

; i ¸ 1 X

₁

= aX

₀

¡ mk

¹

X

₂

= a

²

X

₀

¡ mk

²

¡ mk

¹

a

X

₃

= a

³

X

₀

¡ mk

³

¡ mk

²

a ¡ mk

¹

a

²

: : : : : : : : : : : :

X

_n

= a

ⁿ

X

₀

¡ m(k

ⁿ

+ k

_n_¡1

a + : : : + k

₁

a

ⁿ^¡1

)

(4)

4 Ostatnie równanie można zapisać w postaci

skąd wynika, że wybór X₀ determinuje wszystkie liczby w generowanym ciągu (a i m są ustalone) – uzyskany ciąg liczb jest deterministyczny

Przykład.

Generator multiplikatywny

X

n

= a

ⁿ

X

0

mod m

Xi

a=1 2 3 4 5 6 7 8 9 10

i=0 1 1 1 1 1 1 1 1 1 1

1 1 2 3 4 5 6 7 8 9 10

2 4 9 5 3 3 5 9 4 1

3 8 5 9 4 7 2 6 3

4 5 4 3 9 9 3 4 5

5 10 1 1 1 10 10 10 1

6 9 5 4 3

7 7 8 6 2

8 3 4 9 5

9 6 2 8 7

10 1 1 1 1

X

i

= aX

i¡1

mod 11; X

0

= 1

(5)

5 Okres generatora multiplikatywnego

Maksymalny okres generatora multiplikatywnego wynosi

Gdy m jest liczbą pierwszą a p jest czynnikiem pierwszym liczby (m-1).

Przykład

Wykorzystujemy liczby Marsenne'a (które dość często są liczbami pierwszymi)

Okres generatora

Liczby

występują dokładnie 1 raz w pojedynczym okresie generatora.

Odległość pomiędzy najbliższymi sąsiadami

T = min fi : X

ⁱ

= X

0

; i > 0 g

a

^(m^¡1)=p

6= 1 mod m

m = 2

^p

¡ 1

a ´ 1 mod 4

a ´ 1 mod p

a = 69069 c = 1 m = 2

³²

W przypadku generatora mieszanego maksymalny okres uzyskamy po spełnieniu warunków:

a) liczby c i m nie mają wspólnych dzielników b) jeżeli 4 jest dzielnikiem m to

c) dla każdego dzielnika pierwszego p liczby m

Przykład.

T = 2

³¹

¡ 2

p = 31 ) m = 2

³¹

; a = 7

⁵

U = fU

ⁱ

; 1 · i · T g

1

2

³¹

¡ 1 = 4:657 £ 10

^¡10

(6)

6 Rozkład przestrzenny ciągu

Wadą generatorów multiplikatywnych jest

nierównomierne pokrycie d-wymiarowej kostki (I^d).

Generowane liczby lokalizują się na

hiperpłaszczyznach, których położenie uzależnione jest od parametrów generatora.

Przykład.

X

i

= aX

i¡1

mod 11

a) X₀=1, a=2 b) X₀=1, a=8

(U

1

; U

2

; : : : ; U

d

); (U

2

; U

3

; : : : ; U

d+1

); : : :

(U

1

; U

2

; : : : ; U

d

); (U

d+1

; U

d+2

; : : : ; U

2d

); : : :

(7)

7 Parametry statystyczne generatora o rozkładzie

równomiernym w (0,1)

Jeśli generowany ciag liczb jest niezależny to wartość oczekiwana (średnia) powinna wynosić

natomiast wariancja jest równa

Ponadto współczynniki autokorelacji elementów ciągu powinny wynosić 0.

Jeśli parametry statystyczne generatora (ciągu generowanych przez niego liczb) odbiegają od powyższych wartości to jest on nieprzydatny (lub warunkowo przydatny).

¹ = Z

₁

0

xdx = x

²

2 j

¹0

= 1 2

¹

¹ = 1 N

X

N i=1

x

_i

¾

²

= Z

₁

0

(x ¡ ¹)

²

dx = 1 12

¹

¾ = 1 N

X

N i=1

(x

_i

¡ ¹¹)

²

Przykład.

Przeanalizujmy parametry statystyczne L bitowego generatora

Można nim wygenerować 4 ciągi liczb o okresie

Jeden z nich:

Ciąg liczb pseudolosowych

jest permutacją liczb

Liczby znormalizowane

Średnia

Wariancja

X

_i+1

= aX

_i

mod 2

^L

c ´ 3 mod 8; X

0

´ 1; 3; 9; 11 mod 16 X

0

; X

1

; X

2

; : : :

8j + 1; 8j + 3; j = 0; 1; : : : ; 2

^L^¡3

¡ 1 T = 2

^L^¡2

U

_i

= X

_i

2

^L

¾

²

= 1

12 ¡ 13 3 ¢ 2

^m

¹

¹ = 1

2 ¡ 1

2

^L^¡1

(8)

8 Funkcja autokorelacji opisuje zależność

elementów ciągu od wyrazów poprzednich.

Definicja

Oraz wzór dla ciągu skończonego

Inaczej: opisuje związek pomiędzy elementami dówch szeregów – danego i przesuniętego o r.

Efektywnie funkcję autokorelacji można badać przy użyciu FFT – splot dwóch wektorów.

Dla analizowanego generatora mieszanego oraz dla r=1 współczynnk autokorealcji można oszacować z poniższej relacji

A = 1

a ¡ 6c

am (1 ¡ c m )

B = a

m

R

₁

2 [A ¡ B; A + B]

Przykłady generatorów liniowych

Ich okresy są maksymalne tj. równe (m-1) Generatory na rejestrach przesuwnych Definiujemy ciąg bitów b_i otrzymywanych rekurencyjnie

gdzie:

są stałymi binarnymi , a stałe b_i

tworzą ciąg inicjujący.

X

_i

= (1176X

_i_¡1

+ 1476X

_i_¡2

+ 1776X

_i_¡3

) mod (2

³²

¡ 5) X

i

= 2

¹³

(X

i¡1

+ X

i¡2

+ X

i¡3

) mod (2

³²

¡ 5)

X

_i

= (1995X

_i_¡1

+ 1998X

_i_¡2

+ 2001X

_i_¡3

) mod (2

³⁵

¡ 849) X

i

= 2

¹⁹

(X

i¡1

+ X

i¡2

+ X

i¡3

) mod (2

³²

¡ 1629)

b

i

= (a

1

b

i¡1

+ : : : + a

k

b

i¡k

) mod 2 i = k + 1; k + 2; : : :

a

₁

; a

₂

; : : : ; a

_k

2 f0; 1g

b

1

; b

2

; : : : ; b

k

2 f0; 1g R ~

_r

= lim

n!1

1 N

N

X

¡1 i=0

X

_i

X

_i_¡r

R

_r

= 1

(N ¡ r)¾

²

N

X

¡r i=1

(X

_i

¡ ¹)(X

^i+r

¡ ¹)

(9)

9 Inny sposób zapisu relacji rekurencyjnej

wykorzystuje operator xor

Który można zdefiniować

Jeśli założymy

to relację rekurencyjną można zapisać przy użyciu xor

Jakie są własności takiego ciągu bitów?

Ciąg jest okresowy o okresie

nieprzekraczającym 2^k a dokładniej (2^k-1) ze względu na wyrzucenie układu bitów złożonych z samych zer.

Praktyczną realizacją tego pomysłu jest

algorytm wykorzystujący tylko dwa elementy ciągu:

a b a xor b

0 0 0

0 1 1

1 0 1

1 1 0

a xor b = (a + b) mod 2 a

j1

= a

j2

= : : : = a

jk

= 1

b

i

= b

i¡j¹

xor b

i¡j²

xor : : : xor b

i¡jk

b

i

= b

i¡p

xor b

i¡q

; p > q; p; q 2 N

Wykorzystujemy ciąg bitów do obliczenia liczby pseudolosowej z przedziału (0,1]

(generator Tauswortha)

gdzie: s jest ustaloną całkowitą liczbą nieujemną a) jeśli s<L to do utworzenia U_i oraz U_i+1

wykorzystywane są elementy tego samego podciągu

b) jeśli s=L to U_i oraz U_i+1 są tworzone z rozłącznych fragmentów ciągu globalnego

Ciąg bitów łatwo generuje się przy użyciu rejestrów przesuwnych oraz bramek logicznych (xor) – łatwa implementacja w języku C.

U

_i

=

X

L j=1

2

^¡j

b

_is+j

= 0:b

_is+1

: : : b

_is+L

i = 0; 1; 2; : : :

(10)

10 Generator Fibonacciego

Punktem wyjścia do konstrukcji generatora są liczby Fibonacciego

a dokładniej ciąg reszt tego ciągu

Powyższy ciąg reszt ma rozkład równomierny ale nie spełnia testów niezależności.

Jego modyfikacja

nie posiada już tej wady.

Okres generatora zależy od operacji. Dla

f

₀

= f

₁

= 1

f

_n

= f

_n_¡2

+ f

_n_¡1

¦ = +; ¡; ¤; xor

T = 8 >

> <

> >

:

(2

^r

¡ 1)2

^L^¡1

F (r; s; +) (2

^r

¡ 1)2

^L^¡1

F (r; s; ¡) (2

^r

¡ 1)2

^L^¡3

F (r; s; ¤)

(2

^r

¡ 1) F (r; s; xor) m = 2

^L

Generator charakteryzuje się dużym okresem ale jest wolniejszy np. względem generatorów

multiplikatywnych co obecnie nie jest już dużą wadą.

Kombinacje generatorów

Zakładamy że dysponujemy zmiennymi losowymi X i Y określonymi na zbiorze S={1,2,...,n}

z rozkładami prawdopodobieństwa

Z tych liczb możemy utworzyć wektory

Za normę wektora przyjmiemy p-normę

Miarą „odległości” danego rozkładu od rozkładu rónomiernego będzie wówczas wyrażenie

qqq = (q

1

; q

2

; : : : ; q

n

)

krk =

Ã

_n

X

i=1

r

_i^p

!

1=p

rrr = (r

₁

; r

₂

; : : : ; r

_n

) P fX = ig = r

ⁱ

P fY = ig = q

ⁱ

i = 1; 2; : : : ; n

±(X) = k(r

¹

; r

2

; : : : ; r

n

) ¡ (1=n; 1=n; : : : ; 1=n)k X

i

= X

i¡2

+ X

i¡1

mod m; i ¸ 2

X

_i

= X

_i_¡r

¦ X

ⁱ¡s

mod m

i ¸ r; r > s ¸ 1

(11)

11 Dla określonego działania na zbiorze S tj.

rozkład nowej zmiennej losowej

będzie bliższy rozkładowi równomiernemu niż rozkłady zmiennych X i Y

Nowy ciąg ma lepsze własności statystyczne a także większy okres. Jeżeli ciąg

ma okres T₁, a ciąg

ma okres T₂ i są liczbami pierwszymi to wtedy nowy ciąg liczb

ma okres równy T₁T₂.

Generator uniwersalny

Daje jednakowe wyniki na dowolnym komputerze. Jego działanie oparte jest na wykorzystaniu kombinacji kilku generatorów.

+; ¡; ¤; xor X ¦ Y

±(X ¦ Y ) · minf±(X); ±(Y )g

X

1

; X

2

; : : : ; X

n

Y

1

; Y

2

; : : : ; Y

n

X

i

¦ Y

^j

Pierwszy z nich jest generatorem Fibonacciego

działanie jest zdefiniowane następująco

Inicjalizację generatora tj.wyznaczenie ciągu

przeprowadzamy przy pomocy ciągu bitów (24-bitowa mantysa, 16 bitowe liczby całkowite) tj.

Ciąg bitów generujemy przy użyciu dwóch generatorów

V

i

= V

i¡97

¦ V

ⁱ¡33

V

i

2 [0; 1)

x ¦ y = x ¡ y; x ¸ y F (97; 33; ¦)

x ¦ y = x ¡ y + 1; x < y V

1

; V

2

; : : : ; V

97

V

1

= 0:b

1

b

2

: : : b

24

V

2

= 0:b

25

b

26

: : : b

48

y

_n

= (y

_n_¡3

y

_n_¡2

y

_n_¡1

) mod 179 z

_n

= (52z

_n_¡1

+ 1) mod 169 b

_n

=

½ 0; gdy y

_n

z

_n

mod 64 < 32

b

_n

= 1; w pozostalych przypadkach

U

n

= V

n

¦ c

ⁿ

(12)

12 Generatory muszą być zainicjowane

Okres generatora kombinowanego: 2¹²⁰.

Drugi generator (c_n) o rozkładzie równomiernym w (0,1) jest zdefiniowany następująco

Okres tego generatora to 2²⁴-3.

Okres generatora uniwersalnego (U_n): 2¹⁴⁴

y

1

; y

2

; y

3

2 f1; 2; : : : ; 178g z

1

2 f0; 1; : : : ; 168g

c

_n

= c

_n_¡1

¦

µ 7654321 16777216

¶

n ¸ 2

c

₁

= 362436 16777216 c ¦ d = c ¡ d; c ¸ d c ¦ d = c ¡ d + 362436

16777216 ; c < d c; d 2 [0; 1)

Generator ULTRA – oparty na odejmowaniu z pożyczką

Wykorzystujemy w nim operację

której wynikiem jest

Parametr c jest tzw. bitem przeniesienia. Jego początkowa wartośc wynosi 0.

W generatorze ULTRA przyjęto parametryzację

Elementy ciągu wyznaczamy rekurencyjnie

Generator inicjalizujemy L-bitowymi liczbami

x ª y mod m

½ x ¡ y ¡ c + m x ¡ y ¡ c < 0 ! c = 1 x ¡ y ¡ c x ¡ y ¡ c ¸ 0 ! c = 0

c 2 f0; 1g

m = 2

^L

L ¸ 32; r; s; r > s

X

i

= X

i¡r

ª X

ⁱ¡s

mod m X

1

= b

L

b

L¡1

: : : b

1

X

2

= b

2L

b

2L¡1

: : : b

L+1

X

r

= : : :

(13)

13 Ciąg bitów

tworzymy ze znaków liczb

które generujemy następująco:

1) Podajemy dwie liczby:

2) Kolejno obliczamy

gdzie: k₁, k₂ są ustalonymi liczbami.

Operacja

oznacza przesunięcie bitów w v_i w prawo i wypełnienie najstarszych k₁ bitów zerami.

b

1

; b

2

; : : :

w

₁

; w

₂

; : : :

u

₀

; v

₀

2 (0; m)

u

_i

= ¸u

_i_¡1

mod m v

_i

= (v

_i

>> k

₁

) xor v

_i

v

_i

= (v

_i

<< k

₂

) xor v

_i

w

_i

= u

_i

xor v

_i

v

i

>> k

1

Jeśli

jest liczbą pierwszą to okres generatora jest równy najmniejszej liczbie naturalnej k dla której spełnione jest poniższe równanie

W generatorze ULTRA dla parametrów

Okres generatora wynosi 10³⁴⁶.

Generator jest bardzo szybki. Pozwala generować liczby całkowite: 32, 31, 8, 7 i 1 bitowe.

M = m

^r

¡ m

^s

+ 1

m

^k

mod M = 1

L = 32 r = 37 s = 24

¸ = 69069

(14)

14 Generatory nieliniowe

Zaletą generatorów nieliniowych jest to że ciągi generowanych przez nie liczb nie układają się na hiperpłaszczyznach tak jak w przypadku

generatorów liniowych.

Generator nielinowy Eichenauera-Lehna

gdzie: m jest liczbą pierwszą

Odwrotność modulo liczymy następująco

Uzyskujemy w ten sposób ciąg liczb

o rozkładzie równomiernym.

c = 0 ) c

^¡1

mod m = 0

c 6= 0 ) c ¢ (c

^¡1

mod m) = 1 c

^¡1

= c

^m^¡2

mod m

X

i

2 f0; 1; : : : ; m ¡ 1g

U

_i

= X

_i

m 2 [0; 1)

Generator Eichenauera-Hermanna

W generatorze tym kolejne elementy ciągu są niezależne od poprzednich – cecha szczególnie przydatna w obliczeniach równoległych.

Dla

generator osiąga okres T=m.

Aby generator osiągał maksymalny okres równy m musi być spełniony jeszcze warunek

jest najmniejszą liczbą całkowitą dla której zachodzi

a 2 f1; 2; : : : ; mg

m

²

¡ 1

z

^m²^¡1

= 1 mod (z

²

¡ bz ¡ a) X

_i+1

= (aX

_i^¡1

+ b) mod m; i = 0; 1; : : :

X

_i

= (a(i + i

₀

) + b)

^¡1

mod m; i = 0; 1; : : :

(15)

15 Generatory o dowolnym rozkładzie

prawdopodobieństwa

Metoda odwracania dystrybuanty Dystrybuanta określonego rozkładu prawdopodobieństwa jest funkcją

niemalejącą i prawostronnie ciągłą

Dystrybuanta jednoznacznie definiuje rozkład prawdopodobieństwa.

Związek pomiędzy dystrybuantą a gęstością prawdopodobieństwa f(x):

Przykład.

Rozkład wykładniczy

F : R ! R

x!¡1

lim F (x) = 0

x

lim

!1

F (x) = 1

F (x) = Z

x

¡1

f (t)dt

F (x) =

½ 1 ¡ e

^¡¸x

x ¸ 0 0 x < 0

Rozkład normalny

F (x) = Z

_x

¡1

1 ¾ p

2¼ exp µ

¡ (t ¡ ¹)

²

2¾

²

¶ dt

Rys. Dystrybuanta rozkładu normalnego.

f (x) = e

^¡¸x

(16)

16 U jest zmienną losową o rozkładzie

równomiernym w przedziale (0,1).

Nową zmienną losową będzie

Generujemy więc ciąg liczb pseudolosowych

który przekształcamy w ciąg

Liczby X_i mają rozkład prawdopodobeństwa o dystrybuancie F.

Odwracanie dystrybuanty można wykorzystać także w przypadku rozkładów dyskretnych.

Np. ciąg zmiennych

o rozkładzie

X = F

^¡1

(U )

P fX · xg = P fF

^¡1

(U ) · xg

= P fU · F (x)g

= F (x)

U

1

; U

2

; : : : ; U

n

2 (0; 1)

X

1

; X

2

; : : : ; X

n

2 (¡1; 1)

X

1

; X

2

; : : : ; X

n

p

k

= P fX = kg; k = 0; 1; 2; : : :

Można wygenerować przy użyciu ciągu

korzystając ze wzoru

Odwracanie dystrybuanty sprawia duże trudności numeryczne.

Przykład.

Odwracanie dystrybuanty dla rozkładu normalnego

gdzie: L(t) i M(t) są wielomianami stopnia 4 zmiennej t.

Zaletą tej metody jest to, że do wygenerowania jednej nowej zmiennej losowej X_n potrzeba tylko jednej zmiennej pierwotnej U_n.

U

1

; U

2

; : : : ; U

n

2 (0; 1)

X

_n

= min (

k : U

_n

· X

k

i=0

p

_i

)

; n = 1; 2; : : :

©

^¡1

(u) =

½ g(u) 10

^¡20

< u < 0:5

¡g(1 ¡ u) 0:5 · u · 1 ¡ 10

^¡20

g(u) = t ¡ L(t)

M (t) ; t = p

¡2ln u

(17)

17 Metoda eliminacji (von Neumann)

Chcemy wygenerować ciąg zmiennych losowych o gęstości prawdopodobieństwa f w przedziale [a,b].

Wartość f jest w przedziale [a,b] ograniczona od góry przez stałą d.

Sposób otrzymania ciągu zmiennych losowych o rozkładzie f(x) jest następujący:

1) Losujemy dwie zmienne o rozkładzie równomiernym

2) jeżeli

3) gdy powyższy warunek nie jest spełniony wówczas odrzucamy parę U₁, U₂

4) wykonujemy czynności 1-3 aż do uzyskania odpowiednio licznego ciągu

Wygenerowana zmienna losowa X ma rozkład prawdopodobieństwa f.

Oznaczenia

- pole powierzchnii zbioru C (miara Lebesgue'a): l₂(C) - zbór A

Ponieważ f(x) jest gęstością prawdopodobieństwa, więc

U

1

2 [a; b] U

2

2 [0; d]

U

2

· f(U

¹

) ) X = U

¹

A = f(x; u) : a · x · b; 0 · u · f(x)g

l

2

(A) = 1

(18)

18 Pole powierzchnii prostokąta (a,b)x(0,d)

Przy tych założeniach możemy stwierdzić że dowolnie wybrany punkt  ma rozkład

równomierny na zbiorze

jeżeli dla podzbiorów C tego zbioru zachodzi

Tw. Jeśli (X₁,U₁), (X₂,U₂),... jest ciągiem punktów losowych o rozkładzie

równomiernym w prostokącie (a,b)x(0,d) oraz (X_i,U_i) będzie pierwszym punktem

wpadajacym do zbioru A to punkt ten ma rozkład równomierny w A.

Dowód. Rozważamy podzbiór B zbioru A

l

2

((a; b) £ (0; d)) = (b ¡ a)d

D ½ R

²

P f! 2 Cg = l

₂

(C) l

₂

(D)

P f(X; U) 2 Bg = X

1

i=1

P f(X

¹

; U

₁

) = 2 A; : : : ; (X

_i_¡1

; U

_i_¡1

) = 2 A; (X

ⁱ

; U

_i

) 2 Bg

= X

1

i=1

µ

1 ¡ l

₂

(A) (b ¡ a)d

¶

i¡1

l

₂

(B)

(b ¡ a)d = l

₂

(B) l

₂

(A)

Tw. Jeżeli U ma rozkład równomierny w [0,1] a X ma rozkład o gęstości f(x) oraz X i U są niezależne, to punkt losowy (X,Uf(X)) ma rozkład równomierny w zbiorze A.

Powyższe rozważania można uogólnić na większą liczbę wymiarów.

Ponadto zamiast stałej d ograniczającej f(x) od góry można wprowadzić funkcję ograniczającą cg(x), wówczas warunkiem akceptacji jest

gdzie: c jest stałą, a g(x) rozkładem zbliżonym do f(x).

Zabieg taki opłaca się wykonać wówczas gdy

wyznaczenie ciągu liczb o gęstości g(x) jest łatwe i szybkie. Funkcję g(x) nazywamy wtedy rozkładem dominującym.

Jak dobrać stałą c?

cg(X)U · f(X); X 2 [a; b]; U 2 [0; 1]

c = sup

x

f (x) g(x) P fU cg(X) · f (X)g = Z

R^k

g(x)d

^k

x

Z

f (x)=cg(x) 0

du = f (x)

cg(x)

(19)

19 Superpozycja rozkładów

Naszym zadaniem jest uzyskanie ciągu liczb pseudolosowych o gęstości f(x), którą możemy wyrazić w postaci

gdzie: g_t(x) oraz h(t ) są również gęstościami prawdopodobieństwa – funkcje znane.

Rozkład prawdopodobieństwa f(x) nazywamy rozkładem złożonym.

Algorytm generowania liczb o rozkładzie f(x) jest następujący:

1) Generujemy zmienną T o rozkładzie h

2)Dla wartości t zmiennej losowej T generujemy zmienną losową X dla rozkładu gęstości g_t(x) W praktyce całkę zastępuje się sumą

f (x) =

Z

₁

¡1

g

_t

(x)h(t)dt

f (x) = X

1

i=1

p

_i

g

_i

(x) = X

K

i=1

p

_i

g

_i

(x)

Przedział [a,b] w którym generujemy ciąg zmiennych z rozkładem f(x) dzielimy na sumę K rozłącznych podprzedziałów. W każdym z nich (A_i) wyznaczamy

oraz

gdzie: 1_Ai jest funkcją przynależności do podzbioru A_i. Algorytm generacji ciagu zmiennej X jest wówczas następujący:

1) Losujemy zmienną losową

2) Dla wygenerowanej wartości i zmiennej I generujemy X z rozkładem gęstości

Dla dostatecznie wąskich przedziałów można h(t) przybliżyć wielomianem niskiego stopnia.

p

_i

= Z

A_i

f (x)dx

g

i

(x) = 111

A_i

f (x) p

i

I 2 f1; 2; : : : ; Kg

g

i

(x) = 111

A_i

f (x) p

i

p

_i

¸ 0;

X

K i

p

_i

= 1

(20)

20 Rozkład dyskretny

a) metoda odwracania dystrybuanty W rozkładzie dyskretnym mamy określone prawdopodobieństwo wylosowania danej liczby

wraz z warunkiem

Algorytm generowania ciągu zmiennych o rozkładzie dyskretnym:

1) X=0, S=p₀

2) Losujemy zmienną U o rozkładzie równomiernym z przedziału [0,1]

3) Sprawdzamy warunek

a)Iteracyjnie obliczamy

dopóki warunek jest spełniony

b) W przeciwym wypadku akceptujemy X 4) Kroki 1-3 wykonujemy aż do uzyskania odpowiednio licznego ciągu X₁,X₂,X₃,...

P fX = kg = p

^k

; k = 0; 1; 2; : : : ; M

X

M k=0

p

_k

= 1

U > S

X = X + 1; S = S + p

x

b) Metoda równomiernego rozbicia przedziału Zakładamy że zmienna losowa X przyjmuje określone wartości z pewnym prawdopodobieństwem

Przedział (0,1) dzielimy na K+1 podprzedziałów o jednakowej długości

Zmienna U wpada do przedziału

Konstruujemy dwa ciągi

µ i ¡ 1

K + 1 ; i K + 1

¶

; i = 1; 2; : : : ; K + 1

[(K + 1)U + 1]

P fX = kg = p

^k

; k = 0; 1; 2; : : : ; K

q

_¡1

= 0

g

_i

= max

½

j : q

_j

< i K + 1

¾

; i = 1; 2; : : : ; K + 1 q

_i

=

X

i j=0

p

_j

; i = 0; 1; : : : ; K

(21)

21 Algorytm

1) Generujemy zmienną U o rozkładzie równomiernym w (0,1)

2) Obliczamy

3) Iteracyjnie obliczamy

dopóki jest spełniony warunek

4) Jeśli

to akceptujemy X

5) Kroki 1-4 powtarzamy aż do uzyskania odpowiednio licznego ciągu X₁,X₂,...

Powyższy algorytm zapewnia to, że warunek

będzie sprawdzany conajwyżej dwukrotnie.

X = [(K + 1)U + 1]

X = X ¡ 1 q

X¡1

> U X = g

X

+ 1

q

X¡1

< U

q

X¡1

> U

Generatory o rozkładach wielowymiarowych Zadanie można sformułować następująco:

Należy wygenerować ciąg wielowymiarowych zmiennych losowych

których rozkład prawdopodobieństwa ma gęstość

Do generacji takiego ciągu można stosować metodę eliminacji czy superpozycji rozkładów. Przy użyciu metody elminacji w najprostszej postaci pojawiają się problemy.

Przykład.

Określić prawdopodobieństwo akceptacji

wielowymiarowej zmiennej losowej o rozkładzie równomiernym na kuli jednostkowej (K_m(0,1)) . Algorytm.

Losujemy m zmiennych niezależnych o rozkładzie równomiernym w (-1,1) i konstruujemy zmienną wielowymiarową

Zmienną akceptujemy jeśli

X

X X = (X

₁

; X

₂

; : : : ; X

_m

)

f (x

₁

; x

₂

; : : : ; x

_m

)

U U U = (U

1

; U

2

; : : : ; U

m

)

kUk

²

· 1

(22)

22 Prawdopodobieństwo akceptacji zmiennej jest

równe ilorazowi objętości kuli i opisanej na niej kostki [-1,1]^m

Średnia liczba wylosowanych punktów N_m potrzebnych do realizacji jednej zmiennej wynosi

Modyfikacją usprawniającą powyższy algorytm jest podział kostki na rozłączne podobszary i przeprowadzenia losowania w każdym z nich z osobna.

N

_m

= 1 p

_m

p

_m

= ¼

^m=2

2

^m

¡(m=2 + 1)

m pm Nm

2 7.854 x 10^-1 1.27 5 1.645 x 10^-1 6.08 10 2.490 x 10^-3 4.015 x 10² 20 2.461 x 10^-8 4.063 x 10⁷ 50 1.537 x 10^-28 6.507 x 10²⁷

Rozkład równomierny na sferze

Jeżeli m-wymiarowa zmienna losowa

ma rozkład równomierny na sferze

oraz macierz A_mxm jest macierzą ortonormalną tj. macierzą obrotu w przestrzeni R^m to zmienna losowa AX ma

również rozkład równomierny na tej sferze.

m-wymiarowa zmienna

ma rozkład sferycznie konturowany jeżeli jej gęstość prawdopodobieństwa

zależy tylko od

X X X = (X

1

; X

2

; : : : ; X

m

)

S

_m

= 8 <

: (x

₁

; : : : ; x

_m

) : X

m j=1

x

²_j

= 1 9 =

;

Z Z Z = (Z

₁

; Z

₂

; : : : ; Z

_m

)

g

_Z

(z

₁

; z

₂

; : : : ; z

_m

)

kzk

²

= X

m j=1

z

_j²

(23)

23 Wniosek: mając do dyspozycji odpowiedni rozkład

sferycznie konturowany można go użyć do generowania zmiennej losowej o rozkładzie równomiernym na powierzchnii kuli.

Przykład.

m-wymiarowy rozkład normalny opisuje gęstość

Dla macierzy ortonormalnej zachodzi

więc AZ ma identyczny rozkład.

Algorytm generowania rozkładu równomiernego na sferze w m wymiarach:

1) Generujemy m-wymiarową zmienną losową Z o rozkładzie normalnym

2) Obliczamy

Rozkład nowej zmiennej X będzie równomierny na sferze S_m.

g

_Z

(z

₁

; : : : ; z

_m

) = 1

(2¼)

^m=2

exp µ

¡ 1

2 kzk

²

¶

kAZ Z Z k

²

= kZ Z Z k

²

X

X X = Z Z Z kZ Z Z k

Rozkład równomierny na sferze S_m Tw. Jeżeli zmienna

ma rozkład równomierny na k-wymiarowej sferze S_k, R jest zmienną o rozkładzie

a s jest losowym znakiem

to (k+1)-wymiarowa zmienna losowa

ma rozkład równomierny w (k+1) wymiarowej kuli.

Rozkład równomierny na Kuli K_m

Zauważamy że długość wektora wodzącego R zmiennej X jest także zmienną losową, i ma ona rozkład

Z Z Z = (Z

1

; Z

2

; : : : ; Z

k

)

h(r) =

(

pcr^k¡1

1¡r²

; 0 · r · 1 0 r = 2 [0; 1]

P fs = 1g = P fs = ¡1g = 1 2

X X X = (RZ

₁

; RZ

₂

; : : : ; RZ

_k

; s p

1 ¡ R

²

)

h(r) = mr

^m^¡1

; 0 · r · 1

(24)

24 Wystarczy więc wygenerować punkt

leżący na sferze S_m a następnie obliczyć

Zmiena X leży wewnątrz kuli jednostkowej K_mi ma w tym obszarze rozkład równomierny.

Dwuwymiarowy rozkład normalny (metoda Boxa-Mullera)

Jeżeli dwie niezależne zmienne losowe U₁ i U₂ mają rozkład równomierny w przedziale [0,1] to zmienne losowe

również są niezależne a prawdopodobieństwo ich otrzymania opisuje rozkład normalny o

parametrach

Z Z Z = (Z

1

; Z

2

; : : : ; Z

m

)

X

X X = (RZ

1

; RZ

2

; : : : ; RZ

m

)

¹ = 0

¾ = 1 X

₁

= p

¡2ln(U

¹

)cos(2¼U

₂

) X

₂

= p

¡2ln(U

¹

)sin(2¼U

₂

)

Testowanie generatorów liczb pseudolosowych

Ponieważ wszystkie generatory o dowolnym rozkładzie bazują na wykorzystaniu ciągów liczb

losowych o rozkładzie równomiernym więc istotne jest badanie tylko generatorów liczb o takim właśnie

rozkładzie.

Testowanie generatora jest procesem złożonym:

1) Dla ustalonej liczby n, generujemy n kolejny ch liczb startując od losowo wybranej liczby początkowej 2)Obliczamy wartość statystyki testowej (T)

3)Obliczamy F(T) czyli dystrybuantę statystyki T, gdy weryfikowana hipoteza jest prawdziwa

4) Kroki 1-3 powtarzamy N-krotnie obliczając

statystyki: T₁,T₂,...,T_N. Jeśli weryfikowana hipoteza jest prawdziwa to

jest ciągiem zmiennych niezależnych o rozkładzie równomiernym. Testowanie generatora kończy się sprawdzeniem tej hipotezy.

F (T

₁

); F (T

₂

); F (T

₃

); : : : ; F (T

_N

)

(25)

25 Testy zgodności z rozkładem równomiernym

U(0,1)

Test chi-kwadrat

Jest najczęściej stosowanym testem.

Badamy w nim hipotezę że generowana zmienna losowa X ma rozkład prawdopodobieństwa o dystrybuancie F.

Jeżeli

to możemy dokonać następującego podziału zbioru wartości zmiennej X

Generujemy n liczb

Sprawdzamy ile z nich spełnia warunek

Ich liczbę oznaczamy n_i.

F (a) = 0 F (b) = 1

a < a

1

< a

2

< : : : < a

k

= b

p

i

= P fa

ⁱ¡1

< X · a

ⁱ

g; i = 1; 2; : : :

X

1

; X

2

; : : : ; X

n

a

i¡1

< X · a

ⁱ

Statystyką testu jest

Dla dużego n statystyka ta ma rozkład ² o (k-1) stopniach swobody.

Możemy tak dobrać szerokości przedziałów aby otrzymać zależność

wówczas statystyka przyjmuje prostszą postać

Â

²_k_¡1

= X

k

i=1

(n

_i

¡ np

ⁱ

)

²

np

_i

p

_i

= 1 k

Â

²_k_¡1

= k n

X

k i=1

n

²_i

¡ n

(26)

26 Test OPSO (overlapping-pairs-sparse-occupancy)

Generujemy ciąg liczb

Jeśli z każdej weźmiemy k bitów to możemy utworzyć ciąg liczb całkowitych

z zakresu {0,1,...,2^r-1}.

Następnie tworzymy ciąg kolejnych nakładających się par

Jeśli przez Y oznaczymy liczbę takich par

które nie pojawiły się w ciągu (I_i,I_i+1), to ta zmienna ma rozkład normalny N() – oczywiście dla

odpowiednio dużego n.

Przykładowe parametry testu OPSO

X

1

; X

2

; : : : ; X

n

I

1

; I

2

; : : : ; I

n

(I

₁

; I

₂

); (I

₂

; I

₃

); : : : ; (I

_n_¡1

; I

_n

)

f(i; j) : i; j = 0; 1; : : : ; 2

^b

¡ 1g

b n  

10 2

²¹

141909 290.26 11 2

²²

1542998 638.75 12 2

²³

567639 580.80

Testy zgodności rozkładów statystyk

Jeżeli wygenerowany ciąg zmiennych losowych

Jest ciągiem zmiennych niezależnych to możemy z elementów tego ciągu utworzyć wektory

które też będą zmiennymi losowymi ale o rozkładzie równomiernym w kostce jednostkowej (0,1)^m.

Możemy zatem zdefiniować pewną funkcję

określoną w kostce jednostkowej.

W ten sposób tworzymy ciąg nowych zmiennych losowych

o jednakowym rozkładzie i dystrybuancie

Testowanie generatora polega na sprawdzeniu hipotezy że ciąg Y₁,Y₂,... jest próbką z populacji o dystrybuancie G.

X

1

; X

2

; : : : ; X

n

(X

₁

; X

₂

; : : : ; X

_m

); (X

_m+1

; X

_m+2

; : : : ; X

_2m

); : : :

y = h(x

1

; x

2

; : : : ; x

m

)

Y

_j

= h(X

_(j_¡1)m+1

; X

_(j_¡1)m+2

; : : : ; X

_jm

) j = 1; 2; : : :

G(y) = P fY

^j

· yg

(27)

27 Testy oparte na statystykach

pozycyjnych

Dla wektorów losowych w kostce (0,1)^m definiujemy funkcje

co generuje nowe zmienne

Nowe zmienne mają następujące rozkłady

Testowanie generatora polega na

sprawdzeniu hipotezy o zgodności rozkładów zmiennych U,V,R z powyższym. Testy

przeprowadza się dla niewielkich wartości m=2,3,...,10.

u = max fx

¹

; x

2

; : : : ; x

m

g v = min fx

¹

; x

2

; : : : ; x

m

g r = u ¡ v

U; V; R

P fU

^j

· ug = u

^m

; 0 · u · 1

P fV

^j

· vg = 1 ¡ (1 ¡ v)

^m

; 0 · v · 1

P fR

^j

· rg = mr

^m^¡1

¡ (m ¡ 1)r

^m

; 0 · r · 1

Test sum

Definiujemy funkcję

Wygenerowana zmienna losowa Y ma rozkład o gęstości

Dla m=2

Dla m=3

Testowanie generatora polega na weryfikacji

hipotezy, że zmienna losowa Y ma rozkład zgodny z g_m(y). Zazwyczaj m nie przekracza 5.

y = x

1

+ x

2

+ : : : + x

m

g

₂

(y) =

½ y 0 · y · 1 2 ¡ y 1 < y · 2

g

3

(y) = 8 <

:

y²

2

0 · y · 1

1

2

(y

²

¡ 3(y ¡ 1)

²

) 1 < y · 2

1

2

(y

²

¡ 3((y ¡ 1)

²

+ 3(y ¡ 2)

²

)) 2 < y · 3

(28)

28 Testy kombinatoryczne

Pozwalają sprawdzić czy dostarczane przez generator liczby są niezależnymi zmiennymi losowymi.

W testach tych sprawdza się hipotezę że

wielowymiarowa zmienna losowa utworzona z ciągu liczb

ma rozkład o dystrybuancie

Do tej grupy testów zaliczają się np: test pokerowy, test kolekcjonera, test kolizji, test permuatcji.

H(x

1

; x

2

; : : : ; x

n

) = F (x

1

)F (x

2

) : : : F (x

n

)

(X

₁

; X

₂

; : : : ; X

_n

)