Dowód poprawno±ci algorytmu Prefer-Opposite

(1)

Dowód poprawno±ci algorytmu Prefer-Opposite

Grzegorz Prusak, Katarzyna Mandziuk, Krzysztof Opolski Grudzie« 2012

W pracy [1] zaprezentowany zostaª algorytm generuj¡cy ci¡g de Bruijna. Niniejszy dokument, w oparciu o niektóre argumenty autora tego tekstu, przedstawia kompletny i bardziej zrozumiaªy dowód poprawno±ci algorytmu (Twierdzenie w cz¦±ci 1).

Prezentujemy tak»e zaproponowany przez profesora Ryttera alternatywny dowód (cz¦±¢ 2), który jest du»o bardziej obrazowy i korzysta tylko z jednego lematu z cz¦-

±ci 1.

Rozwa»amy znaki ze zbioru Σ = {0, 1}; a oznacza znak przeciwny do a.

Algorytm (nieznacznie zmodykowany celem uproszczenia dowodu) ma posta¢:

1. Przyjmij w = 0ⁿ⁻¹1. 2. Wypisz w.

3. Je±li w = x1x₂. . . x_n i sªowo v = x2x₃. . . x_nx_n nie zostaªo jeszcze wypisane, przyjmij w = v i przejd¹ do 2.

4. Je±li w = x1x₂. . . x_n i sªowo v = x2x₃. . . x_nx_n nie zostaªo jeszcze wypisane, przyjmij w = v i przejd¹ do 2.

5. Koniec.

Przykªad 1. Dla n = 4 algorytm wypisze nast¦puj¡ce sªowa:

0 0 0 1 0 0 1 0

0 1 0 1 1 0 1 0

0 1 0 0 1 0 0 1

0 0 1 1 0 1 1 0

1 1 0 1 1 0 1 1

0 1 1 1 1 1 1 0

1 1 0 0 1 0 0 0

0 0 0 0

Jak ªatwo zauwa»y¢, pojawiªy wszystkie sªowa binarne dªugo±ci 4 z wyj¡tkiem sªowa 1111. Poka»emy, »e podobnie b¦dzie dla dowolnego n > 1, a co za tym idzie, algorytmu Prefer-Opposite mo»na u»ywa¢ do generowania ci¡gu de Bruijna rz¦du n.

1 Dowód oparty na oryginalnej pracy

Przypadek n = 2 jest prosty do zwerykowania, dalej zakªadamy n > 3. B¦dziemy korzysta¢ z nast¦puj¡cych, ªatwych do zaobserwowania wªasno±ci algorytmu:

(2)

(W1) W wypisanym ci¡gu sªowa nie powtarzaj¡ si¦ (dowód: w punktach 3. i 4. spraw- dzamy, czy kandydat na kolejne sªowo nie byª wypisany).

(W2) Sªowo w które zostaªo wypisane i jest ró»ne od 0ⁿ⁻¹1, nie stoi na pocz¡tku wypisanego ci¡gu, istnieje zatem sªowo wypisane bezpo±rednio przed nim (b¦dziemy je nazywa¢ poprzednikiem sªowa w).

(W3) Je±li sªowo w postaci x1x₂. . . x_n−2aa zostaªo wypisane, to wcze±niej zostaªo wy- pisane sªowo x1x2. . . xn−2aa(dowód: z W2 istnieje poprzednik w, skoro zostaª dla niego wykonany krok 4. algorytmu, to warunek w kroku 3. nie byª speªniony).

(W4) Wypisane sªowa s¡ kolejnymi wierzchoªkami pewnej ±cie»ki w grae de Bruijna (którego wierzchoªki s¡ sªowami binarnymi dªugo±ci n).

Lemat 1. Sªowo 1ⁿ nie zostanie wypisane.

Dowód. Fragment grafu de Bruijna obejmuj¡cy wierzchoªki s¡siaduj¡ce z 1ⁿ ma posta¢:

01ⁿ⁻¹ 1ⁿ⁻¹0

1ⁿ

Zaªó»my, »e sªowo 1ⁿ zostaªo wypisane jako k-te z kolei. Z W1 i W2 wnioskujemy, »e poprzednim wypisanym sªowem (pozycja k − 1) byªo sªowo 01ⁿ⁻¹. Zastosowanie W3 do sªowa 1ⁿpokazuje, »e jeszcze wcze±niej (pozycja l < k − 1) pojawiªo si¦ sªowo 1ⁿ⁻¹0. Ale sªowo 1ⁿ⁻¹0ma poprzednik, jest nim 1ⁿlub 01ⁿ⁻¹. St¡d jedno z tych sªów wyst¦puje na pozycji l − 1, czyli pojawia si¦ wi¦cej ni» jeden raz. Uzyskana sprzeczno±¢ dowodzi, »e sªowo 1ⁿ nie mo»e zosta¢ wypisane.

Lemat 2. Je±li a = x1x2. . . xn−1c oraz b = x1x2. . . xn−1c zostaªy wypisane i s¡ ró»ne od 0ⁿ⁻¹1, to dla dowolnego s ∈ Σ zostaªo wypisane sªowo vs= sx₁x2. . . xn−1 i jest ono poprzednikiem a lub poprzednikiem b.

Dowód. Z W2 sªowa a i b maj¡ poprzedniki, które z W1 s¡ ró»ne, musz¡ wi¦c mie¢

posta¢:

tx1. . . xn−1

Jednym z tych sªów jest vs.

(3)

Lemat 3. Algorytm zako«czy si¦; ostatnie dwa sªowa na wyj±ciu to 10ⁿ⁻¹ oraz 0ⁿ. Dowód. Istnieje sko«czenie wiele sªów binarnych dªugo±ci n, za± na mocy W1 ka»de sªowo jest wypisywane co najwy»ej raz. St¡d algorytm si¦ zako«czy.

Niech w = x1x₂. . . x_n b¦dzie ostatnim wypisanym sªowem. Zaªó»my, »e w 6= 0ⁿ. Warunki w kroku 3. i 4. algorytmu byªy dla tego sªowa faªszywe, zatem sªowa

p = x₂x₃. . . x_n0 q = x₂x₃. . . x_n1 pojawiªy si¦ nie pó¹niej ni» w.

Je±li w = 10ⁿ⁻¹, to p = 0ⁿ. Wtedy sªowo p ma poprzednik; ªatwo zauwa»y¢, »e musi nim by¢ 10ⁿ⁻¹= w. Ale sªowo w nie mo»e si¦ pojawi¢ wi¦cej ni» raz.

St¡d w 6= 10ⁿ⁻¹. Poniewa» zaªo»yli±my, »e w 6= 0ⁿ, wynika st¡d, »e x2x₃. . . x_n 6=

0ⁿ⁻¹. Tym samym q = x2x3. . . xn1 6= 0ⁿ⁻¹1; zachodzi te» p 6= 0ⁿ⁻¹1. Do sªów p i q stosuje si¦ wi¦c lemat 2, w szczególno±ci sªowo w jest poprzednikiem p lub q. Ale w nie mo»e pojawi¢ si¦ w wypisanym ci¡gu wi¦cej ni» raz.

Uzyskana sprzeczno±¢ pokazuje, »e w = 0ⁿ. Jego poprzednikiem jest 10ⁿ⁻¹.

Lemat 4. Je±li sªowo x1x₂. . . x_n−2bb zostaªo wypisane, to dla dowolnego c ∈ Σ sªowo vc= cx₁x2. . . xn−2b tak»e zostaªo wypisane.

Dowód. Z lematu 3 wiemy, »e sªowa 10ⁿ⁻¹ oraz 0ⁿ zostaªy wypisane. Wystarczy wi¦c rozpatrzy¢ przypadek x1x2. . . xn−2b 6= 0ⁿ⁻¹.

Zaªó»my, »e sªowo x1x₂. . . x_n−2bb si¦ pojawiªo. Wtedy z W3 wyst¡piªo tak»e sªowo x₁x₂. . . x_n−2bb. Te dwa sªowa s¡ ró»ne od 0ⁿ⁻¹1, mo»emy wi¦c zastosowa¢ do nich lemat 2, by wywnioskowa¢, »e vc zostaªo wypisane.

Lemat 5. Sªowo w = x1x₂. . . x_n−10 zostaªo wypisane.

Dowód. Skoro (z lematu 3) sªowo 0ⁿ zostaªo wypisane, to na mocy lematu 4 wypisane zostaªy te» sªowa xn−10ⁿ⁻¹, xn−2xn−10ⁿ⁻², . . . , x1x2. . . xn−10 = w.

Twierdzenie. Dowolne sªowo w ∈ Σⁿ ró»ne od 1ⁿ zostaªo wypisane dokªadnie raz.

Dowód. Niech w = x1x₂. . . x_n−1x_n.

Z uwagi na lemat 5 wystarczy rozpatrzy¢ przypadek xn= 1.

Poniewa» w 6= 1ⁿ, to istnieje pozycja i taka, »e xi jest ostatnim wyst¡pieniem znaku 0 w w.

Z lematu 5 sªowo 1ⁿ⁻¹0zostaªo wypisane. Na mocy lematu 1 jego poprzednikiem jest 01ⁿ⁻¹= x_ixi+1. . . xn−11ⁱ. Z kolei (i−1)-krotne zastosowanie lematu 4 do tego sªowa po- zwala wywnioskowa¢, »e pojawiªy si¦ te» sªowa xi−1x_i. . . x_n−11ⁱ⁻¹, xi−2x_i−1. . . x_n−11ⁱ⁻², . . . , x1x₂. . . x_n−11 = w.

Z poczynionych obserwacji wynika, »e wypisane przez algorytm sªowa to wierzchoªki

±cie»ki w grae de Bruijna o pocz¡tku w 0ⁿ⁻¹1 i ko«cu w 0ⁿ. cie»ka omija wierzchoªek 1ⁿ, ale wiadomo, »e po 01ⁿ⁻¹ nast¦puje w niej 1ⁿ⁻¹0. St¡d przez drobn¡ modykacj¦

mo»na uczyni¢ j¡ scie»k¡ Hamiltona, a po poª¡czeniu 0ⁿ i 0ⁿ⁻¹1 cyklem Hamiltona w grae de Bruijna.

(4)

01ⁿ⁻¹ 1ⁿ⁻¹0

1ⁿ

01ⁿ⁻¹ 1ⁿ⁻¹0

1ⁿ

atwo teraz stwierdzi¢, »e rozwa»ana modykacja algorytmu polegaªa jedynie na przeniesieniu pierwszego wypisanego sªowa (0ⁿ) na koniec ci¡gu wyj±ciowego (kolejno±¢

pozostaªych sªów nie ulegªa zmianie - w obu wariantach sprawdzenie, czy wyst¡piªo ju»

0ⁿ jest wykonywane dopiero na samym ko«cu).

2 Interpretacja grafowa

Niech G b¦dzie skierowanym grafem eulerowskim, a T (skierowanym) ukorzeniownym drzewem rozpinaj¡cym G o nast¦puj¡cej wªasno±ci: ka»da kraw¦d¹ jest zwrócona w kie- runku korzenia.

Przyjmijmy, »e out(v) oznacza zbiór kraw¦dzi wychodz¡cych z wierzczhoªka v.

Rozwa»my nast¦puj¡cy (niedeterministyczny) algorytm (A):

V isited ← ∅

P ref ← E(G) \ E(T ) v ←korze« T

while out(v) 6⊆ V isited do C ← out(v) \ V isited if C ∩ P ref 6= ∅ then

e ←dowolny element zbioru C ∩ P ref else

e ←dowolny element zbioru C end if

wypisz e

V isited ← V isited ∪ {e}

v ←nast¦pnik kraw¦dzi e end while

Próbuje on zachªannie generowa¢ cykl Eulera, bior¡c do niego najpierw kraw¦dzie le»¡ce poza drzewem T .

Lemat 6. Dowolny przebieg algorytmu (A) wypisuje cykl Eulera grafu G.

Dowód. Zauwa»my najpierw, »e algorytm zako«czy si¦, gdy v b¦dzie korzeniem T (bo wszystkie kraw¦dzie wychodz¡ce z v nale»¡ do V isited, ale stopie« wej±ciowy v jest równy wyj±ciowemu, czyli jest to wierzchoªek, z którego algorytm ruszaª).

Poka»emy przez indukcj¦ po k - odlegªo±ci w T wierzchoªka w od korzenia T , »e wszystkie kraw¦dzie wychodz¡ce z w zostaªy odwiedzone.

(5)

Baza (k = 0): wiemy, »e algorytm zako«czyª si¦ w korzeniu, a to oznacza, »e wszystkie kraw¦dzie wychodz¡ce z korzenia zostaªy wypisane.

Krok: Niech w b¦dzie odlegªe od korzenia T o k + 1. Je±li nie wszystkie kraw¦dzie wychodz¡ce z w zostaªy odwiedzone, to nie zostaªa odwiedzona ta kraw¦d¹ wychodz¡ca z w, która le»y w T (bo algorytm najpierw wybiera spo±ród kraw¦dzi wychodz¡cych, które nie le»¡ w T ). Tym samym nie zostaªa odwiedzona pewna kraw¦d¹ wchodz¡ca do ojca w (odlegªego od korzenia o k). Ale algorytm wychodziª z ojca w tyle razy, ile do niego wchodziª, czyli istnieje kraw¦d¹ wychodz¡ca z ojca w, która nie zostaªa odwiedzona. To daje sprzeczno±¢ z zaªo»eniem indukcyjnym.

Wiadomo, »e ci¡g de Bruijna rz¦du n mo»na uto»samia¢ z cyklem Eulera w grae de Bruijna, w którym wierzchoªki s¡ sªowami dªugo±ci n − 1, za± kraw¦d¹ od sªowa x1x2. . . xn−1 do sªowa x2x3. . . xn odpowiada sªowu x1x2. . . xn−1xn(oznaczmy taki graf przez Bn).

Wiemy z cz¦±ci 1, »e algorytm Prefer-Opposite nie wypisze sªowa 1ⁿ; sugeruje to rozwa»enie grafu B^fn, który okre±limy jako Bn bez p¦tli na wierzchoªku 1ⁿ⁻¹ (ta p¦tla odpowiada pomini¦temu sªowu).

Zdeniujemy Tn, ukorzenione drzewo rozpinaj¡ce wB^f_n. Niech jego korzeniem b¦dzie 0ⁿ⁻¹, za± zbiorem kraw¦dzi

n(x₁x2. . . xn−20, x₂x3. . . xn−200) : x₁x2. . . xn−2∈ Σⁿ⁻², x1x2. . . xn−26= 0ⁿ⁻²^o∪

n(x₁x₂. . . xn−21, x₂x₃. . . xn−211) : x₁x₂. . . xn−2∈ Σⁿ⁻², x₁x₂. . . xn−26= 1ⁿ⁻²^o∪ n1ⁿ⁻¹, 1ⁿ⁻²0^o.

Przykªad 2. Drzewo T4 w grae B^f₄ ma posta¢:

000

001

011

111

110 100 010

101 0001

0010

0101 1010

1001

0110

1101 0000

0100

0011

1011

0111 1110

1100 1000

Tn jest rzeczywi±cie drzewem; z ka»dego wierzchoªka oprócz 0ⁿ⁻¹ wychodzi jedna kraw¦d¹ wskazuj¡ca na ojca. Jasne jest te», »e B^f_n jest grafem eulerowskim. Ma zatem sens mówienie o uruchomieniu algorytmu (A) dla grafu i drzewa T .

(6)

Przykªad 3. Kolejne kraw¦dzie odwiedzane przez algorym (A) dla grafu B^f₄ z drzewem T₄ (na pocz¡tku algorytm mo»e wybra¢ spo±ród dwóch kraw¦dzi, zaªó»my »e wybraª 0001):

000

001

011

111

110 100 010

101 0001 1

0010

2

0101

3

1010

4

1001

6

0110

8

1101

9

0000 15

0100

5

0011

7

1011

10

0111

11

12 1110

1100

13

1000

14

Lemat 7. Kraw¦dzie wypisane przez taki bieg algorytmu (A) dla grafu B^f_n i drzewa Tn, który najpierw wypisuje 0ⁿ⁻¹1 odpowiadaj¡ kolejnym sªowom wypisanym przez algorytm Prefer-Opposite startuj¡cy od sªowa 0ⁿ⁻¹1.

Dowód. W tym rozumowaniu uto»samiamy kraw¦dzie B^f_n i sªowa które reprezentuj¡.

Algorytm (A) zaczyna w korzeniu Tn, czyli 0ⁿ⁻¹. adna kraw¦d¹ wychodz¡ca z tego wierzchoªka nie le»y w Tn, zatem algorytm mo»e wybra¢ dowoln¡ z nich. Rozwa»amy zatem taki bieg algorytmu (A), który wybiera najpierw kraw¦d¹ 0ⁿ⁻¹1 (pierwsze sªowo wypisane przez algorytm Prefer-Opposite).

Zaªó»my teraz, »e algorytm (A) wypisaª kraw¦d¹ x1x₂. . . x_ni »e do tej pory wszystkie wypisane przez niego kraw¦dzie pokrywaªy si¦ ze sªowami, które wypisaª algorytm Prefer- Opposite z odpowiednio dobranym sªowem startowym.

Je±li x2x₃. . . x_n = 1ⁿ⁻¹ to algorytm (A) pójdzie kraw¦dzi¡ 1ⁿ⁻¹0, bo to jedyna kraw¦d¹ wychodz¡ca z 1ⁿ⁻¹ w grae B^f_n. Algorytm Prefer-Opposite, na mocy lematu 1 nie mo»e wypisa¢ 1ⁿ, wi¦c równie» wypisze 1ⁿ⁻¹0(nie zatrzyma si¦, bo przed 1ⁿ⁻¹0musi sta¢ 01ⁿ⁻¹, zatem sªowo 1ⁿ⁻¹0 jeszcze nie wyst¡piªo).

Je±li x2x₃. . . x_n= 0ⁿ⁻¹, to algorytm (A) powróciª do korzenia. Je±li jest to pierwszy powrót, to (A) przejdzie po p¦tli (wypisuj¡c 0ⁿ) i zatrzyma si¦ w korzeniu (bo wyko- rzystaª wszystkie kraw¦dzie wychodz¡ce z korzenia). Algorytm Prefer-Opposite wypisze najpierw 0ⁿ (0ⁿ⁻¹1 ju» wypisaª, nie mo»e powtórzy¢ tego sªowa), a potem zatrzyma si¦, bo wypisaª oba sªowa 0ⁿ i 0ⁿ⁻¹1.

Dalej zakªadamy, »e x2x₃. . . x_n6= 0ⁿ⁻¹i x2x₃. . . x_n6= 1ⁿ⁻¹. To oznacza, »e wierzcho- ªek x2x₃. . . x_n nie jest korzeniem Tn i ma dwie kraw¦dzie wychodz¡ce w B^f_n, z których dokªadnie jedna (x2x3. . . xnxn) le»y w Tn.

Je±li kraw¦d¹ x2x₃. . . xnxnnie wyst¡piªa, to algorytm (A) wypisze j¡ (bo x2x₃. . . xnxn

jako jedna z co najwy»ej dwóch rozwa»anych nie le»y w Tn), podobnie algorytm Prefer- Opposite wypisze to sªowo, bo jeszcze nie wyst¡piªo i jest preferowane.

(7)

Je±li kraw¦d¹ x2x₃. . . xnxn wyst¡piªa, ale kraw¦d¹ x2x₃. . . xnxn nie wyst¡piªa, to algorytm (A) wypisze t¦ ostatni¡; algorytm Prefer-Opposite równie» wypisze to sªowo, bo jeszcze si¦ nie pojawiªo.

Je±li dla dowolnego c ∈ Σ kraw¦d¹ x2x₃. . . xnc wyst¡piªa, to algorytm (A) si¦ zatrzyma, podobnie jak algorytm Prefer-Opposite.

Powy»sze obserwacje pokazuj¡, »e bieg obu algorytmów b¦dzie taki sam.

Poª¡czenie dwóch powy»szych lematów pokazuje, »e algorytm Prefer-Opposite wypisuje cykl Eulera w grae B^fn, a to jest dokªadnie teza twierdzenia z cz¦±ci 1. W tym dowodzie korzystali±my jedynie z lematu 1.

Literatura

[1] Abbas Alhakim, A Simple Combinatorial Algorithm for de Bruijn Sequences