Złożoność obliczeniowa (bioinformatyka) Egzamin 8 lutego 2021 1. Jeśli w ∈ {a, b}

(1)

Złożoność obliczeniowa (bioinformatyka) Egzamin 8 lutego 2021

1. Jeśli w ∈ {a, b}

^∗

, to przez w oznaczymy słowo powstające przez zamianę wszystkich liter a na b i wszystkich b na a. Na przykład jeśli w = ababb, to w = babaa. Które z następujących języków są regularne, a które są bezkontekstowe?

(a) L

₁

= {w

^R

w | w ∈ {a, b}

^∗

};

(b) L

₂

= {ww | w ∈ {a, b}

^∗

};

2. Czy języki L

₁

i L

₂

z zadania 1 są rozstrzygalne? Do jakich należą klas złożoności? Czy to możliwe, że któryś z nich jest P-zupełny? NP-zupełny? Pspace-zupełny? Co by z tego wynikało?

3. Które z następujących zawierań: CSL ⊆ Dspace(n

²

log n) ⊆ Nspace(n log log n) ⊆ P

(gdzie CSL oznacza klasę języków kontekstowych) faktycznie zachodzą, które nie za-

chodzą, a które implikują równość Pspace = P?

(2)

Przykładowe rozwiązania

1a: Elementy języka L₁to wszystkie słowa postaci x₁x₂. . . x_nx_n. . . x₂x₁, gdzie x₁, x₂, . . . , x_n∈ {a, b}.

Ten język jest bezkontekstowy. Generuje go taka gramatyka: ξ0::= ε | aξ0b | bξ0a . Ale nie jest regularny. W przeciwnym razie iloczyn L⁰₁= L1∩ a⁺bab⁺= {aⁿbabⁿ | n, k > 0} też byłby regularny.

A ten jezyk nie da się pompować: jeśli N jest stałą z lematu o pompowaniu, to trzeba podzielić słowo a^Nbab^N na trzy części x, y, z i to tak że |xy| ≤ N , czyli segment y ma postać a^d, dla pewnego d > 0.

Wtedy xy²z = a^{N +d}bab^N 6∈ L⁰₁, bo liczba liter w pierwszej i ostatniej części się nie zgadza.

1b: Ten język nie jest bezkontekstowy. Gdyby był, to język

L⁰₂= L₁∩ a⁺b⁺a⁺b⁺a⁺b⁺= {aⁿb^ma^kbⁿa^mb^k | n, m, k > 0}

też byłby bezkontekstowy, a nie jest. Użyjemy lematu o pompowaniu: niech N będzie stałą z lematu i niech a^Nb^Na^Nb^Na^Nb^N = xyzuv, gdzie |yzu| ≤ N , yu 6= ε. Słowo yzu mieści w jednym z segmentów postaci a^Nb^N lub postaci b^Na^N. Przy tym słowo y zbudowane jest z samych a lub samych b i tak samo słowo u – inaczej słowo xy²zu²v ma za dużo alternacji liter i nie należy do L⁰₂. Ale wtedy xzv 6∈ L⁰₂, bo któraś z sześciu części jest w nim za krótka.

2: Język L₁ należy do klasy Dtime(O(n)), bo można go rozpoznawać maszyną, która czytając słowo wejściowe w zapisuje w na taśmie roboczej, a następnie porównuje taśmy czytając je w przeciwne strony (tutaj korzystamy z tego, że L1= {w | w = w^R}). Możemy też zauważyć, że L1∈ Logspace, bo zamiast słowo kopiować (co wymaga pamięci liniowej) można porównywać poszczególne litery, posługując się licznikami rozmiaru log n. Podobnie jak L1, także język L2należy do klas Dtime(O(n)) i Logspace. Tym razem algorytmy są nieco bardziej kłopotliwe, trzeba bowiem (deterministycznie) odnaleźć środek słowa (czyli obliczyć ¹₂n) i porównywać połówki czytając obie od lewej do prawej.

Liczbę¹₂n można jednak ustalić z pomocą jednego licznika w czasie liniowym: czytamy słowo wejściowe, dodając jedynkę do licznika co dwa kroki. Skoro języki L1i L2mają określoną złożoność, to oczywiście są rozstrzygalne. Gdyby któryś z nich okazał się zupełny w klasie P lub NP (czego nie wiadomo), to wtedy cała klasa P (odpowiednio NP) byłaby równa klasie Logspace. Ale nasze języki na pewno nie są zupełne w Pspace, bo wiadomo, że Logspace 6= Pspace.

3: Ponieważ CSL = Nspace(n) ⊆ Dspace(n²) z twierdzenia Savitcha, więc tym bardziej zachodzi pierwsza inkluzja w zadaniu. Druga nie zachodzi, bo z tegoż twierdzenia Savitcha i z tego, że limn→∞ (log log n)²

log n = 0 wynika, że Nspace(n log log n) ⊆ Dspace(n²(log log n)²) Dspace(n²log n).

Pozostaje pokazać, że jeśli Nspace(n log log n) ⊆ P, to Pspace = P. Niech więc L ∈ Pspace, powiedzmy, że L ∈ Nspace(n^k). „Wypychamy” język L, aby dostać język L⁰ należący do klasy Nspace(n log log n). Można to zrobić tak: L⁰= {w$...$ | w ∈ L oraz |w$...$| = |w|^k}. Maszynę, która rozpoznawała język L w pamięci n^k można łatwo przerobić na maszynę rozpoznającą L⁰ w pamięci liniowej (liczonej od N = n^k). Zatem L⁰ ∈ Nspace(n) ⊆ Nspace(n log log n) ⊆ P, czyli mamy de- terministyczną maszynę rozpoznającą język L⁰ w czasie wielomianowym, powiedzmy n^r. Pozostaje ją przerobić na taką maszynę M , że L = L(M ), która działa w wielomianowym czasie N^r= n^kr.