Równania różnicowe - Kolokwium ze wstępu do informatyki, I rok Mat.

Chyba najważniejszym (a w każdym razie skutecznym w wielu przypadkach) środkiem do obliczania złożoności obliczeniowej różnych algorytmów iteracyjnych i rekurencyjnych jest rozwiązywanie równań różnicowych. Możemy użyć tego środka, jeśli dany algorytm rozwiązywania zadania o rozmiarze k > 1 wymaga rozwiązania ustalonej liczby zadań mniejszych (np. o rozmiarze k − 1 lub k/2), oraz wykonania pewnej liczby f(k) operacji w celu uzyskania końcowego rozwiązania.

4.9

Niech liczby a₀, . . . , a_n−1 będą dane i niech dla każdego całkowitego k ≥ n ak= cn−1ak−1+· · · + c0ak−n+ f(k), (*) gdzie liczby c₀, . . . , c_n−1i funkcja f są ustalone. Równanie o podanej wyżej postaci nazywa się równaniem różnicowym liniowym rzędu n. Razem

z warunkiem początkowym, tj. danymi liczbami a₀, . . . , a_n−1, określa ono jednoznacznie nieskończony ciąg liczbowy (ak)^∞_k=0. Koszty i złożoności wielu algorytmów (a także inne wielkości występujące w różnych zastosowaniach) można przedstawić za pomocą równań różnicowych. Aby uzyskać wynik w postaci jawnej (w której jest od razu widoczny na przykład rząd złożoności algorytmu), trzeba rozwiązać takie równanie.

Równanie o postaci

ak= c_n−1ak−1+· · · + c0ak−n, (**)

nazwiemy równaniem jednorodnym. Łatwo możemy zauważyć, że jeśli ciągi (a_k)^∞_k=0i (b_k)^∞_k=0są rozwiązaniami równania (*), to różnica tych ciągów jest rozwiązaniem równania (**) i na odwrót: suma rozwiązania równania (*) i dowolnego rozwiązania odpowiadającego mu równania jednorodnego

(otrzymanego przez usunięcie składnika f(k)) też jest rozwiązaniem równania (*).

Metoda rozwiązywania równań różnicowych liniowych jest następująca. Należy znaleźć (np. przez odgadnięcie, co bywa łatwe dla pewnych funkcji f) dowolne rozwiązanie równania. Następnie należy znaleźć takie rozwiązanie równania jednorodnego, aby suma obu rozwiązań spełniała warunki początkowe. Zaczniemy od zbadania, jakie ciągi spełniają równania jednorodne.

Zbadamy hipotezę, że rozwiązanie równania jednorodnego ma postać ak= λ^k. Wstawiając to do (**), po podzieleniu stron przez λ^k−ni uporządkowaniu, dostaniemy tzw. równanie charakterystyczne:

λⁿ− c_n−1λⁿ⁻¹−· · · − c1λ − c₀= 0,

czyli w(λ) = 0. Wielomian w stopnia n nazywa się wielomianem

charakterystycznym równania; liczba λ musi być jego miejscem zerowym. Jeśli wielomian ten ma n różnych (jednokrotnych) miejsc zerowych, to mamy n liniowo niezależnych ciągów liczbowych spełniających równanie jednorodne.

Przykład. Jednorodne równanie różnicowe drugiego rzędu Fk= F_k−1+ F_k−2 z warunkiem początkowym F0= 0, F1= 1określa znany ciąg Fibonacciego.

4.10

Podstawiając a_k= λ^k, otrzymamy równanie kwadratowe λ²− λ − 1 = 0,

którego rozwiązaniami są liczby λ1=¹₂(1 −√

5)i λ2= ¹₂(1 +√

5). Dowolne rozwiązanie równania jednorodnego, w tym rozwiązanie poszukiwane, ma postać Fk= b1λ^k₁+ b2λ^k₂. Na podstawie warunków początkowych

F0= b₁+ b₂= 0, F1= b1λ1+ b2λ2= 1, skąd możemy obliczyć b1= −√¹

5, b2= √¹

5, czyli ostatecznie Fk= 1

√5

1 +√ 5 2

− 1 −√ 5 2

Jeśli pierwiastki wielomianu w są zespolone, to (dla równania o współczynnikach rzeczywistych) występują w parach sprzężonych, (λi, λi), i możemy znaleźć dla każdej takiej pary dwa liniowo niezależne ciągi liczb rzeczywistych, (λ^k_i + λi

k)^∞_k=0 oraz (i(λ^k_i − λ_i^k))^∞_k=0, które spełniają równanie (**). Ten przypadek ma mniejsze znaczenie w obliczaniu kosztów algorytmów, bo rozwiązania odpowiadające zespolonym pierwiastkom równania charakterystycznego oscylują (przyjmując także wartości ujemne).

Jeśli wielomian w ma miejsca zerowe o krotności większej niż 1, to liniowo niezależnych ciągów geometrycznych spełniających równanie (**) jest mniej niż n, zatem może ich nie wystarczyć do znalezienia rozwiązania spełniającego dowolne warunki początkowe. Jeśli liczba λ jest miejscem zerowym wielomianu

charakterystycznego o krotności r, to ciąg (d0+ d1k +· · · + dr−1k^r−1)λ^k^∞ jest rozwiązaniem. Aby spełnić warunek początkowy, należy odpowiednio dobraćk=0

współczynniki d₀, . . . , d_r−1.

Przykład. Rozwiążemy równanie ak= 2ak−1− ak−2 z warunkiem a0= 1, a1= 2.

Mamy w(λ) = λ²− 2λ + 1 = (λ − 1)², skąd wynika, że liczba λ = 1 jest

pierwiastkiem wielomianu w o krotności 2. Zatem rozwiązanie ogólne ma postać (d0+ d1k)· 1^k, i łatwo możemy sprawdzić, że ciąg arytmetyczny ak= k + 1spełnia to równanie i warunek początkowy.

Teraz zajmiemy się znajdowaniem rozwiązań szczególnych równania

niejednorodnego. Postać rozwiązania zależy od funkcji f. Jeśli f(k) = p(k) · µ^k, gdzie p jest wielomianem stopnia s (funkcje o tej postaci mają dla nas największe

4.11

znaczenie) i µ nie jest miejscem zerowym wielomianu charakterystycznego w, to istnieje rozwiązanie szczególne o postaci q(k) · µ^k, gdzie q jest wielomianem stopnia s. Jeśli liczba µ jest miejscem zerowym o krotności r wielomianu charakterystycznego, to pewne rozwiązanie szczególne równania (*) ma postać k^rq(k)· µ^k, gdzie wielomian q ma stopień s; współczynniki tego wielomianu otrzymamy, podstawiając odpowiednie wyrażenie do równania.

Przykład. Niech ak= 2ak−1+ k, oraz a0= 0. Funkcja f jest tu wielomianem stopnia 1, liczba µ = 1 nie jest miejscem zerowym wielomianu w(λ) = λ − 2, zatem pewne rozwiązanie szczególne ma postać ak= ck + d. Podstawiamy,

ck + d = 2 c(k − 1) + d + k, ck + d = 2ck + 2(d − c) + k,

−ck + 2c − d = k,

skąd wynika −c = 1, 2c − d = 0, czyli c = −1, d = −2. Rozwiązanie równania jednorodnego ak= 2ak−1ma postać ak= e· 2^k, zatem rozwiązanie ogólne naszego równania niejednorodnego ma postać ak= −k − 2 + e· 2^k. Na podstawie warunku początkowego −2 + e · 2⁰= 0, skąd e = 2. Poszukiwanym rozwiązaniem równania jest ciąg ak= 2^k+1− k − 2.

Więcej przykładów poznamy, analizując konkretne algorytmy.

4.12

Zadania i problemy

1. Udowodnij, że algorytm

for ( x = a, e = b, z = 1; ; ) { if ( e % 2 == 1 ) z *= x;

e /= 2;

if ( e == 0 ) break;

x *= x;

}

jest poprawnym algorytmem obliczania liczby z = a^bdla a, b ∈ N (o ile nie wystąpi nadmiar w obliczeniach); wszystkie zmienne są typu int.

Wskazówka: Przedstaw wykładnik b i kolejne wartości zmiennej e w układzie dwójkowym.

2. Wskaż w algorytmie z poprzedniego zadania instrukcje, które można uznać za operacje dominujące. Jaka jest złożoność tego algorytmu?

3. Algorytm FFT obliczania dyskretnej transformaty Fouriera (informacja, co to jest, będzie podana później) ciągu liczb (zespolonych) o długości n wykonuje

f(n) = cn(n1+ . . . + n_k)działań arytmetycznych, gdzie c jest stałą dodatnią niezależną od n, natomiast n1, . . . , nk są to liczby pierwsze, których iloczynem jest n.

Znajdź funkcje monotoniczne g i h, takie że f(n) = O(g(n)) oraz f(n) = Ω(h(n)).

Czy istnieje taka funkcja monotoniczna k, że f(n) = Θ(k(n))?

4. Zadanie polega na obliczeniu iloczynu trzech macierzy: D = ABC, gdzie A ∈ R^m,n, B∈ R^n,k i C ∈ R^k,l. Podaj koszty (czasowe i pamięciowe) dwóch algorytmów rozwiązywania tego zadania oparte na „zwykłym” wzorze na iloczyn macierzy.

Pierwszy z tych algorytmów oblicza najpierw E = AB, a następnie D = EC, a drugi najpierw F = BC, a następnie D = AF.

Napisz podprogram w C, który na podstawie liczb m, n, k, l podaje informację, który z tych dwóch algorytmów wykonuje mniej działań.

5. Dla zadania mnożenia macierzy A ∈ R^m,ni B ∈ R^n,kdana jest tylko sumaryczna liczba współczynników tych macierzy: l = (m + k)n. Jaki może być maksymalny koszt mnożenia (w „zwykły” sposób) tych macierzy?

Porównaj otrzymany wynik z kosztem mnożenia macierzy, jeśli wiadomo, że m = n = k(tj. l = 2n²), a także w przypadku, gdy m = k = 1 (tj. l = 2n).

6. Na podstawie deﬁnicji udowodnij, że dowolny wielomian w zmiennej n stopnia k jest funkcją rzędu co najwyżej n^k(czyli w(n) = O(n^k)).

7. Oblicz złożoność pesymistyczną i optymistyczną algorytmu sortowania przez wstawianie (z pierwszego wykładu), przyjmując za operację dominującą porównywanie elementów sortowanego ciągu.

4.13

Zakładając, że wszystkie permutacje, które porządkują ciąg, są jednakowo prawdopodobne, oblicz złożoność średnią tego algorytmu.

Jakie są rzędy wszystkich tych złożoności?

8. Rozważmy zadanie mnożenia liczb n-cyfrowych (którego wynikiem jest liczba 2n-cyfrowa). Dodanie dwóch takich liczb jest wykonalne kosztem O(n) operacji, ponieważ trzeba wykonać odpowiednie działanie na n parach cyfr, do których dochodzą przeniesienia. Natomiast mnożenie w „zwykły” sposób zabiera O(n²) operacji; wszystkie cyfry jednego czynnika mnożymy przez każdą cyfrę drugiego czynnika, a potem trzeba dodać wyniki tych mnożeń (odpowiednio je przesuwając

— to jest algorytm mnożenia „pisemnego”).

Aby uzyskać algorytm o mniejszej złożoności, przedstawimy czynniki, które są liczbami n-cyfrowymi (dla n > 1), w postaci a + bx i c + dx, za pomocą liczb

⌈n/2⌉-cyfrowych a, b, c, d i odpowiednio dobranej liczby x (x = 2^⌈n/2⌉albo x = 10^⌈n/2⌉, zależnie od tego, jakiej podstawy układu używamy). Jeśli pomnożymy

(a + bx)(c + dx) = ac + (bc + ad)x + bdx²,

to sprowadzimy zadanie do czterech mnożeń liczb n/2-cyfrowych (dla uproszczenia zaniedbuję zaokrąglenie n/2 w górę); trzeba obliczyć ac, bc, ad i bd, a następnie wykonać dodawania (w czasie proporcjonalnym do n). W ten sposób otrzymujemy rekurencyjny algorytm mnożenia w czasie cn², bo najwięcej czasu zabierają w nim mnożenia; 4 · c(n/2)²= cn².

Jeśli jednak obliczymy

e = (a + b)(c + d) = ac + ad + bc + bd,

oraz iloczyny ac i bd, to możemy następnie obliczyć (bc + ad) = e − ac − bd.

W ten sposób sprowadziliśmy zadanie do obliczenia tylko trzech iloczynów liczb n/2-cyfrowych (ściślej biorąc, liczby a + c oraz b + d mogą być

(⌈n/2⌉ + 1)-cyfrowe, ale to zaniedbamy, tak samo jak koszt dodawań i odejmowań

— w dokładnych rachunkach oczywiście nie można robić takich zaniedbań, ale tu chodzi o przedstawienie idei).

Napisz odpowiednie równanie różnicowe i wyznacz na jego podstawie rząd złożoności opisanego wyżej algorytmu mnożenia liczb.

9. Algorytm „zwykły” mnożenia macierzy n × n wymaga wykonania 2n³− n²działań arytmetycznych (mnożeń i dodawań zmiennopozycyjnych).

Algorytm Strassena rozwiązuje to samo zadanie kosztem 7n^log²⁷− 6n²działań.

Dla jakich n algorytm Strassena wykonuje mniej działań niż algorytm „zwykły”?

5.1

W dokumencie Kolokwium ze wstępu do informatyki, I rok Mat. (Stron 83-87)