Wielomiany ortogonalne

(1)

2 Wielomiany ortogonalne

Niech I będzie przedziałem otwartym (a, b) (niewykluczone, że nieograniczo-nym).

Rozważmy równanie różniczkowe zwyczajne liniowe drugiego rzędu (2.1) p(x)u00(x) + q(x)u0(x) + r(x)u(x) = f (x),

gdzie p, q, r, f : I → R są co najmniej ciągłe. Ponadto zakładamy, że p(x) > 0 dla wszystkich x ∈ I.

Równanie (2.1) można przekształcić na wiele sposobów. Jednym z nich jest cechowanie: zapisujemy

u(x) = ϕ(x)v(x),

gdzie ϕ: I → R jest funkcją klasy C2 taką, że ϕ(x) 6= 0 dla wszystkich x ∈ I.

Zachodzi

u0(x) = ϕ0(x)v(x)+ϕ(x)v0(x), u00(x) = ϕ00(x)v(x)+2ϕ0(x)v0(x)+ϕ(x)v00(x), co po podstawieniu do równania (2.1) daje

p(x)v00(x)+ 2p(x)ϕ 0_(x) ϕ(x)+q(x) ! v0(x)+ p(x)ϕ 00_(x) ϕ(x) +q(x) ϕ0(x) ϕ(x)+r(x) ! v(x) = f (x) q(x).

Przy pomocy odpowiedniego cechowania możemy, na przykład, usunąć wyrazy rzędu pierwszego w równaniu. Istotnie, zauważmy, że biorąc ϕ takie, że ϕ0 ϕ = − q 2p (na przykład, ϕ(x) = exp − x Z x0 q(ξ) 2p(ξ)dξ ! ,

gdzie x0 ∈ I jest ustalone), w równaniu na v(x) współczynnik przy wyrazach

rzędu pierwszego jest stale równy zeru.

2.1 Twierdzenie Sturma

(1)

Rozważmy równanie różniczkowe zwyczajne liniowe jednorodne drugiego rzę-du

(2.2) p(x)u00(x) + q(x)u0(x) + r(x)u(x) = 0.

(2)

Twierdzenie 2.1 (Twierdzenie Sturma). Niech u1, u2 będą nietrywialnymi

rozwiązaniami równań

p(x)u00_j(x) + q(x)u0_j(x) + rj(x)uj(x) = 0, j = 1, 2,

gdzie r1(x) < r2(x)dla wszystkich x ∈ I. Wówczas, jeśli dla pewnych c, d ∈ I,

c < d, zachodzi u1(c) = u1(d) = 0, to istnieje ˜x ∈ (c, d) takie, że u2(˜x) = 0.

Dowód. Poprzez cechowanie i podzielenie przez p(x) można założyć, że rów-nania mają postać

u00_j(x) + rj(x)uj(x) = 0, j = 1, 2.

Załóżmy, że u1 nie ma miejsc zerowych na (c, d) (w przeciwnym razie, za d

bierzemy pierwsze miejsce zerowe na prawo od c).

Załóżmy nie wprost, że u2 nie ma miejsc zerowych na (c, d). Dla ustalenia

uwagi można założyć, że u1 i u2 są dodatnie na (c, d). Oznaczmy przez W

wrońskian układu funkcji (u1, u2),

W := u1 u2 u0₁ u0₂ = u1u02− u 0 1u2. Zachodzi W0 = u0₁u0₂+u1u002−u 00 1u2−u01u 0 2 = −u1r2u2+r1u1u2 = (r1−r2)u1u2 < 0 na (c, d).

Ponieważ miejsca zerowe nietrywialnego rozwiązania równania różniczkowego liniowego jednorodnego drugiego rzędu są proste(2)_{, musi zachodzić u}0

1(c) > 0

i u0

1(d) < 0, zatem W (c) = −u 0

1(c)u2(c) ¬ 0 i W (d) = −u01(d)u2(d) 0.

Doszliśmy zatem do sprzeczności.

2.2 Operatory różniczkowe

Operatorem różniczkowym stowarzyszonym z równaniem różniczkowym li-niowym jednorodnym drugiego rzędu

(2.3) p(x)u00(x) + q(x)u0(x) + r(x)u(x) = 0 nazywamy odwzorowanie liniowe zdefiniowane jako

L := p(x) d

2

dx2 + q(x)

d

dx + r(x),

(2)_{Miejsce zerowe funkcji jednej zmiennej, klasy C}1_{, nazywamy prostym, gdy pochodna}

(3)

którego dziedziną jest pewna podprzestrzeń liniowa przestrzeni liniowej funk-cji rzeczywistych określonych na I.

Niech w : I → R będzie funkcją ciągłą (w praktyce, znacznie bardziej regularną) taką, że w(x) > 0 dla wszystkich x ∈ I. Taką funkcje w nazywamy wagą.

Dla wagi w na przedziale I oznaczmy

L2_w _{:= { f : I → R, mierzalne,} Z I (f (x))2w(x) dx < ∞ }. Dla f, g ∈ L2 w definiujemy (f, g)w := Z I f (x)g(x)w(x) dx. L2

w jest (rzeczywistą) przestrzenią Hilberta, z iloczynem skalarnym (·, ·)w.

Definicja 2.2. Operator różniczkowy L stowarzyszony z równaniem (2.2) jest symetryczny względem wagi w, gdy

(Lu, v)w = (Lv, u)w

dla dowolnych u, v klasy C2_{, o nośnikach zawartych w zwartym podprzedziale}

przedziału I.(3)

Od tej pory zakładamy, że wszystkie współczynniki równań, wa-gi, itp., są tak regularne, by występujące w dowodach operacje róż-niczkowania i całkowania miały sens.

Lemat 2.3. Operator różniczkowy L stowarzyszony z równaniem (2.2) jest symetryczny względem wagi w wtedy i tylko wtedy, gdy

L = p d 2 dx2 + (pw)0 w d dx+ r = 1 w d dx pw d dx ! + r. Dowód. Załóżmy dodatkowo, że waga w jest klasy C1.

Niech L będzie operatorem symetrycznym. Dla dowolnych u i v jak w definicji operatora symetrycznego zachodzi

Z I (pu00+ qu0+ ru)vw dx = Z I (pv00+ qv0+ rv)uw dx,

(3)_{Zauważmy, że takie funkcje u, v należą do przestrzeni Hilberta L}2

(4)

czyli Z I pw(u00v − v00u) + qw(u0v − v0u)dx = 0, i dalej Z I p(u0v − uv0)0+ q(u0v − uv0)w dx = 0. Ale Z I (pw)(u0v − uv0)0dx = − Z I (pw)0(u0v − uv0) dx, więc (2.4) Z I (u0v − uv0)qw − (pw)0dx = 0.

Dla dowolnej, lecz ustalonej, funkcji v klasy C2 o zwartym nośniku

za-wartym w I weźmy za u funkcję klasy C2_{, o zwartym nośniku zawartym w I,}

przyjmującą wartość 1 na pewnym przedziale zwartym zawierającym nośnik funkcji v w swym wnętrzu.

( )

u(x)

v(x)

Dla każdej funkcjiv(x)można znaleźć funkcjęu(x)taką, że u0(x)v(x) − u(x)v0(x) = −v0(x) na I

Z (2.4) wynika, po scałkowaniu przez części,

0 = − Z I v0qw − (pw)0dx = Z I vqw − (pw)00dx.

Skoro powyższa równość zachodzi dla dowolnej funkcji v klasy C2 _{o zwartym}

nośniku zawartym w I, zachodzi qw − (pw)0

= c, gdzie c jest stałą.

Znów niech v będzie funkcją klasy C2_{, o zwartym nośniku zawartym w I.}

Weźmy za u funkcję klasy C2, o zwartym nośniku zawartym w I, i taką że

u(x) = x na pewnym przedziale zwartym zawierającym nośnik funkcji v w

(5)

( )

u(x)

v(x)

Dla każdej funkcjiv(x)można znaleźć funkcjęu(x)taką, że u0(x)v(x) − u(x)v0(x) = v(x) − xv0(x) na I

0

Na podstawie wzoru (2.4) zachodzi, po scałkowaniu przez części, 0 = c Z I (v(x) − xv0(x)) dx = 2c Z I v(x) dx.

Ponieważ zachodzi to dla dowolnej funkcji nieujemnej i nierównej stale zero, wynika stąd, że c = 0.

Wniosek. Dla operatora różniczkowego L stowarzyszonego z równaniem (2.2) istnieje waga w, określona jednoznacznie z dokładnością do mnożenia przez stałą dodatnią, taka, że L jest symetryczny względem w.

Dowód. (pw)0_{/w = q}_{, czyli (pw)}0_{/(pw) = q/p}_{, a zatem}

w(x) = C p(x)exp   x Z x0 q(y) p(y)dy  , x ∈ I,

gdzie x0 jest ustalonym punktem z I.

Dla danego operatora różniczkowego L stowarzyszonego z równaniem (2.2) można postarać się rozszerzyć jego dziedzinę w taki sposób, by był on wciąż symetryczny względem wagi w.

Przykład. Niech I = (a, b), gdzie −∞ < a < b < ∞. Załóżmy ponadto, że p, p0_{, q, q}0_{, w, w}0 _{rozszerzają się w sposób ciągły na [a, b]. Możemy}

powie-dzieć, że operator L jest symetryczny względem wagi w, gdy dla dowolnych

u, v ∈ L2

w takich, że u, u

0_{, v, v}0 _{są ciągłe na [a, b] zachodzi (Lu, v)}

w = (Lv, u)w.

Zauważmy jednak, że przy takich u i v zachodzi

(Lu, v)w − (Lv, u)w = (pwu0v − pwuv0)| b a.

(6)

Zatem przy powyższej definicji operatora symetrycznego, oprócz warunku

qw = (pw)0 trzeba jeszcze założyć coś więcej. Na przykład, warunkiem

do-statecznym jest, by

p(a)w(a) = p(b)w(b) = 0.

Dla danego operatora L przez klasę funkcji dopuszczalnych rozumiemy odpowiednio „dużą” klasę funkcji, zawartą w L2

w i zawierającą funkcje klasy

C2 o zwartych nośnikach zawartych w I, dla których spełniony jest warunek

(Lu, v)w = (Lv, u)w. W powyższym przykładzie (gdy I jest przedziałem

ogra-niczonym, qw = (pw)0 _{oraz p(a)w(a) = p(b)w(b) = 0), funkcje dopuszczalne}

to funkcje dające sie przedłużyć do funkcji klasy C1 na [a, b].

Dopuszczalna funkcja u 6≡ 0 jest funkcją własną dla operatora L, odpo-wiadającą wartości własnej −λ, gdy

Lu + λu = 0.

Załóżmy, że u1, u2są funkcjami własnymi symetrycznego operatora L

od-powiadającymi wartościom własnym λ1 6= λ2. Zachodzi zatem (Lu1, u2)w =

−λ1(u1, u2)wi (u1, Lu2)w = −λ2(u1, u2)w. Ale (Lu1, u2)w = (Lu2, u1)w, zatem

(u1, u2)w = 0.

2.2.1 Wielomiany Hermite’a, Laguerre’a i Jacobiego

Zastanówmy się, kiedy w skład rodziny funkcji własnych symetrycznego ope-ratora L = p d 2 dx2 + (pw)0 w d dx + r

na I = (a, b) wchodzą (pewne) wielomiany dowolnego stopnia.

Dla każdego n = 0, 1, 2, 3, . . . istnieje wielomian stopnia n będący funk-cją własną operatora L. Wynika stąd, że dla każdego takiego n operator L przeprowadza przestrzeń liniową wielomianów stopnia co najwyżej n w siebie.

Dalej, skoro funkcje własne należą do L2

w, musi zachodzić

(2.5) Z

I

|x|nw(x) dx < ∞

dla wszystkich n = 0, 1, 2, . . . . W szczególności,

(2.6) Z

I

w(x) dx < ∞.

Dalej, L1 = λ oraz L1 = r, zatem współczynnik rzędu zerowego r musi być stały. „Przesuwając” wartości własne można założyć, że r ≡ 0.

(7)

L przeprowadza przestrzeń liniową wielomianów stopnia co najwyżej

je-den w siebie. Dla u(x) = x zachodzi

Lu = (pw) 0 w = p 0 + pw 0 w, zatem (2.7) p0+ pw 0

w jest wielomianem stopnia ¬ 1.

L przeprowadza przestrzeń liniową wielomianów stopnia co najwyżej dwa

w siebie. Dla u(x) = 1 2x 2 zachodzi Lu = p + x p0+ pw 0 w ! zatem

(2.8) p jest wielomianem stopnia ¬ 2.

Skoro L jest operatorem symetrycznym (w rozszerzonym znaczeniu), musi zachodzić (2.9) b Z a pw(u0v − uv0)0dx = 0

dla dowolnych dopuszczalnych u, v, w szczególności dla u i v będących wie-lomianami.

(A) p jest funkcją stałą. Weźmy p ≡ 1.

Zatem w0_/w_{jest wielomianem stopnia co najwyżej jeden. Wynika stąd, że}

wjest eksponentą pewnego wielomianu stopnia co najwyżej dwa. Dokonując

afinicznej zmiany zmiennej niezależnej i dzieląc przez stałą dodatnią, można założyć, że albo w(x) ≡ 1, albo w(x) = e−x_{, albo w(x) = e}±x2

.

Jeśli w(x) ≡ 1, z warunku (2.6) wynika, że I musi być przedziałem ogra-niczonym. Lecz warunek (2.9) nie może być spełniony.

Załóżmy, że w(x) = e−x_{. Warunek (2.6) wymusza, że I nie może być równy}

(−∞, ∞). Lecz wtedy warunek (2.9) nie może być spełniony w skończonych krańcach przedziału I.

W przypadku w(x) = e±x2

warunek (2.9) wymusza, że I = (−∞, ∞), zaś z warunku (2.6) wynika, że w(x) = e−x2

. Operator L ma zatem postać

L = d

2

dx2 − 2x

d dx

(8)

na (−∞, ∞), z wagą w(x) = e−x2

.

Zauważmy, że operator L przeprowadza, dla każdego n = 0, 1, 2, . . . , prze-strzeń wielomianów stopnia co najwyżej n w siebie. Wynika stąd, że dla każ-dego n istnieje wielomian stopnia n będący funkcją własną operatora L. Taki, odpowiednio znormalizowany(4)_{, wielomian nazywamy n-tym wielomianem}

Hermite’a(5), i oznaczamy przez H n.

Łatwo wykazać, że n-ty wielomian Hermite’a Hnodpowiada wartości

wła-snej −2n:

LHn+ 2nHn= 0.

Wielomiany Hermite’a są ortogonalne w przestrzeni Hilberta L2

(R, e−x2dx). Funkcje Hn(x)e −1 2x2 są ortogonalne w przestrzeni L2

(R). Są one funkcjami własnymi operatora

d2

dx2 + (1 − x 2

).

(B) p jest funkcją liniową.

Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = x.

Z (2.7) wynika, że w0_{/w = β + α/x}_{. Zatem w(x) = x}α_eβx_{. Z (2.9)}

wy-nika, że I = (−∞, 0) lub I = (0, ∞). Wybierzmy to drugie. Warunek (2.6) implikuje, że β < 0 i α > −1. Po przeskalowaniu i podzieleniu przez stałą dodatnią możemy założyć, że β = −1.

Operator L ma zatem postać

L = x d 2 dx2 + (α + 1) − x d dx na (0, ∞), z wagą w(x) = xα_e−x_{, gdzie α > −1}

Laguerre’a(7)_{, i oznaczamy przez L}(α) n .

(4)_{W tym przypadku oznacza to, że współczynnik przy najwyższej potędze jest równy}

2n.

(5)_{Charles Hermite (1822 – 1901), matematyk francuski.}

(6)_{W tym przypadku oznacza to, że współczynnik przy najwyższej potędze jest równy}

(−1)n_/n!.

(9)

Łatwo wykazać, że n-ty wielomian Laguerre’a L(α) n odpowiada wartości własnej −n: LL(α) n + nL (α) n = 0.

Wielomiany Laguerre’a są ortogonalne w przestrzeni Hilberta L2_{((0, ∞), x}α_e−x_dx)_.

Funkcje L(α)_n (x)x 1 2αe− 1 2x

są ortogonalne w przestrzeni L2_{((0, ∞))}_{. Są one funkcjami własnymi}

opera-tora x d 2 dx2 + d dx − x 4 − α2 4x+ α + 1 2 . (C) p jest funkcją kwadratową, z wyróżnikiem dodatnim.

Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = 1 − x2.

Z (2.7) wynika, że w0_{/w = β/(1+x)−α/(1−x)}_{. Zatem w(x) = (1−x)}α₍₁₊

x)β_{. Z (2.9) wynika, że I = (−1, 1), lub I = (−∞, −1), lub I = (1, ∞). Dwa}

ostatnie przypadki są wykluczone, gdyż wtedy xn dla dostatecznie dużych n

nie należałyby do L2

w, co przeczy (2.5).

Zatem I = (−1, 1). Warunek (2.6) implikuje, że α > −1 i β > −1. Operator L ma zatem postać

L = (1 − x2₎ d2 dx2 + β − α − (α + β + 2)x d dx na (−1, 1), z wagą w(x) = (1 − x)α_{(1 + x)}β_{, gdzie α, β > −1.}

Jacobiego(9)_{, i oznaczamy przez P}(α,β)

n .

Łatwo wykazać, że n-ty wielomian Jacobiego P(α,β)

n odpowiada wartości własnej −n(n + α + β + 1): LP(α,β) n + n(n + α + β + 1)P (α,β) n = 0.

Wielomiany Jacobiego są ortogonalne w przestrzeni Hilberta L2_{((−1, 1), (1−}

x)α_{(1 + x)}β_dx)_.

(D) p jest funkcją kwadratową, z wyróżnikiem ujemnym.

(8)_{Tutaj normalizacja jest bardziej skomplikowana.}

(10)

Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = 1 + x2_.

Z (2.7) wynika, że w(x) = (1+x2₎a. Z (2.9) wynika, że I = (−∞, ∞). Lecz

wtedy, jakiekolwiek a weźmiemy, xn _{dla dostatecznie dużych n nie należą do}

L2

(E) p jest funkcją kwadratową, z wyróżnikiem równym zeru.

Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = x2_.

Z (2.7) wynika, że w(x) = xa_eb/x_{. Z (2.9) wynika, że I = (0, ∞) (dla}

ustalenia uwagi). Lecz wtedy, jakiekolwiek a weźmiemy, xn dla dostatecznie

dużych n nie należą do L2

Wykazaliśmy, że z dokładnością do dodania wyrazu rzędu zerowego (o stałym współczynniku), afinicznej zamiany zmiennej niezależnej i pomnoże-nia przez stałą dodatnią, równapomnoże-nia różniczkowe zwyczajne liniowe jednorodne rzędu drugiego, mające wielomiany dowolnego stopnia jako funkcje własne, to równania odpowiadające wielomianom Hermite’a, Laguerre’a i Jacobiego (czyli tzw. klasycznym wielomianom ortogonalnym).

2.3 Ogólna teoria wielomianów ortogonalnych

Niech I = (a, b). Niech w : I → (0, ∞) będzie funkcją ciągłą taką, że

An:= Z I xnw(x) dx < ∞ dla wszystkich n = 0, 1, 2, . . . . Oznaczmy ∆−1 := 1, ∆n:= A0 A1 . . . An A1 A2 . . . An+1 ... ... ... ... An An+1 . . . A2n , n = 0, 1, 2, . . . .

Lemat 2.4. ∆n> 0 dla każdego n = 0, 1, 2, . . . .

Dowód. Forma kwadratowa

n X j,k=0 Aj+kajak= Z I n X j,k=0 xj+kajak w(x) dx = Z I n X j=0 ajxj 2 w(x) dx

(11)

Zdefiniujmy wielomiany Qn(x) := A0 A1 . . . An−1 1 A1 A2 . . . An x ... ... ... ... ... An An+1 . . . A2n−1 xn .

Wykorzystując rozwinięcie Laplace’a względem (n + 1)-szej kolumny otrzy-mujemy, że (Qn(x), xm)w = A0 A1 . . . An−1 Am A1 A2 . . . An Am+1 ... ... ... ... ... An An+1 . . . A2n−1 Am+n , co daje (Qn(x), xm)w = 0 dla m = 0, 1, . . . , n − 1, (Qn(x), xn)w = ∆n.

W szczególności, wielomiany Qn są ortogonalne. Dalej,

(Qn(x), Qn(x))w = (Qn(x), ∆n−1xn)w = ∆n−1(Qn(x), xn)w = ∆n−1∆n, zatem wielomiany Pn(x) := 1 √ ∆n−1∆n Qn(x) są ortonormalne.

Oznaczmy przez hn współczynnik przy xn w wielomianie Pn(x). Zachodzi

hn= ∆n−1 √ ∆n−1∆n = s ∆n−1 ∆n .

Wielomian xPn(x) ma stopień n + 1, i jest ortogonalny do xm dla m =

0, 1, . . . , n − 2, zatem dla takich m zachodzi (xPn(x), Pm(x))w = 0.

Mnożąc skalarnie równość

xPn(x) =

(12)

przez Pm(x) otrzymujemy, że αn−2 = . . . = α0 = 0. Zatem istnieją an, bn, cn

takie, że

(2.10) xPn(x) = anPn+1(x) + bnPn(x) + cnPn−1(x).

Powyższy wzór nazywamy formułą trójczłonową. Wyliczmy an = hn hn+1 , cn= (xPn(x), Pn−1(x))w = (Pn(x), xPn−1(x))w = hn−1 hn = an−1.

Po prostych manipulacjach otrzymujemy, dla x, y ∈ I, x 6= y, (x − y)Pn(x)Pn(y) = = an Pn+1(x)Pn(y)−Pn(x)Pn+1(y) −an−1 Pn(x)Pn−1(y)−Pn−1(x)Pn(y) ,

i ostatecznie otrzymujemy wzór Christoffela(10)_–Darboux(11)_:

(2.11) an Pn+1(x)Pn(y) − Pn(x)Pn+1(y) x − y = n X j=0 Pj(x)Pj(y).

Lewą stronę wzoru Christoffela–Darboux nazywamy jądrem Dirichleta(12)_{, i}

oznaczamy przez Kn(x, y).

Twierdzenie 2.5. Dla wielomianu q stopnia ¬ n zachodzi

q(x) =

Z

I

Kn(x, y)q(y)w(y) dy, x ∈ I.

Dowód. q jest kombinacją liniową wielomianów Pk, k = 0, 1, . . . , n. Z

orto-normalności wynika, że

q =

n

X

j=0

(q, Pj)wPj.

Stosujemy teraz wzór Christoffela–Darboux.

Gdy y → x, otrzymujemy ze wzoru Christoffela–Darboux (2.11), że (2.12) an P_n+10 (x)Pn(x) − Pn+1(x)Pn0(x) = n X j=0 (Pj(x))2. Wynika stąd następujący

(10)_{Elwin Bruno Christoffel (1829 – 1900), matematyk niemiecki.} (11)_{(Jean) Gaston Darboux (1842 – 1917), matematyk francuski.}

(13)

Wniosek. Pierwiastki wielomianów Pn należące do I są pojedyncze.

Dowód. P0 jest różną od zera funkcją stałą, zatem nie ma pierwiastków.

Załóżmy nie wprost, że x0 ∈ I jest pierwiastkiem pewnego Pn, n 1,

krotności większej niż 1. Lecz wtedy lewa strona wzoru (2.12) jest równa zeru, podczas gdy prawa strona jest co najmniej równa (P0)2 > 0.

Lemat 2.6. Pn ma n pierwiastków rzeczywistych, wszystkie w przedziale I.

Dowód. Niech x1 < . . . < xm będą wszystkimi pierwiastkami wielomianu Pn

w przedziale I. Oznaczmy q(x) := m Y j=1 (x − xj)gdy m > 0, q(x) :≡ 1 gdy m = 0.

x1, . . . , xm są pierwiastkami krotności jeden zarówno wielomianu Pn jak i q,

więc Pn i q zmieniają znak w tych samych punktach przedziału I. Zatem

qPn ma stały znak poza pierwiastkami. Wynika stąd, że (q, Pn)w 6= 0. Lecz

Pn jest ortogonalny do wszystkich xk, k = 0, 1, . . . , n − 1, więc q musi być

wielomianem stopnia co najmniej n. Zatem m = n.

Lemat 2.7. Pomiędzy kolejnymi pierwiastkami wielomianu Pn znajduje się

pierwiastek wielomianu Pn−1

Dowód. Niech n 2. Zachodzi

P_n0(x)Pn−1(x) − Pn(x)Pn−10 (x) > 0.

Dla x1 < x2, kolejnych pierwiastków wielomianu Pn, powyższa nierówność

implikuje, że

P_n0(x1)Pn−1(x1) > 0, Pn0(x2)Pn−1(x2) > 0.

P_n0(x1) i Pn0(x2) muszą mieć różne znaki, zatem Pn−1(x1) i Pn−1(x2) mają

różne znaki.

2.3.1 Zupełność wielomianów ortogonalnych

Twierdzenie 2.8. Załóżmy, że dla pewnego c > 0 zachodzi

Z

I

e2c|x|w(x) dx < ∞.

(14)

Dowód. Niech f ∈ L2 w. Ciąg (fn)∞n=0, gdzie fn = n X j=0 (f, Pj)wPj,

jest ciągiem Cauchy’ego w L2

w. Oznaczmy jego granicę przez g.

Dla każdego n ∈ N ∪ {0} zachodzi (f, Pn)w = (g, Pn)w. zatem h := f − g

jest ortogonalna do każdego Pm. Rozszerzamy h i w na całe R kładąc zero

poza I. Z nierówności Schwarza

Z R |h(x)w(x)| dx ¬ Z R |h(x)|qw(x)2dx 1/2 · Z R q w(x)2dx 1/2 < ∞.

Transformata Fouriera, H(ξ), funkcji hw,

H(ξ) =hw(ξ) =d 1 √ 2π Z R e−ixξh(x)w(x) dx,

jest holomorficzna w pasie { |Im ξ| < c }. Zachodzi

H(n)(0) = (−i) n √ 2π Z R xnh(x)w(x) dx.

Lecz z (h, Pn)w = 0 wynika, że h jest ortogonalne do xn, czyli H(n)(0) = 0,

dla każdego n. Zatem H ≡ 0. 2.3.2 Wzór Rodriguesa

Powracamy teraz do klasycznych wielomianów ortogonalnych. Rozważmy równanie na wartości własne:

(2.13) p(x)ψ00_n(x) + (p(x)w(x)) 0 w(x) ψ 0 n(x) + λnψn(x) = 0. Różniczkując je po x otrzymujemy (2.14) p(ψ_n0)00+ (q + p0)(ψ_n0)0+ (q0 + λn)ψn0 = 0. Ale q + p0 = (pw) 0 w + p 0 = p 2_w0_{+ 2pp}0_w pw = p(pw)0 pw ,

(15)

Otrzymaliśmy, że ψ0

n są wielomianami ortogonalnymi stopnia n − 1 dla

wagi pw, z wartościami własnymi −λn− q0.

Dalej, ψ00

n są wielomianami ortogonalnymi stopnia n − 2 dla wagi p2w, z

wartościami własnymi

−λn− q0− (p0+ q)0 = −λn− 2q0 − p00.

Ogólnie, ψ(m)

n są wielomianami ortogonalnymi stopnia n − m dla wagi

pm_w_{, z wartościami własnymi}

−λn− mq0− 1₂m(m − 1)p00.

ψ(n)

n to stała odpowiadająca wartości własnej zero. Otrzymujemy stąd

λn= −nq0−1₂n(n − 1)p00. Równanie (2.13) daje (2.15) wψn = − 1 λn (pwψ0_n)0, ale, z (2.14), (λn+ q0)pwψ0n= −(p 2_wψ000 n + p 2_w0 ψ_n00+ 2pp0wψ_n00) = = −(p2(wψ_n00)0+ (p2)0(wψ00_n)) = −(p2wψ_n00)0, stąd (2.16) (pwψ_n0)0 = − 1 λn+ q0 (p2wψ_n00)00. Z (2.15) i (2.16) wynika, że wψn= 1 λn(λn+ q0) (p2wψ00_n)00.

Powtarzając powyższe rozumowanie otrzymujemy, że

wψn = (−1)n n−1 Y m=0 λn+ mq0+1₂m(m − 1)p00 −1 (pnwψ(n)_n )(n) Zauważmy, że ψ(n) n to stała.

(16)

W szczególności, otrzymujemy (ogólny) wzór Rodriguesa(13) (2.17) ψn(x) = cn w(x) dn dxn p(x)nw(x), gdzie cn 6= 0.

Przy „tradycyjnej” normalizacji klasycznych wielomianów ortogonalnych mamy

• wzór Rodriguesa dla wielomianów Hermite’a (2.18) Hn(x) = (−1)nex

2 dn

dxn(e −x2

), • wzór Rodriguesa dla wielomianów Laguerre’a

(2.19) L(α)_n (x) = 1 n!x −α ex d n dxn(e −x xn+α), • wzór Rodriguesa dla wielomianów Jacobiego

(2.20) P(α,β) n (x) = (−1)n n!2n (1−x) −α (1+x)−β d n dxn (1−x)n+α(1+x)n+β. 2.3.3 Funkcje tworzące

Funkcją tworzącą dla (klasycznych) wielomianów ortogonalnych ψnnazwijmy

funkcję G(x, s) := ∞ X n=0 ψn(x) n! s n_. Rozważmy wzór Rodriguesa ψn(x) = 1 w(x) dn dxn p(x)nw(x).

Ustalmy x ∈ I, i niech Γ ∈ C będzie zorientowanym dodatnio okręgiem o środku w x i promieniu tak małym, by był zawarty wraz ze swym wnętrzem w dziedzinie funkcji p i w. Zachodzi

ψn(x) = n! 2πi Z Γ w(z) w(x) p(z)n (z − x)n dz z − x.

(13)_{(Benjamin-)Olinde Rodrigues(-Henriques) (1795 – 1851), matematyk, filozof i bankier}

(17)

Podstawiając powyższe do wzoru na funkcję tworzącą otrzymujemy G(x, s) = 1 2πi Z Γ ∞ X n=0 sn_p(z)n (z − x)n w(z) w(x) dz z − x = 1 2πi Z Γ w(z) w(x) dz z − x − sp(z).

Oznaczmy przez ζ(x, s) rozwiązanie (względem z) równania z − x = sp(z), zbieżne do x przy s → 0. Z postaci p (mianowicie, p(z) ≡ 1, lub p(z) = z lub

p(z) = 1 − z2_{) wynika, że rozwiązanie to jest jednoznacznie określone.}

Jako że pochodna po z funkcji z − x − sp(z), czyli 1 − sp0_(z)_{jest różna od}

zera dla |s| dostatecznie małych, więc ζ = ζ(x, s) jest biegunem rzędu jeden funkcji podcałkowej, i residuum w tym punkcie jest równe

lim z→ζ w(z) w(x) z − ζ z − x − sp(z) = w(ζ) w(x) 1 1 − sp0_(ζ). ( ) ζ x Γ

Przy dostatecznie małym |s| i dostatecznie małym promieniu okręgu Γ, wewnątrz Γ znajduje się tylko jeden biegunζfunkcji podcałkowej

Zatem

G(x, s) = w(ζ) w(x)

1

1 − sp0_(ζ), ζ − sp(ζ) = x, |s| małe.

2.3.4 Więcej o wielomianach Hermite’a

Przypomnijmy, że wielomiany Hermite’a spełniają równanie (2.21) H_n00(x) − 2xH_n0(x) + 2nHn(x) = 0,

są ortogonalne na (−∞, ∞) względem wagi e−x2

, i spełniają wzór Rodriguesa Hn(x) = (−1)nex 2 dn dxn(e −x2 ).

(18)

Powyższy wzór można zapisać jako Hn(x) = 2x − d dx !n (1).

Wynika zeń, w szczególności, że współczynnik przy najwyższej potędze w

Hn(x)jest równy 2n,

H_n0(x) = 2nHn−1(x),

H_n0(x) − 2xHn(x) = −Hn+1(x).

Formuła trójczłonowa (2.10) przybiera teraz postać

Hn+1(x) = 2xHn(x) − 2nHn−1(x).

Wielomian Hermite’a stopnia n jest funkcją parzystą dla n parzystych, i nieparzystą dla n nieparzystych.

Zapisując wielomiany Hermite’a jako

Hn(x) = n

X

k=0

ckxk,

z równania na wartości własne (2.21) otrzymujemy, że (k + 2)(k + 1)ck+2= 2(k − n)ck,

z czego wynika, że

Hn(x) = X 2j¬n (−1)j n! j!(n − 2j)!(2x) n−2j_.

Funkcję tworzącą dla wielomianów Hermite’a definiujemy jako

G(x, s) = ∞ X n=0 Hn(x) n! s n .

Zastosujmy wyliczenia z poprzedniego podrozdziału, pamiętając o tym, że w przypadku wielomianów Hermite’a występuje współczynnik (−1)n_.

Odpo-wiada to zastąpieniu s przez −s. Wówczas ζ(x, s) = x − s, i otrzymujemy

G(x, s) = e

−(x−s)2

e−x2 = e 2xs−s2

(19)

Zauważmy, że ∞ X m,n=0 sm m! tn n! ∞ Z −∞ Hm(x)Hn(x)e−x 2 dx = ∞ Z −∞ G(x, s)G(x, t)e−x2dx = = ∞ Z −∞ e2ste−(x−s−t)2dx = e2st√π =√π ∞ X n=0 (2st)n n! , co daje ∞ X n=0 tn n! ∞ X m=0 (Hm, Hn)wsm m! ! =√π ∞ X n=0 tn n!2 n_sn_, i dalej, ∞ X m=0 (Hm, Hn)wsm m! = √ π2nsn. Zatem (Hm, Hn)w = 0 dla m 6= n, (Hn, Hn)w = n! 2n √ π.

Znormalizowane wielomiany Hermite’a definiujemy jako

f Hn(x) = 1 4 √ π√n! 2nHn(x).

Przypomnijmy, że dla f ∈ L2

w współczynniki rozwinięcia w bazie

ortonor-malnej (Hf_n)∞

n=0 są równe

fn= (f,Hf_n)_w.

Załóżmy teraz, że funkcja f ma wszystkie pochodne wykładniczego wzrostu. Wtedy dla n = 0, 1, 2, . . . zachodzi

∞ Z −∞ f (x)Hn(x)e−x 2 dx = ∞ Z −∞ (−1)nf (x)ex2 d n dxn(e −x2 ) ! e−x2dx = = ∞ Z −∞ (−1)nf (x) d n dxn(e −x2 ) dx = ∞ Z −∞ f(n)(x)e−x2dx.

Wynika stąd w szczególności, że (xm_{, H}

n)w = 0 gdy m < n (co już wiemy),

a także, że (xm_{, H}

n)w 6= 0 co najwyżej, gdy m i n mają tę samą parzystość.

Gdy m = n + 2k, otrzymujemy (xm, Hn)w = m! (m − n)! ∞ Z −∞ e−x2xm−ndx = 2 m! (m − n)! ∞ Z 0 e−x2xm−ndx,

(20)

co po zamianie zmiennych t = x2 _{(dx =} 1 2t −1/2_dt_{, x}m−n _{= t}(m−n)/2_{) daje} m! (m − n)! ∞ Z 0 e−tt(m−n)/2t−1/2dt = m! (m − n)!Γ( 1 2(m − n + 1)).

Analogicznie można wyliczyć, dla a ∈ C,

(eax, Hn)w = an ∞ Z −∞ eax−x2dx = an ∞ Z −∞ e−(x−a/2)2ea2/4dx = = anea2/4 ∞ Z −∞ e−x2dx = anea2/4√π.

Oznaczając zmienną x przez t i podstawiając następnie a = 2ix, otrzymujemy

e−x2 = √1 π ∞ Z −∞ e−2ixt−t2dt.

Z powyższego wzoru można otrzymać, wykorzystując wzór Rodriguesa, że

Hn(x) = (−1)n ex2 √ π ∞ Z −∞ (−2it)ne−2ixt−t2dt.

Pierwiastki wielomianów Hermite’a mają następujące własności:

Twierdzenie 2.9. Wielomian Hermite’a Hn(x) ma n pierwiastków

pojedyn-czych, leżących w przedziale

−√2n + 1 < x <√2n + 1. Można nawet powiedzieć więcej:

Twierdzenie 2.10. Dodatnie pierwiatki x1,n < x2,n < . . . wielomianu

Her-mite’a Hn(x) spełniają następujące oszacowania:

• dla n = 2m, (2k − 1)π 2√2n + 1 < xk,n < 4k + 1 √ 2n + 1, k = 1, 2, . . . , m; • dla n = 2m + 1, kπ 2√2n + 1 < xk,n < 4k + 3 √ 2n + 1, k = 1, 2, . . . , m. Zachodzi następujący wzór asymptotyczny

(2.22) Hn(x) = 2n/2 21/4_(n!)1/2 (nπ)1/2 e x2_/2 cos √ 2n + 1 x −1 2nπ + O(n−1/2) !

(21)

2.3.5 Rozwinięcia w szeregi względem wielomianów Hermite’a Oznaczmy, dla funkcji rzeczywistej f określonej na (−∞, ∞)

f (x) ∼ ∞ X n=0 cnHn(x), gdzie cn = 1 2n_n!√_π ∞ Z −∞ f (x)Hn(x)e−x 2 dx.

Wiemy już (Twierdzenie 2.8), że dla f ∈ L2

w sumy częściowe szeregu są

zbieżne do f w normie L2 w.

Twierdzenie 2.11. Załóżmy, że f ∈ L2_w. Niech x będzie takie, że dla pewnych

δ > 0 i C > 0 zachodzi f (ξ) − f (x) ξ − x ¬ C gdy 0 < |ξ − x| < δ. Wówczas szereg P∞ n=0 cnHn(x) jest zbieżny do f(x).

2.3.6 Wielomiany Legendre’a i Czebyszewa

Wielomiany Legendre’a(14) _{to wielomiany Jacobiego dla α = β = 0:}

Pn(x) = Pn(0,0)(x).

Waga to w(x) ≡ 1, równanie na wartości własne to

(1 − x2)P_n00(x) − 2xP_n0(x) + n(n + 1)Pn(x) = 0, i funkcja tworząca to ∞ X n=0 Pn(x)sn = (1 − 2xs + s2)−1/2.

Wielomiany Czebyszewa(15) _{można zdefiniować jako}

Tn(x) = 2 · 4 · 6 · . . . · (2n) 3 · 5 · . . . · (2n − 1)P (−1/2,−1/2) n (x), Un(x) = 4 · 6 · . . . · (2n + 2) 1 · 3 · 5 · . . . · (2n + 1)P (1/2,1/2) n (x).

(14)_{Adrien-Marie Legendre (1752 – 1833), matematyk francuski.}

(15)_{Pafnutij Lwowicz Czebyszew (powinno być: Czebyszow) (1821 – 1894), matematyk}

(22)

Ich funkcje tworzące to ∞ X n=0 Tn(x)sn = 1 − xs 1 − 2xs + s2, ∞ X n=0 Un(x)sn = 1 1 − 2xs + s2.

Wielomiany Gegenbauera(16)_{, zwane też wielomianami ultrasferycznymi,}

definiowane są jako C_nλ(x) = (2λ) · (2λ + 1) · . . . · (2λ + n − 1) (λ + 1 2) · (λ + 3 2) · . . . · (λ + n − 1 2) P_n(λ−1/2,λ−1/2)(x).

2.3.7 Informacja o dyskretnych wielomianach ortogonalnych W poprzednich podrozdziałach rozważaliśmy wielomiany, które są ortogonal-ne względem iloczynu skalarortogonal-nego wyznaczoortogonal-nego przez ciągłą wagę: całkowa-nie odbywało się po mierze absolutcałkowa-nie ciągłej względem miary Lebesgue’a, z gęstością w(x). Zamiast takiej miary możemy wziąć miarę dyskretną (na przykład, sumę przeliczalnie wielu delt Diraca w punktach całkowitych).

Dokładniej, niech w = (wn)∞n=−∞ będzie ciągiem liczb nieujemnych.

Ilo-czyn skalarny definiujemy wzorem (f, g)w := ∞ X k=−∞ f (m)g(m)wm, a normę wzorem kf k2 w := ∞ X k=−∞ (f (m))2wm.

Wielomiany mają skończoną normę wtedy i tylko wtedy, gdy momenty rzędu parzystego sa skończone:

∞

X

k=−∞

m2nwm < ∞.

W takim przypadku można skonstruować wielomiany ortogonalne analogicz-nie jak w przypadku ciągłej wagi. Zachodzą wtedy odpowiedniki formuły trójczłonowej (2.10) i wzoru Christoffela–Darboux (2.11). Ponadto, jeśli ist-nieje c > 0 takie, że

∞

X

k=−∞

e2c|m|wm < ∞,

(23)

to wielomiany ortogonalne tworzą bazę odpowiedniej przestrzeni Hilberta. Zamiast liniowego operatora różniczkowego drugiego rzędu rozpatrujemy teraz tzw. liniowy operator różnicowy drugiego rzędu. Rozpocznijmy od zde-finiowania operatorów przesunięcia wzorem

(S±f )(m) := f (m ± 1).

Operator różnicowy drugiego rzędu to

L := p+S++ p−S−+ r,

gdzie p+, p− i r to funkcje. Operator L jest symetryczny względem w wtedy

i tylko wtedy, gdy

S−(p+w) = p−w,

co jest równoważne

S+(p−w) = p+w.

Z symetrii wynika, że funkcje własne odpowiadające różnym wartościom wła-snym sa ortogonalne.

Można spytać, kiedy operator L ma jako funkcje własne pewne wielomia-ny stopni zero, jeden i dwa. Okazuje się, że odpowiada to tzw. klasyczwielomia-nym dyskretnym wielomianom ortogonalnym:

• wielomiany Charliera(17)(zwane też wielomianami Poissona–Charliera),

• wielomiany Krawczuka(18)_,

• wielomiany Meixnera(19)_,

• wielomiany Hahna(20).

(17)_{Carl Vilhelm Ludwig Charlier (1862 – 1934), astronom szwedzki.}

(18)_{Mychajło Pyłypowicz Krawczuk (1892 – 1942), matematyk ukraiński (używana jest}

też forma rosyjska: Michaił Filippowicz Krawczuk).

(19)_{Josef Meixner (1908 – 1992), niemiecki fizyk teoretyk.}

(20)_{Wolfgang Hahn (1911 – 1998), matematyk niemiecki (nie mylić z matematykiem}