2
Wielomiany ortogonalne
Niech I będzie przedziałem otwartym (a, b) (niewykluczone, że nieograniczo-nym).
Rozważmy równanie różniczkowe zwyczajne liniowe drugiego rzędu (2.1) p(x)u00(x) + q(x)u0(x) + r(x)u(x) = f (x),
gdzie p, q, r, f : I → R są co najmniej ciągłe. Ponadto zakładamy, że p(x) > 0 dla wszystkich x ∈ I.
Równanie (2.1) można przekształcić na wiele sposobów. Jednym z nich jest cechowanie: zapisujemy
u(x) = ϕ(x)v(x),
gdzie ϕ: I → R jest funkcją klasy C2 taką, że ϕ(x) 6= 0 dla wszystkich x ∈ I.
Zachodzi
u0(x) = ϕ0(x)v(x)+ϕ(x)v0(x), u00(x) = ϕ00(x)v(x)+2ϕ0(x)v0(x)+ϕ(x)v00(x), co po podstawieniu do równania (2.1) daje
p(x)v00(x)+ 2p(x)ϕ 0(x) ϕ(x)+q(x) ! v0(x)+ p(x)ϕ 00(x) ϕ(x) +q(x) ϕ0(x) ϕ(x)+r(x) ! v(x) = f (x) q(x).
Przy pomocy odpowiedniego cechowania możemy, na przykład, usunąć wyrazy rzędu pierwszego w równaniu. Istotnie, zauważmy, że biorąc ϕ takie, że ϕ0 ϕ = − q 2p (na przykład, ϕ(x) = exp − x Z x0 q(ξ) 2p(ξ)dξ ! ,
gdzie x0 ∈ I jest ustalone), w równaniu na v(x) współczynnik przy wyrazach
rzędu pierwszego jest stale równy zeru.
2.1
Twierdzenie Sturma
(1)Rozważmy równanie różniczkowe zwyczajne liniowe jednorodne drugiego rzę-du
(2.2) p(x)u00(x) + q(x)u0(x) + r(x)u(x) = 0.
Twierdzenie 2.1 (Twierdzenie Sturma). Niech u1, u2 będą nietrywialnymi
rozwiązaniami równań
p(x)u00j(x) + q(x)u0j(x) + rj(x)uj(x) = 0, j = 1, 2,
gdzie r1(x) < r2(x)dla wszystkich x ∈ I. Wówczas, jeśli dla pewnych c, d ∈ I,
c < d, zachodzi u1(c) = u1(d) = 0, to istnieje ˜x ∈ (c, d) takie, że u2(˜x) = 0.
Dowód. Poprzez cechowanie i podzielenie przez p(x) można założyć, że rów-nania mają postać
u00j(x) + rj(x)uj(x) = 0, j = 1, 2.
Załóżmy, że u1 nie ma miejsc zerowych na (c, d) (w przeciwnym razie, za d
bierzemy pierwsze miejsce zerowe na prawo od c).
Załóżmy nie wprost, że u2 nie ma miejsc zerowych na (c, d). Dla ustalenia
uwagi można założyć, że u1 i u2 są dodatnie na (c, d). Oznaczmy przez W
wrońskian układu funkcji (u1, u2),
W := u1 u2 u01 u02 = u1u02− u 0 1u2. Zachodzi W0 = u01u02+u1u002−u 00 1u2−u01u 0 2 = −u1r2u2+r1u1u2 = (r1−r2)u1u2 < 0 na (c, d).
Ponieważ miejsca zerowe nietrywialnego rozwiązania równania różniczkowego liniowego jednorodnego drugiego rzędu są proste(2), musi zachodzić u0
1(c) > 0
i u0
1(d) < 0, zatem W (c) = −u 0
1(c)u2(c) ¬ 0 i W (d) = −u01(d)u2(d) 0.
Doszliśmy zatem do sprzeczności.
2.2
Operatory różniczkowe
Operatorem różniczkowym stowarzyszonym z równaniem różniczkowym li-niowym jednorodnym drugiego rzędu
(2.3) p(x)u00(x) + q(x)u0(x) + r(x)u(x) = 0 nazywamy odwzorowanie liniowe zdefiniowane jako
L := p(x) d
2
dx2 + q(x)
d
dx + r(x),
(2)Miejsce zerowe funkcji jednej zmiennej, klasy C1, nazywamy prostym, gdy pochodna
którego dziedziną jest pewna podprzestrzeń liniowa przestrzeni liniowej funk-cji rzeczywistych określonych na I.
Niech w : I → R będzie funkcją ciągłą (w praktyce, znacznie bardziej regularną) taką, że w(x) > 0 dla wszystkich x ∈ I. Taką funkcje w nazywamy wagą.
Dla wagi w na przedziale I oznaczmy
L2w := { f : I → R, mierzalne, Z I (f (x))2w(x) dx < ∞ }. Dla f, g ∈ L2 w definiujemy (f, g)w := Z I f (x)g(x)w(x) dx. L2
w jest (rzeczywistą) przestrzenią Hilberta, z iloczynem skalarnym (·, ·)w.
Definicja 2.2. Operator różniczkowy L stowarzyszony z równaniem (2.2) jest symetryczny względem wagi w, gdy
(Lu, v)w = (Lv, u)w
dla dowolnych u, v klasy C2, o nośnikach zawartych w zwartym podprzedziale
przedziału I.(3)
Od tej pory zakładamy, że wszystkie współczynniki równań, wa-gi, itp., są tak regularne, by występujące w dowodach operacje róż-niczkowania i całkowania miały sens.
Lemat 2.3. Operator różniczkowy L stowarzyszony z równaniem (2.2) jest symetryczny względem wagi w wtedy i tylko wtedy, gdy
L = p d 2 dx2 + (pw)0 w d dx+ r = 1 w d dx pw d dx ! + r. Dowód. Załóżmy dodatkowo, że waga w jest klasy C1.
Niech L będzie operatorem symetrycznym. Dla dowolnych u i v jak w definicji operatora symetrycznego zachodzi
Z I (pu00+ qu0+ ru)vw dx = Z I (pv00+ qv0+ rv)uw dx,
(3)Zauważmy, że takie funkcje u, v należą do przestrzeni Hilberta L2
czyli Z I pw(u00v − v00u) + qw(u0v − v0u)dx = 0, i dalej Z I p(u0v − uv0)0+ q(u0v − uv0)w dx = 0. Ale Z I (pw)(u0v − uv0)0dx = − Z I (pw)0(u0v − uv0) dx, więc (2.4) Z I (u0v − uv0)qw − (pw)0dx = 0.
Dla dowolnej, lecz ustalonej, funkcji v klasy C2 o zwartym nośniku
za-wartym w I weźmy za u funkcję klasy C2, o zwartym nośniku zawartym w I,
przyjmującą wartość 1 na pewnym przedziale zwartym zawierającym nośnik funkcji v w swym wnętrzu.
( )
u(x)
v(x)
Dla każdej funkcjiv(x)można znaleźć funkcjęu(x)taką, że u0(x)v(x) − u(x)v0(x) = −v0(x) na I
Z (2.4) wynika, po scałkowaniu przez części,
0 = − Z I v0qw − (pw)0dx = Z I vqw − (pw)00dx.
Skoro powyższa równość zachodzi dla dowolnej funkcji v klasy C2 o zwartym
nośniku zawartym w I, zachodzi qw − (pw)0
= c, gdzie c jest stałą.
Znów niech v będzie funkcją klasy C2, o zwartym nośniku zawartym w I.
Weźmy za u funkcję klasy C2, o zwartym nośniku zawartym w I, i taką że
u(x) = x na pewnym przedziale zwartym zawierającym nośnik funkcji v w
( )
u(x)
v(x)
Dla każdej funkcjiv(x)można znaleźć funkcjęu(x)taką, że u0(x)v(x) − u(x)v0(x) = v(x) − xv0(x) na I
0
Na podstawie wzoru (2.4) zachodzi, po scałkowaniu przez części, 0 = c Z I (v(x) − xv0(x)) dx = 2c Z I v(x) dx.
Ponieważ zachodzi to dla dowolnej funkcji nieujemnej i nierównej stale zero, wynika stąd, że c = 0.
Wniosek. Dla operatora różniczkowego L stowarzyszonego z równaniem (2.2) istnieje waga w, określona jednoznacznie z dokładnością do mnożenia przez stałą dodatnią, taka, że L jest symetryczny względem w.
Dowód. (pw)0/w = q, czyli (pw)0/(pw) = q/p, a zatem
w(x) = C p(x)exp x Z x0 q(y) p(y)dy , x ∈ I,
gdzie x0 jest ustalonym punktem z I.
Dla danego operatora różniczkowego L stowarzyszonego z równaniem (2.2) można postarać się rozszerzyć jego dziedzinę w taki sposób, by był on wciąż symetryczny względem wagi w.
Przykład. Niech I = (a, b), gdzie −∞ < a < b < ∞. Załóżmy ponadto, że p, p0, q, q0, w, w0 rozszerzają się w sposób ciągły na [a, b]. Możemy
powie-dzieć, że operator L jest symetryczny względem wagi w, gdy dla dowolnych
u, v ∈ L2
w takich, że u, u
0, v, v0 są ciągłe na [a, b] zachodzi (Lu, v)
w = (Lv, u)w.
Zauważmy jednak, że przy takich u i v zachodzi
(Lu, v)w − (Lv, u)w = (pwu0v − pwuv0)| b a.
Zatem przy powyższej definicji operatora symetrycznego, oprócz warunku
qw = (pw)0 trzeba jeszcze założyć coś więcej. Na przykład, warunkiem
do-statecznym jest, by
p(a)w(a) = p(b)w(b) = 0.
Dla danego operatora L przez klasę funkcji dopuszczalnych rozumiemy odpowiednio „dużą” klasę funkcji, zawartą w L2
w i zawierającą funkcje klasy
C2 o zwartych nośnikach zawartych w I, dla których spełniony jest warunek
(Lu, v)w = (Lv, u)w. W powyższym przykładzie (gdy I jest przedziałem
ogra-niczonym, qw = (pw)0 oraz p(a)w(a) = p(b)w(b) = 0), funkcje dopuszczalne
to funkcje dające sie przedłużyć do funkcji klasy C1 na [a, b].
Dopuszczalna funkcja u 6≡ 0 jest funkcją własną dla operatora L, odpo-wiadającą wartości własnej −λ, gdy
Lu + λu = 0.
Załóżmy, że u1, u2są funkcjami własnymi symetrycznego operatora L
od-powiadającymi wartościom własnym λ1 6= λ2. Zachodzi zatem (Lu1, u2)w =
−λ1(u1, u2)wi (u1, Lu2)w = −λ2(u1, u2)w. Ale (Lu1, u2)w = (Lu2, u1)w, zatem
(u1, u2)w = 0.
2.2.1 Wielomiany Hermite’a, Laguerre’a i Jacobiego
Zastanówmy się, kiedy w skład rodziny funkcji własnych symetrycznego ope-ratora L = p d 2 dx2 + (pw)0 w d dx + r
na I = (a, b) wchodzą (pewne) wielomiany dowolnego stopnia.
Dla każdego n = 0, 1, 2, 3, . . . istnieje wielomian stopnia n będący funk-cją własną operatora L. Wynika stąd, że dla każdego takiego n operator L przeprowadza przestrzeń liniową wielomianów stopnia co najwyżej n w siebie.
Dalej, skoro funkcje własne należą do L2
w, musi zachodzić
(2.5) Z
I
|x|nw(x) dx < ∞
dla wszystkich n = 0, 1, 2, . . . . W szczególności,
(2.6) Z
I
w(x) dx < ∞.
Dalej, L1 = λ oraz L1 = r, zatem współczynnik rzędu zerowego r musi być stały. „Przesuwając” wartości własne można założyć, że r ≡ 0.
L przeprowadza przestrzeń liniową wielomianów stopnia co najwyżej
je-den w siebie. Dla u(x) = x zachodzi
Lu = (pw) 0 w = p 0 + pw 0 w, zatem (2.7) p0+ pw 0
w jest wielomianem stopnia ¬ 1.
L przeprowadza przestrzeń liniową wielomianów stopnia co najwyżej dwa
w siebie. Dla u(x) = 1 2x 2 zachodzi Lu = p + x p0+ pw 0 w ! zatem
(2.8) p jest wielomianem stopnia ¬ 2.
Skoro L jest operatorem symetrycznym (w rozszerzonym znaczeniu), musi zachodzić (2.9) b Z a pw(u0v − uv0)0dx = 0
dla dowolnych dopuszczalnych u, v, w szczególności dla u i v będących wie-lomianami.
(A) p jest funkcją stałą. Weźmy p ≡ 1.
Zatem w0/wjest wielomianem stopnia co najwyżej jeden. Wynika stąd, że
wjest eksponentą pewnego wielomianu stopnia co najwyżej dwa. Dokonując
afinicznej zmiany zmiennej niezależnej i dzieląc przez stałą dodatnią, można założyć, że albo w(x) ≡ 1, albo w(x) = e−x, albo w(x) = e±x2
.
Jeśli w(x) ≡ 1, z warunku (2.6) wynika, że I musi być przedziałem ogra-niczonym. Lecz warunek (2.9) nie może być spełniony.
Załóżmy, że w(x) = e−x. Warunek (2.6) wymusza, że I nie może być równy
(−∞, ∞). Lecz wtedy warunek (2.9) nie może być spełniony w skończonych krańcach przedziału I.
W przypadku w(x) = e±x2
warunek (2.9) wymusza, że I = (−∞, ∞), zaś z warunku (2.6) wynika, że w(x) = e−x2
. Operator L ma zatem postać
L = d
2
dx2 − 2x
d dx
na (−∞, ∞), z wagą w(x) = e−x2
.
Zauważmy, że operator L przeprowadza, dla każdego n = 0, 1, 2, . . . , prze-strzeń wielomianów stopnia co najwyżej n w siebie. Wynika stąd, że dla każ-dego n istnieje wielomian stopnia n będący funkcją własną operatora L. Taki, odpowiednio znormalizowany(4), wielomian nazywamy n-tym wielomianem
Hermite’a(5), i oznaczamy przez H n.
Łatwo wykazać, że n-ty wielomian Hermite’a Hnodpowiada wartości
wła-snej −2n:
LHn+ 2nHn= 0.
Wielomiany Hermite’a są ortogonalne w przestrzeni Hilberta L2
(R, e−x2dx). Funkcje Hn(x)e −1 2x2 są ortogonalne w przestrzeni L2
(R). Są one funkcjami własnymi operatora
d2
dx2 + (1 − x 2
).
(B) p jest funkcją liniową.
Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = x.
Z (2.7) wynika, że w0/w = β + α/x. Zatem w(x) = xαeβx. Z (2.9)
wy-nika, że I = (−∞, 0) lub I = (0, ∞). Wybierzmy to drugie. Warunek (2.6) implikuje, że β < 0 i α > −1. Po przeskalowaniu i podzieleniu przez stałą dodatnią możemy założyć, że β = −1.
Operator L ma zatem postać
L = x d 2 dx2 + (α + 1) − x d dx na (0, ∞), z wagą w(x) = xαe−x, gdzie α > −1
Zauważmy, że operator L przeprowadza, dla każdego n = 0, 1, 2, . . . , prze-strzeń wielomianów stopnia co najwyżej n w siebie. Wynika stąd, że dla każ-dego n istnieje wielomian stopnia n będący funkcją własną operatora L. Taki, odpowiednio znormalizowany(6), wielomian nazywamy n-tym wielomianem
Laguerre’a(7), i oznaczamy przez L(α) n .
(4)W tym przypadku oznacza to, że współczynnik przy najwyższej potędze jest równy
2n.
(5)Charles Hermite (1822 – 1901), matematyk francuski.
(6)W tym przypadku oznacza to, że współczynnik przy najwyższej potędze jest równy
(−1)n/n!.
Łatwo wykazać, że n-ty wielomian Laguerre’a L(α) n odpowiada wartości własnej −n: LL(α) n + nL (α) n = 0.
Wielomiany Laguerre’a są ortogonalne w przestrzeni Hilberta L2((0, ∞), xαe−xdx).
Funkcje L(α)n (x)x 1 2αe− 1 2x
są ortogonalne w przestrzeni L2((0, ∞)). Są one funkcjami własnymi
opera-tora x d 2 dx2 + d dx − x 4 − α2 4x+ α + 1 2 . (C) p jest funkcją kwadratową, z wyróżnikiem dodatnim.
Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = 1 − x2.
Z (2.7) wynika, że w0/w = β/(1+x)−α/(1−x). Zatem w(x) = (1−x)α(1+
x)β. Z (2.9) wynika, że I = (−1, 1), lub I = (−∞, −1), lub I = (1, ∞). Dwa
ostatnie przypadki są wykluczone, gdyż wtedy xn dla dostatecznie dużych n
nie należałyby do L2
w, co przeczy (2.5).
Zatem I = (−1, 1). Warunek (2.6) implikuje, że α > −1 i β > −1. Operator L ma zatem postać
L = (1 − x2) d2 dx2 + β − α − (α + β + 2)x d dx na (−1, 1), z wagą w(x) = (1 − x)α(1 + x)β, gdzie α, β > −1.
Zauważmy, że operator L przeprowadza, dla każdego n = 0, 1, 2, . . . , prze-strzeń wielomianów stopnia co najwyżej n w siebie. Wynika stąd, że dla każ-dego n istnieje wielomian stopnia n będący funkcją własną operatora L. Taki, odpowiednio znormalizowany(8), wielomian nazywamy n-tym wielomianem
Jacobiego(9), i oznaczamy przez P(α,β)
n .
Łatwo wykazać, że n-ty wielomian Jacobiego P(α,β)
n odpowiada wartości własnej −n(n + α + β + 1): LP(α,β) n + n(n + α + β + 1)P (α,β) n = 0.
Wielomiany Jacobiego są ortogonalne w przestrzeni Hilberta L2((−1, 1), (1−
x)α(1 + x)βdx).
(D) p jest funkcją kwadratową, z wyróżnikiem ujemnym.
(8)Tutaj normalizacja jest bardziej skomplikowana.
Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = 1 + x2.
Z (2.7) wynika, że w(x) = (1+x2)a. Z (2.9) wynika, że I = (−∞, ∞). Lecz
wtedy, jakiekolwiek a weźmiemy, xn dla dostatecznie dużych n nie należą do
L2
w, co przeczy (2.5).
(E) p jest funkcją kwadratową, z wyróżnikiem równym zeru.
Dokonując afinicznej zmiany zmiennej niezależnej i dzielenia przez stałą dodatnią można założyć, że p(x) = x2.
Z (2.7) wynika, że w(x) = xaeb/x. Z (2.9) wynika, że I = (0, ∞) (dla
ustalenia uwagi). Lecz wtedy, jakiekolwiek a weźmiemy, xn dla dostatecznie
dużych n nie należą do L2
w, co przeczy (2.5).
Wykazaliśmy, że z dokładnością do dodania wyrazu rzędu zerowego (o stałym współczynniku), afinicznej zamiany zmiennej niezależnej i pomnoże-nia przez stałą dodatnią, równapomnoże-nia różniczkowe zwyczajne liniowe jednorodne rzędu drugiego, mające wielomiany dowolnego stopnia jako funkcje własne, to równania odpowiadające wielomianom Hermite’a, Laguerre’a i Jacobiego (czyli tzw. klasycznym wielomianom ortogonalnym).
2.3
Ogólna teoria wielomianów ortogonalnych
Niech I = (a, b). Niech w : I → (0, ∞) będzie funkcją ciągłą taką, że
An:= Z I xnw(x) dx < ∞ dla wszystkich n = 0, 1, 2, . . . . Oznaczmy ∆−1 := 1, ∆n:= A0 A1 . . . An A1 A2 . . . An+1 ... ... ... ... An An+1 . . . A2n , n = 0, 1, 2, . . . .
Lemat 2.4. ∆n> 0 dla każdego n = 0, 1, 2, . . . .
Dowód. Forma kwadratowa
n X j,k=0 Aj+kajak= Z I n X j,k=0 xj+kajak w(x) dx = Z I n X j=0 ajxj 2 w(x) dx
Zdefiniujmy wielomiany Qn(x) := A0 A1 . . . An−1 1 A1 A2 . . . An x ... ... ... ... ... An An+1 . . . A2n−1 xn .
Wykorzystując rozwinięcie Laplace’a względem (n + 1)-szej kolumny otrzy-mujemy, że (Qn(x), xm)w = A0 A1 . . . An−1 Am A1 A2 . . . An Am+1 ... ... ... ... ... An An+1 . . . A2n−1 Am+n , co daje (Qn(x), xm)w = 0 dla m = 0, 1, . . . , n − 1, (Qn(x), xn)w = ∆n.
W szczególności, wielomiany Qn są ortogonalne. Dalej,
(Qn(x), Qn(x))w = (Qn(x), ∆n−1xn)w = ∆n−1(Qn(x), xn)w = ∆n−1∆n, zatem wielomiany Pn(x) := 1 √ ∆n−1∆n Qn(x) są ortonormalne.
Oznaczmy przez hn współczynnik przy xn w wielomianie Pn(x). Zachodzi
hn= ∆n−1 √ ∆n−1∆n = s ∆n−1 ∆n .
Wielomian xPn(x) ma stopień n + 1, i jest ortogonalny do xm dla m =
0, 1, . . . , n − 2, zatem dla takich m zachodzi (xPn(x), Pm(x))w = 0.
Mnożąc skalarnie równość
xPn(x) =
przez Pm(x) otrzymujemy, że αn−2 = . . . = α0 = 0. Zatem istnieją an, bn, cn
takie, że
(2.10) xPn(x) = anPn+1(x) + bnPn(x) + cnPn−1(x).
Powyższy wzór nazywamy formułą trójczłonową. Wyliczmy an = hn hn+1 , cn= (xPn(x), Pn−1(x))w = (Pn(x), xPn−1(x))w = hn−1 hn = an−1.
Po prostych manipulacjach otrzymujemy, dla x, y ∈ I, x 6= y, (x − y)Pn(x)Pn(y) = = an Pn+1(x)Pn(y)−Pn(x)Pn+1(y) −an−1 Pn(x)Pn−1(y)−Pn−1(x)Pn(y) ,
i ostatecznie otrzymujemy wzór Christoffela(10)–Darboux(11):
(2.11) an Pn+1(x)Pn(y) − Pn(x)Pn+1(y) x − y = n X j=0 Pj(x)Pj(y).
Lewą stronę wzoru Christoffela–Darboux nazywamy jądrem Dirichleta(12), i
oznaczamy przez Kn(x, y).
Twierdzenie 2.5. Dla wielomianu q stopnia ¬ n zachodzi
q(x) =
Z
I
Kn(x, y)q(y)w(y) dy, x ∈ I.
Dowód. q jest kombinacją liniową wielomianów Pk, k = 0, 1, . . . , n. Z
orto-normalności wynika, że
q =
n
X
j=0
(q, Pj)wPj.
Stosujemy teraz wzór Christoffela–Darboux.
Gdy y → x, otrzymujemy ze wzoru Christoffela–Darboux (2.11), że (2.12) an Pn+10 (x)Pn(x) − Pn+1(x)Pn0(x) = n X j=0 (Pj(x))2. Wynika stąd następujący
(10)Elwin Bruno Christoffel (1829 – 1900), matematyk niemiecki. (11)(Jean) Gaston Darboux (1842 – 1917), matematyk francuski.
Wniosek. Pierwiastki wielomianów Pn należące do I są pojedyncze.
Dowód. P0 jest różną od zera funkcją stałą, zatem nie ma pierwiastków.
Załóżmy nie wprost, że x0 ∈ I jest pierwiastkiem pewnego Pn, n 1,
krotności większej niż 1. Lecz wtedy lewa strona wzoru (2.12) jest równa zeru, podczas gdy prawa strona jest co najmniej równa (P0)2 > 0.
Lemat 2.6. Pn ma n pierwiastków rzeczywistych, wszystkie w przedziale I.
Dowód. Niech x1 < . . . < xm będą wszystkimi pierwiastkami wielomianu Pn
w przedziale I. Oznaczmy q(x) := m Y j=1 (x − xj)gdy m > 0, q(x) :≡ 1 gdy m = 0.
x1, . . . , xm są pierwiastkami krotności jeden zarówno wielomianu Pn jak i q,
więc Pn i q zmieniają znak w tych samych punktach przedziału I. Zatem
qPn ma stały znak poza pierwiastkami. Wynika stąd, że (q, Pn)w 6= 0. Lecz
Pn jest ortogonalny do wszystkich xk, k = 0, 1, . . . , n − 1, więc q musi być
wielomianem stopnia co najmniej n. Zatem m = n.
Lemat 2.7. Pomiędzy kolejnymi pierwiastkami wielomianu Pn znajduje się
pierwiastek wielomianu Pn−1
Dowód. Niech n 2. Zachodzi
Pn0(x)Pn−1(x) − Pn(x)Pn−10 (x) > 0.
Dla x1 < x2, kolejnych pierwiastków wielomianu Pn, powyższa nierówność
implikuje, że
Pn0(x1)Pn−1(x1) > 0, Pn0(x2)Pn−1(x2) > 0.
Pn0(x1) i Pn0(x2) muszą mieć różne znaki, zatem Pn−1(x1) i Pn−1(x2) mają
różne znaki.
2.3.1 Zupełność wielomianów ortogonalnych
Twierdzenie 2.8. Załóżmy, że dla pewnego c > 0 zachodzi
Z
I
e2c|x|w(x) dx < ∞.
Dowód. Niech f ∈ L2 w. Ciąg (fn)∞n=0, gdzie fn = n X j=0 (f, Pj)wPj,
jest ciągiem Cauchy’ego w L2
w. Oznaczmy jego granicę przez g.
Dla każdego n ∈ N ∪ {0} zachodzi (f, Pn)w = (g, Pn)w. zatem h := f − g
jest ortogonalna do każdego Pm. Rozszerzamy h i w na całe R kładąc zero
poza I. Z nierówności Schwarza
Z R |h(x)w(x)| dx ¬ Z R |h(x)|qw(x)2dx 1/2 · Z R q w(x)2dx 1/2 < ∞.
Transformata Fouriera, H(ξ), funkcji hw,
H(ξ) =hw(ξ) =d 1 √ 2π Z R e−ixξh(x)w(x) dx,
jest holomorficzna w pasie { |Im ξ| < c }. Zachodzi
H(n)(0) = (−i) n √ 2π Z R xnh(x)w(x) dx.
Lecz z (h, Pn)w = 0 wynika, że h jest ortogonalne do xn, czyli H(n)(0) = 0,
dla każdego n. Zatem H ≡ 0. 2.3.2 Wzór Rodriguesa
Powracamy teraz do klasycznych wielomianów ortogonalnych. Rozważmy równanie na wartości własne:
(2.13) p(x)ψ00n(x) + (p(x)w(x)) 0 w(x) ψ 0 n(x) + λnψn(x) = 0. Różniczkując je po x otrzymujemy (2.14) p(ψn0)00+ (q + p0)(ψn0)0+ (q0 + λn)ψn0 = 0. Ale q + p0 = (pw) 0 w + p 0 = p 2w0+ 2pp0w pw = p(pw)0 pw ,
Otrzymaliśmy, że ψ0
n są wielomianami ortogonalnymi stopnia n − 1 dla
wagi pw, z wartościami własnymi −λn− q0.
Dalej, ψ00
n są wielomianami ortogonalnymi stopnia n − 2 dla wagi p2w, z
wartościami własnymi
−λn− q0− (p0+ q)0 = −λn− 2q0 − p00.
Ogólnie, ψ(m)
n są wielomianami ortogonalnymi stopnia n − m dla wagi
pmw, z wartościami własnymi
−λn− mq0− 12m(m − 1)p00.
ψ(n)
n to stała odpowiadająca wartości własnej zero. Otrzymujemy stąd
λn= −nq0−12n(n − 1)p00. Równanie (2.13) daje (2.15) wψn = − 1 λn (pwψ0n)0, ale, z (2.14), (λn+ q0)pwψ0n= −(p 2wψ000 n + p 2w0 ψn00+ 2pp0wψn00) = = −(p2(wψn00)0+ (p2)0(wψ00n)) = −(p2wψn00)0, stąd (2.16) (pwψn0)0 = − 1 λn+ q0 (p2wψn00)00. Z (2.15) i (2.16) wynika, że wψn= 1 λn(λn+ q0) (p2wψ00n)00.
Powtarzając powyższe rozumowanie otrzymujemy, że
wψn = (−1)n n−1 Y m=0 λn+ mq0+12m(m − 1)p00 −1 (pnwψ(n)n )(n) Zauważmy, że ψ(n) n to stała.
W szczególności, otrzymujemy (ogólny) wzór Rodriguesa(13) (2.17) ψn(x) = cn w(x) dn dxn p(x)nw(x), gdzie cn 6= 0.
Przy „tradycyjnej” normalizacji klasycznych wielomianów ortogonalnych mamy
• wzór Rodriguesa dla wielomianów Hermite’a (2.18) Hn(x) = (−1)nex
2 dn
dxn(e −x2
), • wzór Rodriguesa dla wielomianów Laguerre’a
(2.19) L(α)n (x) = 1 n!x −α ex d n dxn(e −x xn+α), • wzór Rodriguesa dla wielomianów Jacobiego
(2.20) P(α,β) n (x) = (−1)n n!2n (1−x) −α (1+x)−β d n dxn (1−x)n+α(1+x)n+β. 2.3.3 Funkcje tworzące
Funkcją tworzącą dla (klasycznych) wielomianów ortogonalnych ψnnazwijmy
funkcję G(x, s) := ∞ X n=0 ψn(x) n! s n. Rozważmy wzór Rodriguesa ψn(x) = 1 w(x) dn dxn p(x)nw(x).
Ustalmy x ∈ I, i niech Γ ∈ C będzie zorientowanym dodatnio okręgiem o środku w x i promieniu tak małym, by był zawarty wraz ze swym wnętrzem w dziedzinie funkcji p i w. Zachodzi
ψn(x) = n! 2πi Z Γ w(z) w(x) p(z)n (z − x)n dz z − x.
(13)(Benjamin-)Olinde Rodrigues(-Henriques) (1795 – 1851), matematyk, filozof i bankier
Podstawiając powyższe do wzoru na funkcję tworzącą otrzymujemy G(x, s) = 1 2πi Z Γ ∞ X n=0 snp(z)n (z − x)n w(z) w(x) dz z − x = 1 2πi Z Γ w(z) w(x) dz z − x − sp(z).
Oznaczmy przez ζ(x, s) rozwiązanie (względem z) równania z − x = sp(z), zbieżne do x przy s → 0. Z postaci p (mianowicie, p(z) ≡ 1, lub p(z) = z lub
p(z) = 1 − z2) wynika, że rozwiązanie to jest jednoznacznie określone.
Jako że pochodna po z funkcji z − x − sp(z), czyli 1 − sp0(z)jest różna od
zera dla |s| dostatecznie małych, więc ζ = ζ(x, s) jest biegunem rzędu jeden funkcji podcałkowej, i residuum w tym punkcie jest równe
lim z→ζ w(z) w(x) z − ζ z − x − sp(z) = w(ζ) w(x) 1 1 − sp0(ζ). ( ) ζ x Γ
Przy dostatecznie małym |s| i dostatecznie małym promieniu okręgu Γ, wewnątrz Γ znajduje się tylko jeden biegunζfunkcji podcałkowej
Zatem
G(x, s) = w(ζ) w(x)
1
1 − sp0(ζ), ζ − sp(ζ) = x, |s| małe.
2.3.4 Więcej o wielomianach Hermite’a
Przypomnijmy, że wielomiany Hermite’a spełniają równanie (2.21) Hn00(x) − 2xHn0(x) + 2nHn(x) = 0,
są ortogonalne na (−∞, ∞) względem wagi e−x2
, i spełniają wzór Rodriguesa Hn(x) = (−1)nex 2 dn dxn(e −x2 ).
Powyższy wzór można zapisać jako Hn(x) = 2x − d dx !n (1).
Wynika zeń, w szczególności, że współczynnik przy najwyższej potędze w
Hn(x)jest równy 2n,
Hn0(x) = 2nHn−1(x),
Hn0(x) − 2xHn(x) = −Hn+1(x).
Formuła trójczłonowa (2.10) przybiera teraz postać
Hn+1(x) = 2xHn(x) − 2nHn−1(x).
Wielomian Hermite’a stopnia n jest funkcją parzystą dla n parzystych, i nieparzystą dla n nieparzystych.
Zapisując wielomiany Hermite’a jako
Hn(x) = n
X
k=0
ckxk,
z równania na wartości własne (2.21) otrzymujemy, że (k + 2)(k + 1)ck+2= 2(k − n)ck,
z czego wynika, że
Hn(x) = X 2j¬n (−1)j n! j!(n − 2j)!(2x) n−2j.
Funkcję tworzącą dla wielomianów Hermite’a definiujemy jako
G(x, s) = ∞ X n=0 Hn(x) n! s n .
Zastosujmy wyliczenia z poprzedniego podrozdziału, pamiętając o tym, że w przypadku wielomianów Hermite’a występuje współczynnik (−1)n.
Odpo-wiada to zastąpieniu s przez −s. Wówczas ζ(x, s) = x − s, i otrzymujemy
G(x, s) = e
−(x−s)2
e−x2 = e 2xs−s2
Zauważmy, że ∞ X m,n=0 sm m! tn n! ∞ Z −∞ Hm(x)Hn(x)e−x 2 dx = ∞ Z −∞ G(x, s)G(x, t)e−x2dx = = ∞ Z −∞ e2ste−(x−s−t)2dx = e2st√π =√π ∞ X n=0 (2st)n n! , co daje ∞ X n=0 tn n! ∞ X m=0 (Hm, Hn)wsm m! ! =√π ∞ X n=0 tn n!2 nsn, i dalej, ∞ X m=0 (Hm, Hn)wsm m! = √ π2nsn. Zatem (Hm, Hn)w = 0 dla m 6= n, (Hn, Hn)w = n! 2n √ π.
Znormalizowane wielomiany Hermite’a definiujemy jako
f Hn(x) = 1 4 √ π√n! 2nHn(x).
Przypomnijmy, że dla f ∈ L2
w współczynniki rozwinięcia w bazie
ortonor-malnej (Hfn)∞
n=0 są równe
fn= (f,Hfn)w.
Załóżmy teraz, że funkcja f ma wszystkie pochodne wykładniczego wzrostu. Wtedy dla n = 0, 1, 2, . . . zachodzi
∞ Z −∞ f (x)Hn(x)e−x 2 dx = ∞ Z −∞ (−1)nf (x)ex2 d n dxn(e −x2 ) ! e−x2dx = = ∞ Z −∞ (−1)nf (x) d n dxn(e −x2 ) dx = ∞ Z −∞ f(n)(x)e−x2dx.
Wynika stąd w szczególności, że (xm, H
n)w = 0 gdy m < n (co już wiemy),
a także, że (xm, H
n)w 6= 0 co najwyżej, gdy m i n mają tę samą parzystość.
Gdy m = n + 2k, otrzymujemy (xm, Hn)w = m! (m − n)! ∞ Z −∞ e−x2xm−ndx = 2 m! (m − n)! ∞ Z 0 e−x2xm−ndx,
co po zamianie zmiennych t = x2 (dx = 1 2t −1/2dt, xm−n = t(m−n)/2) daje m! (m − n)! ∞ Z 0 e−tt(m−n)/2t−1/2dt = m! (m − n)!Γ( 1 2(m − n + 1)).
Analogicznie można wyliczyć, dla a ∈ C,
(eax, Hn)w = an ∞ Z −∞ eax−x2dx = an ∞ Z −∞ e−(x−a/2)2ea2/4dx = = anea2/4 ∞ Z −∞ e−x2dx = anea2/4√π.
Oznaczając zmienną x przez t i podstawiając następnie a = 2ix, otrzymujemy
e−x2 = √1 π ∞ Z −∞ e−2ixt−t2dt.
Z powyższego wzoru można otrzymać, wykorzystując wzór Rodriguesa, że
Hn(x) = (−1)n ex2 √ π ∞ Z −∞ (−2it)ne−2ixt−t2dt.
Pierwiastki wielomianów Hermite’a mają następujące własności:
Twierdzenie 2.9. Wielomian Hermite’a Hn(x) ma n pierwiastków
pojedyn-czych, leżących w przedziale
−√2n + 1 < x <√2n + 1. Można nawet powiedzieć więcej:
Twierdzenie 2.10. Dodatnie pierwiatki x1,n < x2,n < . . . wielomianu
Her-mite’a Hn(x) spełniają następujące oszacowania:
• dla n = 2m, (2k − 1)π 2√2n + 1 < xk,n < 4k + 1 √ 2n + 1, k = 1, 2, . . . , m; • dla n = 2m + 1, kπ 2√2n + 1 < xk,n < 4k + 3 √ 2n + 1, k = 1, 2, . . . , m. Zachodzi następujący wzór asymptotyczny
(2.22) Hn(x) = 2n/2 21/4(n!)1/2 (nπ)1/2 e x2/2 cos √ 2n + 1 x −1 2nπ + O(n−1/2) !
2.3.5 Rozwinięcia w szeregi względem wielomianów Hermite’a Oznaczmy, dla funkcji rzeczywistej f określonej na (−∞, ∞)
f (x) ∼ ∞ X n=0 cnHn(x), gdzie cn = 1 2nn!√π ∞ Z −∞ f (x)Hn(x)e−x 2 dx.
Wiemy już (Twierdzenie 2.8), że dla f ∈ L2
w sumy częściowe szeregu są
zbieżne do f w normie L2 w.
Twierdzenie 2.11. Załóżmy, że f ∈ L2w. Niech x będzie takie, że dla pewnych
δ > 0 i C > 0 zachodzi f (ξ) − f (x) ξ − x ¬ C gdy 0 < |ξ − x| < δ. Wówczas szereg P∞ n=0 cnHn(x) jest zbieżny do f(x).
2.3.6 Wielomiany Legendre’a i Czebyszewa
Wielomiany Legendre’a(14) to wielomiany Jacobiego dla α = β = 0:
Pn(x) = Pn(0,0)(x).
Waga to w(x) ≡ 1, równanie na wartości własne to
(1 − x2)Pn00(x) − 2xPn0(x) + n(n + 1)Pn(x) = 0, i funkcja tworząca to ∞ X n=0 Pn(x)sn = (1 − 2xs + s2)−1/2.
Wielomiany Czebyszewa(15) można zdefiniować jako
Tn(x) = 2 · 4 · 6 · . . . · (2n) 3 · 5 · . . . · (2n − 1)P (−1/2,−1/2) n (x), Un(x) = 4 · 6 · . . . · (2n + 2) 1 · 3 · 5 · . . . · (2n + 1)P (1/2,1/2) n (x).
(14)Adrien-Marie Legendre (1752 – 1833), matematyk francuski.
(15)Pafnutij Lwowicz Czebyszew (powinno być: Czebyszow) (1821 – 1894), matematyk
Ich funkcje tworzące to ∞ X n=0 Tn(x)sn = 1 − xs 1 − 2xs + s2, ∞ X n=0 Un(x)sn = 1 1 − 2xs + s2.
Wielomiany Gegenbauera(16), zwane też wielomianami ultrasferycznymi,
definiowane są jako Cnλ(x) = (2λ) · (2λ + 1) · . . . · (2λ + n − 1) (λ + 1 2) · (λ + 3 2) · . . . · (λ + n − 1 2) Pn(λ−1/2,λ−1/2)(x).
2.3.7 Informacja o dyskretnych wielomianach ortogonalnych W poprzednich podrozdziałach rozważaliśmy wielomiany, które są ortogonal-ne względem iloczynu skalarortogonal-nego wyznaczoortogonal-nego przez ciągłą wagę: całkowa-nie odbywało się po mierze absolutcałkowa-nie ciągłej względem miary Lebesgue’a, z gęstością w(x). Zamiast takiej miary możemy wziąć miarę dyskretną (na przykład, sumę przeliczalnie wielu delt Diraca w punktach całkowitych).
Dokładniej, niech w = (wn)∞n=−∞ będzie ciągiem liczb nieujemnych.
Ilo-czyn skalarny definiujemy wzorem (f, g)w := ∞ X k=−∞ f (m)g(m)wm, a normę wzorem kf k2 w := ∞ X k=−∞ (f (m))2wm.
Wielomiany mają skończoną normę wtedy i tylko wtedy, gdy momenty rzędu parzystego sa skończone:
∞
X
k=−∞
m2nwm < ∞.
W takim przypadku można skonstruować wielomiany ortogonalne analogicz-nie jak w przypadku ciągłej wagi. Zachodzą wtedy odpowiedniki formuły trójczłonowej (2.10) i wzoru Christoffela–Darboux (2.11). Ponadto, jeśli ist-nieje c > 0 takie, że
∞
X
k=−∞
e2c|m|wm < ∞,
to wielomiany ortogonalne tworzą bazę odpowiedniej przestrzeni Hilberta. Zamiast liniowego operatora różniczkowego drugiego rzędu rozpatrujemy teraz tzw. liniowy operator różnicowy drugiego rzędu. Rozpocznijmy od zde-finiowania operatorów przesunięcia wzorem
(S±f )(m) := f (m ± 1).
Operator różnicowy drugiego rzędu to
L := p+S++ p−S−+ r,
gdzie p+, p− i r to funkcje. Operator L jest symetryczny względem w wtedy
i tylko wtedy, gdy
S−(p+w) = p−w,
co jest równoważne
S+(p−w) = p+w.
Z symetrii wynika, że funkcje własne odpowiadające różnym wartościom wła-snym sa ortogonalne.
Można spytać, kiedy operator L ma jako funkcje własne pewne wielomia-ny stopni zero, jeden i dwa. Okazuje się, że odpowiada to tzw. klasyczwielomia-nym dyskretnym wielomianom ortogonalnym:
• wielomiany Charliera(17)(zwane też wielomianami Poissona–Charliera),
• wielomiany Krawczuka(18),
• wielomiany Meixnera(19),
• wielomiany Hahna(20).
(17)Carl Vilhelm Ludwig Charlier (1862 – 1934), astronom szwedzki.
(18)Mychajło Pyłypowicz Krawczuk (1892 – 1942), matematyk ukraiński (używana jest
też forma rosyjska: Michaił Filippowicz Krawczuk).
(19)Josef Meixner (1908 – 1992), niemiecki fizyk teoretyk.
(20)Wolfgang Hahn (1911 – 1998), matematyk niemiecki (nie mylić z matematykiem