Szeregi. Funkcja wykładnicza zmiennej zespolonej
5.7 Funkcje wypukłe
x ∈ [0, 1] : x =
∞
X
j=1
aj
3j, gdzie aj ∈ {0, 2}
.
Sprawdzenie, że określamy ten sam zbiór, co wcześniej, pozostawimy Czytelnikowi.
(Proszę posłużyć się rozwinięciami trójkowymi liczb rzeczywistych i zbadać, jakie liczby są usuwane w j-tym kroku konstrukcji K, gdy usuwamy środkowe części od-cinków.)
Teraz możemy sformułować dwa twierdzenia: ogólne wersje twierdzeń Weierstrassa i Cantora dla zbiorów zwartych.
Twierdzenie 5.64 (Weierstrassa o przyjmowaniu kresów, wersja ogólna). Jeśli f : K → R
jest ciągła, a K ⊂ R jest zwarty i niepusty, to istnieją punkty x0, x00∈ K takie, że f (x0) = sup
K
f , f (x00) = inf
K f .
Twierdzenie 5.65 (Cantora o jednostajnej ciągłości, wersja ogólna). Jeśli K ⊂ R jest zbiorem zwartym, to każda funkcja ciągła f : K → R jest jednostajnie ciągła na K.
Dowody obu twierdzeń są, praktycznie biorąc, takie same, jak w przypadku K = [a, b], tylko zamiast twierdzenia Bolzano–Weierstrassa trzeba w odpowiednim miejscu skorzy-stać z definicji zwartości.
Uwaga 5.66. Zarówno definicją zbioru zwartego, jak i twierdzeniami Weierstrassa i Can-tora, można posługiwać się także dla podzbiorów K ⊂ C. Żadne istotne szczegóły w przy-toczonych dowodach nie ulegają wtedy zmianie. Przykładem zbioru zwartego w C jest np.
każdy kwadrat z brzegiem, a także koło domnięte o środku z0 ∈ C i promieniu R > 0, tzn.
{z ∈ C : |z − z0| ≤ R}.
5.7 Funkcje wypukłe
Na zakończenie rozdziału o ciągłości powiemy, co to jest funkcja wypukła. Poznamy sens geometryczny tego pojęcia. Aby mówić o funkcjach wypukłych, potrzebne jest pojęcie zbioru wypukłego. Zbiór jest wypukły, jeśli dowolne dwa jego punkty można połączyć od-cinkiem, zawartym w tym zbiorze. Zbiorami wypukłymi na prostej są wszystkie prze-działy. Zbiorami wypukłymi na płaszczyźnie są np.: każdy kwadrat, każde koło, każda półpłaszczyzna. Nie jest zbiorem wypukłym np. pięciokąt gwiaździsty.
Definicja 5.67. Niech P będzie zbiorem wypukłym. Funkcja f : P → R nazywa się wy-pukła wtedy i tylko wtedy, gdy dla wszystkich x, y ∈ P i dowolnej liczby t ∈ (0, 1) zachodzi nierówność
f tx + (1 − t)y ≤ tf (x) + (1 − t)f (y) . (5.6) Warunek (5.6) nazywamy nierównością Jensena. Gdy powyższa nierówność jest ostra dla każdego t ∈ (0, 1) i każdej pary różnych punktów x 6= y ∈ P , to f nazywa się ściśle wypukła.
Zastępując (5.6) nierównością przeciwną,
f tx + (1 − t)y ≥ tf (x) + (1 − t)f (y) , (5.7) otrzymujemy definicję funkcji wklęsłej.
Ponieważ nierówności wolno dodawać stronami, zachodzi następujący oczywisty fakt.
Stwierdzenie 5.68. Jeśli zbiór P jest wypukły i f1, . . . , fN: P → R są wypukłe, to f = f1+ · · · + fN jest wypukła. Jeśli co najmniej jedna z funkcji fi (i = 1, 2, . . . , N ) jest ściśle wypukła, to także f jest ściśle wypukła.
(Rzecz jasna, analogiczne stwierdzenie jest prawdziwe także dla funkcji wklęsłych.) Interpretacja geometryczna wypukłości. Warunek podany w definicji funkcji wypu-kłej ma bardzo prosty sens geometryczny: każdy odcinek, który łączy dwa punkty wykresu funkcji wypukłej, leży nad wykresem tej funkcji (być może go dotyka).
Sprawdźmy, że w istocie tak jest. Niech f : I → R (gdzie I ⊂ R jest przedziałem) i niech a 6= b ∈ I. Prosta, która przechodzi przez punkty (a, f (a)) i (b, f (b)), ma równanie
y = la,b(x) = Ax + B, gdzie
A = f (a) − f (b)
a − b , B = f (b) − Ab.
Ponieważ la,b(tx + (1 − t)y) = tla,b(x) + (1 − t)la,b(y) dla wszystkich t, x, y, a ponadto tla,b(a) + (1 − t)la,b(b) = tAa + (1 − t)Ab + B
= tAa + (1 − t)Ab + f (b) − Ab
= tA(a − b) + f (b) = tf (a) + (1 − t)f (b),
więc warunek f (ta + (1 − t)b) ≤ tf (a) + (1 − t)f (b) oznacza tyle samo, co f (ta + (1 − t)b) ≤ la,b(ta + (1 − t)b). Innymi słowy, w dowolnym punkcie ta + (1 − t)b, gdzie t ∈ (0, 1), f ma mniejszą wartość niż funkcja liniowa la,b. Trzeba jeszcze zauważyć, że jeśli a < b, to ta+(1−t)b ∈ (a, b) dla każdego t ∈ (0, 1) i każdy punkt przedziału (a, b) można przedstawić w takiej postaci dla pewnego t ∈ (0, 1).
Podamy teraz proste przykłady funkcji wypukłych.
Przykład 5.69. a) Funkcja f (x) = x2 jest ściśle wypukła na R. Mamy bowiem tf (x) + (1 − t)f (y) = tx2+ (1 − t)y2,
f tx + (1 − t)y = t2x2+ 2t(1 − t)xy + (1 − t)2y2;
104 ostatnie poprawki: 14 grudnia 2018
odejmując te równości stronami i zauważając, że t − t2 = (1 − t) − (1 − t)2 = t(1 − t), otrzymujemy
tf (x) + (1 − t)f (y) − f tx + (1 − t)y = t(1 − t)(x − y)2≥ 0 .
Dla t ∈ (0, 1) i wszystkich x 6= y ostatnia nierówność jest ostra, więc istotnie f (x) = x2jest ściśle wypukła na całej prostej.
b) Funkcja g(x) = |x| jest wypukła na R, ale nie jest ściśle wypukła. Wypukłość g wynika natychmiast z nierówności trójkąta dla modułu: dla dowolnych t ∈ (0, 1) oraz x, y ∈ R mamy
g tx + (1 − t)y =
tx + (1 − t)y
≤ |tx| + |(1 − t)x| = tg(x) + (1 − t)g(y) . Nietrudno zauważyć, że powyższa nierówność staje się równością np. dla t = 12 i dla wszystkich x, y > 0, więc g nie jest ściśle wypukła.
c) Dla każdego a ∈ R funkcja g(x) = |x − a|, x ∈ R, jest wypukła. Ze Stwierdzenia5.68 wynika więc, że dla dowolnego doboru stałych a1, a2, . . . , aN ∈ R funkcja
h(x) = |x − a1| + |x − a2| + · · · + |x − aN|, x ∈ R, jest wypukła.
Oczywiście, badanie za każdym razem wypukłości wprost z definicji byłoby rzeczą kłopotliwą. Niedługo nauczymy się, jak (w pewnych przypadkach) badać wypukłość za pomocą pochodnych. Teraz podamy proste twierdzenie.
Twierdzenie 5.70 (kryterium wypukłości funkcji ciągłych). Jeśli P ⊂ R jest prze-działem i funkcja ciągła f : P → R spełnia warunek
fx 2 +y
2
≤ f (x)
2 +f (y)
2 dla wszystkich x, y ∈ P , (5.8) to f jest wypukła. Ponadto, jeśli nierówność (5.8) jest ostra dla wszystkich x 6= y ∈ P , to f jest ściśle wypukła.
Dowód. Krok 1. Wykażemy przez indukcję względem n następujący fakt: jeśli t = k/2n, gdzie n ∈ N i k = 0, 1, 2, . . . , 2n, to
f tx + (1 − t)y ≤ tf (x) + (1 − t)f (y) dla wszystkich x, y ∈ P . (5.9) (Intuicja jest prosta: wiemy, że wartość f w środku odcinka nie przekracza średniej war-tości f na końcach odcinka; stosujemy ten fakt wielokrotnie, znajdując kolejne punkty wykresu położone poniżej odcinka siecznej. Proszę pomyśleć o geometrycznej interpreta-cji tego warunku.)
Dla n = 1 podany warunek to po prostu założenie twierdzenia (uzupełnione tautolo-giami dla k = 0, 2). To jest baza indukcji. Załóżmy, że podany fakt zachodzi dla pewnej liczby n ∈ N. Niech t = k/2n+1, gdzie k = 1, . . . , 2n+1 − 1. Wtedy 1 − t = l/2n+1 dla
l = 2n+1− k. Jedna z liczb k, l jest nie większa niż 12 · 2n+1 = 2n. Z uwagi na symetrię
To kończy dowód indukcyjny. Zauważmy jeszcze, że jeśli f jest ściśle wypukła, to w (5.9) otrzymujemy ostrą nierówność dla x 6= y i t = k/2n, gdzie 0 < k < 2n.
Krok 2. Jeśli t ∈ (0, 1), to t = lim tn dla pewnego ciągu ułamków tn = kn/2n, gdzie n = 1, 2, . . . i 0 < kn < 2n. Korzystając z pierwszego kroku dowodu i przechodząc do granicy n → ∞ otrzymujemy, dzięki ciągłości f ,
f (tx + (1 − t)y) = lim
Krok 3. Trzeba jeszcze sprawdzić, że jeśli nierówność (5.8) jest ostra dla x 6= y, to f jest ściśle wypukła. Przypuśćmy, że jest przeciwnie. Wtedy dla pewnego t ∈ (0, 1) i pewnych punktów x < y ∈ P jest
f (tx + (1 − t)y) = tf (x) + (1 − t)f (y). (5.10) Niech r będzie dowolną liczbą taką, że 0 < r < t. Oznaczmy
z = tx + (1 − t)y, w = rx + (1 − r)y .
Wtedy x < z < w < y (proszę sprawdzić środkową nierówność samodzielnie!) i dla pew-nego λ ∈ (0, 1) jest z = λx + (1 − λ)w. Liczba λ spełnia warunek
λ + (1 − λ)r = t .
Korzystając z (5.10) i dwukrotnie stosując definicję wypukłości, otrzymujemy tf (x) + (1 − t)f (y) = f (z) = f (λx + (1 − λ)w)
≤ λf (x) + (1 − λ)f (w)
≤ λf (x) + (1 − λ)
rf (x) + (1 − r)f (y)
= tf (x) + (1 − t)f (y) .
Zatem, wszystkie nierówności w powyższym ciągu napisów są równościami, a stąd f (w) = f (rx + (1 − r)y) = rf (x) + (1 − r)f (y) dla każdego r ∈ (0, t).
106 ostatnie poprawki: 14 grudnia 2018
Jednak w pierwszym kroku dowodu stwierdziliśmy, że jeśli f spełnia ostrą wersję założe-nia (5.8), to dla każdego r = k/2n, gdzie 0 < k < 2n, takie nierówności powinny być ostre.
Dobierając r = k/2n∈ (0, t), uzyskujemy sprzeczność, która kończy cały dowód. Podkreślmy: ścisły zapis całego dowodu jest dość długi, jednak wiążąca się z powyż-szym twierdzeniem intuicja jest bardzo prosta. W końcówce dowodu sprawdzaliśmy w istocie następujący fakt geometryczny: jeśli odcinek I ma oba końce na wykresie funkcji wypukłej f , a ponadto trzeci, różny od końców, punkt I też należy do wykresu f , to cały odcinek I jest zawarty w wykresie f .
Spójrzmy na zastosowania tego twierdzenia.
Przykład 5.71. a) Funkcja f (x) = exp x jest ściśle wypukła na R. Istotnie, ostra nie-równość
xy, a stąd, dzięki monotoniczności logarytmu naturalnego, lnx + y
2 > ln√ xy = 1
2ln xy = ln x + ln y
2 .
Dzięki wiedzy o wypukłości rozmaitych funkcji można wykazać szereg konkretnych nierówności. Podamy tu dwie z nich.
Lemat 5.72 (Nierówność Younga). Jeśli p, q > 1 i 1p +1q = 1, to dla wszystkich x, y ≥ 0 jest
xy ≤ xp p +yq
q .
Dowód. Jeśli xy = 0, to nierówność jest oczywista. Niech więc x, y > 0. Skorzystamy z wklęsłości logarytmu naturalnego. Oznaczmy t = 1/p ∈ (0, 1); wtedy 1 − t = 1/q. Połóżmy xp = z, yq= w. Przy tych oznaczeniach, mamy Logarytm naturalny jest funkcją rosnącą, więc wynika stąd teza lematu.
Twierdzenie 5.73 (nierówność Höldera). Jeśli p, q > 1 i 1p +1q = 1, to dla dowolnych
Uwaga: dla p = q = 2 nierówność Höldera nazywa się nierównością Schwarza i wyraża następujący fakt geometryczny: iloczyn skalarny wektorów x, y ∈ Rnnie przekracza ilo-czynu długości tych wektorów. Höldera przybiera banalną postać 0 ≤ 0.
Krok 3 (przypadek ogólny). Niech Sx > 0, Sy > 0. Połóżmy
Stosując nierówność uzyskaną w pierwszym kroku dowodu do liczb ai, bi, otrzymujemy
n
X
i=1
aibi ≤ 1,
a po pomnożeniu obu stron przez iloczyn Sx
1/p
· Sy1/q
— tezę twierdzenia. Stwierdzenie 5.74 (nierówność Jensena). Załóżmy, że P jest zbiorem wypukłym i f : P → R jest wypukła. Jeśli n ∈ N, x1, . . . , xn ∈ P , a t1, . . . , tn ∈ [0, 1] i P ti = 1, to
Dowód. Indukcja względem n. Dla n = 2 nierówność podana w tezie wynika wprost z definicji wypukłości. Załóżmy, że nierówność Jensena zachodzi dla liczby n i dowolnych punktów x1, . . . , xn∈ P oraz wag t1, t2, . . . , tno sumie równej 1. Niech y1, y2, . . . , yn+1∈ P
108 ostatnie poprawki: 14 grudnia 2018
na mocy założenia indukcyjnego zastosowanego do ti = si, xi= yi(i = 1, 2, . . . , n − 1) oraz tn = sn+ sn+1 i xn = s sn
n+sn+1yn+ s sn+1
n+sn+1yn+1 (proszę sprawdzić, żeP ti = 1). Szacując teraz ostatni składnik wprost z definicji wypukłości,
f
Uwaga terminologiczna. Liczby nieujemne tio sumie równej 1 będziemy nazywać wa-gami. Sumę
n
X
i=1
tixi
nazywamy średnią ważoną (albo inaczej: kombinacją wypukłą) xi, z wagami ti.
Przykład 5.75. Wypisując nierówność Jensena dla funkcji wypukłej f(x) = − ln x z rów-nymi wagami ti = 1n (i = 1, 2 . . . , n) dla dodatnich xi, otrzymujemy nierówność między
Funkcja (− ln) jest malejąca, a zatem
x1+ x2+ · · · + xn
n ≥ √n
x1x2· · · xn
Podamy teraz charakteryzację funkcji wypukłych w języku tzw. ilorazów różnicowych.
Posłużymy się nią w Rozdziale 6, podając różne dostateczne warunki wypukłości.
Twierdzenie 5.76. Niech P ⊂ R będzie przedziałem i niech f : P → R. Następujące warunki są równoważne:
(i) f jest wypukła;
(ii) dla wszystkich x < y < z należących do P zachodzą nierówności f (y) − f (x)
y − x ≤ f (z) − f (x) z − x ;
(iii) dla wszystkich x < y < z należących do P zachodzą nierówności f (y) − f (x)
y − x ≤ f (z) − f (y) z − y ;
(iv) dla wszystkich x < y < z należących do P zachodzą nierówności f (z) − f (x)
z − x ≤ f (z) − f (y) z − y .
Jeśli f jest ściśle wypukła, to w każdym z punktów twierdzenia nierówności są ostre, i na odwrót.
Czytelnik zechce wykonać rysunek i zinterpretować twierdzenie w języku geometrii.
Szkic dowodu. Wykażemy równoważność dwóch pierwszych warunków; dowody (i) ⇔ (iii) oraz (i) ⇔ (iv) są identyczne i nie będziemy ich wypisywać.
Ustalmy x, z ∈ P . Wtedy każdy punkt y ∈ (x, z) można zapisać jako y = z − y
z − x· x +y − x
z − x· z = tx + (1 − t)z, gdzie t := z − y
z − x ∈ (0, 1) .
(Na odwrót, dla każdej liczby t ∈ (0, 1) prawa strona powyższego wzoru wyznacza pewien punkt y ∈ (x, z).) Dodając do obu stron nierówności (ii) f (x)/(y − x) i mnożąc obie strony przez y − x, otrzymujemy równoważną nierówność
f (tx + (1 − t)z) = f (y) ≤
1 −y − x z − x
· f (x) + y − x
z − x· f (z) = tf (x) + (1 − t)f (z) . Zatem, warunek (ii) jest równoważny wypukłości f .
Twierdzenie 5.77. Niech P ⊂ R będzie przedziałem otwartym. Wtedy każda funkcja wypukła f : P → R jest ciągła.
Szkic dowodu. Wykażemy, że lim
y→x+f (y) = f (x) = lim
y→x−f (y) . (5.12)
Udowodnimy tylko pierwszą z tych równości. Dowód drugiej jest w pełni analogiczny.
Ustalmy x ∈ P oraz dwa inne6 punkty z, w ∈ P takie, że w < x < z. Niech y ∈ (x, z).
Wtedy
y = tx + (1 − t)z, x = sw + (1 − s)y,
gdzie t = t(y) = (z − y)/(z − x) i s = s(y) = (y − x)/(y − w). Wyznaczając z nierówności f (x) ≤ sf (w) + (1 − s)f (y)
wartość f (y), otrzymujemy (patrz też rysunek) z wypukłości f dwie nierówności,
Ciągłość funkcji wypukłej. Nierówność (5.13) wy-raża fakt, że fragment wykresu f na przedziale [x, z]
zawiera się między dwiema siecznymi. Dlatego granica prawostronna f w punkcie x istnieje. Tak samo dowo-dzimy istnienia granicy lewostronnej.
f (x) − s(y)f (w)
1 − s(y) ≤ f (y) (5.13)
≤ t(y) · f (x) + 1 − t(y)f (z) . Przechodząc do granicy y → x+ i stosu-jąc twierdzenie o trzech funkcjach, otrzy-mujemy tezę, tzn. lewą z równości (5.12), gdyż t(y) → 1 i s(y) → 0 dla y → x. Uwaga 5.78. Założenie otwartości prze-działu P jest istotne. Nietrudno spraw-dzić, że funkcja
f (x) =
x2, x ∈ [0, 1) 2011, x = 1
jest wypukła i nieciągła w punkcie x = 1.
6Uwaga: z otwartości przedziału P korzystamy właśnie tu!