Badania Operacyjne

(1)

Badania Operacyjne

kierunek Informatyka, studia II stopnia wyklad

1 Programowanie liniowe

Programowanie liniowe jest jednym z działów teorii zada´n ekstremalnych i głównym nurtem bada´n operacyjnych. Podstawy programowania liniowego stworzył Kantorowicz w latach 30-tych ubiegłego stulecia.

Przedmiotem programowania liniowego s ˛a zadania polegaj ˛ace na szukaniu punktów minimum (b ˛ad´z maksimum) funkcji liniowej na zbiorze opisanym układem równo´sci lub nierówno´sci liniowych. Najprostszym przykładem zadania programowania liniowego jest zadanie znalezienia punktu minimum funkcji f (x) = ax na przedziale [c, d] ⊂ R⁺0. W postaci zadania programowania liniowego mo˙zna zapisa´c wiele praktycznych zagadnie´n natury ekonomicznej i produkcyjno-handlowej.

1.1 Modelowanie

Przykład 1 (planowanie produkcji). Wytwórca dysponuje okre´slonymi ilo´sciami ró˙znych

´srodków (surowce, praca, sprz ˛et), wykorzystywanych do produkcji ró˙znych towarów. Wia- domo, jaka ilo´s´c i-tego ´srodka jest potrzebna do produkcji jednostki j-tego towaru, a tak˙ze jaki dochód daje sprzeda˙z ka˙zdej wyprodukowanej jednostki j-tego towaru. Wytwórca powinien tak zaplanowa´c produkcj ˛e, by całkowity dochód uzyskany ze sprzeda˙zy towarów był maksymalny.

Model. Wprowad´zmy nast ˛epuj ˛ace oznaczenia:

(2)

m - ilo´s´c ´srodków n- ilo´s´c towarów

aij - ilo´s´c jednostek i-tego ´srodka potrzebna do produkcji jednostki j-tego towaru bi - dost ˛epna ilo´s´c jednostek i-tego ´srodka

xj - wielko´s´c produkcji j-tego towaru

cj - dochód uzyskiwany ze sprzeda˙zy jednostki j-tego towaru

Całkowit ˛a ilo´s´c i-tego ´srodka, wykorzystan ˛a podczas produkcji, mo˙zna wi ˛ec wyrazi´c nast ˛epuj ˛aco:

Xn j=1

aijxj.

Ilo´s´c ta powinna by´c mniejsza lub równa dost ˛epnej ilo´sci jednostek i-tego ´srodka, czyli Xn

j=1

aijxj ≤ bⁱ, i = 1, ..., m.

Dochód uzyskany ze sprzeda˙zy wszystkich wyprodukowanych towarów wyra˙za si ˛e nast ˛epu- jaco:

Xn j=1

cjxj, przy czym oczywi´scie nale˙zy ˙z ˛ada´c, by

xj ≥ 0, j = 1, ..., n.

Mo˙zna wi ˛ec sformułowa´c opisane zagadnienie w nast ˛epuj ˛acy sposób:

zmaksymalizowa´c funkcjonał kosztu (dochód) Xn

j=1

cjxj

przy ograniczeniach

xj ≥ 0, j = 1, ..., n, Xn

j=1

aijxj ≤ bⁱ, i = 1, ..., m.

(3)

1.2 Sformułowanie zadania

Ogólnym zadaniem programowania liniowego nazywamy zadanie postaci:

J(u) = c1u¹+ ... + cnuⁿ→ min . (1)

u^k ≥ 0, k ∈ I (2)

⎧⎪

⎪⎪

⎪⎨

⎪⎪

⎩

a1,1u¹+ ... + a1,nuⁿ ≤ b¹ ...

am,1u¹+ ... + am,nuⁿ≤ b^m am+1,1u¹+ ... + am+1,nuⁿ = b^m+1

...

as,1u¹+ ... + as,nuⁿ = b^s

, (3)

gdzie u = (u¹, ..., uⁿ) ∈ Rⁿ, natomiast cj, ai,j, bⁱ, i = 1, ..., s, j = 1, ..., n, s ˛a danymi liczbami rzeczywistymi, przy czym nie wszystkie liczby cj i nie wszystkie liczby aij s ˛a równe zero, I ⊂ {1, ..., n} jest ustalonym zbiorem indeksów; mo˙zliwe s ˛a tutaj przypadki:

I =∅, I = {1, ..., n}, m = s, m = 0. Wprowadzaj ˛ac oznaczenia c = (c1, ..., cn),

ai = (ai,1, ..., ai,n), mo˙zemy zapisa´c powy˙zsze zadanie w nast ˛epuj ˛acy sposób:

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

J(u) =hc, ui → min .

u∈ U = {u = (u¹, ..., uⁿ)∈ Rⁿ; uⁱ ≥ 0 dla i ∈ I,

haⁱ, ui ≤ bⁱ dla i = 1, ..., m, haⁱ, ui = bⁱ dla i = m + 1, ..., s}

(4)

(symbolem hx, yi oznaczamy iloczyn skalarny wektorów x = (x¹, ..., xⁿ), y = (y¹, ..., yⁿ), t.zn. hx, yi =Pn

i=1xiyi). W dalszym ci ˛agu, zapis x≥ y,

gdzie x = (x¹, ..., xⁿ), y = (y¹, ..., yⁿ), b ˛edzie oznaczał, ˙ze xⁱ ≥ yⁱ, i = 1, ..., n.

(4)

Wobec tego, zadanie (4) mo˙zemy zapisa´c nast ˛epuj ˛aco:

⎧⎨

⎩

u∈ U = {u = (u¹, ..., uⁿ)∈ Rⁿ; uⁱ ≥ 0 dla i ∈ I, Au ≤ b, Au = b}

(5) gdzie

A =

⎡

⎢⎢

⎢⎣

a1,1 ... a1,n

... ... am,1 ... am,n

⎤

⎥⎥

⎥⎦, A =

⎡

⎢⎢

⎢⎣

am+1,1 ... am+1,n

... ... as,1 ... as,n

⎤

⎥⎥

⎥⎦,

b =

⎡

⎢⎢

⎢⎣ b¹

... b^m

⎤

⎥⎥

⎥⎦, b =

⎡

⎢⎢

⎢⎣ b^m+1

... b^s

⎤

⎥⎥

⎥⎦.

Ka˙zdy punkt u ∈ U nazywamy punktem dopuszczalnym zadania (5). Punkt u∗ ∈ U nazywamy rozwi ˛azaniem zadania (5), gdy

J(u_∗)≤ J(u) dla dowolnego u ∈ U.

Kanonicznym zadaniem programowania liniowego nazywamy zadanie postaci

⎧⎨

⎩

u∈ U = {u = (u¹, ..., uⁿ)∈ Rⁿ; u≥ 0 , Au = b}

, (6)

gdzie A ∈ R^m×n, b ∈ R^m.

Podstawowym zadaniem programowania liniowego nazywamy zadanie postaci

⎧⎨

⎩

u∈ U = {u = (u¹, ..., uⁿ)∈ Rⁿ; u≥ 0 , Au ≤ b}

, (7)

gdzie A i b s ˛a takie, jak wy˙zej.

1.3 Równowa˙zno´s´c zada´ n

Zajmiemy si ˛e teraz zagadnieniem „równowa˙zno´sci” zada´n ró˙znego typu. Dokładniej, poka˙zemy, ˙ze rozwi ˛azywanie zadania podstawowego i zadania ogólnego mo˙zna zast ˛api´c rozwi ˛azywaniem zadania kanonicznego.

(5)

Istotnie, niech dane b ˛edzie zadanie podstawowe (7) i rozwa˙zmy w przestrzeni R^n+m zadanie postaci

⎧⎨

⎩

hd, zi → min .

z ∈ Z = {z = (u, v) ∈ R^n+m; z ≥ 0 , Cz = b}

, (8)

gdzie d = (c, 0) ∈ R^n+m,

C = [A| Im×m] =

⎡

⎢⎢

⎢⎣

a1,1 ... a1,n

... ... am,1 ... am,n

1 ... 0 ... ... 0 ... 1

⎤

⎥⎥

⎥⎦

(I_m×m jest macierz ˛a jednostkow ˛a wymiaru m × m).

Łatwo zauwa˙zy´c, ˙ze je´sli u∗ ∈ U jest rozwi ˛azaniem zadania (7), to z∗ = (u_∗, v_∗), gdzie v_∗ = b− Au∗,

jest rozwi ˛azaniem zadania (8), t.zn. z_∗ ∈ Z oraz hd, z∗i ≤ hd, zi dla dowolnego z ∈ Z.

Je´sli natomiast z_∗ = (u_∗, v_∗) ∈ Z jest rozwi ˛azaniem zadania (8), to u∗ jest rozwi ˛azaniem zadania (7), t.zn. u_∗ ∈ U oraz

hc, u∗i ≤ hc, ui dla dowolnego u ∈ U.

Podobnie, rozwi ˛azywanie zadania ogólnego (5) mo˙zna zast ˛api´c rozwi ˛azywaniem zadania kanonicznego. Rzeczywi´scie, rozwa˙zmy w przestrzeni R^p (p = m + I + J + J, gdzie

(6)

J ={1, ..., n}ÂI) zadanie postaci

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

he, zi =X

i∈I

ciuⁱ+X

i∈J

ciwⁱ+X

i∈J

−cⁱwⁱ → min . z ∈ Z = {z = (v, uⁱ; i∈ I, wⁱ; i∈ J, wⁱ; i∈ J) ∈ R^p; z≥ 0,

v +X

i∈I

Aiuⁱ+X

i∈J

Aiwⁱ+X

i∈J

−Aⁱwⁱ = b, X

i∈I

Aiuⁱ+X

i∈J

Aiwⁱ+X

i∈J

−Aⁱwⁱ = b}

={z ∈ R^p; z≥ 0,

⎡

⎣ [I_m×m | Aⁱ; i∈ I | Aⁱ; i∈ J | −Aⁱ; i∈ J]

£0| Aⁱ; i∈ I | Aⁱ; i∈ J | −Aⁱ; i∈ J¤

⎤

⎦ z =

⎡

⎣ b b

⎤

⎦}

, (9)

gdzie e = (0, ci; i ∈ I, cⁱ; i∈ J, −cⁱ; i ∈ J) ∈ R^p, Ai - i-ta kolumna macierzy A, Ai - i-ta kolumna macierzy A.

Je´sli u_∗ ∈ U jest rozwi ˛azaniem zadania ogólnego (5), to

z_∗ = (v_∗, uⁱ_∗; i∈ I, wⁱ_∗; i∈ J, wⁱ_∗; i∈ J), gdzie

v_∗ = b− Au∗, w_∗ⁱ = max{0, uⁱ_∗}, i ∈ J, wⁱ_∗ = max{0, −uⁱ_∗}, i ∈ J,

jest rozwi ˛azaniem zadania (9) (zauwa˙zmy, ˙ze uⁱ_∗ = wⁱ_∗− wⁱ∗ dla i ∈ J).

Je´sli natomiast

z_∗ = (v_∗, uⁱ_∗; i∈ I, wⁱ∗; i∈ J, wⁱ∗; i∈ J), jest rozwi ˛azaniem zadania (9), to

u_∗ = (uⁱ_∗; i∈ I, wⁱ_∗− wⁱ_∗; i∈ J) jest rozwi ˛azaniem zadania (5).

(7)

1.4 Interpretacja geometryczna zada´ n programowania liniowego

Rozwa˙zmy zadanie podstawowe (7) w przypadku, gdy n = 2, czyli

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

J(u) = c1u¹ + c2u² → min .

u∈ U = {u = (u¹, u²)∈ R²; u¹ ≥ 0, u² ≥ 0, ai,1u¹+ ai,2u² ≤ bⁱ, i = 1, ..., m}

. (10)

Wprowad´zmy oznaczenia

U0,1 ={(u¹, u²)∈ R²; −u¹ ≤ 0}, U0,2 ={(u¹, u²)∈ R²; −u² ≤ 0},

Ui ={(u¹, u²)∈ R²; ai,1u¹+ ai,2u² ≤ bⁱ}, i = 1, ..., m.

Oczywi´scie

U = U0,1∩ U^0,2∩ U¹∩ ... ∩ U^m. Mo˙zliwe s ˛a nast ˛epuj ˛ace przypadki:

1⁰ zbiór U jest pusty

2⁰ zbiór U jest niepustym wielobokiem wypukłym i ograniczonym

3⁰ zbiór U jest niepustym wielobokiem wypukłym i nieograniczonym

(8)

Ustalmy liczb ˛e α ∈ R. Równanie

c1u¹+ c2u² = α

opisuje poziomic ˛e funkcjonału J odpowiadaj ˛ac ˛a warto´sci α, czyli zbiór {(u¹, u²)∈ R²; J(u) = α}.

Jest to prosta o wektorze normalnym c = (c1, c2). Przy zmianie warto´sci stałej α od −∞

do ∞ prosta ta zmienia swoje poło˙zenie, przesuwaj ˛ac si ˛e w sposób równoległy w kierunku wektora c i „zamiataj ˛ac” cał ˛a płaszczyzn ˛e.

W przypadku 2⁰ zawsze istnieje „punkt pierwszego kontaktu” (by´c mo˙ze nie jedyny) przesuwaj ˛acej si ˛e prostej z wielobokiem U . Odpowiednia warto´s´c stałej α wynosi wówczas

minu∈UJ(u) =: J_∗

(9)

(10)

W przypadku 3⁰ ów „punkt pierwszego kontaktu” istnieje (by´c mo˙ze nie jedyny) lub nie.

Je´sli nie istnieje, oznacza to, ˙ze zadanie nie ma rozwi ˛azania; w takim przypadku

u∈UinfJ(u) =−∞.

(11)

Z powy˙zszej dyskusji wynika, ˙ze zadanie (10) mo˙ze nie mieć rozwi ˛azań, mo˙ze mieć jedno rozwi ˛azanie lub mo˙ze mieć nieskończenie wiele rozwi ˛azań. Ponadto, w przypadku, gdy zbiór rozwi ˛azań jest niepusty, w zbiorze tym istnieje co najmniej jeden punkt, który jest wierzchołkiem wieloboku U .

Podobn ˛a analiz ˛e mo˙zna przeprowadzi´c w przypadku n = 3, zast ˛epuj ˛ac wielobok wielo´s- cianem, a prost ˛a - płaszczyzn ˛a.

Matod ˛a graficzn ˛a mo˙zna tak˙ze rozwi ˛aza´c niektóre zadania o wi ˛ekszej ni˙z 2 lub 3 ilo´sci zmiennych. Rozwa˙zmy mianowicie zadanie postaci

⎧⎨

⎩

u∈ U = {u ∈ R^m+2; u≥ 0 , Au = b}

gdzie

A =

⎡

⎢⎢

⎢⎣

a1,1 ... a1,m a1,m+1 a1,m+2

... ... ... ... am,1 ... am,m am,m+1 am,m+2

⎤

⎥⎥

⎥⎦, b =

⎡

⎢⎢

⎢⎣ b1

... bm

⎤

⎥⎥

⎥⎦,

przy czym rankA = m i kolumny A1,...,Am s ˛a liniowo niezale˙zne. Wprowad´zmy oznaczenia

A =

⎡

⎢⎢

⎢⎣

a1,1 ... a1,m

... ... am,1 ... am,m

⎤

⎥⎥

⎥⎦, A =

⎡

⎢⎢

⎢⎣

a1,m+1 a1,m+2

... ... am,m+1 am,m+2

⎤

⎥⎥

⎥⎦,

u =

⎡

⎢⎢

⎢⎣ u¹

... u^m

⎤

⎥⎥

⎥⎦, u =

⎡

⎣ u^m+1 u^m+2

⎤

⎦ ,

c =

⎡

⎢⎢

⎢⎣ c1

... cm

⎤

⎥⎥

⎥⎦, c =

⎡

⎣ cm+1

cm+2

⎤

⎦ .

Zatem

A =h

A | Ai , u =

⎡

⎣ u u

⎤

⎦ , c =£ c | c¤

.

(12)

W konsekwencji warunek

Au = b mo˙zemy zapisa´c jako

Au + Au = b.

St ˛ad

u = A⁻¹b− A⁻¹ Au.

Zauwa˙zmy teraz, ˙ze rozwi ˛azywanie zadania wyj´sciowego mo˙zna zast ˛api´c rozwi ˛azywaniem zadania postaci ⎧

⎨

⎩ D

c, A⁻¹b− A⁻¹ AuE +

c, u®

→ min . u∈ U = {u ∈ R²; u≥ 0 , A⁻¹ Au≤ A⁻¹b}

(=) Dokładniej, je´sli u_∗ jest rozwi ˛azaniem zadania (=), to

u_∗ =

⎡

⎣ u_∗ u_∗

⎤

⎦ ,

gdzie

u_∗ = A⁻¹b− A⁻¹ Au_∗,

jest rozwi ˛azaniem zadania wyj´sciowego. Na odwrót, je´sli u_∗ =

⎡

⎣ u_∗ u_∗

⎤

⎦ jest rozwi ˛azaniem zadania wyj´sciowego, to u_∗ jest rozwi ˛azaniem zadania (=).

1.5 Punkty wierzchołkowe

Punkt v ∈ V ⊂ Rⁿnazywamy punktem wierzchołkowym (punktem ekstremalnym) zbioru wypukłego i domkni ˛etego V , je´sli przedstawienie

v = αv1+ (1− α)v², (11)

gdzie α ∈ (0, 1), v¹, v2 ∈ V , mo˙zliwe jest tylko wtedy, gdy v¹ = v2. Innymi słowy, punkt v ∈ V jest punktem wierzchołkowym zbioru V , gdy nie jest on punktem wewn ˛etrznym niezdegenerowanego odcinka o ko´ncach nale˙z ˛acych do V . Poj ˛ecie punktu wierzchołkowego jest poj ˛eciem fundamentalnym w teorii programowania liniowego.

(13)

W dalszej cz ˛e´sci wykładu poka˙zemy, ˙ze je´sli zadanie kanoniczne (przy dowolnym n ∈ N) posiada rozwi ˛azanie, to w´sród rozwi ˛aza´n jest co najmniej jeden punkt wierzchołkowy zbioru

U ={u ∈ Rⁿ; u≥ 0, Au = b}. (12)

Teraz podamy charakteryzacj ˛e punktów wierzcholkowych zbioru postaci (12).

Twierdzenie 1 Niech dany b ˛edzie zbiór U postaci (12) i punkt v ∈ Rⁿ, przy czym A ∈ R^m×nÂ{0}, r := rankA. Punkt v jest punktem wierzchołkowym zbioru U wtedy i tylko wtedy, gdy istniej ˛a wska´zniki j1,...,jr∈ {1, ..., n} takie, ˙ze

⎧⎪

⎪⎪

⎪⎨

⎪⎪

⎩

v^j ≥ 0, j ∈ {j¹, ..., jr} v^j = 0, j /∈ {j¹, ..., jr} Aj1v^j¹ + ... + Ajrv^j^r = b

kolumny Aj1, ..., Ajr s ˛a liniowo niezale˙zne w R^m

(13)

Układ wektorów Aj1,...,Ajr wyst ˛epuj ˛acych w warunkach (13) nazywamy baz ˛a punktu wierzchołkowego v, a odpowiednie współrz ˛edne v^j¹,...,v^j^r- współrz ˛ednymi bazowymi punktu wierzchołkowego v. Punkt wierzchołkowy, którego wszystkie współrz ˛edne bazowe s ˛a do- datnie nazywamy nieosobliwym. Punkt wierzchołkowy, którego co najmniej jedna współrz ˛edna bazowa jest równa zero nazywamy osobliwym. Zmienne u^j¹,...,u^j^r nazywamy zmiennymi bazowymi, a pozostałe - zmiennymi niebazowymi (przy ustalonej bazie Aj1,...,Ajr).

Z twierdzenia 1 wynika, ˙ze baza nieosobliwego punktu wierzchołkowego zbioru (12) jest wyznaczona jednoznacznie. Osobliwy punkt wierzchołkowy mo˙ze mie´c wiele baz.

1.6 Metoda sympleksowa

Metoda sympleksowa polega na „uporz ˛adkowanym” sprawdzaniu warto´sci funkcjonału kosztu w punktach wierzchołkowych zbioru ograniczaj ˛acego („uporz ˛adkowanie” oznacza tu, ˙ze warto´sci funkcjonału kosztu w kolejnych punktach nie rosn ˛a).

Rozwa˙zmy zadanie kanoniczne postaci

⎧⎨

⎩

u∈ U = {u ∈ Rⁿ; u≥ 0 , Au = b}

(14)

gdzie 0 6= A ∈ R^m×n, przy czym zakładać b ˛edziemy w tym rozdziale, ˙ze U 6= ∅ (kwestia niepusto´sci zbioru U omówiona b ˛edzie w dalszej cz ˛e´sci wykładu). Oczywi´scie rankA ≤ min{m, n} (podobnie, jak wcze´sniej, rankA oznaczać b ˛edziemy przez r). Równo´sć

Au = b mo˙zemy zapisa´c w postaci układu równa´n

Xn j=1

ai,ju^j = bi, i = 1, ..., m.

Nie zmniejszaj ˛ac ogólno´sci rozwa˙za´n, mo˙zemy zało˙zy´c, ˙ze r = m. Oczywi´scie r ≤ n. Je˙zeli r = n, to powy˙zszy układ ma dokładnie jedno rozwi ˛azanie u, przy czym u ≥ 0 (gdyby która´s ze współrz ˛ednych punktu u była ujemna, to zbiór U byłby pusty, co sprzeczne byłoby z naszym zało˙zeniem). W konsekwencji zbiór U jest jednoelementowy i tym samym u jest rozwi ˛azaniem zadania (14).

B ˛edziemy wi ˛ec zakłada´c w dalszym ci ˛agu, ˙ze r = m oraz r < n. Równo´s´c Au = b

mo˙zemy wi ˛ec zapisa´c w postaci

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

a1,1u¹+ ... + a1,nuⁿ= b¹ ...

ar,1u¹+ ... + ar,nuⁿ= b^r

(15)

gdzie r = rankA < n.

Podamy teraz opis metody sympleksowej. Przypu´s´cmy, ˙ze dany jest punkt wierzchołkowy v zbioru

U ={u ∈ Rⁿ; u≥ 0 , Au = b}

i załó˙zmy, ˙ze kolumny A1,...,Ars ˛a baz ˛a tego puntu, v¹,...,v^r- jego współrz ˛ednymi bazowymi (kwestia wyznaczenia „pocz ˛atkowego” punktu wierzchołkowego v zbioru U i okre´slenia jego współrz ˛ednych bazowych omówiona b ˛edzie w dalszej cz ˛e´sci wykładu). Wprowad´zmy

(15)

nast ˛epuj ˛ace oznaczenia

u =

⎡

⎢⎢

⎢⎣ u¹ ... u^r

⎤

⎥⎥

⎥⎦, v =

⎡

⎢⎢

⎢⎣ v¹ ... v^r

⎤

⎥⎥

⎥⎦, c =

⎡

⎢⎢

⎢⎣ c1

... c1

⎤

⎥⎥

⎥⎦,

B =

⎡

⎢⎢

⎢⎣

a1,1 ... a1,r

... ... ar,1 ... ar,r

⎤

⎥⎥

⎥⎦= [A1 | ... | A^r] .

Wówczas układ (15) mo˙zemy zapisa´c w postaci

Bu + Ar+1u^r+1+ ... + Anuⁿ= b. (16) Z liniowej niezale˙zno´sci kolumn A1,...,Ar(jest to baza punktu v) wynika, ˙ze det B 6= 0. W konsekwencji istnieje macierz odwrotna B⁻¹. Współrz ˛edne niebazowe punktu v s ˛a zerowe, a wi ˛ec z (16) otrzymujemy

Bv = b, sk ˛ad

v = B⁻¹b.

Mno˙z ˛ac równo´s´c (16) lewostronnie przez B⁻¹, otrzymujemy u +

Xn k=r+1

B⁻¹Aku^k= B⁻¹b = v. (17)

Oznaczmy

γ_s,k = (B⁻¹Ak)^s dla k = r + 1, ..., n, s = 1, ..., r

gdzie (B⁻¹Ak)^soznacza s-t ˛a współrz ˛edn ˛a wektora-kolumny B⁻¹Ak. Równo´sć (17) mo˙zemy teraz zapisać w postaci nast ˛epuj ˛acego układu równań

⎧⎪

⎪⎪

⎪⎨

⎪⎪

⎩

u¹+ γ_1,r+1u^r+1+ ... + γ_1,nuⁿ= v¹ u²+ γ_2,r+1u^r+1+ ... + γ_2,nuⁿ= v²

...

u^r+ γ_r,r+1u^r+1+ ... + γ_r,nuⁿ= v^r

. (18)

(16)

Okre´slmy tak˙ze

γ_s,k = (B⁻¹Ak)^s

dla k = 1, ...r, s = 1, ..., r (oczywi´scie γ_s.k = δs,k dla k = 1, ..., r, s = 1, ..., r, gdzie δs,k

jest symbolem Kronekera).

Pokazali´smy wi ˛ec, ˙ze maj ˛ac ustalony punkt wierzchołkowy v zbioru U i wiedz ˛ac, ˙ze współrz ˛edne z indeksami 1,...,r s ˛a jego współrz ˛ednymi bazowymi, mo˙zna zapisa´c ograniczenia (15) w równowa˙znej postaci (16) lub (17) lub (18).

Warto´s´c funkcjonału kosztu J w punkcie u spełniaj ˛acym ograniczenia typu równo´sci (15), mo˙zna zapisa´c w nast ˛epuj ˛acej postaci

J(u) = hc, ui = Xn

i=1

ciuⁱ =hc, ui + Xn i=r+1

ciuⁱ

=

* c, v−

Xn i=r+1

B⁻¹Aiuⁱ +

+ Xn i=r+1

ciuⁱ

= hc, vi − Xn i=r+1

(

c, B⁻¹Ai

®− cⁱ)uⁱ.

Poniewa˙z

hc, vi = hc, vi = J(v), wi ˛ec

J(u) = J(v)− Xn i=r+1

∆iuⁱ, (19)

gdzie

∆i =

c, B⁻¹Ai

®− cⁱ, i = r + 1, ..., n.

Okre´slmy tak˙ze

∆i =

c, B⁻¹Ai

®− cⁱ (20)

dla i = 1, ..., r. Oczywi´scie

∆i =

c, B⁻¹Ai

®− cⁱ =hc, eⁱi − cⁱ = ci− cⁱ = 0

dla i = 1, ..., r (tutaj ei jest i-t ˛a kolumn ˛a macierzy jednostkowej o wymiarach r × r).

(17)

Dokonajmy cz ˛e´sciowego podsumowania. Pokazali´smy, ˙ze zadanie (14) mo˙zemy zapisa´c w nast ˛epuj ˛acej postaci

⎧⎪

⎨

⎪⎩

J(u) = J(v)− Pn i=r+1

∆iuⁱ → min .

U ={u = (u¹, ..., uⁿ)∈ Rⁿ; u≥ 0 , u spełnia (18)}

(21)

Wyst ˛epuj ˛ace w powy˙zszym opisie wielko´sci γs,k, vⁱ, ∆i zapiszemy w postaci tzw. tablicy sympleksowej, odpowiadaj ˛acej punktowi wierzchołkowemu v

(18)

Tablica sympleksowa I (dla punktu v)

u¹ ... uⁱ ... u^s ... u^r u^r+1 ... u^k ... u^j ... uⁿ u¹ 1 ... 0 ... 0 ... 0 γ_1,r+1 ... γ_1,k ... γ_1,j ... γ_1,n v¹

... ... ... ... ... ... ... ... ... ... uⁱ 0 ... 1 ... 0 ... 0 γ_i,r+1 ... γ_i,k ... γ_i,j ... γ_i,n vⁱ

... ... ... ... ... ... ... ... ... ... u^s 0 ... 0 ... 1 ... 0 γ_s,r+1 ... γ_s,k ... γ_s,j ... γ_s,n v^s

... ... ... ... ... ... ... ... ...

u^r 0 ... 0 ... 0 ... 1 γ_r,r+1 ... γ_r,k ... γ_r,j ... γ_r,n v^r 0 ... 0 ... 0 ... 0 ∆r+1 ... ∆k ... ∆j ... ∆n J(v) Analizuj ˛ac tablic ˛e sympleksow ˛a I, mo˙zemy wyró˙zni´c trzy przypadki:

1⁰ spełnione s ˛a nierówno´sci

∆i =

c, B⁻¹Ai

®− cⁱ ≤ 0 (22)

dla i = r + 1, ..., n, t.zn. w ostatnim wierszu tablicy sympleksowej wszystkie liczby ∆i

s ˛a niedodatnie. W tym przypadku punkt v, dla którego skonstruowana została tablica sympleksowa, jest rozwi ˛azaniem zadania. Istotnie, bowiem dla dowolnego u ∈ U mamy

J(u) = J(v)− Xn i=r+1

∆iuⁱ ≥ J(v)

(bo ∆i ≤ 0, uⁱ ≥ 0).

2⁰ istnieje wska´znik k ∈ {r + 1, ..., n} taki, ˙ze

⎧⎨

⎩

∆k> 0

γ_i,k≤ 0 dla i = 1, ..., r (czyli B⁻¹Ak ≤ 0)

(23)

Oznacza to, ˙ze w k-tej kolumnie tablicy sympleksowej ostatni element (∆k) jest dodatni, a pozostałe - niedodatnie. W tym przypadku inf

u∈UJ(u) =−∞ (dowód tego faktu pomijamy).

Oznacza to, ˙ze zadanie nie ma rozwi ˛azania.

(19)

3⁰ nie zachodz ˛a przypadki 1⁰ i 2⁰; w konsekwencji istniej ˛a wska´zniki k ∈ {r + 1, ..., n}, i∈ {1, ..., r} takie, ˙ze

∆k > 0, γ_i,k > 0. (24)

Oznacza to, ˙ze w k-tej kolumnie tablicy sympleksowej ostatni element (∆k) jest dodatni i co najmniej jedna z liczb γ_i,k jest dodatnia.

Załó˙zmy, ˙ze zachodzi przypadek 3⁰ i okre´slmy zbiór

Ik={i ∈ {1, ..., r}, γi,k > 0}.

Niech s ∈ I^k b ˛edzie takim wska´znikiem, ˙ze v^s

γ_s,k = min

i∈Ik

vⁱ

γ_i,k (25)

Współczynnik γ_s,k, gdzie wska´zniki k, s s ˛a okre´slone przez (24) i (25), nazywany jest elementem rozwi ˛azuj ˛acym tablicy sympleksowej I.

Mo˙zna pokaza´c, ˙ze układ kolumn

A1, ..., A_s−1, As+1, ..., Ar, Ak (26) jest baz ˛a pewnego punktu wierzchołkowego w, przy czym

J(w)≤ J(v).

Uwaga 1. Z faktu, ˙ze macierz A ma r wierszy wynika, wobec twierdzenia charakteryzuj ˛acego punkty wierzchołkowe, i˙z baza (26) wyznacza punkt wierzchołkowy w sposób jednoznaczny. Mo˙zna wi ˛ec znale´z´c współrz ˛edne punktu w, korzystaj ˛ac z tego twierdzenia.

Przejd´zmy teraz do przypadku ogólnego. Łatwo zauwa˙zy´c, ˙ze je´sli współrz ˛ednymi bazowymi punktu v s ˛a

v^j¹, ..., v^j^r,

gdzie 1 ≤ j¹ < ... < jr ≤ n, to wzory wyra˙zaj ˛ace zmienne bazowe i funkcjonał kosztu przy pomocy zmiennych niebazowych, przyjmuj ˛a posta´c (poni˙zej symbolem Iv oznaczamy

(20)

zbiór {j¹, ..., jr}) ⎧

⎪⎪

⎪⎨

⎪⎪

⎪⎩

u^j¹ = v^j¹ − P

k /∈Iv

γ_j₁_,ku^k ...

u^j^r = v^j^r − P

k /∈Iv

γ_j_r_,ku^k

(27)

J(u) = J(v)−X

k /∈Iv

∆ku^k, (28)

gdzie

γ_j_i_,k = (B⁻¹Ak)ⁱ ; i = 1, ..., r, k = 1, ..., n (29) (w szczególno´sci γ_j_i_,k = δji,k dla i = 1, ..., r, k ∈ I^v),

B = [Aj1 | ... | A^j^r] , v^jⁱ = (B⁻¹b)ⁱ, i = 1, ..., r,

v^k = 0, k /∈ I^v,

∆k =

c, B⁻¹Ak

®− c^k = Xr

i=1

cji(B⁻¹Ak)ⁱ− c^k, k = 1, ..., n, (30)

gdzie c =

⎡

⎢⎢

⎢⎣ c1

... c1

⎤

⎥⎥

⎥⎦ (w szczególno´sci ∆k = 0 dla k ∈ I^v).

W tym przypadku tablica sympleksowa dla punktu v jest nast ˛epuj ˛aca:

Tablica sympleksowa II (dla punktu v)

(21)

u¹ ... u^j¹ ... u^jⁱ ... u^k ... u^j^s ... u^j ... u^j^r ... uⁿ

u^j¹ γ_j₁_,1 ... 1 ... 0 ... γ_j₁_,k ... 0 ... γ_j₁_,j ... 0 ... γ_j₁_,n v^j¹

... ... ... ... ... ... ... ... ... ...

u^jⁱ γ_j_i_,1 ... 0 ... 1 ... γ_j_i_,k ... 0 ... γ_j_i_,j ... 0 ... γ_j_i_,n v^jⁱ

... ... ... ... ... ... ... ... ... ...

u^j^s γ_j_s_,1 ... 0 ... 0 ... γ_j_s_,k ... 1 ... γ_j_s_,j ... 0 ... γ_j_s_,n v^j^s

... ... ... ... ... ... ...

u^j^r γ_j_r_,1 ... 0 ... 0 ... γ_j_r_,k ... 0 ... γ_j_r_,j ... 1 ... γ_j_r_,n v^j^r

∆1 ... 0 ... 0 ... ∆k ... 0 ... ∆j ... 0 ... ∆n J(v) Tak, jak wcze´sniej, nale˙zy rozwa˙zy´c trzy przypadki:

1⁰ spełniony jest warunek

∆k ≤ 0, k /∈ I^v (22’)

2⁰ istnieje k /∈ I^v takie, ˙ze

∆k > 0, γ_j_i_,k ≤ 0, i = 1, ..., r (23’) 3⁰ nie zachodzi przypadek 1⁰ i 2⁰; w konsekwencji istniej ˛a k /∈ I^v oraz ji ∈ I^v takie, ˙ze

∆k> 0, γ_j_i_,k > 0. (24’) Podobnie, jak wcze´sniej, łatwo sprawdzi´c, ˙ze w pierwszym przypadku punkt v jest rozwi ˛azaniem zadania (14), w drugim - inf

u∈Uhc, ui = −∞, czyli zadanie (14) nie ma rozwi ˛azania.

W trzecim przypadku nale˙zy wybra´c element rozwi ˛azuj ˛acy γ_j_s_,kna podstawie warunku (24’) oraz warunku

v^j^s γ_j_s_,k min

ji∈Iv,k

v^jⁱ

γ_j_i_,k, (25’)

gdzie Iv,k ={jⁱ ∈ I^v; γ_j_i_,k > 0}, które s ˛a analogiczne do warunków (24), (25). Nast ˛epnie, nale˙zy wykona´c przej´scie do nowego punktu wierzchołkowego w. Z warunków (24’) i (25’) wynika, ˙ze baz ˛a punktu w b ˛edzie układ kolumn (z dokładno´scia do ich kolejno´sci)

Aj1, ..., Ajs−1, Ajs+1, ..., Ajr, Ak,

(22)

przy czym

J(w)≤ J(v).

Współrz ˛edne punktu w mo˙zna wyznaczy´c na podstawie twierdzenia charakteryzuj ˛acego punkty wierzchołkowe.

Uwaga 2. Mo˙zna pokaza´c, ˙ze

⎧⎪

⎪⎪

⎪⎨

⎪⎪

⎩

w^j¹ = v^j¹ − γj1,k v^js γ_js,k

... w^jⁱ = v^jⁱ − γji,k

v^js γ_js,k

...

w^j^s⁻¹ = v^j^s⁻¹− γjs−1,k v^js γ_js,k

w^j^s = v^j^s − γjs,k v^js γ_js,k = 0 w^j^s+1 = v^j^s+1− γjs+1,k v^js

γ_js,k

... w^j^r = v^j^r − γjr,k

v^js γ_js,k

w^k= _γ^v^js

js,k

w^l = 0, l /∈ I^v, l6= k, Tablica sympleksowa dla punktu w przyjmuje posta´c

Tablica sympleksowa III (dla punktu w)

(23)

u¹ ... u^j¹ ... u^jⁱ ... u^k ... u^j^s ... u^j ... u^j^r ... uⁿ

u^j¹ γ⁰_j₁_,1 ... 1 ... 0 ... 0 ... γ⁰_j₁_,j_s ... γ⁰_j₁_,j ... 0 ... γ⁰_j₁_,n w^j¹

... ... ... ... ... ... ... ... ... ...

u^jⁱ γ⁰_j_i_,1 ... 0 ... 1 ... 0 ... γ⁰_j_i_,j_s ... γ⁰_j_i_,j ... 0 ... γ⁰_j_i_,n w^jⁱ

... ... ... ... ... ... ... ... ... ...

u^k γ⁰_k,1 ... 0 ... 0 ... 1 ... γ_k,j⁰ _s ... γ⁰_k,j ... 0 ... γ⁰_k,n w^k

... ... ... ... ... ... ... ... ... ...

u^j^s⁻¹ γ⁰_j_s₋₁_,1 ... 0 ... 0 ... 0 ... γ⁰_j_s₋₁_,j_s ... γ⁰_j_s₋₁_,j ... 0 ... γ⁰_j_s₋₁_,n w^j^s⁻¹ u^j^s+1 γ⁰_j_s+1_,1 ... 0 ... 0 ... 0 ... γ⁰_j_s+1_,j_s ... γ⁰_j_s+1_,j 0 γ⁰_j_s+1_,n w^j^s+1

... ... ... ... ... ... ...

u^j^r γ⁰_j_r_,1 ... 0 ... 0 ... 0 ... γ⁰_j_r_,j_s ... γ⁰_j_r_,j ... 1 ... γ⁰_j_r_,n w^j^r

∆⁰₁ ... 0 ... 0 ... 0 ... ∆_j⁰_s ... ∆⁰_j ... 0 ... ∆⁰_n J(w) gdzie współczynniki γ⁰_i,j, ∆⁰_j s ˛a okre´slone przy pomocy wzorów analogicznych do (29),

(30) z macierz ˛a B postaci

[Aj1 | ... | A^k | ... | A^js−1 | A^js+1 | ... | A^j^r]

(zakładamy tu, ˙ze wiersze i kolumny w tablicy sympleksowej oraz kolumny macierzy B s ˛a ustawione w kolejno´sci rosn ˛acych indeksów).

Uwaga 2. Mo˙zna pokaza´c, ˙ze

⎧⎨

⎩

γ_j⁰_i_,j = γ_j_i_,j− γ^γ_js,k^ji,kγ_j_s_,j ; i = 1, ..., r, i6= s, j = 1, ...n, γ⁰_k,j = ^γ_γ^js,j

js,k, j = 1, ...n, oraz

∆⁰_j = ∆j − ∆^kγ_j_s_,j

γ_j_s_,k dla j = 1, ..., n.

Opisany wi ˛ec został jeden krok metody sympleksowej w dowolnym przypadku (co do bazy punktu wierzchołkowego), czyli przej´scie od jednego punktu wierzchołkowego (v) zbioru U do drugiego punktu wierzchołkowego (w) tego zbioru (w przypadku 3⁰) w taki sposób,

˙ze

J(w)≤ J(v).

(24)

2 Programowanie nieliniowe

2.1 Zadania bez ogranicze´ n - zasada Fermata i warunki dostate- czne

Rozwa˙zmy zadanie postaci (minimalizacyjne zadanie bezwarunkowe)

⎧⎨

⎩

J(u)→ inf , u∈ Rⁿ

(31) gdzie J : Rⁿ → R.

Punkt u_∗ ∈ Rⁿ nazywamy punktem lokalnego minimum dla tego zadania, je´sli istnieje otoczenie V punktu u_∗ takie, ˙ze

J(u_∗)≤ J(u)

dla dowolnego u ∈ V (gdy V = Rⁿ mówimy, ˙ze u∗ jest punktem globalnego minimum dla rozpatrywanego zadania). Prawdziwe jest nast ˛epuj ˛ace:

Twierdzenie 2 (zasada Fermata) Je´sli u_∗ jest punktem lokalnego minimum dla zadania (31) i funkcja J ma w punkcie u_∗ gradient ∇J(x∗) = (_∂u^∂J

1(u_∗), ...,_∂u^∂J

n(u_∗)), to

∇J(u∗) = 0.

Dowód. Istnienie gradientu funkcji J w punkcie u_∗ oznacza istnienie pochodnej funkcji ϕ_i : [−1, 1] 3 t 7→ J(u∗+ tei)∈ R

w punkcie t = 0, gdzie ei jest i-tym wektorem jednostkowym, i = 1, ..., n. Poniewa˙z u∗

jest punktem lokalnego minimum funkcjonału J, wi ˛ec ϕ⁰_i(0) = 0, i = 1, ..., n.

A wi ˛ec ∇J(u∗) = 0, co ko´nczy dowód.

U˙zyteczne jest nast ˛epuj ˛ace

(25)

Twierdzenie 3 (warunki dostateczne drugiego rz ˛edu) Je´sli J : Rⁿ → R jest klasy C² oraz

i) ∇J(u∗) = 0,

ii) macierz ∇²J(u_∗) =h

∂²J

∂xi∂xj(u_∗)i

1≤i,j≤njest dodatnio okre´slona, tzn. deth

∂²J

∂xi∂xj(u_∗)i

1≤i,j≤k >

0 dla dowolnego k = 1, ..., n,

to u_∗ jest punktem ´scisłego minimum lokalnego funkcji J na Rⁿ (¹).

2.2 Zadania z ograniczeniami

2.2.1 Zasada mno˙zników Lagrange’a Rozwa˙zmy zadanie postaci

⎧⎨

⎩

J(u)→ inf ,

u∈ U = {u ∈ Rⁿ; fi(u) = θ, i = 1, ..., m}

(32)

gdzie fi : Rⁿ→ R, i = 1, ..., m.

Mówimy, ˙ze punkt u∗ ∈ Rⁿ jest punktem lokalnego minimum dla zadania (32), je´sli istnieje otoczenie V tego punktu takie, ˙ze dla dowolnego punktu u ∈ V , spełniaj ˛acego ograniczenia

fi(u) = θ, i = 1, ..., m, mamy

J(u_∗)≤ J(u)

(gdy V = Rⁿ mówimy, ˙ze u∗ jest punktem globalnego minimum).

1Mówimy, ˙ze punkt u_∗ ∈ Rⁿ jest punktem ´scisłego minimum lokalnego funkcji J na Rⁿ, je´sli istnieje otoczenie V tego punktu takie, ˙ze dla dowolnego punktu u ∈ V , u 6= u∗, mamy

J(u_∗) < J(u).

(26)

Twierdzenie 4 (o funkcji uwikłanej) Niech dane b ˛ed ˛a funkcje gi = gi(w, z) : R^s+n → R, i = 1, ..., n, klasy C¹ oraz punkt (a, b) ∈ R^s+n taki, ˙ze

gi(a, b) = 0, i = 1, ..., n det[∂gi

∂zj

(a, b)]_1≤i,j≤n6= 0.

Wówczas istnieje δ > 0 i funkcja z = z(w) = (z1(w), ..., zn(w)) : K(a, δ)→ Rⁿ klasy C¹ taka, ˙ze

z(a) = b,

gi(w, z(w)) = 0, i = 1, ..., n.

Twierdzenie 5 (zasada mno˙zników Lagrange’a) Je´sli funkcje J, fi, i = 1, ..., m s ˛a klasy C¹ na Rⁿ i punkt u_∗ jest punktem lokalnego minimum dla zadania (32), to istniej ˛a liczby (mno˙zniki Lagrange’a) λ0, λ1, ..., λm ∈ R, nie wszystkie równe zero i takie, ˙ze

λ0∇J(u∗) +Pm

i=1λi∇fⁱ(u_∗) = 0.

Dowód. Warunek dany w tezie twierdzenia oznacza liniow ˛a zale˙zno´s´c wektorów

∇J(u∗),∇f¹(u_∗), ...,∇f^m(u_∗)

w przestrzeni Rⁿ. Przypu´s´cmy, ˙ze warunek ten nie jest spełniony, tzn. powy˙zsze wektory s ˛a liniowo niezale˙zne. Oznacza to, ˙ze m + 1 ≤ n. W przypadku, gdy m + 1 < n mo˙zemy uzupełni´c układ wektorów ∇J(u∗),∇f¹(u_∗), ...,∇f^m(u_∗)wektorami dm+1, ..., d_n−1 tak, by układ wektorów ∇J(u∗),∇f¹(u_∗), ...,∇f^m(u_∗), dm+1, ..., d_n−1 był układem liniowo niezale˙znym w Rⁿ.

Rozwa˙zmy teraz funkcje

g0(t, u) = J(u)− J(u∗) + t, gi(t, u) = fi(u), i = 1, ..., m,

gi(t, u) =hdⁱ, u− u∗i , i = m + 1, ..., n − 1,

(27)

okre´slone na R¹⁺ⁿ. Łatwo wida´c, ˙ze powy˙zszy układ funkcji spełnia zało˙zenia twierdzenia o funkcji uwikłanej z punktem (a, b) postaci (0, u_∗). Z twierdzenia tego wynika, ˙ze istnieje δ > 0 i funkcja u = u(t) = (u1(t), ..., un(t)) : (−δ, δ) → Rⁿ klasy C¹ (dla naszych celów wystarcza ci ˛agło´s´c) taka, ˙ze

u(0) = u_∗ oraz

J(u(t)) = J(u_∗)− t, fi(u(t)) = 0, i = 1, ..., m,

dla t ∈ (−δ, δ). To oznacza w szczególno´sci, ˙ze dla t ∈ (0, δ) punkty u(t) spełniaj ˛a ograniczenia typu równo´sci wyst ˛epuj ˛ace w zadaniu (32), przy czym

J(u(t)) = J(u_∗)− t < J(u∗) < J(u_∗) + t = J(u(−t)).

Przeczy to optymalno´sci punktu u_∗.

Twierdzenie 6 Niech spełnione b ˛ed ˛a zało˙zenia poprzedniego twierdzenia. Je´sli dodatkowo wektory ∇fⁱ(u_∗), i = 1, ..., m, s ˛a liniowo niezale˙zne, to λ0 6= 0 i mo˙zna przyj ˛a´c λ0 = 1.

Proof. Przypu´s´cmy, ˙ze λ0 = 0. Wówczas Pm

i=1λi∇fⁱ(u_∗) = 0

przy czym λi 6= 0 dla pewnego i ∈ {1, ..., m}. W konsekwencji Pm

i=1λi∇fⁱ(u_∗)u = 0 (33)

dla dowolnego u ∈ Rⁿ. Niech teraz u0 = (u¹₀, ..., uⁿ₀)∈ Rⁿ b ˛edzie takim punktem, ˙ze

∇fⁱ(u_∗)u0 = λi, i = 1, ..., m (34) (istnienie takiego punktu wynika z twierdzenia Kroneckera-Capellego (²)). Zatem, z (33) i (34) wynika, ˙ze

0 =Pm

i=1λi∇fⁱ(u_∗)u0 =Pm

i=1λiλi > 0.

Otrzymana sprzeczno´s´c dowodzi fałszywo´sci przypuszczenia, ˙ze λ0 = 0.

2Układ równa´n liniowych Au = b, gdzie A ∈ R^m^×n, x ∈ Rⁿ, b ∈ R^mma co najmniej jedno rozwi ˛azanie wtedy i tylko wtedy, gdy rzA = rz[A | b].

(28)

Uwaga 7 Twierdzenie 5 mo˙zna wykorzysta´c do rozwi ˛azywania zada´n z ograniczeniami typu równo´sci i nierówno´sci. Istotnie, rozwa˙zmy zadanie postaci

⎧⎨

⎩

J(u)→ inf ,

u∈ U = {u ∈ Rⁿ; fi(u) = 0, i = 1, ..., m, hk(u)≤ 0, k = 1, ..., s}

. (35)

Wprowadzaj ˛ac nowe zmienne w1,...,ws, rozwi ˛azywanie zadania (35) mo˙zna zast ˛api´c rozwi ˛azywaniem zadania postaci

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

J(u, w) = ee J(u)→ inf , fei(u, w) = fi(u) = 0, i = 1, ..., m, ehk(u, w) = w²_k+ hk(u) = 0, k = 1, ..., s.

(36)

Dokładniej, je´sli punkt u_∗ jest punktem lokalnego minimum dla zadania (35), to punkt (u_∗, w_∗), gdzie w_∗ = (w_1∗, ..., w_s∗), w_k∗ = p

−h^k(u_∗), jest punktem lokalnego minimum dla zadania (36). Na odwrót, je´sli punkt (u_∗, w_∗) jest punktem lokalnego minimum dla zadania (36), to punkt u_∗ jest punktem lokalnego minimum dla zadania (35).

W bezpo´sredni sposób mo˙zna udowodni´c nast ˛epuj ˛ace

Twierdzenie 8 Je´sli funkcje J, fi, i = 1, ..., m, hk, j = 1, ..., s s ˛a klasy C¹ na Rⁿ i punkt u_∗ jest punktem lokalnego minimum dla zadania (35), to istniej ˛a mno˙zniki Lagrange’a λ0, λ1, ..., λm, μ₁, ..., μ_s∈ R, nie wszystkie równe zero i takie, ˙ze

λ0 ≥ 0, μ1 ≥ 0, ..., μs ≥ 0 λ0∇J(u∗) +Pm

i=1λi∇fⁱ(u_∗) +Ps

k=1μ_k∇h^k(u_∗) = 0, j = 1, ..., n, μ_khk(u_∗) = 0, k = 1, ..., s.

2.2.2 Programowanie wypukłe - Twierdzenie Kuhna- Tuckera Rozwa˙zmy nast ˛epuj ˛ace zadanie

⎧⎨

⎩

f0(u)→ inf ,

u∈ U = {u ∈ Rⁿ; u∈ A, fⁱ(u)≤ θ, i = 1, ..., m}

(37)

(29)

gdzie A ⊂ Rⁿ, fi : Rⁿ→ R, i = 0, 1, ..., m.

Mówimy, ˙ze u∗ jest rozwi ˛azaniem globalnym zadania (37), je´sli fi(u_∗)≤ 0, i = 1, ..., m,

u_∗ ∈ A oraz

f0(u_∗)≤ f⁰(u) dla dowolnego u ∈ Rⁿ takiego, ˙ze

fi(u)≤ 0, i = 1, ..., m, u∈ A.

Poni˙zsze twierdzenie pokazuje, ˙ze w przypadku zadania (37), przy dodatkowych za- ło˙zeniach wypukło´sci, zasada Lagrange’a prawdziwa jest w postaci wzmocnionej.

Twierdzenie 9 (Kuhna-Tuckera) Niech f0, f1,...,fm : Rⁿ → R b ˛ed ˛a funkcjami wy- pukłymi i A ⊂ Rⁿ - zbiorem wypukłym. Je´sli u_∗ jest rozwi ˛azaniem globalnym zadania (37), to istniej ˛a mno˙zniki Lagrange’a λ0 ≥ 0, λ¹ ≥ 0,...,λ^m ≥ 0 nie znikaj ˛ace jednocze´snie i takie, ˙ze

Xm i=0

λifi(u_∗) = min

u∈A

Xm i=0

λifi(u) (38)

λifi(u_∗) = 0, i = 1, ...m. (39) Jesli ponadto istnieje punkt u ∈ A taki, ˙ze

fi(u) < 0, i = 1, ..., m, (40)

to λ0 6= 0 i mo˙zna przyj ˛a´c λ0 = 1.

Na odwrót, je´sli istniej ˛a λ0 > 0, λ1 ≥ 0,...,λ^m ≥ 0 i punkt u∗ takie, ˙ze f1(u_∗)≤ 0, ..., f^m(u_∗)≤ 0,

u_∗ ∈ A,

(30)

Xm i=0

λifi(u_∗) = min

u∈A

Xm i=0

λifi(u), λifi(u_∗) = 0, i = 1, ...m, to u_∗ jest rozwi ˛azaniem globalnym zadania (37).

Uwaga 10 Łatwo wida´c, ˙ze przy zało˙zeniach wypukło´sci ka˙zde rozwi ˛azanie lokalne zadania (37) jest jego rozwi ˛azaniem globalnym.

Z faktu, ˙ze w przypadku funkcji wypukłej i ró˙zniczkowalnej na przestrzeni Rⁿ zbiór punktów minimum globalnego pokrywa si ˛e ze zbiorem punktów, w których znika gradient tej funkcji, wynika nast ˛epuj ˛acy

Wniosek 11 Niech f0, f1,...,fm : Rⁿ → R b ˛ed ˛a funkcjami wypukłymi i ró˙zniczkowalnymi.

Je´sli u_∗ jest rozwi ˛azaniem globalnym zadania (37) ze zbiorem A = Rⁿ, to istniej ˛a mno˙zniki Lagrange’a λ0 ≥ 0, λ¹ ≥ 0,...,λ^m ≥ 0 nie znikaj ˛ace jednocze´snie i takie, ˙ze

Pm

i=0λi∇fⁱ(u_∗) = 0, λifi(u_∗) = 0, i = 1, ...m.

Je´sli ponadto istnieje punkt u ∈ Rⁿ taki, ˙ze

fi(u) < 0, i = 1, ..., m, to λ0 6= 0 i mo˙zna przyj ˛a´c λ0 = 1.

Na odwrót, je´sli istniej ˛a λ0 > 0, λ1 ≥ 0,...,λ^m ≥ 0 i punkt u∗ ∈ Rⁿ takie, ˙ze f1(u_∗)≤ 0, ..., f^m(u_∗)≤ 0,

Pm

i=0λi∇fⁱ(u_∗) = 0, λifi(u_∗) = 0, i = 1, ...m, to u_∗ jest rozwi ˛azaniem globalnym zadania (37).

(31)

3 Metody numeryczne

3.1 Metoda gradientowa

Rozwa˙zmy zadanie bez ogranicze´n

⎧⎨

⎩

f0(u)→ min u∈ Rⁿ

, zakładaj ˛ac, ˙ze funkcja f : Rⁿ → R jest klasy C¹.

Korzystaj ˛ac z definicji ró˙zniczkowalno´sci funkcji f0oraz nierówno´sci Cauchy’ego-Buniakowskiego (− |∇f⁰(u)| |v| ≤ h∇f⁰(u), vi ≤ |∇f⁰(u)| |v|, przy czym je´sli ∇f⁰(u) 6= 0, to prawa

nierówno´s´c jest równo´sci ˛a tylko dla v = α∇f⁰(u), a lewa nierówno´s´c - tylko dla v =

−α∇f⁰(u), gdzie α ≥ 0), mo˙zna pokaza´c, ˙ze je´sli ∇f⁰(u_∗) 6= 0, to kierunkiem najszyb- szego spadku warto´sci funkcji f0 w punkcie u0jest kierunek antygradientu −∇f⁰(u_∗)(tzn.

dla dowolnego h ∈ Rⁿ, h 6= −∇f⁰(u_∗)

f0(u_∗+ τ (−∇f⁰(u_∗))) < f0(u_∗+ τ h)

dla dostatecznie małych τ > 0). Na tym spostrze˙zeniu opiera si ˛e konstrukcja tzw. metody gradientowej - metody przybli˙zonego wyznaczania rozwi ˛aza´n powy˙zszego zadania.

Niech dany b ˛edzie dowolny punkt u0 ∈ Rⁿ. Rozwa˙zmy ci ˛ag (uk)_k∈N∪{0} okre´slony w sposób rekurencyjny wzorem

uk+1 = uk− α^k∇f⁰(uk), k = 0, 1, ..., (41) gdzie αk > 0 dla k = 0, 1, ... jest tzw. krokiem k-tej iteracji.

Uwaga 12 Je´sli ∇f⁰(uk)6= 0, to α^k> 0 mo˙zna wybrać tak, by spełniona była nierówno´sć f0(uk+1) < f0(uk) (³). Je´sli ∇f⁰(uk) = 0, to post ˛epowanie nale˙zy przerwać (ci ˛ag tworzony

3Z okre´slenia ró˙zniczkowalno´sci funkcji f0w punkcie u:

f₀(u + h) = f₀(u) + h∇f0(u), hi + o(h), h ∈ Rⁿ, wynika, ˙ze

f₀(u_k+1) − f0(u_k) = α_k[− |∇f0(u_k)|²+bok(α_k)α⁻¹_k ] < 0 dla dostatecznie małych warto´sci α_k> 0, gdziebok(α) = o(−α∇f0(u_k))