Jednowymiarowe zagadnienia minimalizacji.
Wcześniej zajmowaliśmy się przypadkiem, w którym zależność między wielkościami mierzonymi dało się przedstawić przy pomocy funkcji:
x a
e
a
a
x
y
=
+
⋅
− 3⋅ 2 1)
(
Dopasowanie modelu do wyników pomiarów okazało się być problemem nieliniowym, prowadzącym do układu trzech równań
=
⋅
⋅
⋅
−
⋅
⋅
+
⋅
⋅
=
⋅
⋅
−
⋅
+
⋅
=
⋅
−
⋅
+
∑
∑
∑
∑
∑
∑
∑
∑
∑
= ⋅ − = ⋅ ⋅ − = ⋅ − = ⋅ − = ⋅ ⋅ − = ⋅ − = = ⋅ − =0
0
0
1 1 2 2 1 1 1 1 2 2 1 1 1 1 2 1 1 3 3 3 3 3 3 3 n i x a i i i n i x a i i n i x a i i n i x a i i n i x a i n i x a i n i i i n i x a i n i i i i i i i i ie
y
x
w
e
x
w
a
e
x
w
a
e
y
w
e
w
a
e
w
a
y
w
e
w
a
w
a
wyznaczających minimum funkcji
χ
2
(
)
∑
= ⋅ −
−
−
⋅
=
n i i x a i ie
a
a
y
a
a
a
1 2 2 1 3 2 1 2 3,
,
σ
χ
Wprowadzimy dodatkowe oznaczenia:
∑
∑
∑
∑
∑
∑
∑
∑
= ⋅ ⋅ − = ⋅ ⋅ − = ⋅ − = ⋅ − = ⋅ − = ⋅ − = =⋅
⋅
=
⋅
=
⋅
⋅
⋅
=
⋅
⋅
=
⋅
⋅
=
⋅
=
⋅
=
=
=
n i x a i i xaxx n i x a i axx n i x a i i i xyax n i x a i i yax n i x a i i xax n i x a i ax n i i i y n i i w i i i i i i i ie
x
w
S
e
w
S
e
y
x
w
S
e
y
w
S
e
x
w
S
e
w
S
y
w
S
w
S
w
1 2 1 2 1 1 1 1 1 1 2 3 3 3 3 3 31
σ
Przy ich pomocy zapiszemy powyższy układ trzech równań w postaci:
=
−
⋅
+
⋅
=
⋅
+
⋅
=
⋅
+
⋅
0
2 1 2 1 2 1 xyax xaxx xax yax axx ax y ax wS
S
a
S
a
S
S
a
S
a
S
S
a
S
a
gdzie parametr
a
3 jest ukryty w wyrazach postaciS
.a.. (w wykładnikach eksponent). Równania układu są nieliniowe tylko ze względu na tenjeden parametr
a
3. Jeżeli przyjmiemy, że parametr ma ustalona wartość(np. stała rozpadu izotopu jest znana), to parametry
a
1, a
2 możemywyznaczyć rozwiązując, na przykład, dwa pierwsze równania:
( )
2 1 ax axx w ax yax axx yS
S
S
S
S
S
S
a
−
−
=
( )
2 2 ax axx w ax y yax wS
S
S
S
S
S
S
a
−
−
=
Po wstawieniu do trzeciego( )
2−
( )
2⋅
−
=
0
−
+
⋅
−
−
xyax xaxx ax axx w ax y yax w xax ax axx w ax yax axx yS
S
S
S
S
S
S
S
S
S
S
S
S
S
S
S
S
i uproszczeniu otrzymujemy(
S
yS
axx−
S
yaxS
ax)
⋅
S
xax+
(
S
wS
yax−
S
yS
ax)
⋅
S
xaxx−
(
S
wS
axx−
S
ax2)
⋅
S
xyax=
0
W naszym przypadku wyniki pomiarów i ich niepewności są ustalone, czyli lewa strona równania jest nieliniową funkcją jednej zmiennej{
}
(
a
3;
x
i,
y
i,
i)
=
0
f
σ
Zatem trójwymiarowe zagadnienie udało się sprowadzić do problemu wyznaczenia miejsc zerowych funkcji jednej zmiennej.
Miejsca zerowe funkcji jednej zmiennej
(a) – pojedynczy pierwiastek ograniczony w przedziale (
a
,b
)(b) – w przypadku podwójnego pierwiastka funkcja może mieć ten sam znak na końcach przedziału
(c) – przykład funkcji z wieloma miejscami zerowymi
(d) – przykład funkcji zmieniającej znak w przedziale (
a
,b
), ale nieMetoda bisekcji
Przed jej zastosowaniem, należy znaleźć przedział (
a
,b
), który ograniczamiejsce zerowe, to znaczy taki, że
f
(
a
)
⋅
f
(
b
)
<
0
. 1. dzielimy przedział na pół2
b
a
c
=
+
i obliczamyf
(c
)
2. jeżeli
f
(
a
)
⋅
f
(
c
)
<
0
, to podstawiamyb
=
c
(w przeciwnym przypadkua
=
c
) i wracamy do 1.3. kończymy jeżeli
f
(
c
)
=
0
luba
−
b
jest dostatecznie małe.Metoda jest pewna, przynajmniej jedno miejsce zerowe znajduje się
w końcowym przedziale i stosunkowo szybko zbieżna. Po
n
krokachszerokość przedziału zawierającego miejsce zerowe wynosi
n n
d
d
2
0=
Na końcu musimy się jeszcze upewnić, czy nie znaleźliśmy przypadkiem lokalnego maksimum funkcji
χ
2.Bezpośrednia minimalizacja funkcji
χ
2
A, C, E
– lokalne maksima funkcji;H
– globalne maksimum w przedziale(
X
1, X
2).G, B, F
– lokalne minima w przedziale;D
– globalne minimum funkcji w przedziale (X
1, X
2).Metoda złotego podziału
Tryplet punktów
X
<
Y
<
Z
ogranicza minimum funkcji jeżeli)
(
)
(
Y
f
X
f
<
if
(
Y
)
<
f
(
Z
)
Odpowiednikiem metody bisekcji jest następujący algorytm lokalizacji minimum funkcji.
1. Mamy tryplet
a
<
b
<
c
ograniczający minimum funkcjif
(x
)
2. Obliczamy wartośćf
(x
)
w punkcieb
<
x
<
c
3. Jeżeli
f
(
b
)
<
f
(
x
)
, to nowym trypletem jesta
<
b
<
x
, w przeciwnym przypadku tym trypletem jestb
<
x
<
c
4. Znaleziony tryplet ograniczający minimum funkcji zastępuje początkowy w punkcie 1. i cykl powtarzamy
5. Kończymy jeżeli szerokość trypletu
c
−
a
jest odpowiednio mała.Kolejne kroki lokalizacji minimum. Początkowo minimum jest
ograniczone przez (1, 3, 2). Funkcja jest obliczona w 4, który zastępuje 2 (1, 3, 4); następnie w 5, który zastępuje 1 (3, 5, 4); następnie w 6, który zastępuje 4. Teraz punkty (3, 6, 5) są trypletem zawierającym minimum.
Optymalizacja podziału
Środkowy punkt trypletu dzieli go tak, że
b
wyznacza ułamekW
drogi oda
doc
W
a
c
a
b
=
−
−
W
a
c
b
c
=
−
−
−
1
.Kolejny punkt
x
leży o dodatkowy ułamekZ
zab
Z
a
c
b
x
=
−
−
Następny tryplet będzie miał szerokość
W
+
Z
albo1
−
W
w stosunkudo poprzedniego. Jeżeli chcemy zminimalizować szerokość nowego trypletu w najgorszym przypadku, to obie szerokości powinny być takie same
W
Z
W
+
=
1
−
alboW
Z
=
1
−
2
Oznacza to, że
x
powinien leżeć w odcinku (a
,c
) symetrycznie dob
i wypadać w większej części tego odcinka. Jeżeli poprzedni podział też był optymalny ze względu na najgorszy przypadek, to
x
dzieli odcinek (b
,c
) w takim stosunku jakb
dzieli (a
,c
)W
W
Z
=
−
1
Wartość
W
wyznacza równanie kwadratowe0
1
3
2−
+
=
W
W
co daje38197
,
0
2
5
3
−
≈
=
W
.Optymalny tryplet ma zatem punkt środkowy we względnej odległości 0,38197 od jednego końca i 0,61803 od drugiego. Taki punkt nazywa się
Przykład minimalizacji jednowymiarowej x a
e
a
a
x
y
=
+
⋅
− 3⋅ 2 1)
(
1E-2 1E-1 1E+0 1E+1 1E+2
Parametr a3 6 8 10 12 χ2 0 20 40 60 Dawka 0 40 80 120 S ygna ł 7.4 7.5 7.6 7.7 χ2
1E-2 Parametr a31E-1 1E+0
←↓
1E-8 1E-7 1E-6 1E-5 1E-4 1E-3 1E-2 1E-1 1E+0 1E+1 1E+2 a3 0 200 400 600 800 χ2 0 40 Dawka 80 120 0 40 80 120 Sygna ł 467.880 467.885 467.890 χ2
Metoda simpleks minimalizacji w wielu wymiarach
Simpleks jest tworem geometrycznym, który w przestrzeni
n
-wymiarowejskłada się z
n + 1
punktów (wierzchołków) oraz wszystkich łączących jeodcinków, wielokątów, itd. Na płaszczyźnie simpleks jest trójkątem, w przestrzeni 3-wymiarowej czworościanem. Simpleks
niezdegenerowany, to taki, który zawiera skończoną (
n
-wymiarową)objętość. Jeżeli jeden z wierzchołków niezdegenerowanego simpleksu obierzemy jako początek układu, to pozostałe wierzchołki wyznaczają
n
liniowo niezależnych wektorów wn
-wymiarowej przestrzeni.Metoda minimalizacji wymaga wybrania początkowego simpleksu o
n + 1
wierzchołkach. Możemy, np. wybrać jeden punkt w przestrzeni parametrówa
0, a pozostałe utworzyć taki
i
a
e
a
=
0+
λ
W kolejnych krokach simpleks jest przemieszczany w kierunku minimum (‘w dół zbocza’). W większości przypadków polega to na tym, że
najgorszy wierzchołek (z największą wartością funkcji) jest przesuwany w kierunku przeciwległej ścianki do miejsca, gdzie wartość funkcji jest mniejsza. Jeżeli to nie daje efektu, to simpleks zostaje zmniejszany przez ściągnięcie wierzchołków w kierunku najlepszego wierzchołka (z najmniejszą wartością funkcji).
Możliwe wyniki kolejnego kroku simpleksu. Poprzedni simpleks (czworościan) jest narysowany ciągłą linią. ‘Wysoki’ i ‘niski’ są
najgorszym i najlepszym wierzchołkiem simpleksu. Simpleks następny jest narysowany linia przerywaną.
(a) – odbicie najgorszego punktu względem przeciwległej ścianki (b) – jak (a) i rozciągnięcie simpleksu w tym kierunku
(c) – zmniejszenie simpleksu w jednym wymiarze przez przesunięcie wysokiego wierzchołka
(d) – zmniejszenie simpleksu we wszystkich wymiarach przez ściągnięcie wierzchołków w kierunku najlepszego wierzchołka.