Dopasowanie dowolnej funkcji do danych pomiarowych.
Do tej pory staraliśmy się dopasować do wyników pomiarów funkcje o ogólnej postaci:
∑
==
m k k kf
x
a
x
y
1)
(
)
(
,zawierające
m
nieznanych parametrówa ...
1a
k. Zakładaliśmy przy tym,że same funkcje
f
k(x
)
nie zawierają tych parametrów. Minimalizacjafunkcji
χ
2 (MNK) prowadziła do układum
równań liniowych ze względuna te parametry, które można rozwiązać metodami algebraicznymi. Dlatego zagadnienie dopasowania funkcji
y
(
x
)
=
∑
a
kf
k(
x
)
do wyników pomiarów nazywa się zagadnieniem liniowym.W przypadku dopasowania dowolnej funkcji układ równań określających warunek minimum
χ
2 jest najczęściej nieliniowy względem szukanych parametrówa ,...,
1a
m. Taki układ nie może być rozwiązany metodami ścisłymi.Metoda najmniejszych kwadratów (MNK)
Funkcja wiarygodności w takim przypadku ma ogólną postać
∏
∑
= = − − ⋅ = n i n i y i i y y i i m i i i x y y y x a a P 1 1 2 1 ) ( 2 1 exp 2 1 }) , , { ; ,..., ( σ π σ σgdzie
y
(x
)
jest dowolną funkcją mającąm
parametrówa
1,
a
2,...,
a
m,które dopasowujemy tak, żeby zmaksymalizować prawdopodobieństwo
P
.Maksymalizacji prawdopodobieństwa
P
odpowiada minimalizacja wykładnika eksponenty, czyliχ
2.(
)
∑
=
−
=
n i i i y y i i mx
y
y
y
x
a
a
i i 1 2 2 1 2(
,...,
;
{
,
,
})
1
(
)
σ
σ
χ
W minimum musi być spełniony układ
m
równań o postaci:(
(
)
)
0
1
1 2 2 2=
−
∂
∂
=
∂
∂
∑
= n i i i y l lx
y
y
a
a
σ
iχ
∑
(
)
=
∂
∂
−
−
=
n i l i i i ya
x
y
x
y
y
i 1 2)
(
)
(
1
2
σ
Dla uproszczenia rozważymy zależność
χ
2 od tylko jednego parametru la
.χ
2 jest funkcją analityczną (jeżeli tylko nasz model wyraża sięfunkcją analityczną) i można ją rozwinąć w szereg potęgowy wokół minimum przypadającego dla wartości
a'
l:...
)
'
(
2
1
)
'
(
)
'
(
)
(
2 2 2 2 2 2 2−
+
∂
∂
+
−
∂
∂
+
=
l l l l l l l la
a
a
a
a
a
a
a
χ
χ
χ
χ
Dostatecznie blisko minimum możemy pominąć wyrazy wyższych rzędów i wykorzystać fakt, że w samym minimum znika pierwsza pochodna. 2 2 2 2 2 2
(
'
)
2
1
)
'
(
)
(
l l l l la
a
a
a
a
−
∂
∂
+
≅
χ
χ
χ
Z drugiej strony, jeżeli rozważymy zachowanie się funkcji wiarygodności wokół wartości
a'
l, to dla dostatecznie dużej liczbyn
punktów będzieono zbliżone do funkcji rozkładu normalnego Gaussa
2 2 2 ) ' (
)
(
al al l lAe
a
P
=
− − σ ,a wartość
χ
2 można alternatywnie przedstawić jako(
)
[
]
+
∑
(
)
−
=
σ
π
χ
22
ln
1,...,
2
ln
2
i ma
a
P
Po podstawieniu otrzymujemy równanie
(
)
C
a
a
l l l−
+
=
2 2 2'
σ
χ
przedstawiające zależność
χ
2 w pobliżu minimum od zmian wartości parametrua
l. Wynika z niego, że w pobliżu minimum funkcjaχ
2zachowuje się jak funkcja kwadratowa (zgodnie z tym co niezależnie wynika z rozwinięcia w szereg potęgowy) oraz, co ważne z praktycznego punktu widzenia, zmiana wartości parametru
a
l ol
a
σ
±
w stosunku dooptymalnej
a'
l powoduje wzrostχ
2 o1
.Przez porównanie możemy jeszcze zapisać
2 2 2 2
1
2
1
l la
σ
χ
=
∂
∂
otrzymując związek między wariancją parametru
a
l a krzywizną funkcji2
χ
w minimum: 1 2 2 2 22
−
∂
∂
=
l la
χ
σ
.Uzasadnienie na przykładzie wyznaczania wartości średniej.
(
)
∏
∑
= = − − ⋅ = n i n i i i a y y a P 1 1 2 2 2 1 exp 2 1 }) , { ; ( σ π σ σ Zauważmy, że(
) (
2) (
2)
2(
)
2'
2
'
'
i i i ia
a
a
a
a
a
a
y
−
=
+
ε
−
=
−
+
−
ε
+
ε
gdzie
a
'
jest optymalną wartością dopasowywanego parametru (czyli średnią) aε
i ma rozkładN
(
0
,
σ
)
. Wtedy(
)
[
(
)
(
)
]
(
)
(
)
∑
∑
∑
∑
+
−
+
−
=
+
−
+
−
=
−
= = 2 2 2 2 2 1 2 2 2 1 2 21
'
2
'
'
2
'
1
i i n i i i n i ia
a
a
a
n
a
a
a
a
a
y
ε
σ
ε
σ
σ
ε
ε
σ
σ
Dla dużych wartości
n
zachodzi2 2
,
0
ε
σ
ε
i≅
∑
i≅
n
∑
oraz dodatkowon
a
σ
σ
(
'
)
=
Możemy zatem zapisać(
)
∏
= − − ⋅ − ⋅ ≅ n i a i a a n y a P 1 2' 2 2 ' exp 2 1 exp 2 1 }) , { ; ( σ π σ σ czyli rzeczywiście(
)
− − ⋅ = 2 ' 2 2 ' exp ) ( a a a A a P σMetody minimalizacji polegają na przeszukiwaniu przestrzeni parametrów
{
a
1,
a
2,
a
3}
i znalezieniu w niej punktu, w którym (zdostateczną dokładnością) wartość funkcji
χ
2 osiąga globalneminimum, albo na przybliżonym rozwiązaniu układu równań nieliniowych. Metoda siatki (niezależnych kierunków) jest bardzo prostą metodą,
przydatną w sytuacji, gdy zależność
χ
2 od każdego z parametrówa
jsłabo zależy od wartości pozostałych parametrów. Funkcję
χ
2 minimalizujemy po kolei względem każdego parametru oddzielnie,powtarzając operacje do osiągnięcia zaniedbywalnie małych zmian
χ
2. 1. Wybieramy początkowe wartości{ }
a
j 0, to znaczy punktpoczątkowy w przestrzeni parametrów i wartości kroku dla każdego parametru
∆
a
j oraz obliczamyχ
02 w punkciepoczątkowym.
2. Powiększmy parametr
a
1 o±
∆
a
1 i obliczamyχ
12 (znak dobranytak, żeby zmniejszyć
χ
2).3. Powtarzamy krok 2. do momentu, kiedy
χ
2 przestaje się zmniejszać. Wzrostχ
2 oznacza przekroczenie „dna doliny” i wspięcie się po drugiej jej stronie.4. Do ostatnich trzech położeń (i odpowiadających im wartościom
2
χ
) obejmujących minimum w kierunku „marszu” dopasowujemy parabolę. Minimum dopasowanej paraboli przyjmujemy jako punkt początkowy dla minimalizacji względem kolejnego parametru. 5. Powtarzamy kroki 2., 3. i 4. minimalizującχ
2 po kolei dla każdegoparametru.
6. Całą procedurę powtarzamy, aż do zlokalizowania minimum z pożądaną dokładnością.
Metoda największego spadku (gradientu) wykorzystuje fakt, że wektor gradientu funkcji
χ
2∑
=
∂
∂
=
∇
m j j je
a
1 2 2!
!
χ
χ
wskazuje kierunek największego wzrostu. Kierunek przeciwny do zwrotu wektora gradientu jest kierunkiem największego spadku. Zatem zmiana początkowych wartości parametrów
)
(
2 1 n n na
const
a
a
+=
−
⋅
∇
!
χ
gwarantuje zmniejszenie wartości
χ
2. Problemem jest odpowiednie dobranie wielkości mnożnika oraz fakt, że blisko minimum gradient ma bardzo małe wartości i staje się praktycznie bezużyteczny (w minimum gradient znika).Metoda rozwinięcia funkcji
χ
2 polega na zastąpieniu dokładnej postaci tej funkcji (i odpowiadającej jej hiperpowierzchni wm
-wymiarowejprzestrzeni parametrów) jej rozwinięciem w szereg z wyrazami do drugiego stopnia włącznie (czyli paraboloidalną powierzchnią drugiego stopnia).
∑∑
∑
= = =
∂
∂
∂
+
∂
∂
+
≅
m k m j k j k j m j j ja
a
a
a
a
a
1 1 2 0 2 1 2 0 2 0 22
1
χ
δ
δ
δ
χ
χ
χ
Wartości
χ
2 i jej pochodnych po prawej stronie są obliczone w punkcie początkowyma
0, przyrostyδ
a
j są zdefiniowane jako:0 j j j
a
a
a
=
−
δ
Wartość
χ
2 po lewej stronie jest funkcjąm
przyrostów parametrówδ
a
j.Minimum tej przybliżonej funkcji
χ
2 (powierzchni paraboloidalnej) wyznaczają warunki0
)
(
1 2 0 2 2 0 2 0=
∂
∂
∂
+
∂
∂
=
∂
∂
∑
= m j j k j k ka
a
a
a
a
δ
χ
χ
δ
χ
,k
=
1
,...,
m
,Jeżeli oznaczymy k k
a
∂
∂
−
=
022
1
χ
β
i k j kj jka
a
∂
∂
∂
=
=
02 22
1
χ
α
α
,to układ równań możemy zapisać w postaci układu macierzowego.
α
δa
β
=
Przykład.
W pracowni fizycznej wyznacza się stałe zaniku izotopów
promieniotwórczych srebra aktywowanego strumieniem neutronów
zliczając impulsy licznika G-M rejestrującego promieniowanie emitowane z płytki srebrnej. Na podstawie prawa zaniku promieniotwórczego
przewidujemy, że liczba zliczeń w kolejnych jednakowych odstępach czasu będzie się zmieniała jak funkcja:
x a x a
e
a
e
a
a
x
y
=
+
⋅
− 3⋅+
⋅
− 5⋅ 4 2 1)
(
gdzie
y
(x
)
jest oczekiwaną liczbą impulsów zarejestrowanychw kolejnym odstępie czasu, po czasie
x
od momentu rozpoczęciapomiarów.
a
1 - ma sens biegu własnego licznika (tła),a
2,a
4 -początkowej liczby zliczeń od każdego izotopu,
a
3,a
5 - szukane stałezaniku. Ze względu na fakt, że funkcja
y
(x
)
zależy nieliniowo odparametrów
a
3 ia
5, dopasowanie tej funkcji do danych doświadczalnychjest zagadnieniem nieliniowym.
Dla uproszczenia rachunków uwzględnimy tylko jeden izotop. Funkcja
χ
2 ma następującą postać(
)
∑
= ⋅ −
−
−
⋅
=
n i i x a i ie
a
a
y
a
a
a
1 2 2 1 3 2 1 2,
,
3σ
χ
.Warunek jaki muszą spełniać wartości parametrów w minimum da się zapisać jako układ trzech równań:
=
−
⋅
⋅
⋅
⋅
+
⋅
⋅
⋅
⋅
+
⋅
⋅
⋅
⋅
−
=
⋅
⋅
−
⋅
⋅
−
⋅
⋅
⋅
−
=
⋅
−
⋅
−
⋅
⋅
⋅
−
∑
∑
∑
∑
∑
∑
∑
∑
∑
= ⋅ ⋅ − = ⋅ − = ⋅ − = ⋅ ⋅ − = ⋅ − = ⋅ − = ⋅ − = =0
2
0
2
0
2
1 2 2 2 1 1 2 1 2 1 2 2 1 1 1 1 2 1 1 1 3 3 3 3 3 3 3 n i x a i i n i x a i i n i x a i i i n i x a i n i x a i n i x a i i n i x a i n i i n i i i i i i i i i ie
x
w
a
e
x
w
a
a
e
y
x
w
a
e
w
a
e
w
a
e
y
w
e
w
a
w
a
y
w
Po uproszczeniach i przy założeniu, że
a
2≠
0
otrzymujemy
=
⋅
⋅
⋅
−
⋅
⋅
+
⋅
⋅
=
⋅
⋅
−
⋅
+
⋅
=
⋅
−
⋅
+
∑
∑
∑
∑
∑
∑
∑
∑
∑
= ⋅ − = ⋅ ⋅ − = ⋅ − = ⋅ − = ⋅ ⋅ − = ⋅ − = = ⋅ − =0
0
0
1 1 2 2 1 1 1 1 2 2 1 1 1 1 2 1 1 3 3 3 3 3 3 3 n i x a i i i n i x a i i n i x a i i n i x a i i n i x a i n i x a i n i i i n i x a i n i i i i i i i i ie
y
x
w
e
x
w
a
e
x
w
a
e
y
w
e
w
a
e
w
a
y
w
e
w
a
w
a
Dane liczbowe do przykładu w wykładzie 10.
xi - czas, s yi - liczba impulsów σ(yi) - niepewność
15 775 27,84 30 479 21,89 45 380 19,49 60 302 17,38 75 185 13,60 90 157 12,53 105 137 11,70 120 119 10,91 135 110 10,49 150 89 9,43 165 74 8,60 180 61 7,81 195 66 8,12 210 68 8,25 225 48 6,93 240 54 7,35 255 51 7,14 270 46 6,78 285 55 7,42 300 29 5,39 315 28 5,29 330 37 6,08 345 49 7,00 360 26 5,10 375 35 5,92 390 29 5,39 405 31 5,57 420 24 4,90 435 25 5,00 450 35 5,92 465 24 4,90 480 30 5,48 495 26 5,10 510 28 5,29 525 21 4,58 540 18 4,24 555 20 4,47 570 27 5,20 585 17 4,12 600 17 4,12 615 14 3,74 630 17 4,12 645 24 4,90 660 11 3,32
675 22 4,69 690 17 4,12 705 12 3,46 720 10 3,16 735 13 3,61 750 16 4,00 765 9 3,00 780 9 3,00 795 14 3,74 810 21 4,58 825 17 4,12 840 13 3,61 855 12 3,46 870 18 4,24 885 10 3,16
0 150 300 450 600 750 900 Czas (s) 1 10 100 1000 Li cz ba im pu ls ów ( na 15 s)
Liczba impulsów rejestrowanych w czasie obserwacji rozpadu aktywowanego srebra
0.0 150.0 300.0 450.0 600.0 750.0 900.0 Czas (s) 1 10 100 1000 Li cz ba im pu ls ów ( na 15 s )
Dopasowanie dwóch eksponent i tła do wyników pomiarów aktywności
0.0 150.0 300.0 450.0 600.0 750.0 900.0 Czas (s) -40.0 -30.0 -20.0 -10.0 0.0 10.0 20.0 30.0 40.0 Reszty d op asowan ia
0.0 150.0 300.0 450.0 600.0 750.0 900.0 Czas (s) -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 Uno rmo wa ne re szty do pas owa ni a