Dopasowanie funkcji liniowej i wielomianu Dopasowanie funkcji liniowej
Zmienna
Y
jest liniową funkcjąX
X
A
A
Y
=
0+
1⋅
Wyniki pomiarów
Y
mają rozkład normalny o dyspersjiσ
Y, która wogólnym przypadku również zależy od
X
. WartościX
nie są obarczonebłędami lub, w najgorszym wypadku, można je pominąć w porównaniu z błędami pomiaru wielkości
Y
. W wyniku wykonanych pomiarówdysponujemy zestawem wartości
}
,
,
{
i y i iy
x
σ
gdziei
=
1
,...,
n
, a i yσ
są dyspersjami wartości mierzonychy
i.Do znalezienia estymatorów
a
0 ia
1 parametrówA
0 iA
1 możemywykorzystać Metodę Największej Wiarogodności. Odpowiednie prawdopodobieństwo będzie teraz wynosiło
(
)
∏
=
−
−
−
=
n i y i i y y i i i i ix
a
a
y
y
x
a
a
P
1 2 2 1 0 1 02
exp
2
1
})
,
,
{
;
,
(
σ
σ
π
σ
Maksymalizacja tego prawdopodobieństwa odpowiada minimalizacji funkcji
∑
=
−
−
=
n i y i i y i i i ix
a
a
y
y
x
a
a
1 2 1 0 1 0 2(
,
;
{
,
,
})
σ
σ
χ
ze względu na wartościa
0 ia
1.Szukamy zatem rozwiązania układu równań
(
)
0
1
2
1 1 0 2 0 2=
−
−
−
=
∂
∂
∑
= n i i i yx
a
a
y
a
σ
iχ
(
)
0
2
1 1 0 2 1 2=
−
−
−
=
∂
∂
∑
= n i i i y ix
a
a
y
x
a
σ
iχ
Można je przekształcić w układ równań liniowych dla szukanych estymatorów
a
0 ia
1
=
+
∑
∑
∑
= = = n i y i n i y i n i yi i iy
x
a
a
1 2 1 2 1 1 2 01
σ
σ
σ
=
+
∑
∑
∑
= = = n i y i i n i y i n i y i i i iy
x
x
a
x
a
1 2 1 2 2 1 1 2 0σ
σ
σ
Wprowadzamy następujące oznaczenia
2
1
i y iw
=
σ
∑
=
i ww
S
∑
=
i i xw
x
S
∑
=
i i yw
y
S
∑
=
2 ix
w
S
xx i∑
=
i i i xyw
x
y
S
i przy ich pomocy zapiszemy rozwiązanie układu
2 0 x xx w xy x y xx
S
S
S
S
S
S
S
a
−
−
=
2 1 x xx w y x xy wS
S
S
S
S
S
S
a
−
−
=
Wariancje estymatorów 2 0 aσ
i 2 1 aσ
można ustalić podobnie jak poprzednio, korzystając z reguły propagacji wariancji∑
=
∂
∂
=
n i y i a iy
a
1 2 2 0 2 0σ
σ
∑
=
∂
∂
=
n i y i a iy
a
1 2 2 1 2 1σ
σ
W tym celu należy znaleźć pochodne cząstkowe
a
0 ia
1 względem wszystkichy
i. 2 0 x xx w x i i xx i iS
S
S
S
x
w
S
w
y
a
−
−
=
∂
∂
2 1 x xx w x i w i i iS
S
S
S
w
S
x
w
y
a
−
−
=
∂
∂
Po podstawieniu i wykonaniu przekształceń otrzymujemy
=
∂
∂
=
∑
= n i y i a iy
a
1 2 2 0 2 0σ
σ
=
−
−
∑
= n i w xx x i x i i xx iw
S
S
S
S
x
w
S
w
1 2 21
(
)
=
−
+
−
∑
= n i i x i i xx x i i xx i x xx ww
S
x
w
S
S
x
w
S
w
S
S
S
1 2 2 2 2 2 2 2 22
1
(
)
(
−
)
=
+
−
∑
= 2 2 1 2 2 22
x xx w n i x i i xx x i i xx iS
S
S
S
x
w
S
S
x
w
S
w
(
)
(
) (
)
(
−
)
=
+
−
∑
∑
∑
= = = 2 2 1 2 2 1 1 22
x xx w n i x i i n i xx x i i n i xx iS
S
S
S
x
w
S
S
x
w
S
w
(
−
)
=
+
−
2 2 2 2 22
x xx w x xx xx x xx wS
S
S
S
S
S
S
S
S
(
)
(
2)
2(
2)
2 22
x xx w xx x xx w x x xx w xxS
S
S
S
S
S
S
S
S
S
S
S
−
=
−
+
−
=
∂
∂
=
∑
= n i y i a iy
a
1 2 2 1 2 1σ
σ
=
−
−
∑
= n i w xx x i x i w i iw
S
S
S
S
w
S
x
w
1 2 21
(
)
=
−
+
−
∑
= n i i x i x w i i w i i x xx ww
S
w
S
S
x
w
S
x
w
S
S
S
1 2 2 2 2 2 2 2 22
1
(
)
(
−
)
=
+
−
∑
= 2 2 1 2 2 22
x xx w n i x i x w i i w i iS
S
S
S
w
S
S
x
w
S
x
w
(
)
(
) ( )
(
−
)
=
+
−
∑
∑
∑
= = = 2 2 1 2 1 1 2 22
x xx w n i x i n i x w i i n i w i iS
S
S
S
w
S
S
x
w
S
x
w
(
−
)
=
+
−
2 2 2 2 22
x xx w x w x w xx wS
S
S
S
S
S
S
S
S
(
)
(
2)
2(
2)
2 22
x xx w w x xx w x x xx w wS
S
S
S
S
S
S
S
S
S
S
S
−
=
−
+
−
Czyli wariancje estymatorów
a
0 ia
1 wynoszą2 2 0 x xx w xx a
S
S
S
S
−
=
σ
2 2 1 x xx w w aS
S
S
S
−
=
σ
Jeżeli parametry zależności
Y
odX
są wielkościami, które mamywyznaczyć na podstawie wyników pomiarów
{
x
i,
y
i,
σ
yi}
, to możemyzapisać: 2 0 x xx w xy x y xx
S
S
S
S
S
S
S
a
−
−
=
,(
0)
2 x xx w xxS
S
S
S
a
u
−
=
2 1 x xx w y x xy wS
S
S
S
S
S
S
a
−
−
=
,(
1)
2 x xx w wS
S
S
S
a
u
−
=
Przykład. Rozkład Poisson'a - dopasowanie linii prostej
W pomiarach zależności intensywności promieniowania od odległości
r
od źródła rejestrowane szybkości zliczeń, o rozkładzie Poisson'a, zależą liniowo od odwrotności kwadratu odległości. Rejestracja przebiega w stałych odcinkach czasu i liczba zliczonych impulsów
y
i ma rozkładPoisson'a o średniej
ax
i+
b
, gdziex
i=
1
r
i2 . Wynika z tego, żedyspersja
i
-tego pomiaru wynosi yax
ib
i
=
+
σ
, a wagab
ax
w
i i+
=
1
. Informację o zależności błędu (wagi) pomiaru od zmiennej niezależnej można wykorzystać na dwa sposoby. Można te wagi wstawić dopoprzednio ustalonego wyrażenia na
χ
2, otrzymanego dla rozkładunormalnego (zakładając, że liczby zliczeń są na tyle duże, że rozkład Poisson’a jest bliski normalnemu),
(
)
∑
=+
−
−
=
n i i i ib
ax
b
ax
y
b
a
1 2 2(
,
)
χ
dostając po zróżniczkowaniu układ dwóch równań
(
)
0
1 2 2 1 2=
+
−
=
∂
∂
∑
∑
= = n i i i i n i ib
ax
y
x
x
a
χ
(
)
0
1 2 2 2=
+
−
=
∂
∂
∑
= n i i ib
ax
y
n
b
χ
które są nieliniowe ze względu na parametry
a
ib, i rozwiązać je
Drugi sposób polega na zastąpieniu rozkładu normalnego rozkładem Poisson'a o wartości średniej
µ
i=
y
(
x
i)
=
a
⋅
x
i+
b
i ponownymskonstruowaniu funkcji rozkładu gęstości prawdopodobieństwa
})
,
{
;
,
(
a
b
x
iy
ip
otrzymania zestawu wyników{
x
i,
y
i}
pod warunkiem,że parametry określające wartość średnią
µ
mają wartościa
ib
∏
= −
=
n i x y i y i i ie
y
x
y
b
a
p
1 ) (!
)]
(
[
)
,
(
i bezpośrednim zastosowaniu MNW. Zamiast maksymalizować prawdopodobieństwo można równie dobrze maksymalizować jego logarytm, co znacznie upraszcza wzory
=
−
−
=
∑
∑
∑
= = = n i i n i n i i i iy
x
y
x
y
y
b
a
p
1 1 1!
)
(
)]
(
ln
[
)
,
(
ln
.
)
(
)]
(
ln
[
1 1
const
x
y
x
y
y
n i n i i i i−
+
∑
∑
= = Po zróżniczkowaniu względema
otrzymujemy∑
∑
= =
∂
∂
−
∂
∂
=
∂
∂
n i n i i i i ia
x
y
a
x
y
x
y
y
a
p
p
1 1)
(
)
(
)
(
1
1
.Warunkiem zerowania się pochodnej
a
p
∂
∂
jest zerowanie się prawejstrony. Biorąc pod uwagę, że i i
x
a
x
y
=
∂
∂
(
)
otrzymujemy pierwsze z układu równań0
1 1=
+
−
∑
∑
= = n i i i i n i ib
ax
y
x
x
Różniczkowanie logarytmu
ln
p
(
a
,
b
)
względemb
daje:∑
∑
= =
∂
∂
−
∂
∂
=
∂
∂
n i n i i i i ib
x
y
b
x
y
x
y
y
b
p
p
1 1)
(
)
(
)
(
1
1
a uwzględniając, że(
)
=
1
∂
∂
b
x
y
i otrzymujemy drugie równanie0
1=
+
−
∑
= n i i ib
ax
y
n
Ostatecznie układ równań przyjmuje w tym przypadku postać
0
1 1=
+
−
∑
∑
= = n i i i i n i ib
ax
y
x
x
0
1=
+
−
∑
= n i i ib
ax
y
n
bardzo podobną do poprzedniego układu.
Różnicy między tymi dwoma sposobami można się spodziewać dla mniejszych liczb zliczonych impulsów, kiedy różnice między
y
i ab
x
a
⋅
i+
stają się relatywnie większe. Wykorzystanie funkcjiχ
2,uwarunkowane normalnym rozkładem gęstości prawdopodobieństwa, wymaga większych liczb impulsów lub grupowania pomiarów. Uniknięcie problemów związanych z grupowaniem wyników i tym samym
zmniejszeniem liczby punktów pomiarowych oraz ustalaniem właściwych wag jest możliwe przez bezpośrednie wykorzystanie Metody Największej Wiarogodności, jak w powyższym przykładzie.
Dopasowanie wielomianu
Jeżeli linia prosta nie daje się dobrze dopasować do danych
pomiarowych to można spróbować dopasować bardziej złożoną funkcję, to jest wielomian stopnia
m
∑
==
m k k kx
a
x
y
0)
(
lub w bardziej ogólnej formie
∑
==
m k k kf
x
a
x
y
0)
(
)
(
gdzie
f
k(x
)
są dowolnymi funkcjami nie zawierającymi parametrówa
k.Jeżeli wyniki pomiarów
y
i mają rozkład normalny o dyspersji i yσ
, to maksymalizacja funkcji gęstości prawdopodobieństwa∏
∑
∑
= = =
−
−
⋅
=
n i n i m k i k k i y y y i i mx
y
y
a
f
x
a
a
P
i i i 1 1 2 0 2 0(
)
1
2
1
exp
2
1
})
,
,
{
;
,...,
(
σ
σ
π
σ
sprowadza się do minimalizacji funkcji
∑
∑
= =
−
=
n i m k i k k i y y i i mx
y
y
a
f
x
a
a
i i 1 2 0 2 0 2(
,...,
;
{
,
,
})
1
(
)
σ
σ
χ
względem parametrówa
k.Różniczkowanie
χ
2 względem parametrul
a
daje=
−
−
=
∂
∂
∑
∑
= = n i i l m k i k k i y lx
f
x
f
a
y
a
i 1 2 0 2)
(
)
(
1
2
σ
χ
[
]
=
+
−
∑
∑
∑
= = = n i m k i k i l k y n i y i l ia
f
x
f
x
x
f
y
i i 1 0 2 1 2)
(
)
(
1
2
)
(
2
σ
σ
∑ ∑
∑
= = =
+
−
m k n i y i k i l k n i y i l i i ix
f
x
f
a
x
f
y
0 1 2 1 2)
(
)
(
2
)
(
2
σ
σ
W rezultacie otrzymujemy układ
m + 1
równań liniowych (dla wskaźnikal
przebiegającego wartości od0
dom
).∑ ∑
∑
= = =
=
m k n i y i k i l k n i y i l i i ix
f
x
f
a
x
f
y
0 1 2 1 2)
(
)
(
)
(
σ
σ
Układ równań można zastąpić równoważnym mu równaniem macierzowym
α
a
β
=
gdzie
a
iβ
są macierzami jednowymiarowymi om + 1
elementach(wektorami), a
α
jest kwadratową i symetryczną macierzą(m + 1)×(m + 1)
. Elementami macierzya
są szukane parametry dopasowaniaa
k, a elementy macierzyβ
iα
wynoszą odpowiednio∑
=
=
n i y i k i k ix
f
y
1 2)
(
σ
β
∑
=
=
=
n i y i k i l kl lk ix
f
x
f
1 2)
(
)
(
σ
α
α
Jeżeli macierz
α
jest nieosobliwa (ma wyznacznik różny od zera), to możemy obie strony równania macierzowego pomnożyć prawostronnie przez macierzε
odwrotną do macierzyα
(ε
=
α
−1,α
α
−1=
1
).Otrzymujemy wtedy
a
α
α
a
ε
α
a
ε
β
=
=
−1=
co daje 1 −=
=
β
ε
β
α
a
Rozwiązanie w formie macierzowej można przedstawić inaczej w formie skalarnej
∑
==
m k kl k la
0ε
β
Macierz
α
nazywana jest macierzą krzywizny funkcjiχ
2 w przestrzenipochodnymi funkcji
χ
2. k l n i y i k i l lka
a
x
f
x
f
i∂
∂
∂
=
=
∑
= 2 2 1 22
1
)
(
)
(
χ
σ
α
Macierz
ε
jest nazywana macierzą (wariancji-)kowariancji. Macierzε
jest również symetryczna. Jej elementy diagonalne są równe wariancjom estymatorówa ...
0a
m, a pozostałe kowariancjom między odpowiednimiparami estymatorów. jj aj
ε
σ
2=
jl a aj lε
σ
=
Jeżeli w szczególności dopasowywane funkcje
f
k(x
)
tworzą układortogonalny, to w macierzach
α
iε
znikają elementy poza główną przekątną. Oznacza to brak korelacji między parametrami i ułatwiarozszerzanie modelu opisanego równaniem
y
(
x
)
=
∑
a
kf
k(
x
)
o kolejneskładniki.
Uwaga o linearyzacji modelu zależności między wielkościami mierzonymi Przedstawione powyżej techniki dopasowania funkcji do wyników
pomiarów były ograniczone tylko do funkcji, które są liniowe względem szukanych parametrów. W przypadku kiedy funkcja nie jest liniowa względem swoich parametrów stosuje się często przekształcenie zmiennych w taki sposób, żeby funkcja opisująca zależność
przekształconych zmiennych była już liniowa względem parametrów. Jeżeli jednak przekształcana jest zmienna zależna (przekształceniem nieliniowym), to zniekształceniu ulegają różnice między pomiarami i modelem i rozwiązanie problemu dla modelu zlinearyzowanego nie odpowiada minimum
χ
2 dla modelu oryginalnego.Przykłady rachunkowe
Pomiary spadku napięcia wzdłuż drutu oporowego z prądem
b ax U = + Nr pomiaru położenie cm różnica potencjału V niepewność pomiaru napięcia V xi2 xiUi dopasowane napięcie axi + b kwadraty różnic 1 10,0 0,37 0,05 100 3,70 0,33 0,001328 2 20,0 0,58 0,05 400 11,60 0,60 0,000247 3 30,0 0,83 0,05 900 24,90 0,86 0,000778 4 40,0 1,15 0,05 1600 46,00 1,12 0,000897 5 50,0 1,36 0,05 2500 68,00 1,38 0,000494 6 60,0 1,62 0,05 3600 97,20 1,64 0,000595 7 70,0 1,90 0,05 4900 133,00 1,91 0,000043 8 80,0 2,18 0,05 6400 174,40 2,17 0,000127 9 90,0 2,45 0,05 8100 220,50 2,43 0,000365 N = 9 Sx = 450,0 SU = 12,44 Sxx = 28500 SxU = 779,30 Σ=0,004874
( )
2 2∑
∑
− = ∆ N xi xi = 54000(
−)
∆ =∑
2∑
∑
∑
/ i i i i i U x xU x b = 7,14·10-2 σU2∑
xi2 /∆= 1,319·10 -3 u(b)= 3,63·10-2 V(
−)
∆ = N∑
xiUi∑
xi∑
Ui / a = 262·10-4 NσU2 /∆= 4,167·10-7 u(a)= 6,45·10-4 V/cm 0,00 0,50 1,00 1,50 2,00 2,50 3,00 0,0 20,0 40,0 60,0 80,0 100,0 po³o¿e nie , cm ró¿nica potencja³u, VLiczby zliczeń impulsów licznika GM w jednakowych odcinkach czasu w funkcji odległości źródła cząstek od licznika b d a N = 12 + Nr pomiaru i odległość d (cm) x = 1/d 2 zliczenia N u(N) wi wixi wixi 2 wiNi wixiNi dopasowana liczba zliczeń axi + b kwadrat różnicy 1 20 25,00 901 30,0 0,00111 0,0277 0,6937 1,0 25,00 886,94 0,22 2 25 16,00 652 25,5 0,00153 0,0245 0,3926 1,0 16,00 610,66 2,62 3 30 11,11 443 21,0 0,00226 0,0251 0,2787 1,0 11,11 460,58 0,70 4 35 8,16 339 18,4 0,00295 0,0241 0,1966 1,0 8,16 370,09 2,85 5 40 6,25 283 16,8 0,00353 0,0221 0,1380 1,0 6,25 311,36 2,84 6 45 4,94 281 16,8 0,00356 0,0176 0,0868 1,0 4,94 271,09 0,35 7 50 4,00 240 15,5 0,00417 0,0167 0,0667 1,0 4,00 242,29 0,02 8 60 2,78 220 14,8 0,00455 0,0126 0,0351 1,0 2,78 204,77 1,05 9 75 1,78 180 13,4 0,00556 0,0099 0,0176 1,0 1,78 174,07 0,20 10 100 1,00 154 12,4 0,00649 0,0065 0,0065 1,0 1,00 150,19 0,09 n=10 Sumy Sw=0,03570 Sx=0,1868 Sxx=1,9122 Sy=10,0 Sxy=81,02 Ss=10,95 = − = ∆ ( )2 x xx wS S S 0,03339 = − =SySxx SxSxy b 119,50 u(b)= Sxx/∆ = 7,57 = − =SwSxy SxSy a 30,70 u(a)= Sw/∆ = 1,03
0 100 200 300 400 500 600 700 800 900 1000 0 20 40 60 80 100 120 o d le g ³o œæ, cm liczba zlicze ñ 0 100 200 300 400 500 600 700 800 900 1000 0,0 5,0 10,0 15,0 20,0 25,0 30,0
kwadrat odwrotnoœci odle g³oœci, 1/cm^2
liczba zlicze