• Nie Znaleziono Wyników

Interpolacja powierzchni odpowiedzi metodą Kriging

3. Metody i algorytmy projektowania w montażu elektronicznym

3.3. Zaawansowane algorytmy kompaktowe

3.3.2. Algorytm parametryczno-sekwencyjny

3.3.2.2. Interpolacja powierzchni odpowiedzi metodą Kriging

W wielu dziedzinach inżynierii najczęściej spotyka się powierzchnie odpowiedzi o charakterze nieliniowym. Dotyczy to zwłaszcza dziedziny montażu elektronicznego. Wynika to z istnienia zjawisk oraz materiałów o właściwościach nieliniowych. Jako model powierzchni odpowiedzi stosuje metody stochastyczne. Przykładem jest metoda Kriging, która należy do metod interpolacyjnych, w związku z czym można ją stosować w przypadku braku czynników szumu.

W przypadku metod stochastycznych przyjmuje się założenie, że uzyskana w wy-niku przeprowadzonego eksperymentu powierzchnia odpowiedzi ma charakter deter-ministyczny y(X), a jednocześnie może być opisana jako realizacja procesu stocha-stycznego. Stochastyczny charakter procesu dotyczy czynnika błędu. Przykładem takiego procesu mogą być obliczenia numeryczne. W takim przypadku model po-wierzchni odpowiedzi można potraktować jako kombinację modelu matematycznego, np. wielomianu oraz dodatkowego czynnika określanego czynnikiem błędu ε(x):

y x=

i=1 k

i fixx . (3.75)

Błąd ε(x) jest odchyleniem wyników eksperymentu od założonego modelu mate-matycznego, co przedstawiono na rysunku 3.32 [219, 220]. Błąd ten można potrak-tować jako wynik realizacji procesu stochastycznego o wartości średniej ε równej 0 i kowariancji V między dwoma punktami przestrzeni u i v:

V u, v=2R u ,v , (3.76) gdzie σ2 – wariancja procesu, R(u,v) – korelacja.

Funkcja kowariancji odpowiada za gładkość dopasowania powierzchni odpowiedzi. W przypadku gładkich powierzchni odpowiedzi funkcja kowariancji ma pochodne, w przeciwieństwie do powierzchni nieregularnych.

Rys. 3.32. Metoda dopasowanie powierzchni odpowiedzi w przypadku metod stochastycznych

Procedura dopasowania modelu powierzchni odpowiedzi składa się z dwóch eta-pów:

wyznaczenia funkcji głównej np. metodą regresji,

interpolacji odchyleń w punktach eksperymentu, tak jakby nie została wcześniej przeprowadzona procedura regresji.

Metoda Kriging jest stosunkowo trudna w implementacji. Wymaga ona precyzyjne-go oszacowania parametrów modelu. Z kolei zaletą tej metody jest możliwość oszaco-wania modelu powierzchni błędu odpowiedzi. Powierzchnia błędu pozwala na za-stosowanie procedury sekwencyjnej, tzn. oszacowanie położenia kolejnego punktu w przestrzeni czynnikowej, który zapewnia najlepszą poprawę modelu powierzchni od-powiedzi.

Metoda Kriging zapewnia stosunkowo dużą elastyczność ze względu na dobór od-powiedniej funkcji korelacji R(u,v). Dodatkowo w niektórych przypadkach – w zależ-ności od funkcji korelacji – można uzyskać model powierzchni odpowiedzi na zasadzie aproksymacji. W przypadku eksperymentów numerycznych, które z natury są deter-ministyczne, najczęściej stosuje się jednak metodę interpolacji.

Jeżeli macierz x oznacza punkty wybranego planu eksperymentu dla k czynników oraz n punktów, natomiast macierz y wyniki eksperymentu, to można zapisać, że:

yi=f

x1i , x2i , , xki

; i=1, , n , (3.77) gdzie

x =

x11 x21xk1 x12 . . . ⋮ . . . x1n . . xkn

, y=

y1 y2yn

. (3.78)

Zgodnie z zależnością 3.75 można dopasować model powierzchni odpowiedzi do wyników doświadczeń według następującej zależności:

yi=

h=1 k

hfh

xi

i, i=1,, n , (3.79) gdzie fh(xi) może być liniową lub nieliniową funkcją położenia xi, βh – nieznany współ-czynnik proporcjonalności założonej funkcji, εi – czynnik błędu odchylenia założonej funkcji od wyników eksperymentu – błąd ten ma rozkład normalny N(0, δ2).

Dodatkowo można przyjąć założenie, że czynniki błędu εi można zapisać jako funk-cję ciągłą położenia xi:

i=i

xi

. (3.80)

W takim przypadku czynniki błędu będą wzajemnie skorelowane oraz zależne od wartości odpowiedzi i odległości między punktami w przestrzeni projektowej. Jeżeli punkty te znajdują się blisko siebie, wówczas błędy powinny być podobne, co oznacza dużą wartość korelacji. Z tego też powodu przyjmuje się założenie, że korelacja błę-dów jest funkcją odległości między punktami. Za funkcję odległości można przyjąć zwykłą odległość euklidesową lub częściej następującą funkcję o współczynnikach wa-gowych Θ i p:

d

xi, xj

=

h=1 k

h

xhixhj

ph, (3.81) gdzie współczynnik Θ jest większy od 0, natomiast współczynnika ph zawiera się w przedziale [1, 2].

Korzystając z przyjętej funkcji odległości opisanej zależnością (3.81), korelację między błędami można wyznaczyć z zależności:

corr

[

xi

, 

xj

]

= 1

edxi, xj . (3.82) Funkcja korelacji ma następujące właściwości:

jeżeli odległość między punktami jest mała, to wartość funkcji korelacji jest duża,

jeżeli odległość między punktami jest duża, to wartość funkcji korelacji zbliża się do 0.

Wartości funkcji korelacji tworzą, tzw. macierz korelacji R o wymiarach n×n, która ma kluczowe znaczenie dla modelu powierzchni odpowiedzi:

R=

r1,1r1, n

⋮ . .

rn,1 . rn , n

, (3.83)

gdzie współczynniki ri,j są wektorami postaci:

ri , j=corr

[

xi

, 

xj

]

. (3.84)

Funkcja korelacji oraz macierzy korelacji R pozwala na wyznaczenie prostego li-niowego modelu powierzchni odpowiedzi, np. metodą regresji lub rachunku wariacyj-nego. Wyznaczony model powierzchni odpowiedzi ma kilka ważnych zalet, z których najważniejsza to możliwość zastąpienia czynników regresji współczynnikami o stałej wartości μ:

=

h=1 k

hfh

xi

, i=1,, n . (3.85) Pozwala to, m.in. na przepisanie zależności (3.79) w postaci:

y

xi

=

xi

, 

xi

N

0,2

. (3.86) Metoda Kriging jest stosowana do interpolacji wyników eksperymentu. Niestety jej główną wadą jest implementacja praktyczna, która wynika z następujących proble-mów:

konieczność estymacji współczynników funkcji odległości opisanej zależnością (3.81); w praktyce dla przypadku jednowymiarowego należy oszacować 2k+2 współczynników, to znaczy: μ, δ2, θ1 ... θk, p1 ... pk,

poprawna definicji funkcji odległości oraz estymacja jej współczynników w przy-padku wielowymiarowym.

Estymację współczynników funkcji odległości można otrzymać metodą największej wiarygodności przez maksymalizację funkcji F opisanej zależnością:

F = 1 2n/ 22n/ 2

R

1/ 2 1 e y−1 ' R1y−1 22 , (3.87)

gdzie 1 – n-wymiarowy wektor jednostkowy, y – n-wymiarowy wektor zaobserwowa-nych odpowiedzi:

Estymatory współczynników μ oraz δ2, które maksymalizują funkcję F opisaną za-leżnością (3.87), można zapisać w postaci:

=1' R−1y 1 ' R−11  2=y−1 ' R−1y−1  n . (3.89)

Z kolei najlepszym nieobciążonym estymatorem wartości odpowiedzi y w punkcie x' jest estymator opisany zależnością:

y x' = r ' R−1y−1  , (3.90) gdzie r – n-wymiarowy wektor macierzowym, którego współczynniki można wy-znaczyć z zależności:

rix ' =corr

[

x, xi

]

. (3.91)

Jak wcześniej podano, zaletą metody Kriging jest możliwość oszacowania błędu dopasowania modelu powierzchni odpowiedzi. Oszacowanie takie można wykonać przez porównanie wartości odpowiedzi y(x') oraz wartości rzeczywistej yi w tym punk-cie, korzystając z definicji wartości średniej błędu kwadratowego s2(x') w postaci:

s2x ' =E

[

y x ' − y x ' 

2

]

= 2

[

1−r ' R r 1−1 ' R−1r '

1' R−11

]

. (3.92) Dla większości przypadków wygodniej jest jednak posługiwać się pierwiastkiem wartości średniej błędu kwadratowego s(x):

s x=

s x2. (3.93)

Jak wynika z zależności (3.92), oszacowanie błędu interpolacji jest funkcją macierzy korelacji R opisanej zależnościami (3.83) i (3.84). Elementy macierzy R można wyznaczyć dla przypadku jednowymiarowego z zależności:

ri , j= 1

ehxixj

hp∣ . (3.94)

Aby wyznaczyć macierz korelacji R należy dokonać estymacji współczynników θh

oraz ph, co stanowi ważny problem metody Kriging. W tym celu można przyjąć założe-nie, że współczynnik p jest równy 2, natomiast wartość współczynnika Θ wyznacza się wówczas – ze względu na brak odpowiedniego estymatora – wybraną metodą optymalizacji. Współczynnik Θ można uznać za miarę istotności zmiennej xh, co można wyrazić w postaci stwierdzenia, że nawet małe wartości odległości dhi,j:

di , jh =

xihx jh

, (3.95) mogą prowadzić do dużych zmian wartości funkcji w punktach xi i xj. Wartość współ-czynnika Θh ma istotne znaczenie:

jeżeli wartość Θh jest duża, to małe zmiany dhi,j prowadzą do małej wartości korela-cji,

jeżeli wartość Θh jest mała, to małe zmiany dhi,j prowadzą do dużej wartości korela-cji,

W praktyce stosuje się następujące metody estymacji współczynnika Θh:

metoda oparta na procedurze sprawdzianu krzyżowego [123, 221],

metoda oparta na wyznaczniku macierzy korelacji det R [222],

metoda zaproponowana przez autora, oparta na rachunku wariacyjnym [208, 206]; metoda polega na wyznaczeniu wartości maksymalnej funkcjonału parametryczne-go F(Θ,p) opisująceparametryczne-go całkowity błąd interpolacji.

Metoda oparta na procedurze sprawdzianu krzyżowego (ang. cross-validation) po-lega na wyznaczeniu błędu dopasowania uzyskanej powierzchni odpowiedzi, według schematu: E  x=

1 n

i=1 n

yix − y x 

2, (3.96)

gdzie n – liczba punktów eksperymentu, y x – dopasowana powierzchnią od-powiedzi, yix – dopasowana powierzchnię powierzchni uzyskaną dla n – 1 punk-tów, przy założeniu, że „usunięty” jest i-ty punkt eksperymentu.

Procedura wymaga zatem dopasowania n – 1 powierzchni odpowiedzi yix  . Optymalną wartość współczynnika Θuzyskuje się w wyniku minimalizacji błędu do-pasowania E(x) opisanego zależnością (3.96), tj.:

 =min

E  x . (3.97)

Metoda oparta na wyznaczniku macierzy korelacji det R polega na wyznaczeniu wartości minimalnej funkcjonału opisanego zależnością:

F  , p=det R

1

n2. (3.98)

Jeżeli przyjmie się założenie, że wartość parametru p = 2, to estymator parametru Θ można zapisać w postaci:

 =min F  , p=2=min det R 1 n2. (3.99)

Z kolei metoda zaproponowana przez autora polega na wyznaczeniu wartości mak-symalnej funkcjonału parametrycznego F(Θ, p) w postaci całki oznaczonej opisującej całkowity błąd interpolacji:

F

, p

=

x ' x ' '

s

x ,, p

d x , (3.100)

gdzie x – wektor punktów, w których szacuje się wartość odpowiedzi, s(x) – pierwiastek z wartości średniej błędu kwadratowego.

W przypadku przyjęcia założenia, że wartość parametru p = 2, estymator parametru Θ można zapisać jako:

 =min F , p=2=min

x ' x ' ' s

x ,, 2

d x . (3.101)

Wartość estymatora parametru Θ wyznacza się metodą numeryczną. Metoda ta po-lega na numerycznym całkowaniu oraz optymalizacji z wykorzystaniem metody sim-pleks [183]. W takim przypadku funkcjonał opisany zależnością (3.100) należy przepi-sać w postaci:

F

, p

=

x ' x ' '

s

x , , p

d x (3.102)

Innym istotnym problemem metody Kriging jest estymacja współczynników Θhi

w przypadku wielowymiarowym. Istnieje wówczas konieczność oszacowania parame-trów Θhi dla każdego wymiaru oddzielnie. Dla przypadku dwuwymiarowego funkcję odległości można zapisać w postaci:

ri , j= 1

eh1x1ix1j

h1ph2x2ix2j

h2p∣ , (3.103)

co wymaga estymacji dwóch współczynników: Θh1 i Θh2.

Problem estymacji wielowymiarowej występuje stosunkowo często w praktyce in-żynierskiej i stanowi poważne wyzwanie dla istniejących obecnie metod. Wydaje się, że jedną z najbardziej optymalnych metod w tym celu, jest metoda sprawdzianu krzy-żowego oraz metoda zaproponowana przez autora. Przykładem odpowiedzi, która wy-maga takiego podejścia może być powierzchnia odpowiedzi, która w jednym wymiarze ma charakter monotoniczny, w drugim natomiast charakter okresowy, np. model funk-cji opisanej następującą zależnością (rys. 3.33):

Rys. 3.33. Przykład modelu powierzchni odpowiedzi, wymagającej estymacji dwóch parametrów Θ