Warunki optymalności sekwencji planów - Sekwencje planów nadążających za zmianami otoczenia

II. Plany optymalne dla modeli wielowymiarowych

10. Sekwencje planów nadążających za zmianami otoczenia

10.2. Warunki optymalności sekwencji planów

Podamy tu pełną charakteryzację optymalnej sekwencji planów w postaci warunku, który jest jednocześnie konieczny i dostateczny dla jej optymalności. Warunek ten można sprawdzać analitycznie, a jego przybliżone – numeryczne – sprawdzanie pozwala znajdować sekwencje bliskie optymalnym. Jednocześnie, w pewnych przypadkach wystarczy odwołać się do warunków, które są tylko do-stateczne, lecz prostsze do sprawdzenia. Podamy dwa zestawy takich warunków i ich zastosowania do znajdowania optymalnych trajektorii ruchu czujników po-miarowych.

Charakteryzacja optymalnej sekwencji planów

Wykażemy najpierw następujący lemat.

Lemat 10.1. Macierz informacyjna M (ˆµ), odpowiadająca D-optymalnej sekwen-cji planów ˆµ, jest macierzą nieosobliwą.

Dowód. Istnienie sekwencji µ ∈ M, dla której M(µ) jest nieosobliwa, wynika bezpośrednio z (A5). •

Dla sekwencji µ ∈ M o nieosobliwej macierzy M(µ) zdeﬁniujmy funkcję ϕ(x, t ; µ) następująco

ϕ(x, t ; µ) = g^T(x, t) M−1(µ) g(x, t); x∈ X, t ∈ T . ^(10.2.20) Dla danego ustalonego t ∈ T funkcja ta pełni taka samą rolę, jak funkcja wariancji odpowiedzi modelu, której używaliśmy w poprzednich rozdziałach. Jak pokazuje następny lemat i poniższe twierdzenie, podobna jest też jej rola w formułowaniu warunków optymalności.

Lemat 10.2. Dla każdej sekwencji planów µ∈ M o nieosobliwej macierzy M(µ) zachodzi następująca nierówność

1 |T | Z T max x∈X ϕ(x, t ; µ) dt  r . (10.2.21)

Dowód. Rozważmy ciąg elementarnych równości r = tr^hM⁻¹(µ) M(µ)ⁱ = ¹ |T | Z T Z X ϕ(x, t ; µ) µ_t(dx)dt. (10.2.22)

Ponieważ funkcja ϕ(x, t; µ) jest nieujemna oraz ciągła na zwartym zbiorze i dla każdego t ∈ T zachodzi ^R_Xµ_t(dx) = 1, to nierówność (10.2.21) otrzymujemy bezpośrednio z (10.2.22). •

Twierdzenie 10.1. Sekwencja planów ˆµ∈ M jest sekwencją D-optymalną wte-dy i tylko wtewte-dy, gwte-dy spełniony jest następujący warunek:

1 |T | Z T max x∈X ϕ(x, t; ˆµ) dt = r, (10.2.23)

gdzie r  1 jest liczbą estymowanych parametrów.

Dowód.Zdeﬁniujmy szczególną sekwencję planów µ0∈ M, która lokuje wszyst-kie pomiary w jednym punkcie, którego położenie może zależeć od t ∈ T . Oznacz-my ten punkt przez x₀(t) ∈ X i wybierzmy jego współrzędne następująco:

x₀(t) = arg max

x∈X ϕ(x, t; ˆµ). (10.2.24) Ponieważ ϕ(x,t; ˆµ), traktowana jako funkcja x, jest ciągłą na domkniętym i ogra-niczonym zbiorze X, więc supremum w (10.2.24) jest osiągane w punktach zbioru X. Możemy zatem powiedzieć, że x₀(t) to punkt, w którym osiągane jest maksi-mum ϕ(x,t; ˆµ) względem x ∈ X. Punktów, w których to maksimaksi-mum jest osiągane może być oczywiście więcej niż jeden. Nadużywając nieco notacji, zbiór takich punktów nadal oznaczać będziemy przez x0(t).

Wypukłość zbioru M gwarantuje nam, że dla dowolnego α ∈ [0,1] zachodzi

µ^{α def}= ^h(1 − α)ˆµ + αµ0ⁱ∈ M . (10.2.25)

Załóżmy, że ˆµ jest optymalną sekwencją planów. Wówczas, ∂ ln det M (µ^α) ∂α α=0 ¬ 0 , ^(10.2.26)

ponieważ odstrojenie od sekwencji optymalnej nie może dawać sekwencji o więk-szej wartości kryterium. Po wykonaniu różniczkowania w (10.2.26), otrzymamy nierówność 1 |T | Z T ϕ(x₀(t), t; ˆµ)dt ¬ r, (10.2.27)

która dowodzi, że warunek (10.2.23) jest warunkiem koniecznym optymalności, gdyż zachodzi także (10.2.21) i (10.2.24).

W celu udowodnienia dostateczności warunku (10.2.23) załóżmy, że jest on spełniony, lecz sekwencja planów ˆµ nie jest D-optymalna. Istnieje wówczas inna sekwencja planów, oznaczmy ją przez µ∗ ∈ M, taka, że det M(µ∗) > det M(ˆµ). Nierówność ta i ścisła wypukłość funkcji ln det[.] na zbiorze M prowadzą do nie-równości ∂ ∂αln det M[(1 − α)ˆµ + αµ∗] α=0 > 0. (10.2.28) Różniczkowanie w (10.2.28) prowadzi do r < 1 |T | Z T Z X ϕ(x,t; µ) µ^∗_t(dx)dt ¬ ¹ |T | Z T max x∈X ϕ(x,t; ˆµ) dt. (10.2.29)

Otrzymana sprzeczność między tą nierównością a warunkiem (10.2.23) dowodzi jego dostateczności. •

Wniosek 10.1. Warunkiem dostatecznym optymalności sekwencji planów ˜µ ∈ M jest spełnienie poniższego warunku

∀t∈T max

x∈X ϕ(x, t; ˜µ) = r. (10.2.30)

Dowód. Dostateczność (10.2.30) wynika ze wstawienia go do (10.2.23). •

I warunek dostateczny optymalności sekwencji planów

W podrozdziale tym podamy zestawy warunków dostatecznych, które – w pew-nych przypadkach – pozwalają uprościć zadanie znajdowania sekwencji optymal-nych.

Twierdzenie 10.2. Niech µ^∗ ∈ M będzie sekwencją planów o nieosobliwej ma-cierzy informacyjnej M (µ∗). Oznaczmy przez x∗

i(t), i = 1, 2, . . . , I∗(t), t ∈ T trajektorie zmian wejść, które odpowiadają sekwencji planów µ^∗. Jeśli spełniony jest warunek

∀t∈T max

x∈X ϕ(x, t; µ^∗) = ϕ (x∗

i(t), t; µ∗) (10.2.31) to µ∗ jest D-optymalną sekwencją planów. Ponadto, jeśli spełniony jest warunek (10.2.31), to zachodzi także

max

Dowód. Pomnóżmy obie strony (10.2.31) przez wagi p∗

i(t), i = 1, 2, . . . , I∗(t), odpowiadające sekwencji planów µ∗. Zsumujmy powstałe w ten sposób równości stronami i scałkujmy obie strony tych sum względem t. W rezultacie otrzymamy

1 |T | Z T " sup x∈X ϕ(x,t; µ^∗) # dt = 1 |T | Z T Z X ϕ(x,t; µ^∗)µ∗ t(dx)dt = r, (10.2.33)

gdzie ostatnia równość w poprzednim ciągu przekształceń wynika z (10.2.22). Teraz D-optymalność sekwencji µ∗ wynika bezpośrednio z Twierdzenia 10.1.

Rozważmy drugie z wymienionych stwierdzeń. Z Lematu 10.2 otrzymujemy, że dla dowolnej sekwencji planów o nieosobliwej macierzy informacyjnej, a więc także dla µ∗, zachodzi

sup

t∈T

max

x∈X ϕ(x, t; µ^∗) r. (10.2.34) Teraz drugie ze stwierdzeń udowodnimy przez sprowadzenie do sprzeczności. Przypuszczenie, że jednocześnie warunek (10.2.31) jest spełniony, ale (10.2.32) nie zachodzi, prowadzi w świetle (10.2.34) do nierówności

sup t∈T max x∈X ϕ(x, t ; µ^∗) < r. (10.2.35)

Skoro jednak supremum względem t funkcji w nawiasach kwadratowych nie prze-kracza r, to i sama ta funkcja nie przeprze-kracza r we wszystkich punktach T . Innymi słowy

∀t∈T max

x∈X ϕ(x, t; µ^∗) < r. (10.2.36) Po scałkowaniu obu stron tej nierówności otrzymamy

1 |T | Z T " sup x∈X ϕ(x, t; ˆµ) # dt < r, (10.2.37)

co, w świetle Twierdzenia 10.1, przeczy udowodnionej wcześniej optymalności µ∗. Udowodniliśmy zatem, że

sup

t∈T

max

x∈X ϕ(x, t; µ^∗) = r. (10.2.38) Wystarczy teraz odwołać się do warunku (10.2.31), aby z (10.2.38) otrzymać (10.2.32). •

Można zauważyć, że warunek (10.2.31) ma postać podobną do zasady maksi-mum Pontriagina, znanej w teorii sterowania optymalnego. Warto wskazać jednak na dwie podstawowe różnice.

– W ogólnym przypadku zasada maksimum jest warunkiem koniecznym opty-malności, podczas gdy warunek (10.2.31) jest warunkiem dostatecznym. – W warunku (10.2.31) obie strony zależą od µ∗, jeśli tylko r > 1.

Przydatność Twierdzenia 10.2 do znajdowania sekwencji optymalnych pokażemy w następnym podrozdziale.

II warunek dostateczny optymalności sekwencji planów

Załóżmy, że gradient q względem parametrów ma postać (por. A3)

g(x, t) = h(w(x, t)), x∈ X, t ∈ T , (10.2.39) gdzie w jest funkcją w : X × T → Rl, 1 ¬ l ¬ r, natomiast h jest r-wymiarowym wektorem funkcji h : Rl→ Rr. Załóżmy także, że zarówno funkcja w, jak i skła-dowe wektora h(·) są funkcjami ciągłymi w swoich obszarach określoności. Przy-kłady problemów, dla których spełniony jest warunek (10.2.39) podamy w na-stępnym podrozdziale.

Zdeﬁniujmy sekwencję zbiorów pomocniczych

Z_t ^def= {z : z = w(x, t), x ∈ X}, t ∈ T . (10.2.40) Założenie o ciągłości funkcji w(·, ·) gwarantuje nam, że zbiory Ztsą zbiorami do-mkniętymi i ograniczonymi. Załóżmy, że zbiory Ztnie zależą od t ∈ T i oznaczmy odpowiedni wspólny zbiór przez Z.

Rozważmy problem pomocniczy: znaleźć wektory Z∗

i ∈ Z, i = 1, 2, . . . , L oraz liczby π^∗_i  0, i = 1, 2, . . . , L, L X i=1 π_i^∗ = 1 takie, że max det " L X i=1 π_ih(Z_i) hT(Zi) # = det " L X i=1 π_i^∗h(Z_i^∗) hT(Z∗ i) # , (10.2.41)

gdzie supremum dotyczy wszystkich

Z_i∈ Z oraz πi  0,

i=1

π_i = 1 .

Liczba wektorów L 1 jest tu również zmienną decyzyjną i nie jest z góry ustalona.

Problem (10.2.41) jest już znanym nam zadaniem D-optymalnego planowania eksperymentu dla pomocniczo skonstruowanej funkcji regresji liniowej, rozpiętej

przez wektor funkcji h(z) z obszarem planowania Z ⊂ Rl. Możemy przyjąć, że zadanie to potraﬁmy rozwiązać analitycznie lub numerycznie, co daje nam punkty planu Z∗

i i wagi π∗

i, i = 1, 2, . . . , L.

Mając to rozwiązanie, możemy znaleźć sekwencję wejść x∗

i(t), i = 1, 2, . . . , L, rozwiązując względem xi następujące równania dla każdego t ∈ T z osobna

Z_i^∗ = w(x_i, t), i = 1, 2, . . . , L . (10.2.42) Możemy teraz utworzyć sekwencję planów µ∗ w ten sposób, że dla każdego t ∈ T kojarzymy wejścia x∗

i(t) ze stałymi (niezależnymi od t) wagami π∗

i, i = 1, 2, . . . , L.

Wniosek 10.2. Jeśli spełnione są założenia (10.2.39) i (10.2.41), to tak

utwo-rzona sekwencja planów µ∗ ∈ M jest sekwencją D-optymalną. Dowód tego wniosku podajemy na końcu podrozdziału.

Uwaga 10.1. W tym przypadku do skonstruowania D-optymalnej sekwencji

pla-nów wystarczy raz rozwiązać pomocniczy problem planowania (10.2.41), a następ-nie rozwiązać równania (10.2.42) dla poszczególnych t∈ T .

Uwaga 10.2. Istnienie rozwiązań równań (10.2.42) mamy zagwarantowane, gdyż

każde z Z∗

i ∈ Z. Rozwiązania te nie muszą być jednoznaczne, co można wykorzy-stać następująco:

– gdy T jest odcinkiem prostej, można szukać rozwiązań x^∗i(t), które są ciągłe jako funkcje zmiennej t,

– gdy mamy dodatkowe kryterium wyboru wartości wejść, to możemy wybrać te spośród niejednoznacznie wyznaczonych x∗

i(t), które zapewniają minimum kryterium pomocniczego.

W celu zilustrowania sposobu posługiwania się Wnioskiem 10.2, rozważmy następującą klasę modeli określonych dla x ∈ [0, 2π]:

q(x, t; a) = α0+ K X k=1 α_k cos[k (x − v t)] + βk sin[k (x − v t)] (10.2.43) gdzie a ^def= [α₀, α₁, . . . , α_K, β₁, . . . , β_K]T

jest wektorem nieznanych parametrów, natomiast v > 0 jest znane. Modele tej klasy można interpretować jako trygonometryczną aproksymację pewnej funkcji argumentu x, której położenie liniowo zmienia się w czasie z prędkością v.

Po obliczeniu gradientu (10.2.43) względem a, stwierdzamy, że wektor wraż-liwości na zmiany parametrów a określony jest wzorem g(x, t) = ˜h(x − v t), gdzie

Aby móc skorzystać z Wniosku 10.2, powinniśmy rozwiązać zadanie (10.2.41) z h(z) = ˜h(z), gdzie supremum obliczane jest w przedziale [0, 2π]. Problem taki już napotkaliśmy, rozwiązując zadanie D-optymalnego planowania dla regresji trygonometrycznej. Przypomnijmy, że jego rozwiązanie ma postać

ˆz_i = 2 π (i − 1)/r, ˆπi = 1/r, i = 1, 2, . . . , r,

gdzie r = 2K + 1. Wybierzmy miarę ˆµ ∈ M w ten sposób, by przypisać masy ˆπi, i = 1,2, . . . ,r do następujących trajektorii

ˆxi(t) = ˆzi+ v t, i = 1, 2, . . . , r (10.2.44) w każdym punkcie t ∈ T . Wówczas, dla każdego t ∈ T spełnione będzie

max

x∈X ˜hT(x − v t) M−1(ˆµ) ˜h(x − v t) = r. (10.2.45) Zgodnie z Wnioskiem 10.1 ˆµ jest rozwiązaniem optymalnym.

Dowód wniosku 10.2.

Z twierdzenia Kiefera–Wolfowitza o równoważności planów D- i G-optymalnych wynika, że zadanie (10.2.41) jest równoważne ze spełnieniem warunku

max z∈Z h^T(z) (H∗)−1h(z) = r, (10.2.46) gdzie H^{∗ def}= L X i=1 π_i^∗h(Z_i^∗) hT(Z∗ i).

Ponadto supremum w (10.2.46) osiągane jest dla wszystkich Z∗

i, i = 1, 2, . . . , L. Bezpośrednim rachunkiem można sprawdzić, że macierz informacyjna dla sekwen-cji planów µ∗ ma postać M(µ∗) = H∗. Dla każdego t ∈ T zachodzi zatem

max x∈X ϕ(x, t; µ^∗) = max z∈Zt h^T(z) (H∗)−1h(z) = max z∈Z h^T(z) (H∗)−1h(z) = ϕ(x∗ i(t), t; µ∗) = r. (10.2.47) Zestawienie tych równości z Twierdzeniem 10.2 kończy dowód. •

W dokumencie Optymalizacja eksperymentu z zastosowaniami w monitorowaniu jakości produkcji (Stron 128-134)