• Nie Znaleziono Wyników

GRUNTÓW ZIARNISTYCH

W dokumencie I INŻYNIERIA ŚRODOWISKA (Stron 41-49)

STRESZCZENIE

W pracy zastosowano metodę bayesowską Gaussowskiego Procesu (GP). Metoda wyróżnia się brakiem wektora wag i użyciem funkcji kernelowskich oraz macierzy kowariancji w przestrzeni danych wejściowych. Dzięki temu w GP można było formułować stosunkowo proste algorytmy i procedury komputerowe. GP zastosowano do identyfikacji dwóch charakterystyk zagęszczenia gruntów ziarnistych, tj. wilgotności optymalnej oraz maksy-malnej gęstości objętościowej. Celem sprawdzenia numerycznej efektywności GP zastosowano ją do analizy nowych danych pomiarowych opisanych w [2], analizowanych w [4] za pomocą semi-baysowskiej sieci neuronowej (SBNN). Wykazano, że dokładność identyfikacji metodą GP jest porównywalna z zaletami SBNN.

SŁOWA KLUCZOWE: grunt ziarnisty, proces gaussowki (GP), semi-bayesowska sieć neuronowa (SBNN), wilgotność optymalna (OWC), maksymalna gęstość objętościowa (MDD), macierz kowariancji, współczynnik sukcesu (SR).

1. WPROWADZENIE

Ocena zagęszczenia gruntów w podłożu budowlanym jest obszernie dyskutowana w monografii [1]. Nawiązując do wcześniejszych prac [2,3], w monografii wykazano efektyw-ność stosowania sztucznych sieci neuronowych do oceny charakterystyk zagęszczania gruntów niespoistych. Uwagę skupiono na predykcji dwóch charakterystyk, tj. na wilgotności optymalnej OWC (ang. Optimum Water Content) oraz maksymalnej gęstości objętościowej MDD (ang. Maximum Dry Density). Dalej posługujemy się akronimami angielskimi, stosowanymi w pracach [4, 5], które dowiązują do nowych badań Sulewskiej i ich analizy za pomocą semi-bayesowskiej sieci neuronowej SBNN (Semi-Baeysian Neural Network).

______________________

1 marklos@prz. edu.pl

2 mslonski@jinx.l5.pk.edu.pl

3 zenwa@l5.pk.edu.pl

Celem niniejszej pracy jest wdrażanie zastosowania nowej efektywnej metody obliczeniowej, jaką jest GP, do analizy zagadnień inżynierii lądowej. Pierwsze zastosowania, dyskutowane na Sesji Specjalnej SSN na 57. Konferencji Krynickiej, por. [6] wskazują na szereg zalet tej metody. Spośród nich można wymienić prostotę podstawowych sformułowań algorytmów oraz procedur komputerowych i, przede wszystkim, dużą numeryczną efektywność GP. Oryginalność GP polega na zbudowaniu modelu numerycznego bez wektora wag, który jest uważany za podstawowy atrybut modeli numerycznych, por. [7, 8]. W zamian jest wykorzystywana macierz korelacji danych wejściowych i stosuje się funkcje korelacyjne zamiast funkcji bazowych używanych w sztucznych sieciach neuronowych.

Wymienione wyżej powody uzasadniają cel warsztatowy niniejszej pracy jako zbieranie doświadczeń ze stosowania GP w inżynierii lądowej. Temu służy porównanie efektywności numerycznej GP z wynikami osiąganymi przez zastosowanie semi-baysowskiej sieci neuronowej SBNN w [5]. Przybliżeniu czytelnikowi metody GP ma służyć rozdz. 2 oraz porównywanie jej zalet na tle wyników otrzymanych przez znacznie bardziej złożony model numeryczny, za jaki można uznać SBNN.

2. METODA GP

W metodzie gaussowskiego procesu GP opieramy się na funkcji kernelowskiej (jądro-wej)

k(xn,xm)Φ(xn)Φ(xm) , (1) definiowanej jako iloczyn skalarny funkcji bazowych  (x p) dla p = n, m, gdzie x pR D jest wektorem wejścia o wymiarach (D1), stosowanej jako element zbioru danych wejściowych D ={xp}Np 1 . Funkcje (1) są składowymi macierzy kowariancji CN o wymiarach (NN) dla N wektorów wejścia z przekątniowymi członami regularyzacyjnymi, por. [9, 10]:

1 , )

,

( 2 nm

N m

n m

n k

c

x x (2)

gdzie: nm  delta Diraca, N2 wariancja szumu gaussowskiego  w składowych zbioru n danych wyjścia:

tnynn. (3) Prawdopodobieństwo warunkowe predykcji obliczania wyjścia tN1 jest przyjęte w postaci rozkładu normalnego Gaussa:

p(tN1xN1,DN)N (tN1xN1, mN1,N21) , (4) gdzie wartość średnia i wariancja są określone wzorami:

m (x N 1 )  k T C N1 t , N21ckTCN1k , (5)

dla k {k(xn,xN1)}Nn1 , 1 .

Wektor k i skalar c są składowymi rozszerzonej macierzy kowariancji CN+1 :

Istotne znaczenie ma obliczanie odwrotnej macierzy kowariancji CN1 w ramach procesu uczenia modelu GP. Proces testowania jest równoznaczny procesowi predykcji dla wzorców wektora wejścia xN1. Z tego powodu metoda GP jet też nazywana interpolacyjną metodą bayesowską, por. [7].

W obliczeniach numerycznych przyjęliśmy dwie funkcje kowariancji z [10]. Pierwsza funkcja SE (ang. Squared Expotential ) określa ważony odstęp między wzorcami n i m

gdzie wektor dodatnich parametrów ma D+3 składowych:

(ExD3)1{v0,b,a1,,aD,N2} . (10) Druga funkcją, określana w [10] jest wymierną kwadratową funkcją RG (ang. Rational Quadratic) o postaci:

z D+4 składowymi wektora parametrów:

.

Parametry występujące w funkcjach kowariantnych SE lub RQ są obliczane na podsta-wie bayesowskiego kryterium ML (ang. Maximum Likelihood), gdzie funkcja wrażliwości L wynika ze wzoru Bayesa, por. [9]:

. 2 2 ln 2

ln 1 2

1 T 1

N

L CNt CN t (13)

3. DANE POMIAROWE

Dla jednego skalarnego wyjścia został sformułowany zbiór danych par wzorców P = {xp,tp}Pp1, otrzymany dla P = 121 doświadczeń opisanych w [4]. Badania wykonano dla piasków polodowcowych północno-wschodniej Polski, stosując test laboratoryjny Proctora i polowe badania uziarnienia gruntów.

W pracy [4] zbiór P =121 wzorców podzielono losowo na dwa zbiory: uczący o liczebności L = 0.5 P = 61 wzorców oraz zbiory testujący i walidujący, dla których T = V = 0.25 P = 30 wzorców. W pracy [5], w której zastosowano SBNN, przyjęto w losowaniu L= 0.7 P = 85 wzorców uczących oraz T = 0.3 P = 36 wzorców testujacych. W niniejszej pracy, celem porównania wyników otrzymanych za pomocą SBNN oraz metody GP przyjęto zbiory z [5].

Opierając się na analizie korelacyjnej w monografii [1], przyjęliśmy wektor wejściowy o 10 składowych:

x(101) = {CU , Dx x = 10%, … , 90%} , (14) gdzie dla rozkładów uziarnienia gruntu x [%] średnic D[mm], jako zmienną wejścia przyjęto

też współczynnik równomierności:

CU = D60/D90 ze zbioru uziarnienia {Dx}(91) = {D10, … , D90}. (15) W [1, 4] stosowano też skompresowany wektor wejścia:

x(51) = {CU , D10, D20, D70, D80}. (16) Składowe wektora wyjścia odpowiadają charakterystykom zagęszczenia:

y(21) = {OWC, MDD}.

Kierując się fizycznymi właściwościami charakterystyk zagęszczenia, w [3]

zapropowano stosowanie dwóch sieci neuronowych o pojedynczych skalarnych wyjściach:

y1 = OWC i y2 = MDD . (17) Takie podejście zastosowano też w [1, 4, 5] oraz w niniejszej pracy.

4. ANALIZA NUMERYCZNA

W pracy [5] zastosowano skalowanie składowych wektora wejścia x(101), dzieląc każdą ze składowych i przez maksymalną wartość zbioru {xin}nN1. Następnie wartości bezwymiarowe xinxin/maxxj(0.0,1.0) zostały przetransformowane do kierunków głównych xinin za pomocą metody PCA (ang. Principle Component Analysis). W [5]

została też wykonana kompresja danych z przestrzeni D = 10 do przestrzeni 4-wymiarowej.

W dalszym ciągu, ze względu na stratność dokładności, nie posługujemy się składowymi skompresowanymi, ale wszystkimi czynnikami głównymi  dla i = 1, …10 . in

4.1. Zastosowanie SBNN

W pracy [5] do identyfikacji charakterystyk zagęszczenia gruntu zastosowano semi-bayesowską sieć neuronową SBNN. W porównaniu z sieciami standardowymi w [4] przyjęto rozszerzoną funkcje błędu sieci:

gdzie: i  numer wyjścia dla charakterystyk zagęszczenia OWC lub MDD, w  RW  wektor uogólnionych wag sieci neuronowej (biasy i połączenia synaptyczne).

Do projektowania sieci (wyznacza się optymalną liczbę H opt w warstwie ukrytej) zastosowano kryterium bayesowskie maksimum całkowitej wiarygodności MLL (ang.

Maximum Marginal Likelihood) zamiast walidacji krzyżowej. W tym celu posłużono się procedurą Evidence opisaną w [10].

Hiperparametry i oraz i w (18) obliczano też na podstawie kryterium MLL korzystając z iteracyjnej procedury, opisanej w [10].

W [5] wykazano, że zastosowanie rozszerzonej funkcji błędu sieci (18) oraz wymienio-nych procedur bayesowskich daje wyraźne poprawienie dokładności identyfikacji parametrów zagęszczenia w porównaniu z wynikami, jakie otrzymano za pomocą sieci standardowych.

4.2. Zastosowanie metody GP i porównanie z wynikami otrzymanymi za pomocą SBNN

Metoda GP, krótko omówiona w p. 2, nie posługuje się wektorem wag, więc nie ma problemu projektowania odpowiedniej sieci neuronowej. Natomiast istotnym problemem jest liczba wzorców N, gdyż wpływa ona na szybkość obliczeń związanych głównie

MultiLeayer Perceptron) i SBNN w Tabl. 1 zestawiono otrzymane błędy procesów uczenia i testowania dla pierwiastkowego błędu średnio kwadratowego RMSE (ang. Root Mean Square Error) oraz współczynnika determinacji R 2, zdefiniowanych następującymi wzorami:

2

W Tabl. 1 zaznaczono w wierszach 5 i 6 akronimy RQ oraz SE funkcji kowariantnych (10) i (12), stosowanych w metodzie GP. Sieci standardowe o numerach 1* i 2* były analizo-wane w [4] dla L = 0.5 P oraz T = 0.25 P wzorców uczących i testujących, gdzie P = 121 jest całkowitą liczbą wzorców pomiarowych.

Tablica 1. Błędy aproksymacji numerycznej i współczynniki wiarygodności dla różnych modeli numerycznych w procesach uczenia i testowania

N standardowej sieci neuronowej MLP. Należy jednak ostrożnie oceniać błędy procesów ucze-nia i testowaucze-nia N i T, gdyż zależą one od losowego wyboru zbiorów uczących i testujących.

Celem lepszego oszacowania dokładności aproksymacji za pomocą SBNN i GP na Rys. 1 porównano rozkłady punktów (tp,yp)dla identyfikowanych wartości charakterystyk OWC oraz MDD. Celem oceny poziomu błędów predykcji, zdefiniowano błąd względny:

Rei (yip /tip1)100% dla i = OWC, MDD . (20) Na Rys.1 linie Re =  C % ograniczają obszar, w którym znajdują się punkty o błędach względnych Re C .

Patrząc na Rys. 1. widać, ze zarówno dla OWC jak też dla MDD obszary ograniczone odpowiednio przez C = 25% lub 5% obejmują porównywalna liczbę punktów (tp, yp) analizowanych za pomocą SBNN lub GP.

Lepszą ocenę efektywności SBNN i GP dają wykresy krzywych kumulacyjnych, nazwanych w [5] współczynnikami sukcesu SR (Re)% (ang. Success Ratio). Są one definiowane następującym wzorem:

SR(SRe/ S)100% , (21) gdzie: SRe  liczba punktów (tp, yp) w obszarze Re, S  całkowita liczba punktów dla

wzorców uczenia i testowania modeli numerycznych GP i SBN(N).

a) b)

Rys. 1. Rozkład punktów (t p, yp ) dla parametrów zagęszczenia OWP i MDD, obliczonych za pomocą modeli GP i SBNN

Na Rys. 2 pokazano krzywe sukcesu dla charakterystyk zagęszczenia gruntu, otrzymane dla procesów uczenia i testowania. Widać, że dla charakterystyk OWC i MDD obszary błędów Re 25 % i Re 5 %, w przypadku procesu testowania, obejmują ok. 85-90 % procent wzorców identyfikowanych przez GP i SBNN.

a)

1. Semi-bayesowska sieć neuronowa SBNN oraz metoda gaussowskiego procesu GP dają dokładniejszą identyfikację parametrów zagęszczenia gruntów ziarnistych niż standardowa, warstwowa sieć neuronowa MLP.

2. Wyniki identyfikacji parametrów zagęszczenia OWC (wilgotność optymalna) i MDD (maksymalna gęstość objętościowa) za pomocą GR i SBNN są porównywalne.

3. Sieć SBNN jest modelem numerycznym znacznie bardziej złożonym niż model GP, gdyż w GP nie posługujemy się wektorem wag. Dzięki temu w GP nie ma problemów z projektowania architektury sieci neuronowej a algorytmy i procedury komputerowe w GP są prostsze niż w SBNN.

4. Bardziej szczegółowa ocena i ewentualne rekomendacje stosowania modelu GP do analizy problemów inżynierii lądowej wymagają jeszcze dalszych badań, zwłaszcza dla problemów o dużej liczbie wzorców wejściowych.

Piśmiennictwo

[1] Sulewska M.J: Sztuczne sieci neuronowe w ocenie parametrów zagęszczenia gruntów niespoistych, Studia z Zakresu Inżynierii, Nr 64. Warszawa-Białystok, 2009.

[2] Najjar, Y.M.: On the identification of compaction characteristics by neuronets. Computers and Geotechnics, 18:167-187, 1996.

[3] Sinha, S.K., Wang, M.C.: Artificial neural network prediction models for soil compaction and permeability. Geotech. Geol. Eng., 26:47-64, 2008.

[4] Sulewska, M., Artificial neural modelling of compaction characteristics of cohesionless soils. Comp. Aided Mech. Eng. Sci., 17:27-40, 2010.

[5] Kłos M.V.J, Sulewska M.J., Waszczyszyn Z.: Neural identification of compaction character-istics for granular soils. Comp. Aided Mech. Eng. Sci., 18(4), 2010 (w druku).

[6] Słoński M.: Bayesian Neural Networks and Gaussian Processes in identification of concrete properties. Comp. Aided Mech. Eng. Sci., 18(4), 2011 (w druku).

[7] Waszczyszyn, Z., Słoński, M.: Selected problems of artificial neural network development, Ch. 5 in: Waszczyszyn, Z. (ed.), Advances of Soft Computing in Engi-neering, CISM Courses and Lectures, vol. 512, pp. 237-316. Springer, Wien-New York, 2011..

[8] Haykin, S.S.: Neural Networks  A Comprehensive Introduction, 2nd Ed., Prentice Hall, 1999.

[9] Bishop C.M.: Neural Networks for Pattern Recognition. Oxford University Press, 2006 [10] Nabney, I.T.: Netlab  Algorithms for Pattern Recognition. Springer, London, 2004.

APPLICATION OF GAUSSIAN PROCESS METHOD TO IDENTIFICATION OF COMPACTION CHARACTERISTICS IN GRANULAR SOILS

Summary

In the paper the Gaussian Process (GP) model is discussed as a simple Bayesian for approach to identification analysis. In GP model the weight vector is not applied, which makes the algorithms and computational procedures simpler than those formulated in the Semi-Bayesian Neural Network (SBNN). In the paper it was numerically proved that the application of GP to the identification of compaction parameters for granular soils is numerically efficient, comparable for GP and SBNN applications.

Wojciech KOZŁOWSKI1 Politechnika Opolska Andrzej SUROWIECKI2

Uniwersytet Przyrodniczy we Wrocławiu,

Wyższa Szkoła Oficerska Wojsk Lądowych we Wrocławiu, Adam BALAWEJDER3

Uniwersytet Przyrodniczy we Wrocławiu,

ANALIZA PRZEMIESZCZEŃ PŁYTY DENNEJ

W dokumencie I INŻYNIERIA ŚRODOWISKA (Stron 41-49)