• Nie Znaleziono Wyników

9. Metoda oznaczania LZO półprzewodnikowymi czujnikami gazów w obecności interferentów

9.3. Analiza danych pomiarowych

Celem analizy danych było sprawdzenie możliwości wykonania kalibracji matrycy czujni-kowej w kilku zakresach stężeń wybranych substancji oraz ocena skuteczności tej operacji podczas wyznaczania stężeń analitów w próbach gazowych. Analizę danych zrealizowano w środowisku obliczeń naukowo-technicznych MATLAB, na podstawie założeń sformułowa-nych w rozdziałach 9.1 oraz 9.2.

Obliczenia przeprowadzono, mając na uwadze:

 kalibrację i oznaczanie LZO w założonych zakresach pomiarowych systemu czujnikowe-go;

 kalibrację klasyfikatorów i określanie przynależności sygnałów czujnikowych do założo-nych zakresów pomiarowych systemu czujnikowego.

Ze względu na problemy związane z wytwarzaniem mieszanin wzorcowych o bardzo ma-łych stężeniach LZO i zaobserwowanym dużym rozrzutem wskazań czujników półprzewod-nikowych w zakresach bardzo małych stężeń LZO z analiz wykluczono zbiory danych, w których: stężenia toluenu były niższe od 1,447 ppm; stężenia benzenu były niższe od 1,064 ppm.

9.3.1. Analiza danych pod kątem wyznaczania stężeń LZO w mieszaninach gazowych

Analizę danych wykonano dla punktów czasowych, pochodzących ze wszystkich etapów trybu pracy stop-flow. Do analizy przyjęto sygnały czujnikowe zarejestrowane w co piątej sekundzie, zaczynając od chwili wpuszczenia mieszanin gazowych do komórek czujniko-wych. Tym samym przeanalizowano 348 momentów czasoczujniko-wych.

Analizę danych przeprowadzono dla zakresów stężeń, w których wykazano możliwość opisania charakterystyk pomiarowych czujników funkcjami liniowymi (patrz tab. 8.1–8.4). Uwzględniono przy tym możliwy rozrzut wskazań czujników półprzewodnikowych. Z tego powodu zdecydowano się na zastosowanie procedury 2p-krotnej walidacji krzyżowej (kro-swalidacji), gdzie p było liczbą powtórzeń każdego pomiaru, a wartość liczbowa 2 odnosiła się do możliwości przeprowadzenia kalibracji dla każdego zakresu liniowości dwoma sposo-bami (wg rys. 9.1).

Przyjęto, że mieszaniny gazowe wytwarzane w generatorze KIN-TEK traktowane będą za-równo jako mieszaniny kalibracyjne, jak i mieszaniny gazowe podlegające oznaczeniu

ilo-134

ściowemu. W tym celu dane pomiarowe z każdego przedziału liniowości podzielono na 2p zestawów. Przyjęto, że w każdym zestawie za dane związane z mieszaninami kalibracyjnymi posłużą sygnały uzyskane po ekspozycji czujników na mieszaniny gazowe o stężeniach kom-ponentów wyznaczających zakresy liniowości. Dane takie pochodziły z jednego z kolejnych powtórzeń pomiarów, według jednego z rozpatrywanych sposobów kalibracji (A lub B na rys. 9.1). Tym sposobem utworzono zbiory uczące – w każdym zbiorze znalazły się 3 wektory sygnałów czujnikowych uzyskanych po ekspozycji na 3 mieszaniny wzorcowe wraz z etykie-tami liczbowymi, określającymi zawartość komponentów mieszanin. Na podstawie tak zesta-wionych danych dla każdego czujnika wyznaczano wartości współczynników równań płasz-czyzn (układ równań (9.2)). Pozostałe sygnały traktowano jako dane, dla których wyznaczane były wartości stężeń analitów. Sygnały te weszły w skład zbiorów walidacyjnych.

Dla danych walidacyjnych, do określenia zawartości substancji w mieszaninach konieczne było rozwiązywanie układów równań liniowych dla różnych kombinacji czujników. W anali-zowanym przypadku mieszanin dwukomponentowych w skład każdej kombinacji wchodziła para czujników należąca do tej samej matrycy czujnikowej. Układy równań rozwiązywane były zatem na podstawie dwuelementowych wektorów sygnałów czujników oraz wartości współczynników równań płaszczyzn dla wybranych sensorów (równanie (9.4)). Przeanalizo-wano wszystkie możliwe kombinacje czujnikowe dla każdej z wykorzystywanych matryc. Dla 17 czujników wziętych do analizy w obrębie jednej matrycy uzyskano 136 różnych kom-binacji. Zrealizowano w ten sposób przeszukiwanie zupełne zbioru cech czujnikowych.

Do oceny skuteczności pomiarowej kombinacji czujników wykorzystano podejście opa-kowane, w którym posłużono się dwoma miarami:

średnim błędem pomiaru odniesionym do zakresu pomiarowego (AE – od ang. average

error), który dla procedury kroswalidacji wyrażono równaniem:

, (9.5) ∑ | ̂| , (9.6) gdzie:

– liczba przeprowadzanych kroswalidacji ( , gdzie to liczba powtórzeń każdego pomiaru),

135

– średni błąd pomiaru odniesiony do zakresu pomiarowego, wyliczony dla jednego powtórzenia kroswalidacji,

– liczba obliczanych stężeń w danym przedziale liniowości,

– rzeczywiste stężenie analitu w próbie gazowej,

̂ – obliczone stężenie analitu w próbie gazowej,

– maksymalne stężenie analitu w danym przedziale liniowości (górna granica zakresu

pomiarowego),

– minimalne stężenie analitu w danym przedziale liniowości (dolna granica zakresu

pomiarowego).

maksymalnym błędem pomiaru odniesionym do zakresu pomiarowego (ME – od ang.

ma-ximum error), który dla procedury kroswalidacji wyrażono równaniem:

ma [ ] , (9.7) ma [ ]( | ̂| ) , (9.8) gdzie: [ ] { },

– maksymalny błąd pomiaru odniesiony do zakresu pomiarowego, wyliczony dla jed-nego powtórzenia kroswalidacji,

[ ] { }.

Pierwsza z miar (AE) wyraża przeciętną wartość błędu pomiaru analitu (wyznaczenia war-tości stężenia), odniesioną do zakresu pomiarowego, w którym odbywa się pomiar. Druga miara (ME) określa największy błąd pomiaru (błąd graniczny) odniesiony do zakresu pomia-rowego i jest ekwiwalentem klasy dokładności.

Do znalezienia najlepszych kombinacji czujników przyjęto 2 kryteria oceny działania sys-temu:

 kryterium 1: AE  10 % oraz ME  30 %,

 kryterium 2: AE  15 % oraz ME  40 %.

Ogólny schemat blokowy algorytmu obliczeń, prowadzonych dla pojedynczej matrycy czujnikowej i w określonym przedziale liniowych zależności sygnałów od stężeń komponen-tów mieszanin, zamieszczono w załączniku 6.

136

9.3.2. Analiza danych pod kątem określania przedziałów stężeń LZO

Drugą część analizy danych wykonano jedynie dla wybranych punktów czasowych z etapu dynamicznej ekspozycji czujników na mieszaniny gazowe oraz z etapu statycznej ekspozycji. Wytypowano następujące punkty czasowe: 120 s, 420 s, 630 s, 840 s. Czas liczono od chwili wpuszczenia próbek na matrycę. Rozłożenie tych punktów w czasie procedury pomiaru poka-zano na rysunku 8.3 (rozdział 8.2).

W analizie danych zastosowano procedurę 2p-krotnej walidacji krzyżowej, opisaną w punkcie 9.3.1. Obliczenia wykonano na podstawie opisanych wcześniej zbiorów danych uczących oraz walidujących. Dane ze zbiorów uczących służyły do wyznaczania wartości współczynników równań płaszczyzn dla przyjętych zakresów pracy systemu. Na podstawie współczynników płaszczyzn wyznaczano w następnym kroku wartości modelowych sygna-łów czujnikowych z każdego zakresu pomiarowego. W każdym zakresie przyjęto siatkę 55 punktów, rozmieszczonych równomiernie. Do modelowych wartości sygnałów przypisywano w kolejnym etapie etykiety informujące o przynależności do konkretnych przedziałów stężeń. Tym sposobem tworzone były zestawy uczące, służące do budowy klasyfikatora. Rozważono wektory danych złożone z sygnałów pochodzących od jednego, dwóch lub trzech czujników matrycy. Rzeczywiste sygnały pomiarowe ze zbiorów walidacyjnych służyły z kolei do two-rzenia wektorów danych sprawdzających działanie klasyfikatorów. Wektorom tym przypo-rządkowano również etykiety określające ich przynależność do zakresów pracy systemu.

Efektywność wskazywania zakresów pomiarowych sprawdzono dla dwóch popularnych algorytmów. Pierwszym z nich był nieliniowy klasyfikator oparty na nieparametrycznej esty-macji rozkładów prawdopodobieństwa w klasach – metoda k-najbliższych sąsiadów (k-NN) [5]. Do obliczeń wykorzystano funkcję knnclassify programu MATLAB [236]. Wartości pa-rametru k wybrano arbitralnie i wynosiły one: 1, 3 oraz 5. Przyporządkowanie wektora sygna-łów ze zbioru walidacyjnego do klasy charakteryzującej zakres stężeń polegało na znalezieniu jego najbliższych sąsiadów wśród wektorów zbioru uczącego i określeniu klasy przynależno-ści według zasady większoprzynależno-ściowej (tzn. do klasy liczniej reprezentowanej przez sąsiadów ze zbioru uczącego). Najbliżsi sąsiedzi wyznaczani byli na podstawie metryki euklidesowej.

Drugim algorytmem wziętym pod uwagę była liniowa analiza dyskryminacyjna (LDA), będąca w odróżnieniu od k-NN klasyfikatorem parametrycznym [5]. Na podstawie macierzy kowariancji w klasach danych ze zbioru uczącego wyznaczana była odpowiednia liniowa funkcja dyskryminacyjna. Walidacyjny wektor sygnałów przypisywany był do klasy, w której

137

wartość funkcji dyskryminacyjnej była największa. W obliczeniach skorzystano z funkcji

classify programu MATLAB [237].

Skuteczność działania klasyfikatorów oceniano na podstawie udziału poprawnych klasyfi-kacji (CCR – od ang. correct classification rate):

, (9.9)

, (9.10)

gdzie:

– liczba przeprowadzanych kroswalidacji,

– udział poprawnych klasyfikacji w i-tym powtórzeniu kroswalidacji,

– liczba wektorów danych poprawnie sklasyfikowanych w i-tym powtórzeniu kroswa-lidacji,

– sumaryczna liczba testowych wektorów danych w i-tym powtórzeniu kroswalidacji. Jako poprawną klasyfikację uznawano przyporządkowanie wektora sygnałów ze zbioru walidacyjnego do klasy określonej w jego etykiecie. W przypadku sygnałów zarejestrowa-nych w wyniku ekspozycji czujników na mieszaniny o stężeniach komponentów znajdujących się na granicach zakresów liniowości, za właściwą klasyfikację uznawano przyporządkowanie do któregokolwiek z tych zakresów.

Ogólny schemat blokowy algorytmu analiz, prowadzonych dla pojedynczej matrycy czuj-nikowej dla wybranego klasyfikatora, zamieszczono w załączniku 7.