• Nie Znaleziono Wyników

Statystyczna analiza danych metodą regresji wielorakiej

W dokumencie Wykrywanie zafałszowań oliwy z oliwek (Stron 128-136)

8. Wyniki badań i dyskusja

8.4. Wykrywanie zafałszowań oliwy z oliwek przy wykorzystaniu pomiarów

8.4.6. Statystyczna analiza danych metodą regresji wielorakiej

Intensywności fluorescencji przy wybranych analitycznych długościach fal analizowane były metodą wielokrotnej regresji liniowej. Metoda ta umożliwia prognozowanie zmiennej

zależnej, jaką w tym przypadku był procent dodatku oleju użytego do zafałszowania oliwy z oliwek ekstra z pierwszego tłoczenia, na podstawie danych niezależnych czyli intensywności fluorescencji próbek olejów i serii mieszanek. Zbudowano modele indywidualne (Id) uwzględniające dodatek do oliwy z oliwek ekstra z pierwszego tłoczenia jednego spośród olejów fałszujących: rafinowanej oliwy z oliwek, oliwy z wytłoków oliwek, olejów roślinnych i jedną oliwę a także modele globalne. Poprzez porównanie parametrów charakteryzujących modele wielokrotnej regresji liniowej możliwy był wybór zmiennych niezależnych, które pozwoliły najlepiej przewidywać poziom zafałszowania oliwy z oliwek ekstra z pierwszego tłoczenia.

Zmienną zależną w budowanych modelach był dodatek oleju fałszującego do oliwy z oliwek ekstra z pierwszego tłoczenia natomiast predykatorami intensywności fluorescencji uzyskane dla poszczególnych olejów i ich mieszanek przy wcześniej wybranych długości fal. W modelach globalnych uwzględniano mieszanki więcej niż jednej oliwy z oliwek z pierwszego tłoczenia. Rozróżnić można modele globalne uwzględniające tylko jeden typ oleju fałszującego (modele globalne pierwszego rzędu– G(I)), modele uwzględniające wszystkie oleje z nasion (modele globalne drugiego rzędu – G(II)) oraz modele globalne uwzględniające jednocześnie wszystkie rodzaje olejów, którymi fałszowano próbki czyli oliwy rafinowane, oliwy z wytłoków oliwek, oleje z nasion: sojowy, słonecznikowy i rzepakowy (modele globalne trzeciego rzędu– G(III)). Zarówno modele indywidualne, jak i globalne, były tworzone oddzielnie na podstawie danych uzyskanych przy poszczególnych Δλ = 10, 30, 60 i 80 nm. Parametry statystyczne charakteryzujące otrzymane modele indywidualne oraz globalne pierwszego i drugiego rzędu zamieszczone są w załącznikach 8.4.6/1-7.

Wszystkie modele indywidualne (Id), czyli modele uwzględniające tylko jedną oliwę z oliwek oraz jeden olej „fałszujący” były dobrze dopasowane o czym świadczą uzyskane współczynniki korelacji (R), determinacji (R^2) i skorygowanej determinacji (skorygowane R^2), które mieściły się w przedziale 0,94-1,00 (załączniki 8.4.6/1-7). W tab. 8/13 zamieszczone są średnie błędy standardowe estymacji i walidacji modeli indywidualnych, uwzględniające wszystkie oliwy z oliwek ekstra z pierwszego tłoczenia zafałszowane rafinowaną oliwą z oliwek, oliwa wytłoków oliwek, olejem sojowym, słonecznikowym i rzepakowym, obliczone na podstawie danych dla modeli indywidualnych umieszczonych w załącznikach 8.4.6/1-7. Najniższe średnie błędy standardowe estymacji i walidacji, świadczące o dużej zdolności prognostycznej, przy rozważaniu modeli indywidualnych, uzyskano przy różnicy między długością fali emisji i wzbudzenia równiej 80 nm,

w przypadku wszystkich rodzajów olejów z wyjątkiem oleju słonecznikowego (tab. 8/13). W przypadku modelu stworzonego z uwzględnieniem oliw zafałszowanych tym olejem najniższy średni błąd standardowy estymacji równy 1,4 uzyskano przy Δλ wynoszącym 10 nm, natomiast średni błąd standardowy walidacji wynoszący 2,3 przy Δλ równym 30 nm.

Tab. 8/13. Średnie, obliczone na podstawie wszystkich badanych oliw z oliwek ekstra z pierwszego tłoczenia, błędy standardowe estymacji i walidacji modeli indywidualnych dla poszczególnych olejów użytych do fałszowania

Różnica między długością fali emisji i wzbudzenia[nm] Rodzaj oleju fałszującego Parametr ∆λ=10 ∆λ=30 ∆λ=60 ∆λ=80 RMSE 2,8 2,2 1,6 1,6 Rafinowana oliwa z oliwek RMSECV 6,8 6,5 5,1 4,6 RMSE 3,6 1,6 2,2 1,1 Oliwa z wytłoków oliwek RMSECV 4,1 3,1 6,5 1,6 RMSE 1,4 1,4 1,4 1,1 Olej sojowy RMSECV 2,1 2,0 2,1 1,7 RMSE 1,4 1,5 2,7 2,3 Olej słonecznikowy RMSECV 2,7 2,3 4,2 4,2 RMSE 1,5 2,1 1,6 1,2 Olej rzepakowy RMSECV 4,8 3,2 2,3 1,9

Wraz z rozbudowywaniem modeli o parametry kolejnych próbek oliw z oliwek i kolejne oleje fałszujące obserwowano, zgodnie z przewidywaniami, wzrost błędów standardowych estymacji i walidacji (załączniki 8.4.6/1-7). W przypadku modeli globalnych drugiego rzędu (G(II)) uwzględniających łącznie wszystkie oliwy rafinowane (OR1-OR4) oraz oliwy z wytłoków oliwek (OW1-OW4) najniższe błędy standardowe estymacji i walidacji uzyskano przy Δλ wynoszącym 80 nm i wynosiły one odpowiednio 4,3 i 5,5 oraz 2,3 i 2,7.

W przypadku modeli stworzonych z uwzględnieniem intensywności fluorescencji próbek zafałszowanych olejem sojowym i rzepakowym, najniższe błędy uzyskano również przy zastosowaniu Δλ równego 80 nm i wynosiły one 0,9 i 1,0 oraz 1,2 i 1,4 (modele globalne pierwszego rzędu – G(I)). Wyjątek stanowiły próbki fałszowane olejem słonecznikowym, w przypadku których najlepsze wyniki uzyskano przy paramach dla Δλ = 30 nm. Błędy standardowe estymacji i walidacji wynosiły odpowiednio 2,1 i 2,7. Przy Δλ równym 80 nm były one nieco wyższe i przyjmowały wartości 2,6 i 3,0. Podsumowując, dla modeli globalnych uwzględniających jeden rodzaj oleju fałszującego (G(I)), najniższe błędy uzyskano przy rozpatrywaniu oliw z oliwek zafałszowanych olejem sojowym; najwyższe natomiast w przypadku fałszowania rafinowaną oliwą z oliwek. Przeprowadzone badania oraz

analiza statystyczna modeli (indywidualnych i globalnych pierwszego rzędu) pozwoliły na uszeregowanie zafałszowań oliwy z oliwek ekstra z pierwszego tłoczenia pod względem trudności ich wykrycia (zaczynając od oleju, którego dodatek najłatwiej wykryć a kończąc na oleju, którego dodatek jest najtrudniejszy do wykrycia) w następującej kolejności: olej sojowy, rzepakowy, oliwa z wytłoków oliwek, olej słonecznikowy oraz rafinowana oliwa z oliwek.

Stworzono ponadto modele, na podstawie intensywności fluorescencji próbek oliwy z oliek ekstra z pierszego tłoczenia zafałszowanych olejem sojowym, słonecznikowym i rzepakowym (modele globalne drugiego rzędu G(II)). Rzeczywiste i prognozowane na podstawie tego modelu wartości dodatku procentowego olejów z nasion w oliwach z oliwek przestawia rys. 8/8. Wartości prognozowane najmniej różnią się od rzeczywistych przy Δλ równym 10 nm oraz 30 nm natomiast najbardziej przy Δλ wynoszącym 80 nm.

Rys. 8/8. Rzeczywiste a przewidywane zafałszowanie oliwy z oliwek uzyskane na podstawie modeli globalnych uwzględniających zafałszowanie oliw z oliwek wszystkimi olejami z nasion

Parametry charakteryzujące te modele zamieszczone są w tab. 8/14. Wartości współczynników korelacji (R), determinacji (R^2) i skorygowanej determinacji (skorygowany R^2 ) przy wszystkich zastosowanych Δλ (10, 30 i 60 nm) były nie niższe od 0,99. W przypadku Δλ równego 80 nm parametry modelu uwzględniającego zafałszowanie oliwy łącznie wszystkimi olejami z nasion wynosiły odpowiednio 0,97; 0,94 i 0,94. Dla wszystkich różnić między długością fali emisji i wzbudzenia zastosowanych do wykonania pomiarów widm różnice między błędami standardowymi estymacji i walidacji były niewielkie i nie przekraczały 0,4, co świadczy o dobrym dopasowaniu i wysokich możliwościach prognostycznych modeli.

Tab. 8/14. Statystyczne parametry modeli globalnych wielokrotnej regresji liniowej uwzględniających intensywności fluorescencji widm synchronicznych przy wybranych długościach fal próbek oliw z oliwek ekstra z pierwszego tłoczenia zafałszowanych wszystkimi olejami z nasion

Parametr Δλ =10 Δλ =30 Δλ =60 Δλ =80 R 1 0,99 1 0,97 R^2 0,99 0,99 0,99 0,94 Skorygowane R^2 0,99 0,99 0,99 0,94 F 1823,3 1231 1799,3 242,8 RMSE 2,7 3,3 2,7 7,3 RMSECV 2,8 3,7 2,9 7,7

Najniższe błędy standardowe estymacji i walidacji uzyskano stosując pomiary synchronicznych widm fluorescencji przy różnicy między długością fali emisji i wzbudzenia równej (Δλ) 10 nm i przyjęły one odpowiednio wartości 2,7 i 2,8, a największe błędy uzyskano wykonując pomiary przy Δλ wynoszącym 80 nm i były równe 7,3 i 7,7. Są to wyniki odmienne od tych uzyskanych w przypadku modeli indywidualnych oraz modeli uwzględniających tylko jeden rodzaj oleju dodawanego w celu fałszowania oliw, dla których to najniższe błędy uzyskiwano właśnie przy Δλ równym 80 nm.

Na podstawie intensywności fluorescencji próbek wszystkich oliw z oliwek ekstra z pierwszego tłoczenia, rafinowanych oliw z oliwek, oliw z wytłoczyn oliwek i olejów roślinnych oraz serii mieszanek przygotowanych przy ich wykorzystaniu stworzono modele globalne trzeciego rzędu (G(III)). Na rys. 8/9 przedstawione są rzeczywiste stężenia olejów fałszujących próbki oliw z oliwek i odpowiadające im obliczone na podstawie modeli prognozowane wartości tychże dodatków, kolejno przy Δλ równych 10, 30, 60 i 80 nm. Przewidywane poziomy zafałszowania oliwy z oliwek wydają się najmniej odbiegać od rzeczywistych przy Δλ wynoszącym 10 nm, a najbardziej przy Δλ równym 80 nm.

Rys. 8/9. Rzeczywiste a przewidywane zafałszowanie oliwy z oliwek uzyskane na podstawie modeli globalnych uwzględniających zafałszowanie oliw z oliwek wszystkimi rodzajami olejów fałszujących

Uzyskane w przypadku modeli globalnych trzeciego rzędu – G(III) równania regresji wielu zmiennych przedstawiały się następująco:

 Równanie regresji wielu zmiennych uzyskane na podstawie modelu uwzględniającego intensywności fluorescencji otrzymane przy zastosowaniu Δλ = 10nm.

Y10= 10,15+ (1,95E-05)x1 +(1,01E-05)x2+(2,3E-05)x3 – (2,6E-05)x4-(1,7E-05)x5 + +(2,43E-05)x6+ (4,59E-05)x7 - 0,00018x8 + 0,000249x9 – (3,3E-05)x10 . (4)

 Równanie regresji wielu zmiennych uzyskane na podstawie modelu uwzględniającego intensywności fluorescencji otrzymane przy zastosowaniu Δλ = 30 nm.

Y30= 1,95- (2,85E-05)x1 +(1,472E-06)x2+(2,85E-05)x3 + (6,69E-06)x4+ (2,73E-06)x5-

-(1,94E-05)x6+(1,80E-05)x7+ (0,00012458)x8- (0,00011561)x9-(0,00020432)x10. (5)

 Równanie regresji wielu zmiennych uzyskane na podstawie modelu uwzględniającego intensywności fluorescencji otrzymane przy zastosowaniu Δλ = 60nm.

Y60= -13,24+(5,38E-07)x1+(1,49E-05)x2+(7,80E-06)x3+(2,45E-05)x4-0,000140164x5+

+(3,35E-05)x6+0,000165878x7+0,00017053x8 –(5,06E-05)x9- (4,55E-05)x10. (6)

 Równanie regresji wielu zmiennych uzyskane dla modelu uwzględniającego intensywności fluorescencji otrzymane przy zastosowaniu Δλ = 80nm.

Y80=30,47-(1,32E-06)x1+(1,92E-05)x2-(2,87E-06)x3-(5,55E-06)x4+(1,89E-05)x5-

-0,000119887x6+0,000155803x7+(1,38E-05)x8- (6,63E-05)x9-0,000578643x10 , (7)

gdzie:

Y10, Y30, Y60, Y80 - prognozowana na podstawie modelu zawartość dodatku oleju fałszującego w oliwie w oliwek,

x 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 - wartości intensywności fluorescencji przy wybranych długościach fal zamieszczonych w tab. 8/9, przy różnicy między długością fali emisji i wzbudzenia 10, 30, 60 i 80 nm; zachowano kolejność długości podaną tab. 8/9.

W tab. 8/15 zamieszczone są parametry charakteryzujące modele globalne trzeciego rzędu (G(III)) przy każdej z różnić między długością fali emisji i wzbudzenia (Δλ) równej kolejno 10, 30 , 60 i 80 nm. Zgodnie przewidywaniami wartości współczynników korelacji, determinacji i skorygowanej determinacji wskazujące na „jakość” dopasowania modeli były niższe, a z kolei błędy standardowe estymacji i walidacji wyższe, niż w przypadku modeli indywidualnych lub zbudowanych z uwzględnieniem mniejszej różnorodności olejów fałszujących.

Współczynniki korelacji, determinacji i skorygowanej determinacji przyjmowały wartości z zakresów odpowiednio 0,88-0,94; 0,77-0,89 oraz 0,76-0,89, przy czym najwyższe wartości uzyskano przy Δλ równym 10 nm a najniższe przy 80 nm.

Tab. 8/15. Statystyczne parametry modeli globalnych wielokrotnej regresji liniowej uwzględniających intensywności fluorescencji widm synchronicznych przy wybranych długościach fal próbek oliw z oliwek ekstra z pierwszego tłoczenia zafałszowanych wszystkimi rodzajami olejów fałszujących

Parametr Δλ =10 Δλ =30 Δλ =60 Δλ =80 R 0,94 0,92 0,93 0,88 R^2 0,89 0,85 0,87 0,77 Skorygowane R^2 0,89 0,85 0,86 0,76 F 256,9 182,1 203,6 105,9 RMSE 9,7 11,3 10,8 14,1 RMSECV 10,1 11,9 11,5 15,0

Najniższe błędy standardowe estymacji i walidacji, świadczące o najwyższych możliwościach prognostycznych modelu, uzyskano przy zastosowaniu różnicy między długością fali emisji wzbudzenia Δλ wynoszącej 10 nm i przyjmowały one wartość 9,7 i 10,1, co potwierdza obserwacje wywnioskowane na podstawie rys. 8/8. Najwyższe błędy z kolei uzyskano przy zastosowaniu parametru Δλ równego 80 nm i wynosiły one 14,1 i 15,0. Potwierdza się tutaj dostrzeżona wcześniej zależność, że im bardziej rozbudowany model i więcej rodzajów olejów fałszujących tym mniejsza zdolność prognostyczna modeli stworzonych na podstawie danych z widm uzyskanych przy Δλ równym 80 nm a większa przy Δλ wynoszącym 10 nm.

W przypadku oznaczania granic wykrywalności zafałszowania oliwy z oliwek ekstra z pierwszego tłoczenia, korzystniejsze wyniki uzyskano przy wyższych różnicach między długościami fali emisji i wzbudzenia. Wynika to z faktu, iż widma synchroniczne fluorescencji wykonane przy zastosowaniu większych różnic między długościami fal emisji i wzbudzenia równych np. 60 lub 80 nm wykazują w przypadku różnych rodzajów olejów są najbardziej zróżnicowane (rys. 8/5 i 8/7).

W przypadku globalnych modeli regresji wielorakiej uwzględniających łącznie wszystkie oleje użyte do fałszowania (G(III)), duże różnice między intesywnościami fluorescencji poszczególnych próbek wpływają na zwiekszenie błędów estymacji i walidacji. Korzystniejsze jest w tym przypadku stosowanie mniejszych różnic między długością fali emisji i wzbudzenia, a zwłaszcza parametru Δλ równego 10 nm.

Ponieważ z założenia dążymy do jak największej uniwersalności modeli, należy przyjąć, że modele budowane na postawie danych uzyskanych przy Δλ wynoszącym 10 nm mogą być bardziej przydatne do przewidywania poziomu zafałszowania oliw z oliwek deklarowanych jako oliwy z oliwek ekstra z pierwszego tłoczenia oliwami niższych kategorii oraz olejem sojowym, słonecznikowym i rzepakowym.

W dokumencie Wykrywanie zafałszowań oliwy z oliwek (Stron 128-136)