• Nie Znaleziono Wyników

Ocena zdolności prognostycznej próbek danych – analiza regresji, wariancji i korelacji

W dokumencie Index of /rozprawy2/11355 (Stron 89-97)

6 OCENA WPŁYWU ZUBOŻENIA NA EFEKTYWNOŚĆ EKONOMICZNĄ PROCESU PRODUKCYJNEGO

6.2 M ETODYKA OCENY WPŁYWU ZANIECZYSZCZENIA UROBKU NA EFEKTYWNOŚĆ EKONOMICZNĄ WYDOBYCIA WĘGLA

6.2.3 Statystyczna ocena danych empirycznych

6.2.3.1 Ocena zdolności prognostycznej próbek danych – analiza regresji, wariancji i korelacji

Dobór właściwego modelu matematycznego (statystycznego) stanowi klucz w pro-gnozowaniu przyszłych tendencji (kolejnych obserwacji) na postawie danych empi-rycznych. W badaniach analiza regresji i wariancji była podstawą oceny zdolności prognostycznej danych postępu przy doborze modelu liniowego, nieliniowego lub innego typu. Wstępna ocena danych dla poszczególnych ścian (rysunki 6.20÷6.22) wskazuje na niską zdolność prognostyczną prób oraz na trudności w doborze modelu statystycznego.

W pierwszym etapie dla wszystkich ścian wykonano próbę doboru modelu liniowego. Ustalono, że zmienną prognozowaną będzie postęp, zmiennymi niezależnymi odpowiednio: masa urobku ze ściany, wartość opałowa oraz zawartość procentowa popiołu.

Wyniki analizy regresji i wariancji w zbiorach danych empirycznych przestawiono w kolejnych tabelach (tab. 6.9÷6.11). Analizy te wykonano przy pomocy programu Statistica.

Tabela 6.9. Analiza regresji, wariancji i korelacji w zbiorze danych ściany 3/VI (G6)

(opracowanie własne)

Wyszczególnienie: korelacje Postęp Masa Wartość opałowa Zawartość popiołu

Postęp 1,00 0,81 0,06 -0,04

Masa 0,81 1,00 0,00 0,02

Wartość opałowa 0,06 0,00 1,00 -0,99

Rys. 6.20. Wykresy odchyleń od normalności i normalność reszt w zbiorze danych dla ściany

3/VI (opracowanie własne)

Analizując wyniki modelu regresji liniowej dla danych ze ściany 3/VI, można zauważyć, iż poziom wyjaśnienia zmienności postępu, mierzony współczynnikiem determinacji R2, wynosi około 57%. Jest to zbyt niska wartość współczynnika determinacji, aby można było stwierdzić, iż taki model cechuje się odpowiednią zdolnością prognostyczną i właściwym opisem postępu przy pomocy wskazanych zmiennych niezależnych (jedynym parametrem istotnym statystycznie jest masa urobku pochodząca z tej ściany poziom istotności testu t-Studenta wynosi 0,0000). Na silny związek masy z postępem wskazuje również macierz korelacji. Wartość współczynnika korelacji liniowej r - Pearsona wynosi w tym przypadku 0,81. Bardzo wysoko skorelowane ze są ze sobą również wartość opałowa i zawartość procentowa popiołu (-0,99). Pozostałe związki korelacyjne są słabe i statystycznie nieistotne. Statystyka Durbina-Watsona ukształtowała się na poziomie niższym niż 2, co może wskazywać na istnienie zależności autokorelacyjnych zmiennych (dla opóźnień równych i większych niż 1). Brak losowości i normalności składników resztowych, zilustrowany rysunkiem 6.21 obniża również zdolność prognostyczną modelu. W tabeli 6.10 przestawiono wyniki analizy regresji, wariancji i korelacji w zbiorze danych ściany 6/VII.

Tabela 6.10. Analiza regresji, wariancji i korelacji w zbiorze danych ściany 6/VII (G4)

(opracowanie własne)

Rys. 6.21. Wykresy odchyleń od normalności i normalność reszt w zbiorze danych dla ściany

6/VII (opracowanie własne)

Wyszczególnienie: korelacje Postęp Masa Wartość opałowa Zawartość popiołu

Postęp 1,00 0,89 0,14 -0,14

Masa 0,89 1,00 0,12 -0,12

Wartość opałowa 0,14 0,12 1,00 -0,98

Analizując wyniki modelu regresji liniowej dla danych ze ściany 6/VII, można zauwa-żyć, iż poziom wyjaśnienia zmienności postępu mierzony współczynnikiem determi-nacji R2 wynosi blisko 83%. Jest to relatywnie wysoka wartość współczynnika de-terminacji, przy pozytywnie zweryfikowanej testem Fishera F(3,68) istotności staty-stycznej (istotność domyślna 0,05% vs istotność krytyczna (p-value) bliska 0,000). Duży jest również udział wyjaśnionej zmienności postępu zawartego w składniku regresyjnym (suma kwadratów 372).

W tym modelu parametrem istotnym statystycznie jest jedynie masa urobku (poziom istotności testu t-Studenta wynosi 0,0000), co potwierdza również silny związek ko-relacyjny masy z postępem (0,89). Bardzo wysoko skorelowane ze sobą są również wartość opałowa i zawartość procentowa popiołu (-0,98). Pozostałe związki korela-cyjne są słabe i statystycznie nieistotne.

Statystyka Durbina-Watsona ukształtowała się na poziomie niższym niż 2, co może wskazywać na istnienie zależności autokorelacyjnych zmiennych (dla opóźnień równych i większych niż 1). Ocena losowości i normalności składników resztowych, zilustrowana rysunkiem 6.22, jest lepsza niż w przypadku ściany 3/VI.

W tabeli nr 6.11 i przy pomocy kolejnych zestawień i wykresów przestawiono wyniki analizy regresji, wariancji i korelacji w zbiorze danych ściany 1/VIII (G1).

Tabela 6.11. Analiza regresji, wariancji i korelacji w zbiorze danych ściany 1/VIII (G1)

(opracowanie własne)

Rys. 6.22. Wykresy odchyleń od normalności i normalność reszt w zbiorze danych dla ściany

opracowanie własne)

Wyszczególnienie: korelacje Postęp Masa Wartość opałowa Zawartość popiołu

Postęp 1,00 0,23 -0,29 0,33

Masa 0,23 1,00 0,34 -0,32

Wartość opałowa -0,29 0,34 1,00 -0,93

Analizując wyniki modelu regresji liniowej dla ściany 1/VIII, można zauważyć, iż poziom wyjaśnienia zmienności postępu mierzony współczynnikiem determinacji R2

wynosi zaledwie 30%. Jest to zbyt niska wartość współczynnika determinacji, aby można było stwierdzić, iż taki model cechuje się odpowiednią zdolnością prognostyczną i właściwym opisem postępu przy pomocy wskazanych zmiennych niezależnych. W modelu występują dwa parametry istotne statystycznie, tj. masa urobku i zawartość procentowa popiołu (poziom istotności testu t-Studenta wynosi odpowiednio: 0,0025 i 0,0027).

Na postawie macierzy wzajemnych korelacji można stwierdzić, iż najwyższą wzajemną korelacją cechuje się wartość opałowa i zawartość popiołu (-0,93). Związek korelacyjny postępu i zawartości popiołu wynosi (0,33), natomiast postępu i masy – tylko 0,23.

Statystyka Durbina-Watsona ukształtowała się na poziomie niższym niż 2, co może wskazywać na istnienie zależności autokorelacyjnych zmiennych (dla opóźnień równych i większych niż 1). Brak losowości i normalności składników resztowych, zilustrowany rysunkiem 6.22, obniża również zdolność prognostyczną modelu. Wykres normalności reszt jest względnie dobry (występuje niewielka ilość obserwacji odstających), przy czym na wykresie odchyleń od normalności widać układające się koncentracje, co może być powiązane z procesem autokorelacyjnym.

Wnioski z analizy statystycznej

1. Istnieje silna zależność postępu od masy urobku. Jest ona widoczna we wszystkich trzech modelach, również mimo niskiej zależności korelacyjnej w modelu ściany likwidowanej (1/VIII). Wydaje się zatem, iż w kopalni zależność ta wynika z nacisku na parametr zadaniowy – ilościowy (maksymalizacja wydobycia) kosztem parametru jakościowego, tj. maksymalizacji czystości wybierania. W praktyce może to oznaczać maksymalizację ilości produkowanego urobku, która jednak nie musi pociągać za sobą istotnego wzrostu wielkości produkowanego węgla handlowego ze względu na niską jakość nadawy.

2. Najlepiej dobranym modelem był model dla ściany 6/VII (G4), w którym wykazano jego istotność statystyczną i relatywnie wysoką zdolność prognostyczną.

3. Model statystyczny dla ściany 1/VIII, co prawda o niskiej skuteczności prognostycznej, włącza w zakres parametrów istotnych statystycznie zawartość

procentową popiołu. Należy jednak nadmienić, iż zależność korelacyjna postępu i zawartości popiołu jest różna i stosunkowo niska we wszystkich analizowanych zbiorach.

Na tej postawie stwierdza się, iż:

1. Kopalnia raczej faworyzuje kryterium ilościowe nad jakościowe w celach produkcyjnych. Maksymalizacja tonażu wydobycia jest silnie widoczna w rosnących postępach i malejącej kaloryczności wydobywanego z tych ścian urobku.

2. Uzyskane wyniki modelowe pozwalają na dalszą realizację tezy i celu pracy. Uzasadniają możliwości budowy modelu wzorcowego przodka ścianowego strugowego, którego cykl życia będzie się składał z fazy rozruchu (3 tygodnie), fazy operacyjnej wydobycia − około 34 tygodni i fazy likwidacji trwającej 4 tygodnie. Łącznie okres istnienia wzorcowego przodka (na bazie danych z kopalni o średnim okresie istnienia ścian strugowych) skalkulowano na 41 tygodni. W praktyce jednak długość poszczególnych faz różni się w zależności od wyrobiska.

3. Operację konstrukcji przodka wzorcowego, na podstawie którego wygenerowano duże zbiory danych, przeprowadzono w metodzie symulacyjnej Monte Carlo. 4. Wyciąganie daleko idących wniosków na bazie modelu liniowego może być

błędne (szczególnie dla populacji złożonej z kilku zbiorów danych w całym cyklu życia).

5. W dalszym pracach zdecydowano się zastąpić wnioskowanie na bazie modeli liniowych wnioskowaniem na bazie analizy skupień. Będzie ona stanowić postawę identyfikacji zbiorów możliwe podobnych obserwacji i określania dla nich statystyk opisowych, tj. zależności technicznych i ekonomicznych.

6.2.3.2 Przygotowanie dużych prób danych dla przodka strugowego – symulacja Monte

W dokumencie Index of /rozprawy2/11355 (Stron 89-97)