D o r o t a S t a d n i c k a
M ETODA 6 S IGMA
FORMUŁOWANIE HIPOTEZ
WYKŁAD 8
Dorota Stadnicka
Hipoteza statystyczna
Hipoteza statystyczna jest to twierdzenie, które wymaga uprawdopodobnienia.
Można udowodnić, że twierdzenie jest prawdziwe dla populacji po zbadaniu całej populacji.
Ponieważ zbadanie całej populacji jest niemożliwe lub zbyt kosztowne hipotezę można uprawdopodobnić opierając się na
losowo wybranej próbce.
W oparciu o próbkę dokonuje się wnioskowania dotyczącego całej populacji.
Testowanie hipotez – procedura postępowania
Hipoteza statystyczna wymaga uprawdopodobnienia.
Etap postępowania Przykład
Postawienie hipotezy zerowej H0: Nie ma różnicy pomiędzy wartościami średnimi z próbki A i próbki B
Postawienie hipotezy alternatywnej H1: Istnieje różnica pomiędzy wartościami średnimi z próbki A i próbki B
Ustalenie wartości p p = 0,05
Wybór testu do zbadania hipotezy Tabela 1 Zebranie danych i przeprowadzenie
testu
Uzyskanie wartości p
Przyjęcie lub
odrzucenie hipotezy zerowej
p > 0,05 p < 0,05
Tabela 1
Testy statystyczne
Y
Dane ciągłe
Y
Dane atrubutowe
X
Dane atrybutowe
Test T (dla średnich) Test F (dla wariancji)
ANOVA GLM
Proporcje Test Chi2
X
Dane ciągłe
Analiza korelacji
Analiza regresji -
Tabela 1
Cel testowania hipotez
Hipotezy testujemy, aby ustalić:
- które czynniki (x) wpływają na y - zidentyfikować istotne x
- mieć podstawę do dalszych analiz lub do podjęcia decyzji Hipoteza zerowa:
- Jest często odwrotna do tego, co chcemy udowodnić
Poprzez obalenie hipotezy zerowej (H0) uprawdopodabniamy hipotezę alternatywną (H1) .
Wartość p-value (probability value) jest wynikiem testowania hipotez.
Wartość p-value
Wartość p-value = 1 oznacza, że należy zaakceptować hipotezę H0 Wartość p-value = 0 oznacza, że należy odrzucić hipotezę H0
Wartość p-value zawiera się pomiędzy 0 a 1
Ponieważ (alpha), czyli poziom zaufania przyjmujemy na poziomie 0,05 to wartość p-value = 0,05 jest wartością graniczną, która pozwala
przyjąć lub odrzucić hipotezę H0
Jeżeli = 0,05 to istnieje 5% prawdopodobieństwo, że niesłusznie odrzucimy hipotezę H0
Mamy jednak 95% zaufania, że podejmujemy słuszną decyzję
Wartość p-value
Jeżeli wartość p-value > 0,05 oznacza to, że należy zaakceptować hipotezę H0
Jeżeli wartość p-value < 0,05 oznacza to, że należy odrzucić hipotezę H0 i przyjąć hipotezę H1
= 0,05
0 1
H1 H0
Dopóki nie udowodnimy hipotezy H1 jest ważna hipoteza H0
Przykładowe hipotezy
Hipoteza H0: Nie ma różnicy pomiędzy średnią liczbą wyrobów niezgodnych wytwarzanych przez operatora A i B.
Hipoteza H1: Istnieje różnica pomiędzy średnią liczbą wyrobów niezgodnych wytwarzanych przez operatora A i B.
Jeżeli p-value < 0,05 to hipoteza H0 jest odrzucana, a przyjmowana jest hipoteza H1
Wniosek: Operator ma wpływ na liczbę wyrobów niezgodnych.
Przykładowe hipotezy
Hipoteza H0: Nie ma różnicy pomiędzy średnim czasem oczekiwania w kolejce do kasy A i B.
Hipoteza H1: Istnieje różnica pomiędzy średnim czasem oczekiwania w kolejce do kasy A i B.
Jeżeli p-value < 0,05 to hipoteza H0 jest odrzucana, a przyjmowana jest hipoteza H1
Wniosek: Na czas oczekiwania w kolejce do kasy ma wpływ to, do której kasy się czeka.
Przykładowe hipotezy
Hipoteza H0: Nie ma różnicy pomiędzy średnim czasem realizacji procesu na tokarce A i B.
Hipoteza H1: Istnieje różnica pomiędzy średnim czasem realizacji procesu na tokarce A i B.
Jeżeli p-value < 0,05 to hipoteza H0 jest odrzucana, a przyjmowana jest hipoteza H1
Wniosek: Na czas realizacji procesu toczenia ma wpływ to, na jakiej tokarce proces toczenia jest realizowany.
Możliwe wnioski – przykład 1
PRAWDZIWA H0:
Podejrzany jest niewinny
PRAWDZIWA H1:
Podejrzany jest winny
H0 przyjęta Sędzia stwierdza, że podejrzany jest
niewinny
Dobra decyzja
Podejrzany został słusznie uniewinniony
Błąd II-go rodzaju Błędna akceptacja hipotezy Winny przestępstwa nie idzie
do więzienia
Błędna decyzja sędziego
H1 przyjęta Sędzia stwierdza, że podejrzany jest
winny
Błąd I-go rodzaju Błąd fałszywego alarmu Niewinna osoba idzie do
więzienia
Błędna decyzja sędziego
Dobra decyzja
Podejrzany został słusznie skazany
Możliwe wnioski – przykład 2
PRAWDZIWA H0:
Nie ma różnicy pomiędzy jakością wyrobów
produkowanych na maszynie A i B
PRAWDZIWA H1:
Istnieje różnica pomiędzy jakością wyrobów produkowanych na
maszynie A i B H0 przyjęta
Podjęto decyzję o dalszym stosowaniu
posiadanych maszyn
Dobra decyzja
Maszyna nie ma wpływu na jakość produkowanych na niej wyrobów
Błąd II-go rodzaju Błędna akceptacja hipotezy Dalsze stosowanie dotychczas stosowanych maszyn powoduje utrzymanie produkcji wyrobów
niezgodnych
H1 przyjęta Podjęto decyzję o
zakupie nowej maszyny
Błąd I-go rodzaju Błąd fałszywego alarmu
Dokonano niepotrzebnego zakupu Poniesiono niepotrzebne koszty
Dobra decyzja
Podjęto słuszną decyzję o zakupie nowej maszyny, co pozwoli na
zmniejszenie liczby wyrobów wadliwych
Przykładowe hipotezy
Hipoteza H0: Nie ma różnicy pomiędzy rozkładem wartości parametru A a rozkładem normalnym.
Hipoteza H1: Istnieje różnica pomiędzy rozkładem wartości parametru A a rozkładem normalnym.
Jeżeli p-value > 0,05 to przyjmowana jest hipoteza H0 Wniosek: Rozkład wartości parametru A jest rozkładem normalnym.
Dziękuję za uwagę
Dr hab. inż. Dorota Stadnicka, Prof. PRz Politechnika Rzeszowska
Wydział Budowy Maszyn i Lotnictwa tel. +48 17 865 1452
e-mail: dorota.stadnicka@prz.edu.pl