4. Test Studenta dla dwóch prób niezależnych

(1)

Wokół testu Studenta

1. Wprowadzenie

Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych Rozkład normalny N (µ, σ²), µ ∈ R, σ²> 0

gęstość:

f (x) = 1 σ√

2π e⁻^(x−µ)2^2σ2

Niech a ∈ R \ {0}, b ∈ R, X ∼ N (µ, σ²), Y ∼ N (ν, τ²), µ, ν ∈ R, σ², τ² > 0 i niech zmienne losowe X i Y będą niezależne. Wówczas:

EX = µ,

V ar(X) = σ²,

X + b ∼ N(µ + b, σ²),

aX ∼ N(aµ, a²σ²),

^X−µ_σ ∼ N (0, 1),

X + Y ∼ N(µ + ν, σ²+ τ²).

Rozkład N (0, 1) nazywamy standardowym rozkładem normalnym. Jego gęstość jest postaci:

f (x) = 1

√2π e⁻^x2² .

Gęstość rozkładu N (0, 1) jest funkcją parzystą.

Niech ξ ∼ N (0, 1), µ ∈ R, σ²> 0. Wówczas σξ + µ ∼ N (µ, σ²).

Φ – dystrybuanta rozkładu N (0, 1)

∀ x ∈ R Φ(−x) = 1 − Φ(x) Φ⁻¹ – funkcja kwantylowa rozkładu N (0, 1)

∀ p ∈ (0, 1) Φ⁻¹(p) = −Φ⁻¹(1 − p) Niech Φ_µ,σ2 oznacza dystrybuantę rozkładu N (µ, σ²), µ ∈ R, σ²> 0. Wówczas

∀ x ∈ R Φ_µ,σ2(x) = Φ x − µ σ

.

Niech Φ⁻¹_µ,σ2 oznacza funkcję kwantylową rozkładu N (µ, σ²), µ ∈ R, σ²> 0. Wówczas

∀ p ∈ (0, 1) Φ⁻¹_µ,σ2(p) = σΦ⁻¹(p) + µ.

Rozkład chi-kwadrat z ν stopniami swobody χ²_ν, ν ∈ N⁺

Niech ξ1, ξ2, . . . , ξν ∼ N (0, 1) będą niezależnymi zmiennymi losowymi. Wówczas ξ²₁+ ξ²₂+ . . . + ξ²_ν∼ χ²_ν.

Niech X ∼ χ²_ν i Y ∼ χ²_κ, ν, κ ∈ N⁺, będą niezależnymi zmiennymi losowymi. Wówczas

P (X ≥ 0) = 1,

EX = ν,

V ar(X) = 2ν,

X + Y ∼ χ²ν+κ.

(2)

χ²_ν – dystrybuanta rozkładu χ²_ν, (χ²_ν)⁻¹ – funkcja kwantylowa rozkładu χ²_ν

Wzór na gęstość rozkładu chi-kwadrat przy zastosowaniu w nim funkcji γ Eulera zachowuje sens także dla niecałkowi- tej liczby stopni swobody, a zatem w oparciu o niego możemy zdefiniować rozkład chi-kwadrat z liczbą stopni swobody będącą dowolną liczbą dodatnią.

Rozkład Studenta z ν stopniami swobody tν, ν ∈ N⁺

Niech ξ0, ξ1, ξ2, . . . , ξν ∼ N (0, 1) będą niezależnymi zmiennymi losowymi. Wówczas ξ0

rξ₁²+ ξ₂²+ . . . + ξ_ν² ν

∼ tν.

Równoważne: niech ξ0∼ N (0, 1) i χ ∼ χ²_ν będą niezależnymi zmiennymi losowymi. Wówczas ξ0

r χ ν

∼ tν.

Gęstość rozkładu tν jest funkcją parzystą.

Niech X ∼ t_ν. Wówczas EX = 0.

t_ν – dystrybuanta rozkładu tν

∀ x ∈ R t_ν(−x) = 1 − t_ν(x) t⁻¹_ν – funkcja kwantylowa rozkładu tν

∀ p ∈ (0, 1) t⁻¹_ν (p) = −t⁻¹_ν (1 − p) Niech Xn∼ tn, n ∈ N⁺. Wówczas Xn

−−−−→D

n→∞ N (0, 1).

Wzór na gęstość rozkładu Studenta przy zastosowaniu w nim funkcji γ Eulera zachowuje sens także dla niecałkowitej liczby stopni swobody, a zatem w oparciu o niego możemy zdefiniować rozkład Studenta z liczbą stopni swobody będącą dowolną liczbą dodatnią.

Rozkład Fishera-Snedecora z ν i κ stopniami swobody Fν,κ, ν, κ ∈ N+

Niech ξ1, ξ2, . . . , ξν, ζ1, ζ2, . . . , ζκ∼ N (0, 1) będą niezależnymi zmiennymi losowymi. Wówczas ξ₁²+ ξ²₂+ . . . + ξ²_ν

ν

ζ₁²+ ζ₂²+ . . . + ζ_κ² κ

∼ Fν,κ.

Równoważne: niech χ1∼ χ²_ν i χ2∼ χ²_κ będą niezależnymi zmiennymi losowymi. Wówczas χ1

χν2

κ

∼ Fν,κ.

Niech X ∼ F_ν,κ. Wówczas

P (X ≥ 0) = 1,

1/X ∼ Fκ,ν.

Fν,κ – dystrybuanta rozkładu Fν,κ, F_ν,κ⁻¹ – funkcja kwantylowa rozkładu Fν,κ

∀ p ∈ (0, 1) F_ν,κ⁻¹(p) = 1 Fκ,ν⁻¹(1 − p) Niech Xn∼ Fν,n, ν, n ∈ N⁺. Wówczas νXn

−−−−→D n→∞ χ²_ν.

Twierdzenie Fishera. Niech X1, X2, . . . , Xn będzie próbą z rozkładu N (µ, σ²). Wówczas statystyki

X = 1 n

n

X

i=1

Xi i

n

X

i=1

(Xi− X)²

(3)

są niezależne. Ponadto

Pn

i=1(Xi− X)²

σ² ∼ χ²_n−1.

2. Test Studenta dla jednej próby

Niech X₁, X₂, . . . , X_n będzie próbą z rozkładu N (µ, σ²), przy czym µ ∈ R i σ² > 0 uznajemy za nieznane.

Rozważamy następujący problem testowania hipotez:

H : µ = µ₀ vs K : µ > µ₀ lub

H : µ = µ0 vs K : µ < µ0

lub

H : µ = µ0 vs K : µ 6= µ0. Niech X = 1

n

X

i=1

Xi. Ze względu na to, że mamy EX = µ, test oprzemy na różnicy X − µ0:

jeśli różnica X − µ0 jest duża (znacznie większa od 0), to przemawia to za prawdziwością hipotezy µ > µ0,

jeśli różnica X − µ0 jest mała (znacznie mniejsza od 0), to przemawia to za prawdziwością hipotezy µ < µ0,

jeśli różnica X − µ0 jest duża lub mała (oddalona od 0), to przemawia to za prawdziwością hipotezy µ 6= µ0. Jako że X ∼ N (µ,^σ_n²), to przy H zachodzi X ∼ N (µ0,^σ_n²), a zatem

X − µ0

rσ² n

∼ N (0, 1).

Ponieważ jednak nie znamy wartości σ², spróbujemy zastąpić σ² statystyką S² = 1 n − 1

n

X

i=1

(Xi − X)² czyli tzw.

wariancją próbkową nieobciążoną (jako że ES²= σ²). Rozważmy statystykę

W = S²

n σ²

n

=S² σ² =

1 n − 1

n

X

i=1

(X_i− X)²

σ² =

n

X

i=1

(X_i− X)² σ² n − 1 .

Zgodnie z twierdzeniem Fishera licznik ostatniego wyrażenia jest zmienną losową o rozkładzie χ²_n−1niezależną odX, zatem przy H

T =

X − µ₀ rσ²

√ n

W = X − µ0

S

√n ∼ t_n−1,

gdzie S =√

S². W innej postaci:

T = X − µ₀ v

u u t

n

X

i=1

(Xi− X)²

pn(n − 1).

H K Zbiór krytyczny p-wartość

µ = µ0 µ > µ0 (t⁻¹_n−1(1 − α), ∞) 1 − tn−1(T )

µ = µ0 µ < µ0 (−∞, t⁻¹_n−1(α)) = (−∞, −t⁻¹_n−1(1 − α)) tn−1(T )

µ = µ₀ µ 6= µ₀ (−∞, −t⁻¹_n−1(1 − ^α₂)) ∪ (t_n−1⁻¹ (1 −^α₂), ∞) 2(1 − t_n−1(|T |)) = 2 min(t_n−1(T ), 1 − t_n−1(T ))

(4)

3. Test Studenta dla par obserwacji

Niech ^X_Y¹

1, ^X_Y²

2, . . . , ^X_Yⁿ

n będzie próbą z ustalonego rozkładu, którego wartość oczekiwana istnieje. Niech Zi = Xi− Yi, i = 1, 2, . . . , n. Zakładamy, że Z1, Z2, . . . , Zn ∼ N (µ, σ²), przy czym przyjmujemy, że µ ∈ R i σ² > 0 nie są znane.

Niech EX1 = µ1, EY1= µ2, przy czym zakładamy, że µ1, µ2 ∈ R nie są znane. Rozważamy następujący problem testowania hipotez:

H : µ₁− µ2= µ₀ vs K : µ₁− µ2> µ₀ lub

H : µ1− µ2= µ0 vs K : µ1− µ2< µ0

lub

H : µ1− µ2= µ0 vs K : µ1− µ26= µ0,

gdzie µ0 ∈ R jest ustaloną liczbą. Zauważmy, że µ1− µ2 = µ, a zatem rozważany problem testowania hipotez jest równoważmy problemowi

H : µ = µ0 vs K : µ > µ0

lub

H : µ = µ0 vs K : µ < µ0

lub

H : µ = µ0 vs K : µ 6= µ0

i może być rozwiązany za pomocą testu Studenta dla jednej próby Z1, Z2, . . . , Zn. Często rozważa się zagadnienie z µ0= 0. Wówczas rozważane hipotezy przyjmują postać:

H : µ1= µ2 vs K : µ1> µ2

lub

H : µ₁= µ₂ vs K : µ₁< µ₂ lub

H : µ1= µ2 vs K : µ16= µ2.

4. Test Studenta dla dwóch prób niezależnych

Niech będą dane dwie niezależne próby: X1, X2, . . . , Xn₁z rozkładu N (µ1, σ²) i Y1, Y2, . . . , Yn₂z rozkładu N (µ2, σ²), przy czym µ1, µ2∈ R i σ² uznajemy za nieznane. Rozważamy następujący problem testowania hipotez:

H : µ1− µ2= µ0 vs K : µ1− µ2> µ0

lub

H : µ₁− µ₂= µ₀ vs K : µ₁− µ₂< µ₀ lub

H : µ1− µ2= µ0 vs K : µ1− µ26= µ0, gdzie µ0∈ R jest ustaloną liczbą. Niech

X = 1 n₁

n₁

X

i=1

X_i i Y = 1

n₂

X

j=1

Y_j.

Ze względu na to, że EX = µ1i EY = µ2, a zatem E(X − Y ) = µ1− µ2, test oprzemy na statystyce X − Y − µ0:

jeśli statystyka X − Y − µ0 jest duża (znacznie większa od 0), to przemawia to za prawdziwością hipotezy µ1− µ2> µ0,

jeśli statystyka X − Y − µ0 jest mała (znacznie mniejsza od 0), to przemawia to za prawdziwością hipotezy µ1− µ2< µ0,

jeśli statystyka X − Y − µ0 jest duża lub mała (oddalona od 0), to przemawia to za prawdziwością hipotezy µ₁− µ₂6= µ₀.

(5)

Skoro X ∼ N (µ1,^σ_n²

1) i Y ∼ N (µ2,^σ_n²

2) to X − Y ∼ N (µ1− µ2,^σ_n²

1 +^σ_n²

2), a zatem przy H zachodzi X − Y ∼ N (µ0,^σ_n²

1 +^σ_n²

2), czyli

X − Y − µ₀ s

σ² 1 n₁ + 1

n₂

∼ N (0, 1).

Ponieważ jednak nie znamy wartości σ², spróbujemy zastąpić σ²statystyką

S_p²=

n1

X

i=1

(X_i− X)²+

n2

X

j=1

(Y_j− Y )² n1+ n2− 2

Niech

W = S_p² 1

n1

+ 1 n2

σ² 1 n1

+ 1 n2

= S_p² σ² =

n1

X

i=1

(X_i− X)²

σ² +

n2

X

j=1

(Y_j− Y )² σ² n1+ n2− 2 .

Ułamki w liczniku ostatniego wyrażenia są niezależnymi zmiennymi losowymi o rozkładach odpowiednio χ²_n₁₋₁ i χ²_n₂₋₁ (zgodnie z twierdzeniem Fishera), zatem ich suma jest zmienną losową o rozkładzie χ²_n₁_+n₂₋₂. Łatwo można stąd wywnioskować, że

EW = n1+ n2− 2

n₁+ n₂− 2 = 1 i V ar(W ) =2(n1+ n2− 2)

(n₁+ n₂− 2)² = 2 n₁+ n₂− 2.

W szczególności z tego, że EW = 1, wynika, że ES_p²= σ², czyli że S²_p jest nieobciążonym estymatorem σ². Statystyka S_p²bywa nazywana wspólną wariancją próbkową (ang. pooled sample variance).

Zgodnie z twierdzeniem Fishera zmienna losowa W jest niezależna od zmiennych losowychX i Y , zatem przy H

T =

X − Y − µ0

s σ² 1

n1

+ 1 n2

√

W = X − Y − µ₀

s S_p² 1

n₁+ 1 n₂

= X − Y − µ₀ Sp

r 1 n1

+ 1 n2

∼ tn1+n2−2,

gdzie Sp=q

S_p². W innej postaci:

T = X − Y − µ0

v u u u t

1 n1

+ 1 n2





n₁

X

i=1

(Xi− X)²+

n₂

X

j=1

(Yj− Y )²





√n1+ n2− 2.

µ₁− µ2= µ₀ µ₁− µ2> µ₀ (t⁻¹_n

1+n2−2(1 − α), ∞) 1 − t_n₁_+n₂₋₂(T ) µ1− µ2= µ0 µ1− µ2< µ0 (−∞, t⁻¹_n₁_+n₂₋₂(α)) = (−∞, −t⁻¹_n₁_+n₂₋₂(1 − α)) tn₁+n₂−2(T ) µ₁− µ2= µ₀ µ₁− µ26= µ0 (−∞, −t⁻¹_n

1+n₂−2(1 −^α₂)) ∪ (t⁻¹_n

1+n₂−2(1 −^α₂), ∞) 2(1 − tn₁+n₂−2(|T |)) =

=2 min(t_n1+n2−2(T ),1−t_n1+n2−2(T ))

Często powyższy test stosuje się dla µ0= 0. Wówczas rozważane hipotezy przyjmują postać:

H : µ₁= µ₂ vs K : µ₁> µ₂ lub

H : µ1= µ2 vs K : µ1< µ2

lub

H : µ₁= µ₂ vs K : µ₁6= µ₂.

(6)

5. Test Welcha

Niech będą dane dwie niezależne próby: X1, X2, . . . , Xn₁z rozkładu N (µ1, σ²₁) i Y1, Y2, . . . , Yn₂z rozkładu N (µ2, σ²₂), przy czym µ1, µ2∈ R i σ²1, σ₂²> 0 uznajemy za nieznane. Rozważamy następujący problem testowania hipotez:

H : µ₁− µ2= µ₀ vs K : µ₁− µ2> µ₀ lub

H : µ₁− µ₂= µ₀ vs K : µ₁− µ₂< µ₀ lub

H : µ1− µ2= µ0 vs K : µ1− µ26= µ0,

gdzie µ0∈ R jest ustaloną liczbą. Tak postawiony problem testowania (tj. bez założenia, że σ1²= σ²₂), nazywany jest problemem Behrensa-Fishera.

Niech

X = 1 n₁

n₁

X

i=1

Xi i Y = 1

n₂

X

j=1

Yj.

Tak jak przy teście Studenta dla dwóch prób nie zależnych, ze względu na to, że EX = µ1 i EY = µ2, a zatem E(X − Y ) = µ1− µ2, test oprzemy na statystyce X − Y − µ0:

jeśli statystyka X − Y − µ0 jest duża (znacznie większa od 0), to przemawia to za prawdziwością hipotezy µ1− µ2> µ0,

jeśli statystyka X − Y − µ0 jest mała (znacznie mniejsza od 0), to przemawia to za prawdziwością hipotezy µ1− µ2< µ0,

jeśli statystyka X − Y − µ0 jest duża lub mała (oddalona od 0), to przemawia to za prawdziwością hipotezy µ₁− µ26= µ0.

Skoro X ∼ N (µ1,^σ_n¹²

1) i Y ∼ N (µ2,^σ_n²²

2) to X − Y ∼ N (µ1− µ2,^σ_n¹²

1 +^σ_n²²

2), a zatem przy H zachodzi X − Y ∼ N (µ0,^σ_n¹²

1 +^σ_n²²

2), czyli

X − Y − µ0

s σ₁² n₁ +σ²₂

n₂

∼ N (0, 1).

Ponieważ jednak nie znamy wartości σ₁² i σ₁², spróbujemy zastąpić σ₁²i σ₂²statystykami odpowiednio

S₁²= 1 n1− 1

n1

X

i=1

(Xi− X)² i S₂²= 1 n2− 1

n2

X

j=1

(Yj− Y )².

S₁² jest nieobciążonym estymatorem σ₁² i podobnie S₁² jest nieobciążonym estymatorem σ²₁. Z twierdzenia Fishera wiemy, że _σ¹2

1

Pn1

i=1(X_i− X)²∼ χ²_n

1−1. W takim razie V ar S₁² = V ar

σ₁² n₁− 1

Pn₁

i=1(Xi− X)² σ₁²

= σ₁⁴

(n₁− 1)²V ar

Pⁿ1

i=1(Xi− X)² σ²₁

= σ₁⁴

(n₁− 1)²· 2(n1− 1) = 2σ₁⁴ n₁− 1. Podobnie _σ¹2

2

Pn2

j=1(Yj− Y )²∼ χ²_n₂₋₁. W takim razie

V ar S₂² = V ar σ₂² n2− 1

Pn2

j=1(Yj− Y )² σ²₂

!

= σ₁⁴

(n2− 1)²V ar Pn2

j=1(Yj− Y )² σ₂²

!

= σ₂⁴

(n2− 1)²· 2(n2− 1) = 2σ₂⁴ n2− 1. Niech

W = S₁² n1

+S²₂ n2

σ₁² n1

+σ²₂ n2

.

(7)

Ze względu na to, że ES₁²= σ₁² i ES₂²= σ²₂, widzimy, że EW = 1. Statystyki S₁² i S₂² są niezależne. Stąd

V ar(W ) = V ar S₁² n1

+S₂² n2

σ²₁ n1

+σ₂² n2

= 1

n²₁V ar(S₁²) + 1

n²₂V ar(S₂²)

σ₁² n1

+σ²₂ n2

² =

1 n²₁ · 2σ⁴₁

n1− 1+ 1

n²₂ · 2σ₂⁴ n2− 1

σ²₁ n1

+σ₂² n2

² .

Rozkład statystyki W nie należy do rodziny rozkładów chi-kwadrat, jednak będziemy się starali przybliżyć ten roz- kład rozkładem z rodziny rozkładów chi-kwadrat. Niech ν^∗ oznacza liczbę stopni swobody poszukiwanego rozkładu.

Wyznaczymy ją w oparciu o równanie V ar(W ) = _ν²∗ (na podobieństwo rozważań w konstrukcji testu Studenta dla dwóch prób niezależnych). W takim razie

1

n²₁ · 2σ₁⁴ n1− 1 + 1

n²₂ · 2σ⁴₂ n2− 1

σ₁² n1

+σ²₂ n2

² = 2

ν^∗, czyli ν^∗ =

σ²₁ n1

+σ₂² n2

² 1

n²₁ · σ₁⁴ n1− 1+ 1

n²₂ · σ⁴₂ n2− 1

.

Ostateczny wynik otrzymujemy, zastępując σ₁² i σ₂²statystykami S₁² i S₂² odpowiednio:

ν^∗=

S₁² n1

+S²₂ n2

² 1

n²₁ · S₁⁴ n1− 1+ 1

n²₂ · S₂⁴ n2− 1

, czyli ν^∗=

S²₁ n1

+S₂² n2

²

S₁² n1

² n1− 1 +

S₂² n2

² n2− 1

.

Ostatnie równanie nosi nazwę równania Welcha-Satterthwaite’a, stąd i test, który konstruujemy bywa nazywany testem Welcha-Satterthwaite’a. Zmienna losowa W jest niezależna od zmiennych losowychX i Y , zatem statystyka

T =

X − Y − µ0

s σ₁² n₁ +σ₂²

n₂

√W =X − Y − µ0

s S₁² n1

+S₂² n2

przy H ma w przybliżeniu rozkład t_ν^∗. ν^∗ możemy zastąpić przez [ν^∗]. W innej postaci:

T = X − Y − µ0

s Pn1

i=1(X_i− X)² n1(n1− 1) +

Pn2

j=1(Y_j− Y )² n2(n2− 1)

.

µ₁− µ₂= µ₀ µ₁− µ₂> µ₀ (t⁻¹_ν∗(1 − α), ∞) 1 − t_ν^∗(T ) µ₁− µ2= µ₀ µ₁− µ2< µ₀ (−∞, t⁻¹_ν∗(α)) = (−∞, −t⁻¹_ν∗(1 − α)) t_n−1(T ) µ1− µ2= µ0 µ1− µ26= µ0 (−∞, −t⁻¹_ν∗(1 − ^α₂)) ∪ (t⁻¹_ν∗(1 −^α₂), ∞) 2(1 − tν^∗(|T |)) =

= 2 min(t_ν^∗(T ), 1 − t_ν^∗(T ))

Często powyższy test stosuje się dla µ₀= 0. Wówczas rozważane hipotezy przyjmują postać:

H : µ1= µ2 vs K : µ1> µ2

lub

H : µ1= µ2 vs K : µ1< µ2

lub

H : µ1= µ2 vs K : µ16= µ2.

(8)

6. Porównanie wariancji w dwóch próbach pochodzących z rozkładów normalnych

Niech będą dane dwie niezależne próby: X1, X₂, . . . , X_n₁z rozkładu N (µ1, σ²₁) i Y₁, Y₂, . . . , Y_n₂z rozkładu N (µ2, σ²₂), przy czym µ₁, µ₂∈ R i σ²1, σ₂²> 0 uznajemy za nieznane. Rozważamy następujący problem testowania hipotez:

H : σ₁²/σ₂²= r vs K : σ₁²/σ₂²> r lub

H : σ₁²/σ₂²= r vs K : σ₁²/σ₂²< r lub

H : σ²₁/σ²₂= r vs K : σ₁²/σ²₂6= r, gdzie r > 0 jest ustaloną liczbą.

Niech

X = 1 n₁

n₁

X

i=1

Xi, X = 1 n₂

n₂

X

j=1

Yj, S₁²= 1 n₁− 1

n₁

X

i=1

(Xi− X)² i S²₂= 1 n₂− 1

n₂

X

j=1

(Yj− Y )².

Ze względu na to, że ES₁²= σ₁² i ES₂²= σ²₂, a zatem ES₁²/ES₂²= σ²₁/σ₂², test oprzemy na statystyce T =1

r·S₁² S₂² :

jeśli statystyka T jest duża (znacznie większa od 1), to przemawia to za prawdziwością hipotezy σ²1/σ₂²> r,

jeśli statystyka T jest mała (znacznie mniejsza od 1), to przemawia to za prawdziwością hipotezy σ1²/σ₂²< r,

jeśli statystyka T jest duża lub mała (oddalona od 1), to przemawia to za prawdziwością hipotezy σ1²/σ₂²6= r.

Ponieważ

T = 1 n1− 1 ·

Pn₁

i=1(X_i− X)² σ₁² 1

n2− 1 · Pn₂

j=1(Y_j− Y )² σ₂²

,

przy czym zgodnie z twierdzenie Fishera

Pn1

i=1(Xi−X)²

σ₁² ∼ χ²_n₁₋₁ i

Pn2

j=1(Y_j−Y )²

σ₂² ∼ χ²_n₂₋₁ i statystyki te są niezależne, to przy H mamy T ∼ F_n₁_−1,n₂₋₁. W innej postaci:

T = 1 r·

1 n1− 1

n₁

X

i=1

(Xi− X)² 1

n₂− 1

n₂

X

j=1

(Yj− Y )² ,

σ²₁/σ₂²= r σ²₁/σ²₂> r (F_n⁻¹

1−1,n2−1(1 − α), ∞) 1 − F_n₁_−1,n₂₋₁(T ) σ²₁/σ₂²= r σ²₁/σ²₂< r (−∞, F_n⁻¹

1−1,n2−1(α)) Fn₁−1,n2−1(T )

σ²₁/σ₂²= r σ²₁/σ₂²6= r (−∞, F_n⁻¹₁_−1,n₂₋₁(^α₂)) ∪ (F_n⁻¹₁_−1,n₂₋₁(1 −^α₂), ∞) 2 min(Fn₁−1,n2−1(T ), 1 − Fn₁−1,n2−1(T ))

Często powyższy test stosuje się dla r = 1. Wówczas rozważane hipotezy przyjmują postać:

H : σ²₁= σ²₂ vs K : σ₁²> σ²₂ lub

H : σ²₁= σ²₂ vs K : σ₁²< σ²₂ lub

H : σ²₁= σ₂² vs K : σ₁²6= σ²₂.

(9)

Sytuacja, w której nie wszystkie obserwacje pochodzą z rozkładów o tej samej wariancji, nazywamy heteroskeda- stycznością danych (w przeciwieństwie do homoskedastyczności danych, gdy wszystkie obserwacje pochodzą z rozkła- dów o tej samej wariancji).

W praktyce zależności od dopasowania danych do rozkładów normalnych, postulowanego ilorazu wariancji i po- stulowanej różnicy wartości oczekiwanych w celu porównania wartości oczekiwanych dwóch rozkładów zaleca się prze- prowadzenie jednej z dwóch procedur:

przetestowanie równości wariancji w pierwszym kroku; jeśli brak podstaw do odrzucenia hipotezy o równości wariancji, wykonujemy test Studenta dla dwóch prób niezależnych, jeśli należy odrzucić hipotezę o równości wariancji, wykonujemy test Welcha,

wykonanie od razu testu Welcha bez uprzedniego testowania równości wariancji.

7. Funkcje w pakiecie R

Do przeprowadzenia testu Studenta dla jednej próby, testu Studenta dla par obserwacji, testu Studenta dla dwóch prób niezależnych i testu Welcha w R służy funkcja t.test.

Jeśli podamy tylko argument x, pozostawiając y=NULL, a zatem podamy tylko jedną próbę, wykona się test Studenta dla jednej próby.

Jeśli podamy argumenty x i y oraz paired = TRUE (domyślna wartość: paired = FALSE), wykona się test Stu- denta dla par obserwacji.

Jeśli podamy argumenty x i y oraz var.equal = TRUE (domyślna wartość: var.equal = FALSE), wykona się test Studenta dla dwóch prób niezależnych.

Jeśli podamy argumenty x i y oraz pozostawimy domyślną wartość var.equal = FALSE, wykona się test Welcha.

alternative = "two.sided" (na ogół wartość domyślna) oznacza alternatywę postaci µ1− µ26= µ0,

alternative = "greater" (równoważnie: alternative = "g") oznacza alternatywę postaci µ1− µ2> µ0,

alternative = "less" (równoważnie: alternative = "l") oznacza alternatywę postaci µ1− µ2< µ0.

W argumencie mu umieszczamy µ0.

W przypadku testów wymagających podania dwóch prób przy podaniu danych możemy posłużyć się także formułą postaci lhs~rhs, gdzie lhs określa wektor danych zaś rhs służy do podziału danych na dwie grupy.

Do przeprowadzenia testu dla wariancji służy funkcja var.test.

alternative = "two.sided" (na ogół wartość domyślna) oznacza alternatywę postaci σ1²/σ²₂6= r,

alternative = "greater" (równoważnie: alternative = "g") oznacza alternatywę postaci σ²1/σ²₂> r,

alternative = "less" (równoważnie: alternative = "l") oznacza alternatywę postaci σ1²/σ₂²< r.

W argumencie ratio umieszczamy r.

Przy podaniu danych możemy posłużyć się także formułą postaci lhs~rhs, gdzie lhs określa wektor danych zaś rhs służy do podziału danych na dwie grupy.