Większość zadań zamieszczonych na tej liście pochodzi z książki „Modele i metody statystyki matematycznej w zadaniach”, autorstwa Alicji Jokiel-Rokity i Ryszarda Magiery. W tym zbiorze można również znaleźć rozwiązania wielu spośród tych problemów.

22  Download (0)

Pełen tekst

(1)

Większość zadań zamieszczonych na tej liście pochodzi z książki

„Modele i metody statystyki matematycznej w zadaniach”,

autorstwa Alicji Jokiel-Rokity i Ryszarda Magiery. W tym zbiorze można również znaleźć rozwiązania wielu spośród tych problemów.

1

(2)

Wstęp do statystyki matematycznej. Lista 1. 2

Lista 1.

Rozkłady.

1. Zmienna losowa X ma rozkład wykładniczy z parametrem λ = 2. Wyznaczyć prawdopodobieństwa P (X > 1), P (X ≤ 3), P (1 ≤ X < 3), P (−5 < X < 2).

2. Zmienna losowa X ma rozkład normalny N (10, 22). Wyznaczyć prawdopodobień- stwa P (X < 13), P (X > 9), P (6 < X < 14), P (2 < X < 4).

3. Czas sprawnej pracy mierników pewnego typu (w dniach) ma rozkład N (900, 1002).

Jaki powinien być okres gwarancji, aby z prawdopodobieństwem 0.95 miernik działał przynajmniej przez okres gwarancji?

4. Niech X, Y i Z będą niezależnymi zmiennymi losowymi o rozkładach N (6, 1), N (7, 1) i N (13, 1). Obliczyć P (X + Y > Z).

5. Niech X1, . . . , Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie (oznaczenie: i.i.d.) N (µ, σ2). Wyznaczyć rozkład średniej arytmetycznej

X = X1, . . . , Xn

n .

Ile pomiarów należy wykonać, aby prawdopodobieństwo, że X odchyli się od µ o mniej niż 0.1 było większe od 0.99, jeśli σ2 = 1/4?

6. Dla dwóch niezależnych prób X1, . . . , Xm i.i.d. N (µ, σ21) i Y1, . . . , Yn i.i.d. N (µ, σ22) wyznaczyć rozkład zmiennej losowej X − Y . Następnie obliczyć

P (|X − Y | < 0.4σ), gdy m = 2n = 12 i σ12 = σ2, σ22 = 3σ2.

7. Niech X1, . . . , Xn będą niezależnymi zmiennymi losowymi o rozkładach gamma G(α1, β), . . . , G(αn, β), tzn. niech Xi ma gęstość

βα

Γ(α)xα−1e−βx1(0,∞)(x).

Udowodnić, że zmienna losowa X1+ . . . + Xnma rozkład gamma G(α1+ . . . + αn, β).

8. Niech X1, . . . , Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie N (0, 1). Wówczas zmienna losowa

χ2n:= X12+ . . . + Xn2

ma rozkład zwany rozkładem chi-kwadrat z n stopniami swobody. Wyznaczyć roz- kład zmiennej losowej X12, a następnie uzasadnić, wykorzystując poprzednie zadanie, że zmienna losowa χ2n ma rozkład gamma G(n/2, 1/2).

9. Niech X1, . . . , Xn będą niezależnymi zmiennymi losowymi rozkładach chi-kwadrat χ2k

1, χ2k

2, . . . , χ2kn. Udowodnić, nie wyznaczając gęstości, że zmienna losowa X = X1+ X2+ . . . + Xn ma rozkład chi-kwadrat z χ2k1+k2+...+kn.

(3)

Wstęp do statystyki matematycznej. Lista 1. 3

10. Niech Z i Y będą niezależnymi zmiennymi losowymi o rozkładach N (0, 1) i chi- kwadrat z n stopniami swobody. Wówczas zmienna losowa

tn := Z pY /n

ma rozkład zwany rozkładem t-Studenta z n stopniami swobody. Wyznaczyć gęstość tego rozkładu i udowodnić, że dla n → ∞, tn jest zbieżny według rozkładu do N (0, 1).

11. Wykorzystując odpowiednie tablice wyznaczyć kwantyle rzędu 1 − α dla rozkładu (a) N (0, 1);

(b) chi-kwadrat z v stopniami swobody;

(c) t-Studenta z v stopniami swobody.

Przyjąć, że α ∈ {0.005, 0.025, 0.05} i v ∈ {1, 10, 20}.

12. Udowodnić, że jeśli X1, . . . , Xn+m są niezależnymi zmiennymi losowymi o tym sa- mym rozkładzie N (0, 1) , to zmienna

Y = X12+ . . . + Xn2 X12+ . . . + Xn+m2 ma rozkład beta Be(n/2; m/2).

13. U i V będą niezależnymi zmiennymi losowymi o rozkładach chi-kwadrat z m i n stopniami swobody, odpowiednio. Jaki rozkład ma zmienna losowa U

U + V ? Od- powiedzieć na to pytania nie obliczając gęstości, a wykorzystując jedynie definicję rozkładu chi-kwadrat i jedno z poprzednich zadań.

14. Niech U i V będą niezależnymi zmiennymi losowymi o rozkładach chi-kwadrat z m i n stopniami swobody, odpowiednio. Wowczas zmienna losowa

F = U/m V /n

ma rozkład zwany rozkładem F-Snedecora z (m, n) stopniami swobody. Wyznaczyć gęstość rozkładu tej zmiennej losowej. Jaki rozkład ma zmienna losowa 1

F?

(4)

Wstęp do statystyki matematycznej. Lista 2. 4

Lista 2.

Rozkłady normalne

Oznaczenia: y1, . . . , yn zmienne losowe, E(yi) = µi, Cov(yi, yj) = σij, Y = (y1, . . . , yn)T,

• wartość oczekiwana (średnia)wektora Y : µ = E(Y ) = (µ1, . . . , µn)T.

• macierz kowariancji wektora Y : Cov(Y ) = E (Y − µ)T(Y − µ) = [σij]n×n 1. Uzasadnić, że dla dowolnej macierzy deterministycznej Ar×n i dla dowolnego deter-

ministycznego wektora b ∈ Rr

E(AY + b) = AE(Y ) + b, Cov(AY + b) = ACov(Y )AT.

2. Załóżmy, że n-wymiarowy wektor losowy Y ma rozkład normalny ze średnią µ i dodatnio określoną macierzą kowariancji Σ, czyli rozkład N (µ, Σ) o gęstości

f (y) = 1

(2π)n/2|Σ|1/2 × exp−(y − µ)TΣ−1(y − µ) . Jaki rozkład ma

(a) wektor losowy Σ−1/2(Y − µ) (wykorzystać zadanie 3.);

(b) zmienna losowa (Y − µ)TΣ−1(Y − µ).

Uwaga: Jeśli A jest nieujemnie określoną macierzą symetryczną, to A1/2 oznacza pierwiastek kwadratowy z macierzy A, czyli symetryczną i nieujemnie określoną macierz, taką że A1/2A1/2 = A. Gdy A jest dodatnio określona, to A−1/2 ozn.= (A1/2)−1.

3. Pokazać, że jeśli Y jest n-wymiarowym wektorem losowym, takim że Y = N (µ, Σ),D to dla dowolnej macierzy B wymiaru m × n, BY = N (Bµ, BΣBD T).

4. Udowodnić, że jeśli Y = N (µ, σD 2I), a Z = U Y , gdzie U jest macierzą ortonor- malną, to

Z = N (U µ, σD 2I)

W szczególności Z1, . . . , Zn są niezależne i mają rozkłady normalne.

5. Przypuśćmy, że X ma rozkład N (µ, σ2In), czyli X = (X1, . . . , Xn)T jest wektorem, którego współrzędne są niezależnymi zmiennymi losowymi o jednakowym rozkła- dzie N (µ, σ2) (próba rozmiaru n z rozkladu N (µ, σ2)). Niech Y = U X, gdzie U jest macierzą ortonormalną, której pierwszy wiersz ma postać

 1

√n, . . . , 1

√n

 . Uzasadnić kolejno, że

(a) taka macierz U istnieje;

(b) Y1 =√ nX;

(c) Y12+ . . . + Yn2 =Pn

i=1(Xi− X)2+ nX2;

(d) Y22+ . . . + Yn2 = (n − 1)S2, gdzie S2 oznacza wariancją próbkową, tzn.

S2 = Pn

i=1(Xi− X)2 n − 1 .

(5)

Wstęp do statystyki matematycznej. Lista 2. 5

(e) Y = N (U µ, σD 2In), przy czym U µ = (√

nµ, 0, 0, . . . , 0)T. (f) Y1, . . . , Yn są niezależne, Y1 = N (D

nµ, σ2), Yi = N (0, σD 2), i = 2, . . . , n.

Wykorzystując te fakty udowodnić, że√

n(X − µ)/σ i (n − 1)S22 są niezależnymi zmiennymi losowymi o rozkładach N (0, 1) i chi kwadrat z (n−1) stopniami swobody.

6. Zużycie wody (w hektolitrach) w pewnym osiedlu w ciagu dnia ma rozkład N (µ, 11).

Obliczyć prawdopodobieństwo, ze wariancja próbkowa (empiryczna wariancja) zu- życia wody w losowo wybranym kwartale nie przekroczy 100 hl.

7. Dla dwóch niezależnych prób X1, . . . , Xmi.i.d. N (µ1, σ2) i Y1, . . . , Yni.i.d. N (µ2, σ2) wyznaczyć rozkład zmiennej losowej SX2

SY2 . Wykorzystać jedno z zadań z poprzedniej listy.

(6)

Wstęp do statystyki matematycznej. Lista 3. 6

Lista 3.

Rodziny wykładnicze.

1. Pokazać, że jeżeli P jest rodziną z parametrem skali na R+, to jej obraz przez przekształcenie Y = log X jest rodziną z parametrem położenia na R.

2. Niech P będzie jednoparametrową rodziną rozkładów gamma G(α, β), gdzie α jest ustalone, a β > 0 jest nieznane. Niech Y = σ log X. Udowodnić, że

(a) jeśli σ > 0 jest nieznana, to Y ma rozkład należący do rodziny rozkładów z parametrami położenia i skali (σ log β, σ);

(b) jeśli σ > 0 jest znana, to Y ma rozkład należący do rodziny wykładniczej.

3. Niech P będzie rodziną wykładniczą o gęstościach względem pewnej miary µ:

f (x; η) = exp

" s X

i=1

ηiTi(x) − A(η)

# h(x),

Niech Σ będzie zbiorem tych wszystkich η = (η1, . . . , ηs) ∈ Rs, dla których Z

exp

" s X

i=1

ηiTi(x)

#

h(x)dµ(x) < ∞.

Stosując twierdzenie Lebesgue’a o zbieżności ograniczonej udowodnić, że zachodzą wzory

Eη(Tj) = ∂

∂ηjA(η); Covη(Tj, Tk) = ∂2

∂ηj∂ηkA(η).

Co w tym dowodzie trzeba założyć o zbiorze Σ i o punkcie η ∈ Σ?

4. Zbadać, czy następujące rodziny rozkładów są rodzinami wykładniczymi:

(a) Poissona P (λ) z parametrem λ > 0;

(b) beta B(α, β) z parametrami α > 0 i β > 0 o gęstości f (x; α, β) = Γ(α + β)

Γ(α)Γ(β)xα−1(1 − x)β−11(0,1)(x);

(c) o gęstości f (x; θ) = 1

9 dla x ∈ {0.1 + θ, 0.2 + θ, . . . , 0.9 + θ}, θ > 0;

(d) o gęstości f (x; θ) = 2(x + θ)

1 + 2θ 1(0,1)(x), θ > 0;

(e) dwuwymiarowych rozkładów normalnych (pięcioparametrowa);

(f) wielomianowych M(n; p0, . . . , ps); gdzie pi > 0, i = 0, . . . , s, p0+ . . . + ps= 1;

(g) lognormalnych L(µ, σ2) z parametrami (µ, σ) ∈ R × R+, o gęstości f (x; µ, σ2) = 1

√2πσxexp −(log x − µ)22



1(0,∞)(x);

(h) ujemno dwumianowych N B(r, p) z parametrami r > 0 i 0 < p < 1, z funkcją prawdopodobieństwa Pr(X = x) = Γ(x+r)Γ(r)x!px(1 − p)r, x = 0, 1, 2, . . ., ;

(i) Cauchy’ego C(µ, σ) z parametrami (µ, σ) ∈ R × R+, o gęstości f (x; µ, σ) = 1

πσ 1 1 + x−µσ 2;

(7)

Wstęp do statystyki matematycznej. Lista 3. 7

(j) Weibulla W e(α, β) z parametrami α > 0 i β > 0, o gęstości f (x; α, β) = α

βαxα−1exp



− x β

α

1(0,∞)(x);

(k) logistycznych LG(µ, σ) z parametrami (µ, σ) ∈ R × R+, o gęstości f (x; µ, σ) = 1

σ

e(x−µ)/σ [1 + (x − µ)/σ]2;

(l) Rayleigha R(σ) z parametrem σ > 0, o gęstości f (x; σ) = x

σ2e−x/(2σ2)10,∞)(x).

(m) podwójnie wykładniczych DE(µ, θ) z parametrami (µ, θ) ∈ R × R+, o gęstości f (x; µ, θ) = 1

2θexp



−|x − µ|

θ

 .

Która z tych rodzin jest naturalną rodziną wykładniczą, rodziną z naturalną para- metryzacją, rodziną pełnego rzędu?

5. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Rayleigha R(σ) Korzystając z zadania 3. wyznaczyć E(Y ) i Var(Y ), gdzie Y =Pn

i=1Xi2.

(8)

Wstęp do statystyki matematycznej. Lista 4. 8

Lista 4.

Dystrybuanta empiryczna, histogram, estymator jądrowy.

1. Niech X1, . . . , Xn będzie próbą losową prostą z rozkładu o dystrybuancie F i niech Fbn(x) = bFn(x; X1, . . . , Xn) będzie dystrybuntą empiryczną opartą na tej próbie.

Udowodnić, że

(a) Dla każdej realizacji x1, . . . , xn próby X1, . . . , Xn, bFn(x; x1, . . . , xn) jest dys- trybuantą pewnego rozkładu. Wyznaczyć ten rozkład.

(b) n bFn(x)= B(n, F (x)) dla każdego x ∈ R.D (c) EF



Fbn(x)

= F (x) i VarF

Fbn(x)

= F (x)(1 − F (x))

n dla każdego x ∈ R.

(d) bFn(x)p.n.→ F (x) (zbieżność z prawdopodobieństwem 1) dla każdego x ∈ R.

(e) √

n( bFn(x) − F (x))→ N (0, F (x)(1 − F (x))) dla każdego x ∈ R.D Następnie obliczyć EF

h

Fbn(x) − F (x)i2

i udowodnić, że jeśli X1, . . . , Xn jest losową próba prostą z rozkładu o ciągłej dystrybuancie F , to rozkłady zmiennych losowych

sup

x∈R

( bFn(x) − F (x)) i sup

x∈R

| bFn(x) − F (x)|

nie zależą od F .

2. Niech bfn(x) = bfn(x; X1, . . . , Xn) będzie estymatorem histogramowym albo estyma- torem jądrowym gęstości f , opartym na próbie X1, . . . , Xn i.i.d. f .

(a) Udowodnić, że dla każdej realizacji x1, . . . , xn próby X1, . . . , Xn, estymator fbn(x; x1, . . . , xn) jest gęstością pewnego rozkładu absolutnie ciągłego wzglę- dem miary Lebesgue’a.

(b) Dla estymatora jądrowego i ustalonego punktu x0 ∈ R obliczyć różnicę E

h

fbn(x0)i

− f (x0).

Przypuśćmy, że f jest ograniczona na R i ciągła w punkcie x0, a szerokość pasma hn dąży do zera, gdy n → ∞. Co można wówczas powiedzieć o

n→∞lim n

E h

fbn(x0) i

− f (x0) o

.

(9)

Wstęp do statystyki. Lista 5. 9

Lista 5.

Metoda momentów i metoda największej wiarogodności.

1. Niech X1, . . . , Xn będzie próbą prostą z populacji o rozkładzie jednostajnym na (0, θ). Za pomocą metody momentów wyznacz estymator ˆθn parametru θ.

(a) Wykorzystując ten estymator oszacuj θ dla próby 0.1, 0.3, 0.7, 0.8, 0.2.

(b) Oblicz obciążenie i błąd średniokwadratowy ˆθn. (c) Zbadaj zgodność ˆθn.

Wyznacz estymator największej wiarogodności (w skrócie: estymator MLE) para- metru θ i oblicz jego wartość dla próby z punktu (a).

2. Niech X1, . . . , Xn będzie próbą z populacji o rozkładzie trzypunktowym P (X = −1) = p, P (X = 0) = 0.4 − p, P (X = 1) = 0.6.

Za pomocą metody momentów wyznacz estymatorpbn parametru p. Wykorzystując ten estymator oszacuj p dla próby −1, 0, 0, 1, 1, 1, −1, 0, −1, 1. Czy to oszacowanie jest sensowne?

3. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu dyskretnego na zbiorze {1, 2, 3}

o gęstości pθ(1) = θ2, pθ(2) = 2θ(1 − θ), pθ(3) = (1 − θ)2, θ ∈ (0, 1). Wyznacz estymator parametru θ metodą momentów i metodą podstawienia.

4. Niech X1, . . . , Xn będzie próbą prostą z populacji o rozkładzie ciągłym o gęstości f (x) = (θ + 1)xθ, gdy 0 ≤ x ≤ 1,

0, w przeciwnym razie.

(a) Znajdź estymator największej wiarogodności ˆθ parametru θ.

(b) Wykorzystując bθ oszacuj θ na podstawie próby 0.1, 0.3, 0.7, 0.8, 0.2.

5. Niech X1, . . . , Xn będzie próbą prostą z populacji o rozkładzie ciągłym o gęstości f (x) = c(1 + θx), gdy − 1 ≤ x ≤ 1,

0, w przeciwnym razie.

(a) Znajdź c.

(b) Za pomocą metody momentów wyznacz estymator parametru θ.

(c) Czy można wyznaczyć jawny wzór na estymator MLE dla θ?

6. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Weibulla W (α, β), gdzie α jest ustalone i znane. Znajdź estymator MLE funkcji parametrycznej g(β) = βα. Sprawdź, czy jest nieobciążony. Wykaż, że jest zgodny i asymptotycznie normalny.

7. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu (a) Gamma G(α, β), gdzie α jest znane i ustalone;

(b) geometrycznego Ge(p), p ∈ (0, 1);

(c) jednostajnego U (θ, θ + 1), θ ∈ R;

(d) normalnego N (σ, σ2), σ ∈ (0, ∞);

(10)

Wstęp do statystyki. Lista 5. 10

(e) normalnego N (µ, σ2), µ ∈ R, σ ∈ (0, ∞);

Znajdź estymatory MLE parametrów rozkładu. Zbadaj ich nieobciążoność i zgod- ność.

8. W jeziorze jest nieznana liczba N ryb. W celu oszacowania N złowiono m ryb, oznakowano i wpuszczono do jeziora. Po dłuższym czasie złowiono ponownie m ryb i okazało sie, ze k z nich jest oznakowanych. Znajdź estymator MLE parametru N . 9. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Pareto P a(1, θ), θ > 1, czyli rozkładem o gęstości f (x; θ) = θx−(θ+1)1(1,∞)(x). Znajdź estymatory parametru θ metodą momentów i metodą największej wiarogodności. Wykaż, że są one estyma- torami zgodnymi i, dla θ > 2, asymptotycznie normalnymi. Porównaj wariancje asymptotyczne tych estymatorów.

(11)

Wstęp do statystyki matematycznej. Lista 6. 11

Lista 6.

Dostateczność i zupełność.

1. Niech X = (X1, . . . , Xn) będzie próbą prostą z rozkładu Poissona P (λ), λ ∈ (0, ∞) i niech T = Pn

i=1Xi. Znaleźć rozkład warunkowy Pr(X|T = t) i wykorzystując definicję dostateczności wykazać, że T jest statystyką dostateczną dla λ.

2. Losujemy bez zwracania n jednostek z partii N wyrobów, spośród których N θ jest wadliwych. Niech Xi, i = 1, . . . , n, przyjmuje wartość 1, gdy i-ta jednostka jest wadliwa i wartość 0, gdy i-ta jednostka jest dobra. Pokazać, że statystyka T = Pn

i=1Xi jest dostateczna dla parametru θ.

3. Pokazać, że jeśli T jest statystyką dostateczną dla P oraz T = g(S) dla pewnej statystyki S i odwzorowania mierzalnego g, to S jest statystyką dostateczną dla P.

4. Niech X będzie czasem czekania na k-ty sukces w schemacie Bernoulliego z praw- dopodobieństwem sukcesu p ∈ (0, 1), gdzie k > 1 ustalone (znane). Pokazać, że rozkłady X tworzą jednoparametrową rodzinę wykładniczą. Niech X1, . . . , Xn bę- dzie próbą prostą z rozkładu z tej rodziny. Korzystając z twierdzenia o rodzinach wykładniczych, podać statystykę dostateczną dla parametru p i wyznaczyć jej roz- kład.

5. Niech X1, . . . , Xn będzie próbą z rozkładu o gęstości p(θ,η) = c(θ, η)h(x)1(θ,η)(x),

gdzie h(x) jest ustaloną dodatnią funkcją całkowalną na (−∞, ∞). Udowodnić, że (X(1), X(n)) jest statystyką dostateczną dla parametru (θ, η) ∈ R × R.

6. Niech X1, . . . , Xnbędzie próbą prostą z populacji o rozkładzie P ∈ P = {Pθ, θ ∈ Θ}.

Wykorzystując kryterium faktoryzacji znaleźć statystykę dostateczną dla θ, tego samego wymiaru co θ, gdy

(a) Pθ jest rozkładem Poissona P (θ), θ ∈ (0, ∞);

(b) Pθ jest rozkładem ujemno dwumianowym N B(r, θ) ze znanym r i θ ∈ (0, 1);

(c) Pθ jest rozkładem wykładniczym Exp(θ), θ ∈ (0, ∞);

(d) Pθ jest rozkładem Gamma G(α, β), θ = (α, β) ∈ (0, ∞) × (0, ∞);

(e) Pθ jest rozkładem beta Be(α, β), θ = (α, β) ∈ (0, ∞) × (0, ∞);

(f) Pθ jest rozkładem lognormalnym LN (µ, σ2), θ = (µ, σ) ∈ R × (0, ∞);

(g) Pθ jest rozkładem Weinbulla W (α, θ) ze znanym α i θ ∈ (0, ∞).

7. Niech X1, . . . , Xn będzie próbą prostą z rozkładu beta B(α, α), α ∈ (0, ∞) Wy- znaczyć minimalną statystykę dostateczną dla parametru α. Uzasadnić, że jest to statystyka zupełna.

8. Udowodnić, ze rodzina rozkładów normalnych N (µ, 1) z parametrem położenia µ ∈ R jest rodziną zupełną.

9. Niech X1, . . . , Xn będzie próbą z rozkładu normalnego N (θ, θ2), θ > 0. Wyzna- czyć minimalną statystykę dostateczną dla parametru σ. Pokazać, że nie jest ona zupełna.

Wskazówka. Obliczyć Eθ(Pn

i=1Xi2) i Eθ(Pn

i=1Xi)2.

(12)

Wstęp do statystyki matematycznej. Lista 6. 12

10. Niech X1, . . . , Xn będzie próbą z rozkładu jednostajnego na odcinku [0, θ], θ ∈ (0, ∞). Pokazać, że T (X) = X(n) jest minimalną, zupełną statystyką dostateczną.

11. Niech X1, . . . , Xn będzie próbą prostą z rozkładu jednostajnego na odcinku [θ −

1

2; θ + 12], θ ∈ R. Udowodnić, ze (X(1), X(n)) jest minimalną statystyką dostateczną dla parametru θ, ale nie jest statystyką zupełną.

12. Niech P będzie rodziną wszystkich rozkładów absolutnie ciągłych na prostej. Niech X1, . . . , Xn będzie próbą z rozkładu z tej rodziny. Wykazać, że wektor statystyk pozycyjnych jest statystyką dostateczną i zupełną, a więc również minimalną dosta- teczną.

13. Niech zmienna losowa X ma rozkład dyskretny

Pθ(X = x) =

θ x

N − θ n − x



N n

 , x = 0, 1, . . . , min(n, θ), n − x ≤ N − θ.

gdzie N i n są ustalonymi liczbami naturalnymi, N ≥ n, a θ jest nieznanym pa- rametrem przyjmującym wartości w zbiorze {0, 1, 2, . . . , N }. Udowodnić, że X jest zupełna.

(13)

Wstęp do statystyki. Lista 7. 13

Lista 7.

Nieobciążoność, dopuszczalność, zgodność.

1. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu B(1, p), p ∈ (0, 1).

(a) Znaleźć estymator UMVU dla funkcji g(p) = pr, gdzie r jest liczbą naturalną nie większą niż n. Dla r = 1 wyznaczyć funkcję ryzyka tego estymator przy kwadratowej funkcji straty.

(b) Znaleźć estymator UMVU dla funkcji g(p) = p(1 − p) i zbadać jego asympto- tyczne własności (zgodność, √

n-zgodność, asymptotyczną normalność).

2. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu jednostajnego U (α, β), α, β ∈ R, α < β.

(a) Znaleźć estymatory UMVU parametrów α i β.

(b) Znaleźć estymator UMVU funkcji g(α, β) = β − α.

3. Pokazać, że estymator X parametru µ w rodzinie N (µ, 1) jest lepszy niż estymator T (X) = 12(X(1) + X(n)), tzn. T (X) jest niedopuszczalny; Następnie udowodnić, że w rodzinie rozkładów jednostajnych na odcinku [µ − 12, µ + 12] jest na odwrót tzn.

X jest niedopuszczalny.

4. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu o wartości oczekiwanej µ, wariancji σ2 i skończonym czwartym momencie centralnym µ4 = E(X − µ)4. Wyznaczyć Var(S2).

5. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu N (µ, σ2). Dobrać stałą c, tak aby statystyka

W2 = c

n−1

X

i=1

(Xi+1− Xi)2

była nieobciążonym estymatorem parametru σ2. Porównać wariancję W2 z warian- cją S2. Który z estymatorów pozwala ocenić σ2 z wiekszą dokładnością?

6. * Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Pθ jednostajnego na zbiorze trzypunktowym {θ − 1, θ, θ + 1}, gdzie θ jest dowolną liczbą całkowitą.

(a) Znaleźć rodzinę wszystkich nieobciążonych estymatorów zera.

(b) Udowodnić, że dla żadnej niestałej funkcji g(θ) nie istnieje estymator UMVU, chociaż estymatory nieobciążone istnieją.

7. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu jednostajnego na przedziale [0, θ], gdzie θ > 0. Wykazać, że w klasie wszystkich estymatorów estymator

T (X) = n + 1 n X(n)

jest niedopuszczalny dla L(θ, d) = (d − θ)2, chociaż jest estymatorem UMVU.

Wskazówka. Rozważyć estymator T1(X) = n + 2 n + 1X(n).

(14)

Wstęp do statystyki. Lista 7. 14

8. * Niech zmienna losowa X ma rozkład

P (X = −1) = p, P (X = x) = (1 − p)2px, gdy x = 0, 1, . . . , z parametrem p ∈ (0, 1).

(a) Udowodnić, że każdy nieobciążony estymator 0 ma postać d(X) = cX.

(b) Wykorzystać (a) do udowodnienia tego, że estymator UMVU funkcji g(p) = (1 − p)2 ma postać d(0) = 1 i d(x) = 0, dla pozostałych wartości x.

(c) Udowodnić, że nie istnieje estymator UMVU parametru p, choć istnieją esty- matory nieobciążone dla p.

9. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu N (µ, 1). Udowodnić, że dla każ- dego c ∈ R, Φ

r n

n − 1(c − X)



jest estymatorem UMVU funkcji parametrycznej gc(µ) := Pr(X1 < c) = Φ(c − µ). Zbadać asymptotyczne własności tego estymatora (zgodność,√

n-zgodność, asymptotyczną normalność).

10. Niech X = (X1, . . . , Xm) i Y = (Y1, . . . , Yn) będą niezależnymi próbami z rozkładów U (0, θ) i U (0, η). Wyznaczyć estymator UMVU ilorazu g(θ, η) = θ/η, gdy n > 1.

(15)

Wstęp do statystyki. Lista 8. 15

Lista 8.

Efektywność.

1. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Bernoulliego B(1, p), p ∈ (0, 1).

Uzasadnij, że T (X) = n

n − 1X(1 − X) jest estymatorem UMVU funkcji parame- trycznej g(p) = p(1 − p). Sprawdź, czy T (X) jest efektywny lub asymptotycznie efektywny.

2. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu normalnego N (0, σ2). Pokaż, że estymator T (X) =Pn

i=1Xi2 jest nieobciążonym i efektywnym estymatorem σ2. 3. *Niech X = (X1, . . . , Xn) będzie próbą z rozkładu jednostajnego U (0, θ) i niech

fθ(x) oznacza gęstość rozkładu statystyki X(n). Pokaż, że (a) ∂

∂θ Z

xfθ(x) dx 6=

Z x ∂

∂θfθ(x) dx,

(b) estymator UMVU parametru θ nie jest efektywny w sensie Rao-Cramera.

4. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu normalnego N (µ, σ), gdzie µ jest znane. Udowodnij, że estymator T (X) =

√π n√

2

n

X

i=1

|Xi − µ| parametru σ jest nieobciążony i ma efektywność 1

π − 2.

5. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu normalnego N (µ, σ2) z nieznaną wartością oczekiwaną µ ∈ R i znaną wariancją σ2 > 0. Dla ustalonego t 6= 0 znajdź estymator UMVU dla e i pokaż, że ten estymator nie jest efektywny w sensie Rao-Cramera, ale jest asymptotycznie efektywny.

6. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu gamma G(α, β).

(a) Wyznacz estymatory parametrów α, β za pomocą metody momentów.

(b) Zakładając, że α jest znane i równe α0 wyznacz estymator parametru β za pomocą metody momentów i oblicz jego efektywność (po usunięciu obciążenia).

(16)

Wstęp do statystyki. Lista 9. 16

Lista 9.

Przedziały ufności.

1. Niech X będzie pojedynczą obserwacją z rozkładu jednostajnego U (θ −1/2, θ +1/2), gdzie θ ∈ R jest nieznane. Pokaż, że Q(X; θ) = X − θ jest funkcją centralną, a następnie udowodnij, że [X + c, X + d] jest przedziałem ufności dla parametru θ na poziomie ufności 1 − α wtedy i tylko wtedy, gdy ma dlugość 1 − α.

2. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu wykładniczego E(λ). Uzasadnij, że Q(X; λ) = 2nXλ jest funkcją centralną. Skonstruuj przedział ufności dla para- metru λ na poziomie ufności 1 − α. Dla n = 10 i α = 0.04 wyznacz końce tego przedziału.

3. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu z rozkładu N (θ, θ), gdzie θ > 0.

Znajdź funkcję centralną i skonstruuj przedział ufności dla θ na poziomie ufności 1 − α.

Wskazówka. Jaki rozkład ma zmienna losowa Q(X; θ) = n(X − θ)2

θ ?

4. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu jednostajnego U (θ − 1/2, θ + 1/2), gdzie θ ∈ R jest nieznane. Skonstruuj przedział ufności dla parametru θ na poziomie ufności 1 − α.

5. Niech X = (X1, . . . , Xm) i Y = (Y1, . . . , Yn) będą niezależnymi próbami z rozkładów N (µ1, σ12) i N (µ2, σ22). Załóżmy, że σ12 = σ22 = σ i oznaczmy θ = (µ1, µ2, σ), g(θ) = µ2− µ1. Uzasadnij, że

Y − X − g(θ) r(m − 1)SX2 + (n − 1)SY2

n + m − 2

r1 m + 1

n

jest funkcją centralną dla g(θ). Skonstruuj przedział ufności dla parametru g(θ) na poziomie ufności 1 − α.

6. Niech X = (X1, . . . , Xm) i Y = (Y1, . . . , Yn) będą niezależnymi próbami z rozkładów N (µ1, σ12) i N (µ2, σ22). Załóżmy, że σ12 = σ22 = σ i oznaczmy θ = (µ1, µ2, σ1, σ2), g(θ) = σ2122. Skonstruuj przedział ufności dla parametru g(θ) na poziomie ufności 1 − α.

7. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu N (µ, σ2), gdzie σ > 0 jest znane.

Podaj postać przedziału ufności dla parametru µ na poziomie ufności 1 − α.

8. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Poissona z parametrem λ. Wyko- rzystując CTG, twierdzenie Słuckiego oraz metodę delta udowodnij, że

(a)

√n(X − λ)

√ X

→ N (0, 1);D

(b) 2√ n(p

X −

λ)→ N (0, 1).D

Użyj tych własności do wyznaczenia asymptotycznych funkcji centralnych i kon- strukcji asymptotycznych przedziałów ufności dla parametru λ, na poziomie ufności 1 − α. Zauważ, że oba przedziały mają tę samą długość i są tylko przesunięte względem siebie.

(17)

Wstęp do statystyki. Lista 9. 17

9. Niech Yn będzie zmienną losową o rozkładzie chi-kwadrat z n stopniami swobody.

Wykorzystując CTG, twierdzenie Słuckiego oraz metodę delta udowodnij, że (a) Yn− n

√2n

→ N (0, 1);D

(b) p

2Yn−√

2n − 1→ N (0, 1);D (c)

r9n 2

3

rYn

n − 1

!

→ N (0, 1);D

Niech X = (X1, . . . , Xn) będzie próbą z rozkładu N (µ, σ2), gdzie µ i σ są nieznane.

Wykorzystaj powyższe fakty do wyznaczenia asymptotycznych funkcji centralnych i do konstrukcji asymptotycznych przedziałów ufności na poziomie ufności 1 − α dla funkcji parametrycznej g(θ) = σ2.

Uwaga. Ciąg zmiennych losowych z punktu c) daje lepsze przybliżenie rozkładu chi-kwadrat niż ciągi z punktów a) i b).

10. *Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Weibulla o gęstości f (x; α, θ) = α

θxα−1e−xα1(0,∞)(x).

Udowodnij, że Q(X; α, θ) = Qn

i=1(Xiα/θ) jest funkcją centralną. Wykorzystaj tę funkcję do konstrukcji zbioru ufności dla (α, θ) na poziomie ufności 1 − α.

(18)

Wstęp do statystyki. Lista 10. 18

Lista 10.

Testy jednostajnie najmocniejsze.

1. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu normalnego N (µ, 1).

(a) Wyznacz statystykę testu Neymana-Pearsona (najmocniejszego, w skrócie NP) dla testowania hipotezy H0 : µ = 0 przeciwko H1 : µ = µ0 > 0.

(b) Wyznacz funkcję mocy dla ustalonego poziomu istotności α ∈ (0,12).

2. Niech X ma rozkład U (0, θ), θ > 0. Skonstruuj test NP na poziomie istotności α dla hipotezy H0 : θ = θ0 przeciwko H1 : θ = θ1, gdy 0 < θ0 < θ1 są ustalonymi liczbami.

3. Niech X ma rozkład należący do rodziny P = {B(10, 1/2), P (1)}. Wykorzystaj tablice rozkładu dwumianowego i rozkładu Poissona do skonstruowania testu NP na poziomie istotności α = 0.1 dla hipotezy H0 : X = B(10, 1/2) przeciwko HD 1 : X = P (1).D

4. Niech X ma rozkład należący do rodziny P = {U (0, 1)}∪{E(λ), λ > 0}. Skonstruuj test NP na poziomie istotności α = 0.1 dla hipotezy H0 : X = U (0, 1) przeciwkoD H1 : X = E(λ), λ > 0. Znajdź funkcję mocy tego testu.D

5. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu normalnego N (0, σ2).

(a) Wyznacz statystykę testu NP dla testowania H0 : σ = 1 przeciwko H1 : σ = σ0 > 1.

(b) Wyznacz funkcję mocy dla ustalonego α ∈ (0, 1). Dla α = 0.05 oraz σ0 ∈ {√

2, 2} oblicz moc w zależności od n.

6. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu (a) gamma G(θ, 1), θ > 0;

(b) Pareto o gęstości pθ(x) = θ

x21(θ,∞)(x), θ > 0.

Wyznacz statystykę testu NP dla testowania H0 : θ = 1 przeciwko H1 : θ = θ1 > 1.

Wyznacz asymptotyczną wartość krytyczną i oblicz ją dla α = 0.05. Dla jakich n dokładna wartość krytyczna różni się o mniej niż 0.1 od wartości asymptotycznej?

Dla b) wyznacz funkcję mocy testu.

7. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu (a) normalnego N (0, θ2), θ > 0;

(b) beta B(θ, 1), θ > 0.

Uzasadnij monotoniczność ilorazu wiarogodności względem odpowiedniej statystyki i skonstruuj test UMP dla hipotezy H0 : θ ≤ θ0 przeciwko H1 : θ > θ0. Wyznacz wartości krytyczne testów dla poziomu istotności α.

8. Niech X będzie zmienną losową o rozkładzie, którego gęstość należy do rodziny P = {fθ : θ ∈ Θ}, Θ ∈ R. Pokaż, że P ma monotoniczny iloraz wiarogodności względem X, gdy

(19)

Wstęp do statystyki. Lista 10. 19

(a) Θ = R, a fθ jest gęstością rozkładu podwójnie wykładniczego z parametrem położenia θ i znanym parametrem skali σ.

(b) Θ = R, a fθ jest gęstością rozkładu wykładniczego na przedziale (θ, ∞) z ze znanym parametrem skali σ.

(c) Θ = R, a fθ jest gęstością rozkładu logistycznego z parametrem położenia θ i znanym parametrem skali σ.

(d) Θ = R, a fθ jest gęstością rozkładu jednostajnego U (θ, θ + 1).

(e) Θ = {1, 2, . . . , N }, a fθ(x) =

θ x

 N −θ

r−x



N r

 dla max (r − θ, 0) ≤ x ≤ min (r, θ), gdzie r, N są znanymi liczbami naturalnymi (X ma rozkład hipergeometryczny).

(20)

Wstęp do statystyki. Lista 11. 20

Lista 11.

Testy ilorazu wiarogodności.

1. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Bernoulliego B(1, p). Skonstruuj test ilorazu wiarogodności (test LR) dla hipotezy H0 : p ≤ p0 przeciwko H1 : p > p0 na poziomie istotności α. Dla jakich wartości X odrzucana jest hipoteza zerowa?

2. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu Poissona z parametrem λ. Skon- struuj test LR dla hipotezy H0 : λ = λ0przeciwko H1 : λ 6= λ0na poziomie istotności α. Wyznacz wartość krytyczną testu dla n = 10, λ0 = 1 i α = 0.05 oraz moc testu (niezrandomizowanego) dla λ0 = 0.6. Wyznacz rozkład asymptotyczny statystyki testowej i asymptotyczną wartość krytyczną.

3. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu beta B(θ, 1). Skonstruuj test LR dla hipotezy H0 : θ = θ0 przeciwko H1 : θ 6= θ0 na poziomie istotności α, gdzie 4. *Niech X = (X1, . . . , Xn) będzie próbą z rozkładu wykładniczego E(µ, σ) o gęstości

f (x; µ, σ) = 1

σe−(x−µ)/σ1(µ,∞)(x), σ ∈ (0, ∞) i µ ∈ (0, ∞).

(a) Załóżmy, że σ jest znane. Skonstruuj test LR rozmiaru α dla hipotezy H0 : µ ≤ µ0 przeciwko H1 : µ > µ0, gdzie µ0 jest znane.

(b) Załóżmy, że σ jest znane. Skonstruuj test LR rozmiaru α dla hipotezy H0 : µ = µ0 przeciwko H1 : µ 6= µ0.

(c) Skonstruuj test LR rozmiaru α dla hipotezy H0 : µ ≤ µ0 przeciwko H1 : µ > µ0, gdy σ także jest nieznane.

(d) Skonstruuj test LR rozmiaru α dla hipotezy H0 : µ = µ0 przeciwko H1 : µ 6= µ0, gdy σ także jest nieznane.

5. Niech X = (X1, . . . , Xn) będzie próbą z rozkładu N (µ, σ2), a Y = (Y1, . . . , Ym) próbą z rozkładu N (η, τ2). Zakładając niezależność obu prób, skonstruuj test ilorazu wiarogodności dla hipotezy H0 : τ = kσ przeciwko H1 : τ 6= kσ, gdzie k znaną liczbą (np. k = 1) na poziomie istotności α. Dla k = 1, n = 12, m = 18, α = 0.05 wyznacz wartość krytyczną, posługując się rozkładem Snedecora. Czy otrzymany test jest nieobciążony?

(21)

Wstęp do statystyki. Lista 12. 21

Lista 12.

Testy chi-kwadrat zgodności i niezależności.

1. W celu sprawdzenia czy kostka sześcienna do gry jest rzetelna (symetryczna), wy- konano 120 rzutów tą kostką i otrzymano następujące wyniki:

Liczba oczek 1 2 3 4 5 6

Liczba rzutów 11 30 14 10 33 22

Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że kostka jest symetryczna.

2. W pewnej fabryce zaobserwowano następujący rozkład absencji w tygodniu, zba- dany w wylosowanej grupie 900 pracowników:

Dzień tygodnia PN WT ŚR CZ PT SOB

Liczba nieobecnych 200 160 140 140 100 160

Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że absencja w tej fabryce jest jednakowa w każdym dniu tygodnia.

3. Zbadano 300 losowo wybranych 5–sekundowych odcinków czasowych pracy pewnej centrali telefonicznej i otrzymano empiryczny rozkład liczby zgłoszeń :

Liczba zgłoszeń 0 1 2 3 4 5

Liczba odcinków 50 100 80 40 20 10

Na poziomie istotności α = 0.05 zweryfikuj hipotezę, że liczba zgłoseń w tej centrali jest zmienną losową o rozkładzie Poissona.

4. W celu zweryfikowania hipotezy, że studentki pewnej uczelni lepiej zdają egzaminy niż studenci, wylosowano próbę 200 studentek i studentów i otrzymano następujące wyniki zaliczenia letniej sesji egzaminacyjnej:

Zdany Oblany

Studenci 55 45

Studentki 75 25

Na poziomie istotności α = 0.05 zweryfikuj hipotezę o niezależności wyniku egza- minu od płci osoby zdającej.

5. Pewien produkt można wytwarzać trzema metodami. Wysunięto hipotezę, że wad- liwość produkcji nie zależy od metody wytwarzania. Wylosowano niezależnie próbę 270 sztuk wyrobu i otrzymano następujące wyniki badania jakości dla poszczegól- nych metod:

Jakość Metoda I Metoda II Metoda III

Dobra 40 80 60

Zła 10 60 20

Na poziomie istotności α = 0.05 zweryfikuj hipotezę o niezależności jakości produkcji od metod produkcji.

(22)

Wstęp do statystyki. Lista 12. 22

6. Studenci Wydziału Matematyki PWr ocenili każdego z trzech wykładowców, prowa- dzących zajęcia ze statystyki

Beznadziejny Niezły Bardzo dobry

Wykładowca nr 1 17 25 18

Wykładowca nr 2 11 29 20

Wykładowca nr 3 12 26 22

Czy na podstawie tych danych należy odrzucić hipotezę zerową, mówiącą, że rozkład ocen dla każdego z wykładowców jest taki sam? Przyjmij poziom istotności α = 0.05.

Obraz

Updating...

Cytaty

Powiązane tematy :