Podstawy statystyki praktycznej, lista zadań nr 2
Konwersatorium
1. Korzystając z własności wartości oczekiwanej podanych na wykładzie, wykaż równoważ- ność dwóch definicji wariancji zmiennej losowej X:
V ar(X) = E(X − EX)2 i V ar(X) = EX2− (EX)2.
Następnie korzystając niezależnie z obu powyższych definicji, udowodnij dwukrotnie każdą z poniższych własności wariancji, gdzie a ∈ R:
V ar(X) ≥ 0,
V ar(a) = 0,
V ar(X + a) = V ar(X),
V ar(aX) = a2· V ar(X)
jeśli X i Y są niezależnymi losowymi, dla których wariancja istnieje, to V ar(X + Y ) = V ar(X) + V ar(Y ).
2. Korzystając ze wzoru dwumiennego Newtona:
(a + b)n=
n
X
k=0
ak bn−k, a, b ∈ R, n ∈ N,
oblicz wartość oczekiwaną, drugi moment i wariancję zmiennej losowej o rozkładzie b(n, p), n ∈ N, p ∈ [0, 1].
3. Korzystając z tożsamości:
ex =
∞
X
k=0
xk
k!, x ∈ R,
oblicz wartość oczekiwaną, drugi moment i wariancję zmiennej losowej o rozkładzie P oi(λ), λ > 0.
4. Oblicz wartość oczekiwaną, drugi moment i wariancję zmiennej losowej o rozkładzie U (a, b), a, b ∈ R, a < b.
5. Oblicz wartość oczekiwaną, drugi moment i wariancję zmiennej losowej o rozkładzie Exp(λ), λ > 0.
6. Korzystając z definicji funkcji Γ Eulera:
Γ(x) = Z ∞
0
tx−1e−tdt, x > 0,
oblicz wartość oczekiwaną, drugi moment i wariancję zmiennej losowej o rozkładzie G(λ, β), λ, β > 0.
7. Korzystając z całki Gaussa:
Z ∞
−∞
e−x2dx =√ π,
oblicz wartość oczekiwaną, drugi moment i wariancję zmiennej losowej o rozkładzie N (µ, σ2), µ ∈ R,σ2 > 0.
8. Skonstatuj, że zmienna losowa o rozkładzie Cauchy’ego C(a, b), a ∈ R, b > 0, nie ma wartości oczekiwanej, drugiego momentu ani wariancji.
Laboratorium
1. Wygeneruj po 10000 obserwacji z podanych dyskretnych rozkładów prawdopodobieństwa:
a) b(10, 0.5) (funkcja rbinom), b) P oi(9) (funkcja rpois).
W przypadku każdego z tych rozkładów wypisz 5 początkowych wylosowanych przez Ciebie obserwacji oraz narysuj histogram gęstościowy sporządzony na podstawie 100 po- czątkowych wylosowanych obserwacji oraz taki sam histogram sporządzony na podstawie wszystkich 10000 wylosowanych obserwacji. Do każdego histogramu dorysuj za pomocą funkcji lines z argumentem type="b" funkcję prawdopodobieństwa danego rozkładu (odpowiednio dbinom i dpois) dla takiego zakresu argumentów, jaki został wykorzystany do sporządzenia histogramu. Pamiętaj, że funkcja prawdopodobieństwa jest tu określona tylko dla argumentów całkowitoliczbowych. Postawaj się wyciągnąć wnioski z rysunków, które sporządziłeś.
Sporządzając histogram dla dyskretnych całkowitoliczbowych zmiennych losowych, dla poprawy estetyki Twoich rysunków (szczególnie w przypadku 10000 obserwacji) w funkcji hist możesz przyjąć breaks=(min(X)-.5):(max(X)+.5), gdzie X jest wektorem, w któ- rym umieszczone są wartości, na podstawie których sporządzasz dany histogram (najpierw liczącym 100, potem 10000 elementów).
Zwróć uwagę, jak parametry rozkładów przekładają się na argumenty wspomnianych funkcji dotyczących rozkładów (warto tu spojrzeć do pomocy do tychże funkcji). Nie zapomnij o ustawieniu za pomocą funkcji set.seed ziarna przed losowaniami, aby Twoje wyniki można było powtórzyć (jeśli nie wiesz, o co chodzi z ustawieniem ziarna, poproś prowadzącego o wyjaśnienie).
2. Wykonaj podobny zestaw poleceń co w zadaniu 1 dla rozkładów:
a) G(1, 5) (funkcja rgamma), b) N (2, 4) (funkcja rnorm).
Tym razem do histogramów dorysuj gęstości (odpowiednio dgamma i dnorm) za pomocą ciągłej linii. Zwróć także baczną uwagę, jak parametry rozkładów przekładają się na argumenty funkcji dotyczących rozkładów. W tym poleceniu nie masz już do czynienia z całkowitoliczbowymi zmiennymi losowymi, więc pozostań przy domyślnej wartość argu- mentu breaks funkcji hist.