Prawdopodobieństwo i Statystyka
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
— wartość oczekiwana
(wartość przeciętna, wartość średnia, nadzieja matematyczna) — wariancja — odchylenie standardowe — asymetria — eksces — mediana — moda
Parametry rozkładu zmiennej losowej, których estymaty najczęściej znajdujemy
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski Rozkład Równomierny
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski Rozkład Wykładniczy (eksponencjalny)
λ
σ
µ
=
=
λ xe
x
F
(
)
= 1
−
− i jego dystrybuanta: fgp tego rozkładu:W przyrodzie rozkładowi eksponencjalnemu podlegają wartości odległości od dowolnie ustalonego punktu do miejsca zdarzenia, w przestrzeni lub w czasie. Stosuje się dla mierzonych wartości niezależnych i pojawiających się losowo.
np. 1.
droga swobodna dla oddziaływania protonów w komorze pęcherzykowej mierzona na zdjęciach;
2.
czas oczekiwania na uderzenie pioruna podczas burzy;
rozkłady odległości od ścianki komory do punktu oddziaływania oraz rozkłady czasów oczekiwania, mają rozkład eksponencjalny.
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład Poissona
z parametrem λ > 0; w skrócie P(λ), definiujemy ciągiem par:
średnia, wariancja, asymetria i eksces:
λ
σ
µ
=
V
x=
2=
λ
γ
3=
1
λ
γ
4=
1
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład Poissona
Liczba zdarzeń,
które zaszły w określonym przedziale czasowym lub przestrzennym, np. w czasie T, podlega rozkładowi Poissona.
np. 1.
liczba elementów elektronicznych, które uległy awarii w czasie roku, dwóch itd. 2.
liczba protonów, które pokonały drogę do momentu zderzenia od L do L+h
(wartości odległości znalazły się w przedziale < L, L+h >)
Rozkład Poissona
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
Twierdzenie Poissona
(przybliżenie Poissona rozkładu dwumianowego)
Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego
z prawdopodobieństwem sukcesu pn.
Jeżeli
to dla dowolnego ustalonego
gdzie Yλ ma rozkład Poissona P(λ)
Twierdzenie Poissona
(przybliżenie Poissona rozkładu dwumianowego)
Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego
z prawdopodobieństwem sukcesu pn.
Jeżeli
to dla dowolnego ustalonego to dla dowolnego ustalonego
gdzie Yλ ma rozkład Poissona P(λ)
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski Rozkład Normalny (Gaussa)
Rozkład normalny N( m, σ ) (Gaussa)
Rozkład normalny z parametrami m, σ oznaczany jest symbolem N( m, σ )
Gęstość prawdopodobieństwa rozkładu normalnego jest określona wzorem:
Rozkład normalny N( 0, 1 )
Jeżeli m = 0 i σ = 1, to funkcja gęstości prawdopodobieństwa ma postać
0
4
3
=
γ
=
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład normalny N( 0, 1 )
Jeżeli m = 0 i σ = 1, to funkcja gęstości prawdopodobieństwa ma postać
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład Normalny (Gaussa)
Ilustracja wartości odchylenia standardowego w rozkładzie Normalnym
Czasem używa się "reguły" 3-sigma, w astrofizyce 5-sigma;
tzn., że dla odległości między wartościami zmierzonymi większej niż 3 lub 5-sigma pozwala uznawać takie wielkości za istotnie różne.
Rozkład Normalny (Gaussa)
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład Normalny (Gaussa)
Własności rozkładu normalnego – c.d.Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład Studenta
(rozkład t lub rozkład t-Studenta)
Ciągły rozkład prawdopodobieństwa stosowany: • w procedurach testowania hipotez statystycznych • i przy ocenie niepewności pomiaru.
dla
oszacowania przedziału, w którym leży, z określonym prawdopodobieństwem,
rzeczywista wartość mierzona,
Jeśli dysponujemy n pomiarami ( n<30 ), możemy wyznaczyć
średnią i odchylenie standardowe lub wariancję („z próby”), Oczywiście, nie znamy odchylenia standardowego w populacji.
Zagadnienie to rozwiązał w 1908 r. William Sealy Gosset (pseudonim Student) podając funkcję zależną od wyników pomiarów
χ
χ
χ
χ
iRachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Definicja
Rozkład Studenta z r stopniami swobody (dla n pomiarów) jest rozkładem zmiennej losowej T postaci:
Rozkład t-Studenta
gdzie:
• u jest zmienną losową mającą standardowy rozkład normalny N(0,1), • z jest zmienną losową o rozkładzie chi-kwadrat o r stopniach swobody, • u i z są niezależne.
r
z
u
t
=
Liczba r stopni swobody, df (degrees of freedom) – liczba niezależnych wyników obserwacji n
pomniejszona o liczbę związków, które łączą te wyniki ze sobą
Rozkład t Studenta
σ
σ
σ
σ
tylko dla r > 2,γγγγ
4 tylko dla n > 4 2 1 21
2
2
1
)
(
+ −
+
Γ
+
Γ
=
rr
t
r
r
r
t
f
π
0
3=
=
γ
µ
2
−
=
r
r
σ
(
)
4
2
3
4−
−
=
r
r
γ
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład t Studenta
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład chi kwadrat (zapisywany także jako χ²)
to rozkład zmiennej losowej, która jest sumą n kwadratów
niezależnych zmiennych losowych o standardowym rozkładzie normalnym.
Liczbę naturalną n nazywa się liczbą stopni swobody rozkładu zmiennej losowej. Jeżeli ciąg niezależnych zmiennych losowych
Rozkład
χ
χ
χ
χ
2(chi-kwadrat)
czyli:
Zmienna losowa z ma rozkład chi kwadrat o n stopniach swobody
( )
0
,
1
N
u
i∝
oraz∑
( )
==
n i iu
z
1 2 to 2 nz
∝
χ
Rozkład
χ
χ
χ
χ
2(chi-kwadrat)
2 1 2 22
2
1
)
(
z n nz
e
n
z
f
− −
Γ
=
dla n stopni swobody i z > 0
n
=
µ
σ
=
2
n
n
2
4
3=
γ
n
12
4=
γ
2
−
= n
z
Wartość modalna:Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład
χ
χ
χ
χ
2(chi-kwadrat)
Suma kwadratów n niezależnych zmiennych N(0, 1)
ma rozkład
χ
χ
χ
χ
2 o r = n – 1 stopniach swobody;(w szczególności kwadrat standaryzowanej zmiennej normalnej jest zmienną
χ
χ
χ
χ
2 o 1 stopniu swobody)Jeśli s2 jest wariancją z n-elementowej próby normalnej,
to z = ns2 /
σ
σ
σ
σ
2 ma rozkładχ
χ
χ
χ
2 o n-1 stopniach swobody.Przy r
→∞
→∞
→∞
→∞
rozkładχ
χ
χ
χ
2 dąży (bardzo wolno!) doN
(
0
,
2
r
)
Szybciej zbieżny do N(0, 1) jest rozkład zmiennej (można z tego przybliżenia korzystać dla r > 30
przy z
∈
∈
∈
∈
(z0.05, z0.95)1
2
2
−
−
=
z
r
u
Rozkład
χ
χ
χ
χ
2(chi-kwadrat)
Zastosowanie rozkładu
χ
χ
χ
χ
2Rozkład
χ
χ
χ
χ
2 wykorzystywany jest przy analizie wariancji m.in.do wyliczenia prawdopodobieństwa,
że wariancja spełnia jakiś warunek,
przy wyznaczaniu poziomu ufności dla wariacji lub
przy testowaniu hipotez dla wariancji
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Funkcja gamma (zwana też gammą Eulera)
– funkcja specjalna, która rozszerza pojęcie silni na zbiór liczb rzeczywistych i zespolonych. Gdy część rzeczywista liczby zespolonej z jest dodatnia, to całka (całka Eulera):
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Rozkład Potęgowy
istnieje tylko dla
1 0 0
)
(
− −
=
ββ
x
x
x
x
f
gdzie
β
β
β
β
> 0 jest wykładnikiem lub nachyleniem "całkowym" (rozkładu całkowego) Dystrybuanta: β −
−
=
01
)
(
x
x
x
F
Rozkład Potęgowy
Średnia istnieje tylko dla
β
β
β
β
> 1, zaś dyspersja dlaβ
β
β
β
> 21
0−
=
β
β
µ
x
)
2
)(
1
(
0−
−
=
β
β
β
σ
x
0x
−
=
µ
µ
β
użyteczne: mediana:β
1 0 2 / 1= x
⋅
2
x
Rachunek Prawdopodobieństwa i Statystyka Matematyczna dr Jan Malinowski Funkcja potęgowa 0 200 400 600 800 1000 0 50 100 X Y = X ^ -2 0,1 100 0,4 50 2,5 20 10 10 40 5 250 2 1000 1 Y = X ^ - 2 X 0,1 1 10 100 1000 1 10 100 X - w skali log Y w s k a li l o g 100 1000 1 10 100 X - w skali log Y * ( X ^ 1 ,9 )
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Centralne twierdzenie graniczne
O twierdzeniach granicznych:
Mamy ciąg zmiennych losowych niezależnych: ξ1, ξ2, …, ξn, … mających
skończone wartości oczekiwane mk i skończone wariancje σk2
(k = 1, 2, …, n, …)
mk = E( ξk ) σk2 = E( ξ
k - mk )2
Oznaczmy:
ηn = ξ1 + ξ2 + … + ξn
Mn = m1 + m2 + … + mn – wartość oczekiwana zmiennych ηn Bn2 = σ
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski Centralne twierdzenie graniczne
Ciąg zmiennych losowych ξ1, ξ2, …, ξn, … mających skończone wartości oczekiwane mk
spełnia
słabe prawo wielkich liczb
jeśli ciąg zmiennych losowych
n
M
n
n n−
η
jest zbieżny do zera według prawdopodobieństwa
Centralnym twierdzeniem prawdopodobieństwa
nazywamy każde twierdzenie zawierające warunki dostateczne na to, aby ciąg dystrybuant zmiennych losowych
n n n
B
M
−
η
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski
Centralne twierdzenie graniczne
(wg. Wikipedii)
https://pl.wikipedia.org/wiki/Centralne_twierdzenie_graniczne
Centralne twierdzenie graniczne – jedno z najważniejszych twierdzeń rachunku
prawdopodobieństwa, uzasadniające powszechne występowanie w przyrodzie rozkładów zbliżonych do rozkładu normalnego.
Sformułowanie szczególne
jeśli Xi są niezależnymi zmiennymi losowymi o jednakowym rozkładzie,
takiej samej wartości oczekiwanej
µ
µ
µ
µ
skończonej wariancji σ, to zmienna losowa o postaci
zbiega według rozkładu do standardowego rozkładu normalnego
Rachunek Prawdopodobieństwa i Statystyka Matematyczna
dr Jan Malinowski