• Nie Znaleziono Wyników

Wybrane funkcje gestosci prawdopodobienstwa

N/A
N/A
Protected

Academic year: 2021

Share "Wybrane funkcje gestosci prawdopodobienstwa"

Copied!
52
0
0

Pełen tekst

(1)

Prawdopodobieństwo i Statystyka

(2)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

— wartość oczekiwana

(wartość przeciętna, wartość średnia, nadzieja matematyczna) — wariancja — odchylenie standardowe — asymetria — eksces — mediana — moda

Parametry rozkładu zmiennej losowej, których estymaty najczęściej znajdujemy

(3)
(4)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski Rozkład Równomierny

(5)
(6)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski Rozkład Wykładniczy (eksponencjalny)

λ

σ

µ

=

=

λ x

e

x

F

(

)

= 1

− i jego dystrybuanta: fgp tego rozkładu:

(7)

W przyrodzie rozkładowi eksponencjalnemu podlegają wartości odległości od dowolnie ustalonego punktu do miejsca zdarzenia, w przestrzeni lub w czasie. Stosuje się dla mierzonych wartości niezależnych i pojawiających się losowo.

np. 1.

droga swobodna dla oddziaływania protonów w komorze pęcherzykowej mierzona na zdjęciach;

2.

czas oczekiwania na uderzenie pioruna podczas burzy;

rozkłady odległości od ścianki komory do punktu oddziaływania oraz rozkłady czasów oczekiwania, mają rozkład eksponencjalny.

(8)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

(9)
(10)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

(11)

Rozkład Poissona

z parametrem λ > 0; w skrócie P(λ), definiujemy ciągiem par:

średnia, wariancja, asymetria i eksces:

λ

σ

µ

=

V

x

=

2

=

λ

γ

3

=

1

λ

γ

4

=

1

(12)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład Poissona

(13)

Liczba zdarzeń,

które zaszły w określonym przedziale czasowym lub przestrzennym, np. w czasie T, podlega rozkładowi Poissona.

np. 1.

liczba elementów elektronicznych, które uległy awarii w czasie roku, dwóch itd. 2.

liczba protonów, które pokonały drogę do momentu zderzenia od L do L+h

(wartości odległości znalazły się w przedziale < L, L+h >)

Rozkład Poissona

(14)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

(15)

Twierdzenie Poissona

(przybliżenie Poissona rozkładu dwumianowego)

Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego

z prawdopodobieństwem sukcesu pn.

Jeżeli

to dla dowolnego ustalonego

gdzie Yλ ma rozkład Poissona P(λ)

Twierdzenie Poissona

(przybliżenie Poissona rozkładu dwumianowego)

Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego

z prawdopodobieństwem sukcesu pn.

Jeżeli

to dla dowolnego ustalonego to dla dowolnego ustalonego

gdzie Yλ ma rozkład Poissona P(λ)

(16)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

(17)
(18)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

(19)
(20)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski Rozkład Normalny (Gaussa)

(21)

Rozkład normalny N( m, σ ) (Gaussa)

Rozkład normalny z parametrami m, σ oznaczany jest symbolem N( m, σ )

Gęstość prawdopodobieństwa rozkładu normalnego jest określona wzorem:

Rozkład normalny N( 0, 1 )

Jeżeli m = 0 i σ = 1, to funkcja gęstości prawdopodobieństwa ma postać

0

4

3

=

γ

=

(22)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład normalny N( 0, 1 )

Jeżeli m = 0 i σ = 1, to funkcja gęstości prawdopodobieństwa ma postać

(23)
(24)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład Normalny (Gaussa)

Ilustracja wartości odchylenia standardowego w rozkładzie Normalnym

Czasem używa się "reguły" 3-sigma, w astrofizyce 5-sigma;

tzn., że dla odległości między wartościami zmierzonymi większej niż 3 lub 5-sigma pozwala uznawać takie wielkości za istotnie różne.

(25)

Rozkład Normalny (Gaussa)

(26)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

(27)

Rozkład Normalny (Gaussa)

Własności rozkładu normalnego – c.d.

(28)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

(29)

Rozkład Studenta

(rozkład t lub rozkład t-Studenta)

Ciągły rozkład prawdopodobieństwa stosowany: • w procedurach testowania hipotez statystycznych • i przy ocenie niepewności pomiaru.

dla

oszacowania przedziału, w którym leży, z określonym prawdopodobieństwem,

rzeczywista wartość mierzona,

Jeśli dysponujemy n pomiarami ( n<30 ), możemy wyznaczyć

średnią i odchylenie standardowe lub wariancję („z próby”), Oczywiście, nie znamy odchylenia standardowego w populacji.

Zagadnienie to rozwiązał w 1908 r. William Sealy Gosset (pseudonim Student) podając funkcję zależną od wyników pomiarów

χ

χ

χ

χ

i

(30)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Definicja

Rozkład Studenta z r stopniami swobody (dla n pomiarów) jest rozkładem zmiennej losowej T postaci:

Rozkład t-Studenta

gdzie:

u jest zmienną losową mającą standardowy rozkład normalny N(0,1), • z jest zmienną losową o rozkładzie chi-kwadrat o r stopniach swobody, • u i z są niezależne.

r

z

u

t

=

(31)

Liczba r stopni swobody, df (degrees of freedom) – liczba niezależnych wyników obserwacji n

pomniejszona o liczbę związków, które łączą te wyniki ze sobą

Rozkład t Studenta

σ

σ

σ

σ

tylko dla r > 2,

γγγγ

4 tylko dla n > 4 2 1 2

1

2

2

1

)

(

+ −





+

Γ

 +

Γ

=

r

r

t

r

r

r

t

f

π

0

3

=

=

γ

µ

2

=

r

r

σ

(

)

4

2

3

4

=

r

r

γ

(32)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład t Studenta

(33)
(34)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład chi kwadrat (zapisywany także jako χ²)

to rozkład zmiennej losowej, która jest sumą n kwadratów

niezależnych zmiennych losowych o standardowym rozkładzie normalnym.

Liczbę naturalną n nazywa się liczbą stopni swobody rozkładu zmiennej losowej. Jeżeli ciąg niezależnych zmiennych losowych

Rozkład

χ

χ

χ

χ

2

(chi-kwadrat)

czyli:

Zmienna losowa z ma rozkład chi kwadrat o n stopniach swobody

( )

0

,

1

N

u

i

oraz

( )

=

=

n i i

u

z

1 2 to 2 n

z

χ

(35)

Rozkład

χ

χ

χ

χ

2

(chi-kwadrat)

2 1 2 2

2

2

1

)

(

z n n

z

e

n

z

f

− −

Γ

=

dla n stopni swobody i z > 0

n

=

µ

σ

=

2

n

n

2

4

3

=

γ

n

12

4

=

γ

2

= n

z

Wartość modalna:

(36)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład

χ

χ

χ

χ

2

(chi-kwadrat)

Suma kwadratów n niezależnych zmiennych N(0, 1)

ma rozkład

χ

χ

χ

χ

2 o r = n – 1 stopniach swobody;

(w szczególności kwadrat standaryzowanej zmiennej normalnej jest zmienną

χ

χ

χ

χ

2 o 1 stopniu swobody)

Jeśli s2 jest wariancją z n-elementowej próby normalnej,

to z = ns2 /

σ

σ

σ

σ

2 ma rozkład

χ

χ

χ

χ

2 o n-1 stopniach swobody.

Przy r

→∞

→∞

→∞

→∞

rozkład

χ

χ

χ

χ

2 dąży (bardzo wolno!) do

N

(

0

,

2

r

)

Szybciej zbieżny do N(0, 1) jest rozkład zmiennej (można z tego przybliżenia korzystać dla r > 30

przy z

(z0.05, z0.95)

1

2

2

=

z

r

u

(37)

Rozkład

χ

χ

χ

χ

2

(chi-kwadrat)

Zastosowanie rozkładu

χ

χ

χ

χ

2

Rozkład

χ

χ

χ

χ

2 wykorzystywany jest przy analizie wariancji m.in.

do wyliczenia prawdopodobieństwa,

że wariancja spełnia jakiś warunek,

przy wyznaczaniu poziomu ufności dla wariacji lub

przy testowaniu hipotez dla wariancji

(38)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

(39)

Funkcja gamma (zwana też gammą Eulera)

– funkcja specjalna, która rozszerza pojęcie silni na zbiór liczb rzeczywistych i zespolonych. Gdy część rzeczywista liczby zespolonej z jest dodatnia, to całka (całka Eulera):

(40)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

(41)
(42)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Rozkład Potęgowy

istnieje tylko dla

1 0 0

)

(

− −





=

β

β

x

x

x

x

f

gdzie

β

β

β

β

> 0 jest wykładnikiem lub nachyleniem "całkowym" (rozkładu całkowego) Dystrybuanta: β −





=

0

1

)

(

x

x

x

F

(43)

Rozkład Potęgowy

Średnia istnieje tylko dla

β

β

β

β

> 1, zaś dyspersja dla

β

β

β

β

> 2

1

0

=

β

β

µ

x

)

2

)(

1

(

0

=

β

β

β

σ

x

0

x

=

µ

µ

β

użyteczne: mediana:

β

1 0 2 / 1

= x

2

x

(44)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna dr Jan Malinowski Funkcja potęgowa 0 200 400 600 800 1000 0 50 100 X Y = X ^ -2 0,1 100 0,4 50 2,5 20 10 10 40 5 250 2 1000 1 Y = X ^ - 2 X 0,1 1 10 100 1000 1 10 100 X - w skali log Y w s k a li l o g 100 1000 1 10 100 X - w skali log Y * ( X ^ 1 ,9 )

(45)
(46)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

(47)

Centralne twierdzenie graniczne

O twierdzeniach granicznych:

Mamy ciąg zmiennych losowych niezależnych: ξ1, ξ2, …, ξn, … mających

skończone wartości oczekiwane mk i skończone wariancje σk2

(k = 1, 2, …, n, …)

mk = E( ξk ) σk2 = E( ξ

k - mk )2

Oznaczmy:

ηn = ξ1 + ξ2 + … + ξn

Mn = m1 + m2 + … + mn – wartość oczekiwana zmiennych ηn Bn2 = σ

(48)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski Centralne twierdzenie graniczne

Ciąg zmiennych losowych ξ1, ξ2, …, ξn, … mających skończone wartości oczekiwane mk

spełnia

słabe prawo wielkich liczb

jeśli ciąg zmiennych losowych

n

M

n

n n

η

jest zbieżny do zera według prawdopodobieństwa

Centralnym twierdzeniem prawdopodobieństwa

nazywamy każde twierdzenie zawierające warunki dostateczne na to, aby ciąg dystrybuant zmiennych losowych

n n n

B

M

η

(49)
(50)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Centralne twierdzenie graniczne

(wg. Wikipedii)

https://pl.wikipedia.org/wiki/Centralne_twierdzenie_graniczne

Centralne twierdzenie graniczne – jedno z najważniejszych twierdzeń rachunku

prawdopodobieństwa, uzasadniające powszechne występowanie w przyrodzie rozkładów zbliżonych do rozkładu normalnego.

Sformułowanie szczególne

jeśli Xi są niezależnymi zmiennymi losowymi o jednakowym rozkładzie,

takiej samej wartości oczekiwanej

µ

µ

µ

µ

skończonej wariancji σ, to zmienna losowa o postaci

zbiega według rozkładu do standardowego rozkładu normalnego

(51)
(52)

Rachunek Prawdopodobieństwa i Statystyka Matematyczna

dr Jan Malinowski

Cytaty

Powiązane dokumenty

Szansa wykonania kroku w kierunku przepaści wynosi 1/3, w przeciwnym — 2/3, kroki są niezależne.. Jaka jest

Popularny ujemny rozkład dwumianowy (Negative Binomial Distribution) ma systematyczne odchylenia od danych.. Dane są najlepiej opisywane przez Rozkład Logarytmiczno-Normalny

Niech ¯ X będzie średnią obliczoną na podstawie próbki 20 losowo wybranych

Niech ¯ X będzie średnią obliczoną na podstawie próbki 20 losowo wybranych

2.4 Wskaż numer statystyki pozycyjnej, która jest p-tym kwantylem próbkowym. Która statystyka pozycyjna jest najmniejszym, a która największym kwantylem w przypadku

Rozkłady zmiennych

Rozkłady zmiennych

X nie ma wtedy interpretacji czasu oczekiwania na m-ty sukces... Podstawowe ciągłe