• Nie Znaleziono Wyników

Badania statystyczne ze względu na jedną cechę

N/A
N/A
Protected

Academic year: 2021

Share "Badania statystyczne ze względu na jedną cechę"

Copied!
18
0
0

Pełen tekst

(1)

Badania statystyczne ze względu na jedną cechę

Zagadnienia estymacji.

Statystyka matematyczna zajmuje się badaniem populacji generalnej za pomocą metod rachunku prawdopodobieństwa. W rachunku prawdopodobieństwa zakłada się, że jest znany rozkład prawdopodobieństwa badanej zmiennej losowej. W statystyce bada się zmienną losową, która przyjmuje wartości – wartość cechy losowo wybranego elementu z populacji generalnej. Rozkład prawdopodobieństwa takiej zmiennej losowej a więc i cechy jest zazwyczaj nie znany albo mamy małe informacje na temat tego rozkładu. Np. mamy informację, że cecha ma rozkład normalny ale nie znamy jakie są istotne parametry

m

i

.

Schemat badania populacji generalnej Z za pomocą próby jest następujący:

Niech X oznacza zmienną losową badanej cechy. Dowolne dwie różne

n

-

elementowe

próby tej samej populacji są zazwyczaj różne z różnymi obliczonymi parametrami

opisowymi. Próbę

n

- elementową x1,x2,x3,....,xn będziemy traktować jaką realizację ciągu zmiennych losowych X1,X2,X3,....,Xn gdzie zmienna losowa Xi przyjmuje wartości – wartość itego pomiaru cechy w próbie i1,2,...,n. Dla różnych prób

n

- elementowych wartości są zazwyczaj różne. Ponieważ próba jest próbą losową prostą / tzn. wybieramy elementy z populacji tak aby każdy element miał jednakowe

prawdopodobieństwo trafienia do próby/ i populacja jest duża /wtedy wylosowany element nie wpływa na stan populacji / to zmienne losowe X1,X2,X3,....,Xnniezależne i rozkład tych zmiennych jest taki sam co rozkład zmiennej losowej X co zapisujemy X ~ Xi i 1,2,...,n

Estymacja punktowa.

Statystyka - jest zmienną losową postaci funkcji wyników próby losowej tzn. dowolną funkcją postaci Z f(X1,X2,X3,....,Xn) gdzie z f(x1,x2,x3,....,xn) jest funkcją n zmiennych.

Estymator - dowolna statystyka służąca do oszacowania nieznanej wartości parametru

 populacji generalnej.

Wartość estymatora w próbie jest szacowaniem punktowym parametru za pomocą próby Najważniejsze statystyki.

Średnia empiryczna.

 

  n

i

n Xi

n n

X X

X X

1 2

1 .... 1

Wariancja empiryczna.

 

  n

i

n Xi X

n n

X X X

X X S X

1 2 2

2 2 2

2 ( 1 ) ( ) ... ( ) 1 ( )

(2)

Odchylenie standardowe empiryczne.

S2

S

Definicja. Mówimy, że statystyka Zn szacująca parametr  jest estymatorem nieobciążonym gdy wartość oczekiwana E(Zn) .

Definicja. Mówimy, że statystyka Zn szacująca parametr  jest estymatorem zgodnym gdy lim ( n )1

n P Z dla każdego  0.

Definicja. Mówimy, że statystyka Zn szacująca parametr jest estymatorem asymptotycznie nieobciążonym gdy 



( )

lim n

n E Z .

Estymator X której wartością jest średnia arytmetyczna x obliczana w próbie szacuje punktowo wartość oczekiwaną mE( X) w populacji generalnej. Jest estymatorem nieobciążonym i zgodnym. Ponadto jeżeli X ~ N(m,) to ~ ( , )

m n N

X

.

Estymator S2 której wartością jest wariancja s2 obliczana w próbie szacuje punktowo wariancję 2 D2(X) w populacji generalnej. Jest estymatorem nieobciążonym i zgodnym gdy X ~N(m,). Jest estymatorem asymptotycznie nieobciążonym i zgodnym gdy X ma rozkład dowolny.

2

2 1

)

(

n S n

E Jeżeli 2 2

1S n S n

to E(S2)2

Estymacja przedziałowa

Estymacja punktowa parametru nie daje odpowiedzi jaka jest dokładność uzyskanej oceny. Innym sposobem estymacji, dającym możliwość oceny tej dokładności jest metoda przedziałowa.

Przedziałem ufności dla parametru  na poziomie ufności 1 (0 1) nazywamy przedział (1,2) spełniającym warunki:

a). jego końce 1 1(X1,X2,...Xn) 2 2(X1,X2,...Xn) są funkcjami próby losowej i nie zależą od parametru .

b). Prawdopodobieństwo pokrycia przez ten przedział nieznanego parametru jest równe 1 tzn. P(1(X1,X2,...Xn) 2(X1,X2,...Xn))1

1 jest poziomem ufności. Końce przedziałów są zmiennymi losowymi a więc nieznany parametr  może być pokryty przez ten przedział lub nie. Prawdopodobieństwo

(3)

nie pokrycia parametru wynosi

a więc

powinno być wartością małą bliską zeru. W praktyce przyjmuje się {0,1;0,05;0,01;...}.

Będziemy wyznaczać przedziały ufności dla wartości oczekiwanej m E( X) i wariancji

)

2(

2 D X

oraz odchylenia standardowego. W pliku „ Wzory estymacja ” są

przedstawione modele dla tych parametrów. W zależności od rodzaju próby i istniejących informacji dotyczących rozkładu cechy oraz parametru należy wybrać odpowiedni model tak aby spełnione były założenia modelu. Stosujemy wzór w tym modelu wyznaczając dodatkowo kwantyle u , , t,n-1 ,

2 1 2,n

,

2 1 2, 1 n

 z rozkładów stablicowanych podanych w modelach. Dlatego należy te stablicowane rozkłady wydrukować.

Wyprowadzę wzory dla modelu I dla wartości oczekiwanej i modelu I dla wariancji.

Przedział ufności dla wartości średniej.

Model I

Zakładamy, że populacja generalna ma rozkład N(m,) tzn. X ~ N(m,). Wartość średnia m jest nie znana, zaś  jest znane. Zachodzi to w sytuacji np. gdy pomiaru danej cechy dokonujemy przyrządem pomiarowym o znanej dokładności (rozrzut pomiarów powinien być podany przez wytwórcę przyrządu pomiarowego). Przedział ufności dla średniej otrzymuje się wówczas z wzoru który można uzyskać w następujący sposób:

Jeżeli założenia modelu są spełnione to zmienna losowa U Xm n ma rozkład normalny standaryzowany tzn. U ~ N(0,1). Z tablic tego rozkładu wyznaczamy kwantyl utak aby

( ) ) ( ) ( )

1 X m u n

u n P u m n u X

P u m n

P X u U

P

) (

)

( m X u n

u n X n P

u X n m

u X

P

Obliczamy wartość zmiennej losowej X która równa się średniej arytmetycznej w próbie i z tablic rozkładu normalnego zatytułowanego P(U u) kwantyl u ponieważ

( ) ( )

1 P U u P U u . Dziesiętne wartości

są zamieszczone w kolumnie z lewej strony a setne wartości

są zamieszczone w wierszu na górze. W przecięciu się wiersza na poziome wartości dziesiętnych

i kolumny z setną wartością

otrzymamy wartość u . Wartość

jest w tym modelu znana a n jest wielkością próby. Otrzymamy przedział xu n mxu n o tych końcach z

prawdopodobieństwem 1 pokrywa istniejącą w badanej populacji generalnej wartość oczekiwaną m E( X).

(4)

Przedziały ufności dla wariancji .

Model I

Populacja generalna ma rozkład normalny N(m, ) tzn. X ~ N(m,) o nieznanych parametrach m i  . Z populacji tej wylosowano niezależnie próbę n elementową

(zakładamy, że n jest małe, tj. n<30). Z próby obliczamy s2. Wówczas przedział ufności dla wariancji 2 populacji generalnej można otrzymać w następujący sposób:

Jeżeli założenia modelu są spełnione to zmienna losowa 2

2 2

  nS ma rozkład ch-kwadrat o r=n-1 stopniach swobody.

) (

1 ) ( 1

) (

) (

1 2

1 2, 1

2 2

2 1 2,

2

2 1 2, 1 2 2

2 1 2, 2

1 2, 2

2 2

1 2, 1 2

1 2, 2 2

1 2, 1

          

n n

n n

n n

n n

nS P nS

P nS P nS

P

 

 

 

Pole zawarte po lewej stronie wartości 2 , 1 12 n

 i ograniczone funkcją gęstości rozkładu

2 i osią OX jest równe 2

 . Również pole zawarte po prawej stronie wartości

2 1 2,n

i ograniczone funkcją gęstości rozkładu 2 i osią OX jest równe

2

 . W sumie pole nad

zewnętrzem przedziału (

2 1 2, 1 n

 ,

2 1 2,n

) i funkcją gęstości jest równe

.

Wartości

2 1 2, 1 n

 ,

2 1 2,n

dla przyjętego

odczytujemy z tablic rozkładu 2 zatytułowanego P(2 2) przyjmując odpowiednio

12

i 2

 . Wartość  znajduje się w wierszu na górze tablicy a stopnie swobody r=n-1 w pierwszej kolumnie z lewej strony tablicy. W przecięciu się wiersza na poziomie stopnia swobody r=n-1 i kolumny zawierającą wartość  otrzymamy szukany kwantyl.

Zad

Zawartość witaminy C wyrażona w mg na 100g w 10 słoikach konserwowanego soku pomidorowego reprezentują liczby 15 ; 21 ; 21; 20 ; 23 ; 15 ; 17 ; 27 ; 23 ; 18 . Wyznaczyć przedział ufności na poziomie ufności 0,95 dla wartości oczekiwanej i wariancji zawartości witaminy C w słoikach konserwowanego soku pomidorowego n = 10

(5)

xi (xi x)2

15 25

21 1

21 1

20 0

23 9

15 25

17 9

27 49

23 9

18 4

 = 200  = 132

10 20 200 

x 13,2

10

2 132 s

63 , 3 2 , 13

s

Przedział ufności dla wartości oczekiwanej.

Model I nie możemy przyjąć gdyż nie znamy wartości

.

Model III nie możemy zastosować ponieważ próba jest mała ( n=10<30)

Zostaje model II w którym trzeba przyjąć, że X ~ N(m,) co dla tej cechy jest wielce prawdopodobne albo wynika to z innych badań. Można taką hipotezę

zweryfikować.

05 , 0 95 , 0

1

Z tablic rozkładu t – Studenta zatytułowanego P(| t | > t

262 ,

9 2

; 05 , 0 1

; t

tn

Wstawiając do wzoru

1

1 ; 1

1

;

n t s

x n m

t s

x n n mamy

1 10

63 , 262 3 , 2 1 20

10 63 , 262 3 , 2

20

m 17,26 m22,74

Ten przedział o tych końcach pokrywa z prawdopodobieństwem 0,95 istniejącą teoretyczną średnią zawartość witaminy C w słoikach konserwowanego soku pomidorowego.

Przedział ufności dla wariancji.

Stosujemy model I dla wariancji gdyż model II jest dla dużej próby (n>30)

05 , 0 95 , 0

1

Z tablic rozkładu chi – kwadrat zatytułowanego P( ; 7

,

2 2

9

; 975 , 0 2

1 2,

1  

n

023 ,

2 19

9

; 025 , 0 2

1 2,



n . Wstawiając do wzoru 2

2 1 1

2 2

2 2 1

2

α,n

α,n χ

σ ns χ

ns

mamy

7 , 2

2 , 13 10 023

, 19

2 , 13

10 σ2 6,94 σ2 48,89 2,63 σ6,99

(6)

Te przedziały o tych końcach z prawdopodobieństwem 0,95 pokrywają istniejącą teoretyczną wariancję i odchylenie standardowe zawartość witaminy C w słoikach konserwowanego soku pomidorowego.

Zad

Badając koszty produkcji kwintala pewnej paszy wylosowano n =80 gospodarstw rolnych z których otrzymano podane poniżej wyniki w postaci szeregu rozdzielczego.

Oszacować metodą przedziałową średni koszt i odchylenie standardowe produkcji kwintala paszy na poziomie ufności 1 -  = 0,9

Koszt paszy w zł/q

Liczba gospodarstw

środki

przedziałów składniki składniki

20 - 40 10 30 300 17222,5

40 -60 16 50 800 7396

60 - 80 24 70 1680 54

80 - 100 18 90 1620 6169,5

100 - 120 12 110 1320 17787

n =  = 80  = 5720  = 48620 5

, 80 71

5720 

x 546,29

80 48620

2

s s 546,29 23,37

Wybieramy model III dla wartości oczekiwanej i model II dla wariancji gdyż mamy dużą próbę (n=80 > 30) .

Przedział ufności dla wartości oczekiwanej.

1 , 0 9 , 0

1

Z tablic rozkładu normalnego zatytułowanego P(U u)u  u0,11,645. Wstawiając do wzoru

n u s x n m

u s

x mamy

80 37 , 64523 , 1 5 , 80 71

37 , 64523 , 1 5 ,

71 m 67,2 m75,8

Ten przedział o tych końcach pokrywa z prawdopodobieństwem 0,9 istniejący teoretyczny średni koszt produkcji kwintala paszy .

Przedział ufności dla odchylenia standardowego.

1 , 0 9 , 0

1

Z tablic rozkładu normalnego zatytułowanego P(U u) ; u  u0,1 1,645 2

i i i

b xa

i

i x n

x )2 ( 

ai bi ni

i in x

(7)

Wstawiając do wzoru

n u

n s u

n n s

2 1

2 1

2

2 mamy

645 , 1 1 80

* 2

80 2 37 , 23 645

, 1 1 80

* 2

80 2 37 , 23

20,73 26,96

Ten przedział o tych końcach pokrywa z prawdopodobieństwem 0,9 istniejącą teoretyczne odchylenie standardowe kosztu produkcji kwintala paszy .

Czynniki wpływające na długość przedziału ufności.

Długość przedziału ufności np. dla modelu III dla wartości oczekiwanej wynosi n

u s

dl,n 2 to istotnie na długość wpływa poziom ufności i wielkość próby. Tak jak w tym przypadku ogólnie długość przedziału ufności dowolnego parametru ma

następującą zależność:

a). Większy poziom ufności 1- długość przedziału większa i odwrotnie i ponadto



dl ,n

lim0

.

b). Wielkość próby n większa - długość przedziału mniejsza i odwrotnie oraz ponadto lim , 0



n

n dl

Hipotezy statystyczne i weryfikacja hipotez.

Drugim istotnym obok estymacji działaniem wnioskowania statystycznego jest weryfikacja czyli podejmowanie decyzji o prawdziwości albo fałszywości hipotez statystycznych.

Hipotezą statystyczną nazywamy każde przypuszczenie odnośnie nieznanego

rozkładu badanej cechy populacji generalnej o prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próby.

Przypuszczenia najczęściej dotyczą postaci rozkładu cechy / hipotezy nieparametryczne / lub wartości jego parametrów / hipotezy parametryczne /.

Przykłady

a). W przypadku gdy cecha X ~N(m,) o nieznanych m, wysuwamy hipotezę , że wartość oczekiwana E(X)2 lub D2(X)0,5 / hipotezy parametryczne /.

b). Wysuwamy hipotezę , że cecha X ~ N(m,) o pewnych parametrach m, / hipoteza nieparametryczna /.

c). Wysuwamy hipotezę o równości parametrów dwóch zbiorów obserwacji lub twierdzimy , że pochodzą z tej samej populacji / hipotezy parametryczne /.

Ogólny sposób tworzenia i weryfikowania hipotez statystycznych jest następujący:

Niech  będzie parametrem cechy populacji generalnej i 1,2 parametrami cechy odpowiednio dwóch populacji generalnych.

0o Formułujemy hipotezę główną tzw. hipotezę zerową co zapisujemy w postaci H0: 0 lub H0:1 2 gdzie 0 konkretna wartość liczbowa tzw. wartość hipotetyczna - w przypadku hipotez parametrycznych. H0 : sformułowanie dotyczące rozkładu cechy - w przypadku hipotez nieparametrycznych.

(8)

1o Przyjmujemy poziom istotności {0,1;0,05;0,01;itd..} na którym będziemy testować

hipotezę zerową.

2o Formułujemy hipotezę alternatywną którą przyjmiemy w przypadku odrzucenia hipotezy zerowej .

Przyjmujemy zazwyczaj H1: 0 lub H2: 0 lub H3: 0 w przypadku hipotezy zerowej H0: 0.

Przyjmujemy zazwyczaj H1:1 2 lub H2:1 2 lub H3:12 w przypadku hipotezy zerowej H0:1 2.

Przyjmujemy zazwyczaj H1: zaprzeczenie hipotezy zerowej w przypadku hipotezy zerowej nieparametrycznej.

3o Formułujemy statystykę testową próby (X1,X2,...Xn) której będzie znany rozkład prawdopodobieństwa przy założeniu prawdziwości hipotezy zerowej i znanych innych własnościach cechy X . W praktyce wybieramy odpowiedni model danego zagadnienia w którym spełnione są pewne założenia odnośnie cechy i wielkości próby.

4o Obliczamy wartość statystyki 0 (x1,x2,...xn) na podstawie uzyskanych wartości x1,x2,...,xn próby.

5o Wyznaczamy obszar krytyczny K tzw. zbiór wartości mało prawdopodobnych statystyki

(X1,X2,...Xn) taki, że P((X1,X2,...Xn) )K .

6o a). Jeżeli wartość statystyki 0 (x1,x2,...xn) obliczona w punkcie 4o należy do obszaru krytycznego K , tzn. 0K to hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej i będziemy twierdzić, że hipoteza alternatywna

jest prawdziwa z prawdopodobieństwem 1.

b). Jeżeli wartość statystyki 0 (x1,x2,...xn) obliczona w punkcie 4o nie należy do

obszaru krytycznego K , tzn. 0K to twierdzimy, że nie ma podstaw do odrzucenia

hipotezy zerowej na poziomie istotności

. W praktyce na

tym poziomie istotności przyjmuje się prawdziwość hipotezy zerowej.

Obowiązują zagadnienia zawarte w modelach i modele przedstawione w pliku

„Weryfikacja hipotez_wzory z m” na stronie internetowej //wmii.uwm.edu.pl/~germaniuk .

W takim postępowaniu mogą pojawić się następujące błędy:

a). Błąd pierwszego rodzaju - odrzucimy hipotezę ze zerową która jest prawdziwa i przyjmujemy hipotezę alternatywną która będzie fałszywa. Ten błąd może pojawić się z prawdopodobieństwem

a więc poziom istotności

przyjmujemy mały bliski zeru.

b). Błąd drugiego rodzaju - nie odrzucamy hipotezę zerową i przyjmujemy ją która w rzeczywistości jest fałszywa. Taki błąd może pojawić się też z małym

prawdopodobieństwem ale z jakim nie możemy określić /nie tak jak w przypadku błędu pierwszego rodzaju/.

Przykład

Badając wpływ pewnego herbicydu na wysokość plonu zboża, użyto go do ochrony roślin na n1=5 poletkach doświadczalnych i otrzymano następujące plony ( w q/ha ) :

(9)

27 , 34 , 36, 31 , 32 . Natomiast w grupie kontrolnej n2=6 poletek doświadczalnych o identycznych warunkach uprawy bez stosowania tego herbicydu, plony były następujące : 25 , 31 , 27 , 23 , 30 , 32 ( w q/ha ). Na poziomie istotności  = 0,1 sprawdzić hipotezę o równości wariancji. Również zweryfikować hipotezę, że stosowanie tego herbicydu zwiększa plony na poziomie istotności  = 0,05 .

Weryfikacja hipotezy o równości wariancji.

Stosujemy test Snedecora

00 22 2

:1

Ho hipoteza zerowa czyli twierdzę, że wariancje są równe 10 α = 0,1 poziom istotności

20 22 2 1 1: 

H hipoteza alternatywna po odrzuceniu hipotezy zerowej

30 Dla zweryfikowana prawdziwości hipotezy zerowej służy statystyka 2

1

S F S

o rozkładzie F - Snedecora z r1 = n1 - 1 i r2 = n2 - 1 stopniami swobody .

Sˆ2 nn1Sk2 k 1,2

k k k

40 Wartość statystyki dla naszej próby

ˆ 5519,2 11,5 66110,66 12,8 0 1211,,58 0,898 2

2 2

1   

 

 

S F

S

50 Test obustronny 









;

;

0 ,( , )

) 2 , ( 2,

1 r1r2 F r1r2

F

K

F0,05;(4,5) 5,19 1 6,125 0,16

) 4 , 5 (

; 05 , 0 ) 5 , 4 (

; 95 ,

0

F F

  

0 ; 0,16 5,19 ; K

60 Ponieważ wartość statystyki nie należy do obszaru krytycznego K

(F0 0,898K

0 ; 0,16

 

5,19 ;

) to nie ma podstaw do odrzucenia hipotezy

zerowej a więc nie ma podstaw do twierdzenia z prawdopodobieństwem co najmniej 0,9 , że wariancje w dwóch populacjach są różne.

xi (xi x1)2 xi (xi x2)2

27 25 25 9

24 4 31 9

36 16 27 1

31 1 23 25

32 0 30 4

 160

 46 32 16

5 32 160

1

x 9,2

5

2 46

1

s

 168

 64

6 28 168

2

x 10,66

6

2 64

2

s

(10)

Po takiej weryfikacji pozostawia się prawdziwość poprzedniego twierdzenia.

Weryfikacja hipotezy, że stosowanie herbicydu zwiększa plony .

Stosujemy testy istotności dla dwóch średnich. Z proponowanych modeli, Model I

odrzucamy, ponieważ nie znamy odchyleń standardowych badanych populacji. Model III również odrzucamy ponieważ mamy małe próby a w tym modelu próby muszą być duże.

Pozostaje Model II w którym należy założyć że cechy mają rozkład normalny.

) , (

~ 1 1

1 N m

X X2 ~N(m2,2) Tego typu cechy mają takie rozkłady. Ponadto trzeba założyć, że 1 2. Prawdziwość tej tezy zweryfikowaliśmy powyżej.

00 Ho :m1 m2 hipoteza zerowa czyli twierdzę, że plony są takie same 10 α = 0,05 poziom istotności

20 H3:m1m2 hipoteza alternatywna po odrzuceniu hipotezy zerowej 30 Dla zweryfikowana prawdziwości hipotezy zerowej służy statystyka



 

 

 

2 1 2

1

2 2 2 2 1 1

2 1

1 1

2 n n

n n

S n S n

X t X

o rozkładzie t – Studenta o r = n1+n2-2 stopni swobody .

40 Wartość statystyki dla naszej próby

889 , 1 6 1 5 1 2

6 5

66 , 10 6 2 , 9 5

28

32

 

to

50 Test prawostronny K(t2;n1n22 , )

t0,1;9 1,833 K (1,833, ) 60 Ponieważ wartość statystyki należy do obszaru krytycznego K

(t0 1,889K

1,833 ;

) to hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej a więc z prawdopodobieństwem co najmniej 0,95 twierdzimy , że stosowanie herbicydu zwiększa wydajność plonu.

Badanie statystyczne ze względu na dwie cechy

W badaniu populacji generalnej będą interesować nas wartości dwóch lub więcej cech mierzalnych elementu populacji, wartości których tworzą tzw. wektor losowy

) ,...., ,

,

(X1 X2 X3 Xn . Wartości zmiennej losowej Xi to wartości itej badanej cechy

(11)

n

i1,2,...., . Zajmiemy się przypadkiem badaniem dwóch cech w populacji generalnej i związanym z tym wektorem losowym dwuwymiarowym (X,Y). Dotychczas zmienne losowe były niezależne a obecnie zmienne losowe X ,Y nie muszą być niezależne i będą mieć pewną współzależność, którą będziemy badać. Badać będziemy za pomocą próby n - elementowej postaci (x1,y1),(x2,y2),(x3,y3),...,(xn,yn) gdzie wartość xi to wartość pierwszej cechy itego elementu próby, wartość yi to wartość drugiej cechy

tego

i elementu próby i1,2,....,n. Elementy próby muszą tak jak poprzednio uzyskane w sposób losowy tak aby każdy element populacji generalnej miał jednakowe prawdopodobieństwo trafienia do próby.

Rozkład prawdopodobieństwa wektora losowego dwuwymiarowego.

Powiemy, że jest określony rozkład wektora losowego (X,Y) jeżeli jest określona

funkcja prawdopodobieństwa

R y x y Y

x X

P y Y x X

P( , ) ({: () }{: () }) , spełniająca aksjomaty prawdopodobieństwa. Taki rozkład można określić podobnie jak w przypadku jednej zmiennej losowej:

1oDla wektora losowego (X,Y) dyskretnego przyjmująca wartości (xi,yj)takie, że pij P(X xi,Y yj)0 i

, 1

j i

pij .

2o Dla wektora losowego (X,Y) typu ciągłego za pomocą funkcji gęstości

z f(x,y) x,yR spełniająca warunki podobne jak w przypadku jednej zmiennej.

a). Przyjmuje wartości nieujemne tzn. f(x,y)0 x,yR

b). Objętość zawarta między wykresem funkcji z f(x,y) a płaszczyzną OXY w przestrzeni R3

jest równe 1 .

c). Prawdopodobieństwa P(aX b;cY d) ab cd a,b,c,dR są równe objętości zawartej między wykresem funkcji z f(x,y) , płaszczyznami xa , x b yc , y d i płaszczyzną OXY.

Składową X wektora losowego (X,Y) można traktować jako zmienną losową jednowymiarową nie biorąc pod uwagę wartości zmiennej Y . Również składową Y wektora losowego (X,Y) można traktować jako zmienną losową jednowymiarową nie biorąc pod uwagę wartości zmiennej X .Rozkłady zmiennych losowych X ,Y

rozkładami brzegowymi rozkładu wektora losowego (X,Y).

Definicja rozkładu dwuwymiarowego normalnego . Powiemy dwuwymiarowy wektor losowy (X,Y) ma rozkład normalny jeżeli funkcja gęstości tego rozkładu wyraża się wzorem:

) ) ( ) )(

2 ( ) (( ) 1 ( 2 ( 1

2 2

1

22 2 2

2 1

2 1 12

1 2 2

1 2

) 1 ,

(



m y m y m x m x

e y

x f z

 

Parametrami tego rozkładu są liczby ,1,2,m1,m2

Wartość oczekiwana tej zmiennej losowej E(X,Y)(E(X),E(Y))(m1,m2)

Rozkłady brzegowe tego rozkładu X ~ N(m1,1) , Y ~ N(m2,2). Niech (X,Y) będzie dowolnym wektorem losowym.

Cytaty

Powiązane dokumenty

Wykonane obliczenia (zapisane w pdf + arkusz kalkulacyjny) trzeba będzie wysład jako załącznik na adres szyszkin@agh.edu.pl, a w tytule wpisad:. KWIM_Spr_Proj2_Nazwisko_Imię Czas

Próbkę przed złamaniem należy dokładnie zmierzyć a wymiary wpisać do tab. Wyniki próby udarowej należy również umieścić w tab. Po złamaniu próbki przeprowadza się

 Próba dzielona jest na podstawie wybranych zmiennych na warstwy.  Proporcje poszczególnych warstw są takie jak w

Przypuśćmy, że chcem y wybrać tylko je ­ dn ą najlepszą populację.. M ożemy teraz podać dalszą in terp retację stałej 6*.. x w'.‘ Zasada wyboru jest prosta i

Мудрий охарактеризовал важность связи УПР с деятельностью депутатов предыдущих каденций в сфере защиты прав украинского народа, сообщил

Pojęcie błędnej reprezentacji odgrywa rolę nie tylko w opisywaniu, wyjaśnianiu i przewidywaniu zachowań pozornie irracjonalnych, lecz także w odniesieniu do (przynajmniej

Nie twierdzi wyraźnie, że św. 12 uczy o grzechu pierworodnym. Uzasadnia natomiast pojawienie się kary za grzech, kary śmierci. Każdy na nią zasłużył przez wzgląd na

„wodotryskami” i wolelibyśmy, aby przyrząd nie wykonał sam całego doświad- czenia za ucznia/studenta, wówczas świetną alternatywą dla zakupu chronogra- fu, może być