• Nie Znaleziono Wyników

Wykład 1.Wstęp

N/A
N/A
Protected

Academic year: 2021

Share "Wykład 1.Wstęp"

Copied!
41
0
0

Pełen tekst

(1)

dr hab.inż. Katarzyna Zakrzewska, prof.AGH Katedra Elektroniki, AGH

e-mail: zak@agh.edu.pl http://home.agh.edu.pl/~zak

Wykład 1.

Wstęp

Wstęp do probabilistyki i statystyki

Wstęp do probabilistyki i statystyki. wykład 1 1

Literatura:

D.C. Montgomery, G.C. Runger, Applied Statistics and Probability for Engineers, Third Edition, J. Wiley & Sons, 2003

A. Plucińska, E. Pluciński, Probabilistyka, rachunek

prawdopodobieństwa, statystyka matematyczna, procesy stochastyczne, WNT, 2000

J. Jakubowski, R. Sztencel, Wstęp do teorii prawdopodobieństwa, SCRIPT, 2000

M. Sobczyk, Statystyka, Wydawnictwo C.H. Beck, Warszawa 2010

A. Zięba, Analiza danych w naukach ścisłych i technice, PWN, Warszawa 2013, 2014

Wstęp do probabilistyki i statystyki. wykład 1 2

(2)

Plan

Przedmiot probabilistyki i statystyki

Rys historyczny

Paradoks kawalera de Méré

Statystyka - typy danych i pojęcie zmiennej losowej

Graficzna prezentacja danych

Znaczenie rachunku prawdopodobieństwa i statystyki w nauce i problemach inżynierskich

Wstęp do probabilistyki i statystyki. wykład 1 3

Czym zajmuje się

probabilistyka i statystyka?

Teoria prawdopodobieństwa (także rachunek

prawdopodobieństwa lub probabilistyka) – dział matematyki zajmujący się zdarzeniami losowymi. Zdarzenie losowe to wynik doświadczenia losowego.

Doświadczenie losowe może być powtarzanedowolnie wiele razy w warunkach identycznychlub bardzo zbliżonych a jego wynik nie daje się przewidzieć jednoznacznie.

Ll – oznacza ile razy zaszło dane zdarzenie gdy

doświadczenie powtarzano n razy

Prawidłowość statystyczna – przy coraz większej liczbie

doświadczeń losowych częstość zdarzenia dąży do pewnej stałej

(3)

Czym zajmuje się

probabilistyka i statystyka?

Statystyka zajmuje się metodami zbierania informacji (liczbowych) oraz ich analizą i interpretacją.

Wstęp do probabilistyki i statystyki. wykład 1 5

• Rachunek prawdopodobieństwa zajmuje się badaniem

abstrakcyjnych pojęć matematycznych stworzonych do opisu zjawisk, które nie są deterministyczne:

1. zmiennych losowych w przypadku pojedynczych zdarzeń oraz 2. procesów stochastycznychw przypadku zdarzeń

powtarzających się (w czasie).

• Jako matematyczny fundament statystyki, teoria

prawdopodobieństwa odgrywa istotną rolę w sytuacjach, w których konieczna jest analiza dużych zbiorów danych.

Jednym z największych osiągnięć fizyki dwudziestego wieku było odkrycie probabilistycznej natury zjawisk fizycznych w skali

mikroskopowej, co zaowocowało powstaniem mechaniki kwantowej.

Statystyka

OPISOWA ANALIZA DANYCH

(DESCRIPTIVE STATISTICS)

Organizacja danych

Podsumowanie danych

Prezentacja danych

DEDUKCYJNA – MODELOWANIE STOCHASTYCZNE

( STATISTICAL INFERENCE)

Podaje metody formułowania wniosków dotyczące obiektu badań (populacji generalnej) w oparciu o mniej liczny zbiór (próbę)

GRAFICZNA NUMERYCZNA

Wstęp do probabilistyki i statystyki. wykład 1 6

Czym zajmuje się probabilistyka i

statystyka?

(4)

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 7

• Matematyczna teoria prawdopodobieństwa sięga swoimi korzeniami do analizy gier losowychpodjętej w

siedemnastym wiekuprzez Pierre de Fermataoraz Blaise Pascala.

• Z tego powodu, początkowo teoria prawdopodobieństwa zajmowała się niemal wyłącznie zjawiskami dyskretnymii używała metod kombinatorycznych. Zmienne ciągłe

zostały wprowadzone do teorii prawdopodobieństwa znacznie później.

• Za początek stworzenia współczesnej teorii prawdopodobieństwa powszechnie uważa się jej aksjomatyzację, której w 1933dokonał Andriej Kołmogorow.

Hazard

Zdecydowana większość gier losowych opiera się na prawdopodobieństwie zdarzenia...

...oraz może być pod tym kątem analizowana.

Prawdopodobieństwo trafienia „oczka”

...najprostszy, jak rzut monetą, ...

...całkowicie losowy jak ruletka...

...złożony, jak rozdanie pokera...

(5)

Rys historyczny

Blaise Pascal (1601-1662) XVII w. , Paryż, Francja

Unieśmiertelnił kawalera de Méré oraz jego paradoks hazardowy

„Trójkąt Pascala” wykorzystywany przy potędze sumy

Wstęp do probabilistyki i statystyki. wykład 1 9

k n k n

k

n a b

k b n

a

= ⎟⎟

⎜⎜ ⎞

= ⎛

+

0

) (

dwumian Newtona

Trójkąt Pascala

Wstęp do probabilistyki i statystyki. wykład 1 10

6 1 6 6 5 15 6 4 20 6 3 15 6 2 6 6 1 1 6 0 6 6

5 1 5 5 4 10 5 3 10 5 2 5 5 1 1 5 0 5 5

4 1 4 4 3 6 4 2 4 4 1 1 4 0 4 4

3 1 3 3 2 3 3 1 1 3 0 3 3

2 1 2 2 1 1 2 0 2 2

1 1 1 1 0 1 1

0 1 0 0

⎟⎟=

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟=

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟=

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟=

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟=

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟=

⎜⎜

=

⎟⎟

⎜⎜

=

⎟⎟=

⎜⎜

=

n n n n n n n

!

! ) (

! k k n

n k

n

= −

⎟⎟⎠

⎜⎜ ⎞

Symbol

(6)

Trójkąt Pascala

1

1 1

1 2 1

1 3 3 1

1 4 6 4 1

1 5 10 10 5 1

1 6 15 20 15 6 1

Wstęp do probabilistyki i statystyki. wykład 1 11

n = 0 n = 1 n = 2 n = 3 n = 4 n = 5 n = 6

+

Pierre de Fermat (1601-1665) Początek XVII w., Touluse, Francja

Badał właściwości liczb pierwszych, teorię liczb,

równolegle opracował metodę współrzędnych w geometrii.

Razem z Pascalem stworzył podstawy pod współczesny rachunek prawdopodobieństwa.

Rys historyczny

(7)

Siméon Denis Poisson (1781-1840) XVIII-XIX w., Paryż, Francja

Przyjaciel Lagrange'a, uczeń Laplace'a na sławnej École Polytechnique.

Poza zagadnieniami fizycznymi zajmował się teorią

prawdopodobieństwa.

Proces stochastyczny (podobnie jak pr.

Markowa), rozkład Poissona - dystrybuanta!

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 13

Carl Frederich Gauss (1777-1855)

XVIII-XIX w., Getynga, Niemcy Profesor Uniwersytetu w Getyndze

Genialny matematyk, który już w dzieciństwie wyprzedzał umiejętnościami rówieśników. W szkole podstawowej jako jedyny rozwiązał zadanie nauczyciela - zsumowanie liczb 1 do 40 – zauważając, że jest to (40+1)*20

Rozkład normalny, zwany krzywą Gaussa

Rys historyczny

Wstęp do probabilistyki i statystyki. wykład 1 14

(8)

Dwaj hazardziści S1i S2umawiają się, że zagrają pewną serię partii i że zwycięzcą będzie ten, kto pierwszy wygra pięć partii.

Wstęp do probabilistyki i statystyki. wykład 1 15

Co należy zrobić, gdy trzeba będzie grę przedwcześnie przerwać?

Załóżmy, że S1 wygrywa cztery partie, a S2 tylko trzy. Jak sprawiedliwie podzielić stawki?

Propozycja 1: podzielić stawki w stosunku 4:3

Propozycja 2: podzielić stawki w stosunku (5-3):(5-4)=2:1

wg W.R. Fuchs, Matematyka popularna, Wiedza Powszechna, Warszawa 1972

Paradoks kawalera de Méré

Blaise Pascal rozwiązał zadanie rozumując bardzo prosto. Aby rozstrzygnąć grę, należy zagrać jeszcze najwyżej dwie partie.

Jeżeli pierwszą partię wygra S1, to gra będzie rozstrzygnięta od razu.

Gdy pierwszą partię wygra S2, to wygranie drugiej partii przez S1 przesądziłoby grę na jego korzyść.

Jednak jeśli pozostałe dwie partie wygra S2 to on zostanie zwycięzcą. Zatem sprawiedliwy

(9)

Statystyka - typy danych

ILOŚCIOWE

(QUANTITATIVE, NUMERICAL)

Przykłady:

Zbiór ludzi

Wiek

Wzrost

Wysokość zarobków Obliczenia pewnych

parametrów, jak np. średnia arytmetyczna, mediana, ekstrema, mają sens

JAKOŚCIOWE

(QUALITATIVE, CATEGORIAL)

Przykłady:

Płeć

Stan cywilny

Można przypisać różnym cechom arbitralne wartości liczbowe.

Obliczenia parametrów nie mają sensu, można jedynie podawać np.

udział procentowy

Wstęp do probabilistyki i statystyki. wykład 1 17

Pojęcie zmiennej losowej

R x e X

R X

e e

i

i

= ∈

→ Ω

= Ω

) (

:

} , , {

1 2

K

Zmienna losowa jest to funkcja X, która przypisuje liczbę rzeczywistąx danemu wynikowieksperymentu losowego.

Przykłady:

1) Rzut monetą: zdarzeniu ‘orzeł’ przypisujemy 1; zdarzeniu reszka przypisujemy 0.

2) Analog. losowanie wyrobów: zdarzeniu ‘brak’ (wadliwy) - 0, dobry – 1 3) Rzut kostką wyrzucenie ‘1’ – 1, ‘2’ – 2 itd…

4) Odcinek [a, b] na osi liczbowej – wybór punktu o współrzędnej ‘x’

przypisujemy np. wartość x ; wartość sin2(3x+17) itp.…

Wstęp do probabilistyki i statystyki. wykład 1 18

(10)

Zmienna losowa

dyskretna

Gdy wartości zmiennej losowej X są izolowanymi punktami na osi

liczbowej (obejmują skończony przedział wartości)

• Rzut monetą

• Błędy przy transmisji

• Wadliwe układy na linii produkcyjnej

• Ilość połączeń przychodzących w ciągu 5 minut

ciągła

Gdy wartości zmiennej losowej stanowią

wszystkie punkty odcinka (obejmują przedział liczb rzeczywistych)

Natężenie prądu w przewodniku

• Temperatura

• Ciśnienie

Wstęp do probabilistyki i statystyki. wykład 1 19

Graficzna prezentacja danych

Dane statystyczne można prezentować na wiele sposobów, np. częstość

występowania danej cechy

x Ilość wystąpień Częstotliwość

1 3 3/23 = 0,1304

2 5 5/23 = 0,2174

3 10 10/23 = 0,4348

4 4 4/23 = 0,1739

5 1 1/23 = 0,0435

Razem: 23 1,0000

(11)

Graficzna prezentacja danych

Wstęp do probabilistyki i statystyki. wykład 1 21

13%

22%

44%

17%

4%

Wykres kołowy

1 2 3 4 5

1 0,13043478

2 0,2173913

3 0,43

4 0,17391

5 0,04347826

graf1

Graficzna prezentacja danych

Wstęp do probabilistyki i statystyki. wykład 1 22

0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45

1 2 3 4 5

Wykres kolumnowy

Serie1

1 0,13043478

2 0,2173913

3 0,43

4 0,17391

5 0,04347826

(12)

Dane ilościowe

Wyniki 34 pomiarów (np. wielkość ziaren w [nm], temperatura w kolejnych dniach o godz. 11:00 w [deg. C], czas rozmów

telefonicznych w [min], itp.

3,6 13,2 12 12,8 13,5 15,2 4,8

12,3 9,1 16,6 15,3 11,7 6,2 9,4

6,2 6,2 15,3 8 8,2 6,2 6,3

12,1 8,4 14,5 16,6 19,3 15,3 19,2

6,5 10,4 11,2 7,2 6,2 2,3

Tak podane wartości są mało czytelne!

Wstęp do probabilistyki i statystyki. wykład 1 23

Histogram Sporządzenie wykresu (histogramu):

1.Uporządkować zbiór wg. rosnących (lub malejących) wartości – program Excel ma taką opcję.

2. Wyniki próby (o liczebności n) stanowią zbiór n-liczb (niekoniecznie różniących się od siebie). Celem ich ilustracji dzieli się je na klasy, tworząc tzn. szereg rozdzielczy.

3. Szerokość poszczególnych klas nie musi być taka sama, choć zwykle stosuje się klasy o tej samej szerokości

4. Ilość klas nie może być zbyt mała ani też zbyt liczna. Najbardziej optymalną liczbę klas 'k' określa reguła Sturge'a.

(13)

Histogram

0 2 8 14 20

0 2 4 6 8 10 12 14 16

3 klasy

x

Częstość bezwgdna

Wstęp do probabilistyki i statystyki. wykład 1 25

Histogram

0 2 3,5 5 6,5 8 9,5 11 12,5 14 15,5 17 18,5 20

0 1 2 3 4 5 6 7 8

12 klas

x

Częstość bezwzgdna

Wstęp do probabilistyki i statystyki. wykład 1 26

(14)

Histogram

0 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 16,5 17 17,5 18 18,5 19 19,5 0

1 2 3 4 5 6 7 8

35 klas

x

Częstość bezwzględna

Wstęp do probabilistyki i statystyki. wykład 1 27

Reguła Sturge'a k= 1+ 3,3log

10

n

n= 34 k= 5. 59≈ 6

Dla naszego przykładu:

Liczebność próbki, n Liczba klas, k

< 50 5 – 7

50 – 200 7 – 9

200 – 500 9 – 10

500 – 1000 10 -11

1000 – 5000 11 – 13 5000 – 50000 13 – 17

(15)

Histogram optymalny

0 2 5 8 11 14 17 20

0 0,05 0,1 0,15 0,2 0,25 0,3

6 klas (optymalnie)

x

Częstość wzgdna

Wstęp do probabilistyki i statystyki. wykład 1 29

Rachunek prawdopodobieństwa i statystyka w nauce i technice Statystyka umożliwia analizę i modelowanie rozwoju chorób oraz pomaga zapobiegać epidemiom.

Statystyka medyczna, np.

średnia liczba zachorowań w regionie

Statystyka społeczna, np.

gęstość zaludnienia Statystyka gospodarcza, np.

PKB, wydatki na opiekę zdrowotną

Liczba zachorowań na świńską grypę w roku 2009 w USA (Źródło: http://commons.wikimedia.org)

Wstęp do probabilistyki i statystyki. wykład 1 30

(16)

Meteorologia

Modele pogodowe umożliwiające

przewidywanie pogody oraz wykrywanie potencjalnych kataklizmów, np. huraganów

(Źródło:stormdebris.net/Math_Forecasting.html)

Wstęp do probabilistyki i statystyki. wykład 1 31

Opis problemu

Identyfikacja najważ- niejszych czynników

Przeprowadzenie eksperymentów

Propozycja

modelu Modyfikacja

modelu Potwierdzenie rozwiązania

Wnioski i rekomendacje

Jak rozwiązuje się problem inżynierski?

(17)

33

Przykład: Załóżmy, że inżynier projektuje przewód paliwowy, który ma zastosowanie w silnikach samochodowych. Inżynier wybiera grubość ściany 3/32 cale ale nie jest pewny czy to jest wystarczające dla uzyskania odpowiedniej siły ciągu.

Jak rozwiązuje się problem inżynierski?

Opis problemu

Identyfikacja najważniejszych czynników Wyprodukowano osiem elementów, dla których zmierzono siły ciągu i otrzymano następujące wartości (w funtach): 12.6, 12.9, 13.4, 12.3, 13.6, 13.5, 12.6, 13.1. Siła ciągu może być

traktowana jako zmienna losowa.

Wstęp do probabilistyki i statystyki. wykład 1

34 Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Propozycja modelu

Przyjmijmy model, w którym zmienna losowa X jest przedstawiona jako:

Stała wartość Zaburzenie (błąd, szum)

Stała µ nie zmienia się przy kolejnych pomiarach. Małe zmiany w otoczeniu, układzie pomiarowym, różnice obserwowane dla obiektu mierzonego wpływają na wartość zaburzenia ε. W świecie rzeczywistym zawsze istnieją czynniki prowadzące do niezerowego zaburzenia. Musimy je opisać w sposób ilościowy i znaleźć sposób na ograniczenie ich wpływu na wynik pomiaru.

(18)

35

Rysunek 1-2 przedstawia uzyskane wyniki w postaci diagramu punktowego (dot diagram).

Diagramy tego typu są użyteczne dla małej ilości danych (do ok. 20 obserwacji).

Wykresy tego typu pozwalają ocenić położenie (środek) i rozproszenie (rozrzut)

Średnia wartość siły ciągu wynosi 13.0 funtów.

Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Przeprowadzenie eksperymentów

Inżynier zmienia grubość ściany do 1/8 cali zakładając, że pomoże to zwiększyć siłę ciągu. Znowu zbudowano 8 prototypów, przeprowadzono eksperymenty i otrzymano wyniki siły ciągu: 12.9, 13.7, 12.8, 13.9, 14.2, 13.2, 13.5, 13.1. Wyniki, w

porównaniu z poprzednim eksperymentem, zestawiono na Rys. 1-3.

.

Średnia wartość siły ciągu wynosi 13.4 funty.

Jak rozwiązuje się problem inżynierski?

Modyfikacja (udoskonalenie) modelu

(19)

37

Wykres stwarza wrażenie, że zwiększenie grubości ściany prowadzi do wzrostu siły ciągu.

Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Potwierdzenie rozwiązania?

Jednak, pozostaje pytanie czy jest tak istotnie?

38 Wstęp do probabilistyki i statystyki. wykład 1

Jak rozwiązuje się problem inżynierski?

Statystykapomoże nam udzielić odpowiedzi na pytania:

• Skąd pewność, że inna próbka elementów nie da innych wyników?

• Czy próbka 8-elementowa jest wystarczająca aby dać wyniki, którym można ufać?

• Jeżeli użyjemy wyników, które do tej pory otrzymaliśmy, aby sformułować wniosek (decyzja), że wzrost grubości ściany jest korzystny, jak oszacować ryzyko z tym związane?

• Czy jest możliwe, że pozorny wzrost siły ciągu obserwowany dla grubszych elementów ma charakter jedynie losowy? Może nie ma sensu zwiększanie grubości ścian (powiększanie kosztów produkcji)?

Wnioski (rekomendacje?)

(20)

http://physics.nist./gov/Uncertainty

Wyrażanie Niepewności Pomiaru. Przewodnik. Warszawa, Główny Urząd Miar 1999

H. Szydłowski, Pracownia fizyczna, PWN Warszawa 1999 A.Zięba, Postępy Fizyki, tom 52, zeszyt 5, 2001, str.238- 247

A.Zięba, Pracownia Fizyczna WFiTJ, Skrypt Uczelniany SU 1642, Kraków 2002

Międzynarodowa Norma Oceny Niepewności Pomiaru (Guide to Expression of Uncertainty in Measurements- Międzynarodowa Organizacja Normalizacyjna ISO)

Wstęp do probabilistyki i statystyki. wykład 1 39

Rachunek niepewności pomiaru

POMIAR

Pomiary w laboratorium można podzielić na pomiary wielkości:

‰ prostych

‰ złożonych

Przykład 1: Pomiar długości nici przymiarem metrowym, pomiar okresu drgań wahadła – pomiary wielkości prostych – pomiary bezpośrednie

Wyznaczanie przyspieszenia ziemskiego na podstawie wzoru - pomiar wielkości złożonej

g

2 l

T = π

(21)

W trakcie pomiaru uzyskujemy wartości różniące się od przewidywań teorii. Źródłem rozbieżności między teorią i eksperymentem są niedoskonałości:

-osoby wykonującej pomiar, -przyrządów pomiarowych, -obiektów mierzonych

Gdy doświadczenie staje się doskonalsze, rozbieżności te maleją. Maleje błąd pomiaru, niepewność pomiaru.

POMIAR

Wstęp do probabilistyki i statystyki. wykład 1 41

Wynik pomiaru jest zawsze obarczony błędem i po przeprowadzeniu odpowiedniej analizy błędów podajemy go w jednej z następujących postaci:

s

2

/ m ) 28 ( 866 , 9 g =

C 10 ) 3 98 (

F = ± ⋅

3

Przykład 2: Załóżmy, że przy wyznaczaniu równoważnika

elektrochemicznego pewnego pierwiastka uzyskaliśmy następujące liczby:

k=0,0010963 g/C Δk=0,0000347 g/C

Jak podać wynik?

cyfry znaczące cyfry nieznaczące Odp. k= (0,00110 ± 0,00004) g/C lub k= 0,00110(4) g/C

Wstęp do probabilistyki i statystyki. wykład 1 42

(22)

Błąd bezwzględny pojedynczego pomiaru:

xi – wartość zmierzona, x0 – wartość rzeczywista

Błąd względny:

0 i

i x x

x = − Δ

0 i

x Δ x

= δ

(1)

(2)

Niepewność a błąd pomiaru

Uwaga: wartości rzeczywiście wielkości mierzonej zazwyczaj nie są znane

Wstęp do probabilistyki i statystyki. wykład 1 43

Niepewność pomiaru

Wielkości określone wzorami (1) i (2) są pojedynczą realizacją zmiennej losowej i nie wchodzą do teorii niepewności. W praktyce nie znamy wartości rzeczywistych wielkości mierzonych i szacujemy niepewności pomiarowe wynikające ze statystycznych praw rozrzutu pomiarów.

Niepewność pomiaru jest

związanym z rezultatem pomiaru parametrem,

charakteryzującym rozrzut wyników, który można

w uzasadniony sposób przypisać wartości mierzonej.

(23)

Niepewność u (ang. uncertainty) posiada wymiar, taki sam jak wielkość mierzona Symbolika: u lub u(x) lub u(stężenie NaCl)

Niepewność względna u

r

(x) to stosunek niepewności (bezwzględnej) do wielkości

mierzonej:

x x x u

u

r

( )

) ( =

Niepewność względna jest wielkością bezwymiarową i może być wyrażona w %

Wstęp do probabilistyki i statystyki. wykład 1 45

Miary niepewności

Istnieją dwie miary niepewności pomiaru:

‰ niepewność standardowa u(x)

‰niepewność maksymalna ∆x

x

0

x

x

0

-u(x) x

0

+u(x)

x

0

-Δx x

0

+Δx

Wstęp do probabilistyki i statystyki. wykład 1 46

(24)

Niepewność standardowa

Jest miarą dokładności pomiaru najpowszechniej stosowaną i uznawaną obecnie za podstawową.

1. Rezultat pomiaru jest zmienną losową x

i

, której rozrzut wokół wartości średniej x charakteryzuje parametr zwany odchyleniem standardowym

2. Dokładnej wartości odchylenia standardowego nie znamy. Niepewność standardowa jest jego niezbyt dokładnym oszacowaniem (estymatorem, oceną).

( )

n x xi 2

lim

n

= σ

Wstęp do probabilistyki i statystyki. wykład 1 47

Niepewność maksymalna

Jest miarą deterministyczną, gdyż zakłada, że można określić przedział wielkości mierzonej x, w którym na pewno znajdzie się wielkość rzeczywista.

W tym przypadku staramy się określić przedział x0 - ∆x < xi< x0 + ∆x

w którym mieszczą się wszystkie wyniki pomiaru xi, aktualnie wykonane i przyszłe.

Zaleca się obecnie niepewność maksymalną specyfikowaną przez producenta zamieniać na niepewność standardową wg wzoru:

3 ) x x (

u Δ

=

(25)

Test 1

17.03.2015

Różne wartości,  xk

Krotności ich  występowania,  nk Częstości, wk

1. Wykonano 18 pomiarów masy pewnej próbki i otrzymano następujące wyniki xk[kg]: 20, 19, 16, 18, 24, 18,19, 21,19, 22, 18, 19, 19, 20, 19, 20, 21, 20.

a) Uporządkować wyniki rosnąco

b) Uzupełnić tabelę, w której należy zestawić różne wartości xk pod podając liczbę nkokreślającą , ile razy występuje dana wartość

c) Obliczyć częstość występowania danej wartości xk d) Narysować histogram

2. Dwaj hazardziści S1 i S2 umawiają się, że zagrają pewną serię partii i że zwycięzcą będzie ten, kto pierwszy wygra sześć partii.

Wstęp do probabilistyki i statystyki. wykład 1 50

W jakim stosunku należy podzielić stawki, gdy trzeba będzie grę przedwcześnie przerwać?

Zakładamy, że S1 wygrywa cztery partie, a S2 tylko trzy.

Ile partii trzeba rozważyć aby rozwiązać teoretycznie ten problem?

Test 1

17.03.2015

(26)

Podział błędów

Wyniki pomiarów podlegają pewnym prawidłowościom, tzw. rozkładom typowym dla zmiennej losowej. Z tego względu błędy dzielimy Błędy grube (pomyłki), które należy eliminować na:

Błędy systematyczne, które można ograniczyć udoskonalając pomiar

Błędy przypadkowe, które podlegają prawom statystyki i rachunku prawdopodobieństwa, wynikają z wielu losowych przyczynków i nie dają się wyeliminować

Wstęp do probabilistyki i statystyki. wykład 1 51

Krzywe rozkładu błędu

x x

x

0

x x

0

=x

Φ(x) Φ(x)

błąd systematyczny błąd przypadkowy-

rozkład Gaussa

(27)

Są wynikiem pomyłki eksperymentatora np. przy odczytywaniu wartości mierzonych, przy przeliczaniu jednostek etc., nieprawidłowego stosowania

przyrządu pomiarowego, poważnego i nieuświadomionego uszkodzenia przyrządu

pomiarowego, zastosowania nieodpowiedniej metody pomiaru lub niewłaściwych wzorów teoretycznych do opracowania wyników. Fakt zaistnienia błędu

grubego należy sobie jak najszybciej uświadomić a wynik obarczony takim błędem wykluczyć z dalszych analiz. Jeśli to możliwe, pomiar powtórzyć.

Błędy grube

Wstęp do probabilistyki i statystyki. wykład 1 53

Błędy systematyczne zawsze w ten sam sposób wpływają na wyniki pomiarów wykonanych za pomocą tej samej metody i aparatury pomiarowej. Minimalna wartość błędu systematycznego jest określona dokładnością stosowanego przyrządu (lub klasą w przypadku analogowych mierników elektrycznych). Wprowadza się pojęcie działki elementarnej czyli wartość najmniejszej działki (odległość między sąsiednimi kreskami na skali przyrządu lub ułamek tej odległości określony klasą przyrządu), która określa dokładność odczytu.

Błędy systematyczne

Wstęp do probabilistyki i statystyki. wykład 1 54

(28)

Źródłem błędu systematycznego są: skale mierników (np. niewłaściwe ustawienie „zera”), nieuświadomiony wpływ czynników zewnętrznych (temperatura, wilgotność) na wartość wielkości mierzonej, niewłaściwy sposób odczytu (błąd paralaksy) lub pomiaru, przybliżony charakter wzorów stosowanych do wyznaczenia wielkości złożonej.

Błędy systematyczne czasami można ograniczyć wprowadzając poprawki, np.

R ) 4 r , 2 1 ( v 6

F = πη +

Błędy systematyczne

Wstęp do probabilistyki i statystyki. wykład 1 55

Występują zawsze w eksperymencie, lecz ujawniają się gdy wielokrotnie dokonujemy pomiaru przyrządem, którego dokładność jest bardzo duża a błędy

systematyczne wynikające z innych przyczyn są bardzo małe. Wynikają one z własności obiektu mierzonego (np. wahania średnicy drutu na całej jego długości), własności przyrządu pomiarowego (np. wskazania przyrządu zależą od przypadkowych drgań budynku, fluktuacji ciśnienia czy temperatury, docisku dla suwmiarki), lub mają podłoże fizjologiczne (refleks eksperymentatora, subiektywność oceny maksimum natężenia dźwięku czy równomierności oświetlenia

Błędy przypadkowe

(29)

Błędy przypadkowe zawsze towarzyszą

eksperymentowi, nawet jeśli inne błędy zostaną wyeliminowane. W przeciwieństwie do błędu systematycznego, ich wpływ na wynik ostateczny pomiaru można ściśle określić.

Błędy przypadkowe

Wstęp do probabilistyki i statystyki. wykład 1

57

Dawniej uważano, że miarą błędu

systematycznego może być tylko niepewność maksymalna. Nowa Norma traktuje błąd systematyczny jako zjawisko przypadkowe, gdyż nie znamy a priori jego wielkości i znaku. Norma zaleca stosowanie niepewności standardowej u.

Typy oceny niepewności wg nowej Normy

Typ A

Metody wykorzystujące statystyczną analizę serii pomiarów:

•wymaga odpowiednio dużej liczby powtórzeń pomiaru

• ma zastosowanie do błędów przypadkowych Typ B

Opiera się na naukowym osądzie eksperymentatora wykorzystującym wszystkie informacje o pomiarze i

źródłach jego niepewności

•stosuje się gdy statystyczna analiza nie jest możliwa

•dla błędu systematycznego lub dla jednego wyniku pomiaru

Wstęp do probabilistyki i statystyki. wykład 1 58

(30)

TYP A

Wstęp do probabilistyki i statystyki. wykład 1 59

Przykład 3 :

Seria wyników (próba) x1,x2, ….xn obarczonych niepewnością przypadkową jest duża gdy 30<n≤100. W próbie takiej wyniki się powtarzają: nkjest liczbą pomiarów, w których wystąpił wynik xk,

nk/n jest częstością występowania wyniku

xk nk nk/n

5,2 1 0,011

5,3 1 0,011

5,4 2 0,021

5,5 4 0,043

5,6 7 0,075

5,7 10 0,106

5,8 14 0,149

5,9 16 0,170

6,0 13 0,138

6,1 12 0,128

6,2 6 0,064

6,3 4 0,043

6,4 3 0,032

6,5 1 0,011

(31)

Opracowanie serii pomiarów bezpośrednich dużej próby

5 ,2 5 ,4 5 ,6 5 ,8 6 ,0 6 ,2 6 ,4 0

2 4 6 8 1 0 1 2 1 4 1 6 nk

xk

H isto g ra m Średnia arytmetyczna

x=5,9

Odchylenie standardowe

( )

) 1 (

2

= −

=

n x x x

u i

σ

σ=0,2

n x x

n

i

i

=

=1

Wstęp do probabilistyki i statystyki. wykład 1 61

Niepewność standardowa średniej

( )

) 1 n ( n

x ) x

x ( u

2 i

= ∑ −

Rozkład normalny Gaussa

Gęstość prawdopodobieństwa wystąpienia wielkości x lub jej błędu Δ x podlega rozkładowi Gaussa

x0 jest wartością najbardziej prawdopodobną i może być nią średnia arytmetyczna, σ jest odchyleniem

standardowym, σ2jest wariancją rozkładu

⎟⎟ ⎠

⎜⎜ ⎞

⎛ − −

=

Φ

20 2

2 ) exp (

2 ) 1

( σ π σ

x x x

Wstęp do probabilistyki i statystyki. wykład 1 62

(32)

Rozkład normalny Gaussa

2σ 95.4 % 99.7 %

x

Φ(x)

W przedziale x

0

-σ < x < x

0

+σ zawiera się 68.2 % (2/3), w przedziale x

0

-2σ < x < x

0

+2σ zawiera się 95.4 % w przedziale x

0

-3σ < x < x

0

+3σ zawiera się 99.7 %

wszystkich wyników

68.2%

pow.

Wstęp do probabilistyki i statystyki. wykład 1 63

0 5 10 15 20 25 30

0 1 2 3

Φ(x)

x

x0=15 σ=2 σ=5

Pomiar o większym σ charakteryzuje się większym rozrzutem wyników wokół wartości średniej a zatem mniejszą precyzją

Rozkład normalny Gaussa

(33)

TYP B

Wstęp do probabilistyki i statystyki. wykład 1 65

Dla oceny typu B wykorzystać można m.in.:

dane z pomiarów poprzednich,

doświadczenie i wiedzę na temat przyrządów i obiektów mierzonych,

informacje producenta przyrządów,

niepewności przypisane danym zaczerpniętym z literatury

Gdy informacja o pomiarze i źródle jego niepewności jest dobra, dokładność oceny typu B jest porównywalna z dokładnością oceny typu A.

Wstęp do probabilistyki i statystyki. wykład 1 66

TYP B

(34)

Przykład 4: Ocena niepewności typu B dla pomiaru długości wahadła.

Długość wahadła mierzymy przymiarem milimetrowym uzyskując wartość L=140 mm.

Przyjmujemy niepewność równą działce elementarnej (działka skali 1mm). A zatem u(L)=1 mm, u

r

(L)=u(L)/L=1/140, błąd procentowy 0,7%

Najczęściej ocena typu B dotyczy określenia niepewności wynikającej ze skończonej dokładności przyrządu.

Wstęp do probabilistyki i statystyki. wykład 1 67

TYP B

NIEPEWNOŚĆ WIELKOŚCI

ZŁOŻONEJ – PRAWO PRZENOSZENIA BŁĘDU

0 2 4

0 20 40 60 80 100 120 140

y

x

u(y)

u(x) funkcja y = f(x)

styczna dy/dx

) x ( dx u ) dy y (

u =

(35)

Metoda różniczki zupełnej

Dla wielkości złożonej y=f(x

1

,x

2

,...x

n

) gdy niepewności maksymalne Δx

1

, Δx

2

, ... Δx

n

są małe w porównaniu z wartościami zmiennych x

1

,x

2

, ... x

n

niepewność maksymalną wielkości y wyliczamy z praw rachunku różniczkowego:

n n

x x x y

x x y

x

y y Δ

∂ + ∂ +

∂ Δ + ∂

∂ Δ

= ∂

Δ

2

...

2 1

1

(3)

Wstęp do probabilistyki i statystyki. wykład 1 69

Prawo przenoszenia niepewności

Niepewność standardową wielkości złożonej y=f(x

1

,x

2

,...x

n

) obliczamy z tzw. prawa przenoszenia niepewności jako sumę geometryczną różniczek cząstkowych

2 2

2 2 2

1 1

) ( ...

) ( )

( )

( ⎥

⎢ ⎤

∂ + ∂

⎥ +

⎢ ⎤

∂ + ∂

⎥ ⎦

⎢ ⎤

= ∂

n

n

c

u x

x x y

x u x y

x u y y

u

y y y u

u

cr c

( ) )

( =

Wstęp do probabilistyki i statystyki. wykład 1 70

(36)

Przykład

W pewnym eksperymencie wyznaczono przyspieszenie ziemskie g mierząc okres T i długość L odpowiedniego wahadła matematycznego. Wyznaczona długość wahadła wynosi 1.1325±0.0014 m. Niezależnie określona niepewność względna pomiaru okresu wahadła wynosi 0,06%, tj.

4

r

6 10

T ) T ( ) u T (

u = = ⋅

Obliczyć względną niepewność pomiarową

przyspieszenia ziemskiego lub niepewność procentową zakładając, że niepewności pomiarowe L i T są

niezależne i mają charakter przypadkowy.

Wstęp do probabilistyki i statystyki. wykład 1 71

7080 10090 110120 130140 150160 170180

Zasady rysowania wykresów

Czy ten wykres jest narysowany zgodnie z zasadami?

1. Należy wyraźnie zaznaczyć

punkty eksperymentalne !!!

(37)

2. Trzeba nanieść błąd pomiaru

0 40 80 120 160 200 240 280 320 6070

8090 100110 120130 140150 160170 180

Wstęp do probabilistyki i statystyki. wykład 1 73

3. Dobrać zakresy osi współrzędnych odpowiednio do zakresu zmienności danych pomiarowych !!!

0 40 80 120 160 200 240 280 320 6070

8090 100110 120130 140150 160170 180

Wstęp do probabilistyki i statystyki. wykład 1 74

(38)

i dobrać skalę, tak aby łatwo można było odczytać wartości zmierzone.

160 200 240 280 320 6070

8090 100110 120130 140150 160170 180

co jest na osiach ???

Wstęp do probabilistyki i statystyki. wykład 1 75

5. Nie łączyć punktów eksperymentalnych linią łamaną!!! Jeśli znany jest przebieg teoretyczny to dokonać dopasowania teorii do doświadczenia (przeprowadzić fitowanie)

160 200 240 280 320 60

90 120 150 180

ρ [μΩcm]

(39)

160 200 240 280 320 60

90 120 150

180 dane eksperymentalne dopasowanie

ρ [μΩcm]

T [K]

zamknięcie ramką, itp.)

Wstęp do probabilistyki i statystyki. wykład 1 77

160 200 240 280 320

60 90 120 150 180

dane eksperymentalne dopasowanie

ρ [μΩ

cm

]

T [K]

Wykres 1

Rezystywnosc ρ probki Bi w funkcji temperatury T

Wstęp do probabilistyki i statystyki. wykład 1 78

(40)

Regresja liniowa

4 6 8 10 12 14 16

0 20 40 60

f(xi) yi

xi y

x f(x)=ax+b a=3.23, b=-2.08

( )

[ ] min

2

= ∑

n

− +

2

=

i

y

i

ax

i

b

S

Wstęp do probabilistyki i statystyki. wykład 1 79

PODSUMOWANIE

1. Każdy pomiar w laboratorium jest obarczony

niepewnością pomiarową, którą eksperymentator musi określić zgodnie z pewnymi zasadami.

2. W pierwszej kolejności należy przeanalizować źródła błędów, pamiętając, aby wyeliminować wyniki

obarczone błędem grubym. W laboratorium studenckim błędy systematyczne z reguły przewyższają błędy przypadkowe.

3. Wielokrotne powtarzanie pomiarów, gdy dominuje błąd systematyczny, nie ma sensu. W takim

przypadku dokonujemy tylko 3-5 pomiarów w tych samych warunkach w celu sprawdzenia powtarzalności

.

(41)

4. Gdy błąd przypadkowy dominuje w eksperymencie, należy sprawdzić czy rozkład wyników może być opisany funkcją Gaussa czy też należy spodziewać się innego rozkładu. W tym celu dokonujemy wielokrotnego (np.

100 razy) pomiaru w tych samych warunkach, obliczamy średnią i wariancję rozkładu, rysujemy histogram, etc.) 5. Jako miarę niepewności stosujemy raczej niepewność

standardową, rzadziej niepewność maksymalną.

6. W przypadku wielkości złożonej, stosujemy prawo przenoszenia błędu. Staramy się przeprowadzić analizę niepewności wielkości złożonej tak, aby uzyskać

informacje dotyczące wagi przyczynków, jakie wnoszą do całkowitej niepewności pomiary poszczególnych wielkości prostych. W tym celu należy analizować niepewności względne.

Wstęp do probabilistyki i statystyki. wykład 1 81

PODSUMOWANIE

7. Ważnym elementem sprawozdania z przebiegu

eksperymentu (i to nie tylko w laboratorium studenckim) jest wykres. Wykresy sporządzamy zgodnie z dobrymi zasadami, pamiętając o jednoznacznym opisie.

8. Jeżeli znane są podstawy teoretyczne badanego zjawiska, na wykresie zamieszczamy krzywą teoretyczną (linia ciągła) na tle wyraźnych punktów eksperymentalnych (dobieramy odpowiednie symbole i nanosimy niepewności

eksperymentalne). Możemy wcześniej dokonać

dopasowania parametrów przebiegu teoretycznego w oparciu o znane metody „fitowania”

9. Zawsze, gdy to możliwe, dokonujemy linearyzacji danych eksperymentalnych, np. rysując y vs. ln (x), lub log y vs. log x, lub y vs. 1/x itp. Do tak przygotowanych danych można zastosować metodę regresji liniowej .

Wstęp do probabilistyki i statystyki. wykład 1 82

PODSUMOWANIE

Cytaty

Powiązane dokumenty

Krystalochemia (krystalografia chemiczna) jest działem chemii zajmującym się ustalaniem zależności między rodzajem wiązań chemicznych w strukturze (strukturą

zmiennymi, niezależne wyniki (nie dla tego samego pacjenta), rozkład zmiennej zależnej y dla danej zmiennej niezależnej x jest normalny, wariancja y jest taka sama dla każdego x,

Zweryfikować hipo- tezę, żę dochody mają rozkład Pareto Pa(1, 3) na poziomie 0.05 za pomocą testów Kołmogorowa, Cram´ era-von Misesa i chi-kwadrat.. Obliczyć p-wartości

Zadanie 28. Opisz przestrzeń zdarzeń elementarnych i oblicz prawdopodobieństwo, że ich suma jest podzielna przez 3... Zadanie 29. Jakie jest prawdopodobieństwo, że wszystkie

Ile jest różnych liczb czterocyfrowych utworzonych z cyfr 1, 2, 3, 4, 5, w których cyfry nie mogą się

b) Oblicz prawdopodobieństwo zdarzenia, że wśród wybranych zawodników jest kapitan drużyny?. (4 pkt) Rzucono dwa razy symetryczną, sześcienną kostką

Liczba możliwości przy- znania medali za trzy pierwsze miejsca (zakładamy, że wszyscy zawodnicy ukończą kon- kurencję i wykluczamy przypadek dzielenia miejsc ex aequo), jest

promieniowanie stawało się coraz bardziej długofalowe – jego temperatura spadała. •Obecnie