Statystyczna Analiza Danych – ćwiczenia
Wprowadzenie i powtórzenie z RP
Dorota Celińska-Kopczyńska
Uniwersytet Warszawski
Zajęcia 1 5 marca 2021
Prowadząca
I dr Dorota Celińska-Kopczyńska I mail: dot@mimuw.edu.pl I strona: mimuw.edu.pl/~dot
I dyżur: czwartek 19:00-20:00, po umówieniu e-mailem
Forma zajęć
I Zajęcia w formie zdalnej, 7 spotkań w semestrze letnim I Ćwiczenia co tydzień przez pierwszą połowę semestru I 6 spotkań poświęconych rozwiązywaniu zadań, tydzień
przerwy i spotkanie-omówienie kolokwium I Spotkania w Zoom, asynchroniczna komunikacja
w wydziałowym Moodle
I Ćwiczenia nie będą nagrywane – notatki w Moodle/na stronie
Elementy zaliczenia w ramach ćwiczeń
1. 10 obowiązkowych punktów z aktywności, w tym:
2. 5 punktów zdobywane podczas zajęć na żywo:
I 2 punkty za obecność (6 obecności - 2p, 5 - 1.5p, 4 - 1p, 3 - 0.5p)
I 3 punkty za aktywność w trakcie ćwiczeń: pytania, problemy, rozwiązanie zadania, pomysły
I W razie usprawiedliwionej nieobecności podczas ćwiczeń możliwość substytucji punktów (proszę wtedy o kontakt) 3. 5 pkt do zdobycia za prace domowe (bliżej terminu
kolokwium)
Wartość oczekiwana i wariancja
I Dla rozkładu dyskretnego o wartościach xi, i ∈ {1, . . . , k} i prawdopodobieństwach pi, i ∈ {1, . . . , k}:
I EX =Pk 1xipi
I Var (X ) = EX2− (EX )2 I Pk
1pi = 1
I Dla rozkładu ciągłego o dystrybuancie F (x ) i funkcji gęstości f (x )
I EX =R∞
−∞xf (x )dx I Var (X ) = EX2− (EX )2 I R∞
−∞f (x ) = 1
I Dystrybuanta = P(X ¬ t)
Rozkład dwumianowy
I Opisuje liczbę wystąpień sukcesu w n niezależnych próbach.
pk p-stwo sukcesu, qk = 1 − pk porażki I EX = np
I Var (X ) = np(1 − p) P(k) = n
k
!
pkk(1 − pk)n−k
Rozkład Poissona z parametrem λ
I Opisuje p-stwo k wydarzeń mających miejsce w określonym czasie, gdy te wydarzenia występują ze znaną średnią
częstotliwością i w sposób niezależny od czasu jaki upłynął od ostatniego zajścia takiego zdarzenia
I Graniczny przypadek rozkładu dumianowego I EX = λ
I Var (X ) = λ
P(x = k) = λk k!e−λ
Rozkład wykładniczy z parametrem λ
I Opisuje czas do zmiany ze stanu X w stan Y I Ciągła wersja rozkładu geometrycznego I Cechuje go właściwość braku pamięci I EX = 1λ
I Var (X ) = λ12
F (x ) = 1 − e−λx
Standaryzacja
I Rodzaj normalizacji zmiennej losowej, w wyniku której zmienna uzyskuje EX = 0 i Var = 1
I µ – średnia z populacji, sigma – odchylenie standardowe z populacji
z = x − µ σ