• Nie Znaleziono Wyników

Zajęcia15marca2021 WprowadzenieipowtórzeniezRPDorotaCelińska-Kopczyńska StatystycznaAnalizaDanych–ćwiczenia

N/A
N/A
Protected

Academic year: 2021

Share "Zajęcia15marca2021 WprowadzenieipowtórzeniezRPDorotaCelińska-Kopczyńska StatystycznaAnalizaDanych–ćwiczenia"

Copied!
9
0
0

Pełen tekst

(1)

Statystyczna Analiza Danych – ćwiczenia

Wprowadzenie i powtórzenie z RP

Dorota Celińska-Kopczyńska

Uniwersytet Warszawski

Zajęcia 1 5 marca 2021

(2)

Prowadząca

I dr Dorota Celińska-Kopczyńska I mail: dot@mimuw.edu.pl I strona: mimuw.edu.pl/~dot

I dyżur: czwartek 19:00-20:00, po umówieniu e-mailem

(3)

Forma zajęć

I Zajęcia w formie zdalnej, 7 spotkań w semestrze letnim I Ćwiczenia co tydzień przez pierwszą połowę semestru I 6 spotkań poświęconych rozwiązywaniu zadań, tydzień

przerwy i spotkanie-omówienie kolokwium I Spotkania w Zoom, asynchroniczna komunikacja

w wydziałowym Moodle

I Ćwiczenia nie będą nagrywane – notatki w Moodle/na stronie

(4)

Elementy zaliczenia w ramach ćwiczeń

1. 10 obowiązkowych punktów z aktywności, w tym:

2. 5 punktów zdobywane podczas zajęć na żywo:

I 2 punkty za obecność (6 obecności - 2p, 5 - 1.5p, 4 - 1p, 3 - 0.5p)

I 3 punkty za aktywność w trakcie ćwiczeń: pytania, problemy, rozwiązanie zadania, pomysły

I W razie usprawiedliwionej nieobecności podczas ćwiczeń możliwość substytucji punktów (proszę wtedy o kontakt) 3. 5 pkt do zdobycia za prace domowe (bliżej terminu

kolokwium)

(5)

Wartość oczekiwana i wariancja

I Dla rozkładu dyskretnego o wartościach xi, i ∈ {1, . . . , k} i prawdopodobieństwach pi, i ∈ {1, . . . , k}:

I EX =Pk 1xipi

I Var (X ) = EX2− (EX )2 I Pk

1pi = 1

I Dla rozkładu ciągłego o dystrybuancie F (x ) i funkcji gęstości f (x )

I EX =R

−∞xf (x )dx I Var (X ) = EX2− (EX )2 I R

−∞f (x ) = 1

I Dystrybuanta = P(X ¬ t)

(6)

Rozkład dwumianowy

I Opisuje liczbę wystąpień sukcesu w n niezależnych próbach.

pk p-stwo sukcesu, qk = 1 − pk porażki I EX = np

I Var (X ) = np(1 − p) P(k) = n

k

!

pkk(1 − pk)n−k

(7)

Rozkład Poissona z parametrem λ

I Opisuje p-stwo k wydarzeń mających miejsce w określonym czasie, gdy te wydarzenia występują ze znaną średnią

częstotliwością i w sposób niezależny od czasu jaki upłynął od ostatniego zajścia takiego zdarzenia

I Graniczny przypadek rozkładu dumianowego I EX = λ

I Var (X ) = λ

P(x = k) = λk k!e−λ

(8)

Rozkład wykładniczy z parametrem λ

I Opisuje czas do zmiany ze stanu X w stan Y I Ciągła wersja rozkładu geometrycznego I Cechuje go właściwość braku pamięci I EX = 1λ

I Var (X ) = λ12

F (x ) = 1 − e−λx

(9)

Standaryzacja

I Rodzaj normalizacji zmiennej losowej, w wyniku której zmienna uzyskuje EX = 0 i Var = 1

I µ – średnia z populacji, sigma – odchylenie standardowe z populacji

z = x − µ σ

Cytaty

Powiązane dokumenty

hipotezę, że średnie zadłużenie w tych województwach jest sobie równe, przeciwko hipotezie alternatywnej, że jest różne I Oblicz samodzielnie wartość statystyki testowej

I Jednostronna hipoteza alternatywna zakłada kierunek zachowania się badanego

I Jakie może być accuracy dla danych rozmiaru 100, w których 99 obserwacji jest typu A, a jedna typu B. Rozważ

I Wykorzystując model regresji liniowej, zbadaj zależność wagi sportowców (WT) od wszystkich pozostałych zmiennych ilościowych. I Sprawdź, które oszacowania parametrów

I Oszacowania przy zmiennych skorelowanych ze zmienną pominiętą będą obciążone (czasem można wysnuć wnioski na temat kierunku obciążenia przy zmiennej zawartej w modelu)

I Jeśli założenia Klasycznego Modelu Regresji Liniowej nie są spełnione, to estymator MNK może nie być nieobciążony, zgodny lub efektywny.. I Uzyskane przez nas oszacowania

I Liczbę wybranych składowych ustala się na podstawie procentu wariancji przez nie tłumaczonej. I Dążymy do odtworzenia co najmniej 70% wariancji (niższe wartości w przypadku

I Dziedzina eksploracji danych – dzielimy wielowymiarowy zbiórdanych na grupy w taki sposób, by elementy w tej samej grupie były do siebie podobne, a jednocześnie jak