Wykład ze statystyki
Maciej Wolny
T1: Zajęcia organizacyjne
Agenda 1. Program wykładu
2. Cel zajęć
3. Nabyte umiejętności 4. Literatura
5. Warunki zaliczenia
Program wykładu
T1: Zajęcia organizacyjne
T2: Przedmiot i zadania statystyki
T3: Metody analizy rozkładu cechy T4: Badanie współzależności zjawisk
T5: Badanie dynamiki zjawisk
T6: Zmienne losowe i ich podstawowe rozkłady
T7: Rozkład normalny
T8: Estymatory i estymacja przedziałowa
T9: Hipotezy statystyczne i ich weryfikacja
Cel
Zaznajomienie z podstawowymi metodami procesu badania statystycznego
umożliwiającymi wykrywanie prawidłowości struktury, współzależności i dynamiki zjawisk
masowych oraz nauczenie wnioskowania
statystycznego
Umiejętności
• czytanie, przetwarzanie i przedstawianie danych statystycznych
• określanie i obliczanie charakterystyk badanych zbiorowości
• weryfikacja hipotez parametrycznych i nieparametrycznych
• wnioskowanie na podstawie przeprowadzonych weryfikacji
• konstruowanie modeli regresji i ich zastosowanie w naukach społecznych
• prognozowanie na podstawie analizy dynamiki zjawisk
Literatura
[1] Aczel A. Statystyka w zarządzaniu, PWN, Warszawa 2000
[2] Ostasiewicz S., Rusnak Z., Siedlecka K., Statystyka. Elementy teorii i zadania, Wyd. AE we Wrocławiu, Wrocław 1999
[3] Sobczyk M., Statystyka, PWN, Warszawa 1997
• Maria Nawojczyk, Przewodnik po statystyce dla socjologów, SPSS Polska, Kraków 2002.
• Biostatystyka, red. A. Stanisz, Wyd. UJ, Kraków 2005.
• A.N. Oppenheim, Kwestionariusze, wywiady,
pomiary postaw, Wyd. Zysk i S-ka, Poznań
2004.
Warunki zaliczenia
Egzamin
1. Pozytywna ocena z ćwiczeń i laboratorium 2. Egzamin pisemny (test wyboru)
• 50% krótkie zadania
• 50% teoria
3. Ocena: 60-68% dst, 68-76% dst plus, 76-84% db, 84-92% db plus, 92-100% bdb.
4. Ocena końcowa: 40% egz.+ 30% lab.+ 30% ćw.
T2: Przedmiot i zadania statystyki
Agenda 1. Definicja
2. Geneza
3. Podstawowe pojęcia i zagadnienia
4. Proces badania statystycznego
Definicja
Statystyka jest to nauka o metodach badania zjawisk masowych, nauka traktująca o metodach ilościowych badania prawidłowości zjawisk masowych
Zjawiska masowe to zjawiska, które występują często
(np. zgony, urodzenia, małżeństwa, etc.)
Geneza
Statystyka – łac. status – państwo
Etapy rozwoju badania zjawisk masowych:
• do XVII w. – okres ewidencji i zliczania (dane, informacje)
• XVII – XVIII w. – opisywanie zbiorowości według wzorca podanego przez państwoznawców (wykrycie prawidłowości w zjawiskach masowych np. zgonach)
• od XVIII w. – wprowadzenie rachunku prawdopodobieństwa (rozwój metod statystycznych opartych na matematyce)
Podstawowe pojęcia (1)
Statystykę dzielimy na:
- opisową, która ukazuje metody gromadzenia, opracowania i prezentacji danych wraz z ich sumarycznym opisem, przy wykorzystaniu właściwych narzędzi statystycznych
- matematyczną zwaną wnioskowaniem statystycznym, która powstała na gruncie rachunku prawdopodobieństwa
„Statystyka” ma zasadniczo cztery znaczenia:
• metoda poznawania zjawisk masowych
• nauka badająca zjawiska masowe
• zbiór liczb charakteryzujący zbiorowość (np. statystyka ludności)
• parametr opisowy rozumiany jako pewna wielkość
charakterystyczna (np. średnia arytmetyczna, odchylenie standardowe)
Podstawowe pojęcia (2)
Przedmiot badania statystycznego
Zbiorowością statystyczną nazywamy zespół jednostek objętych
badaniem statystycznym, posiadających jedną lub kilka cech wspólnych (stałych) oraz wiele cech je różniących
Zbiorowość statystyczna, populacja, masa statystyczna
Zbiorowość jednorodna to zbiorowość, którą tworzą jednostki niezróżnicowane pod względem cechy stałej
Jednostka statystyczna to podstawowy element zbiorowości
statystycznej, który musi być jednoznacznie określony pod względem rzeczowym (kogo lub co badamy), czasowym (kiedy badamy) i
przestrzennym (gdzie, na jakim terytorium badamy)
Podstawowe pojęcia (3)
Cechami statystycznymi nazywamy własności jednostek statystycznych
stałe zmienne
rzeczowe
przestrzenne czasowe
rzeczowe
przestrzenne czasowe
ilościowe jakościowe
skokowe ciągłe
Pomiar, skale pomiarowe
SKALA NOMINALNA – wartości na tej skali nie mają oczywistego
uporządkowania (np. płeć), relacją umożliwiającą porównanie jest równoważność (równość)
SKALA PORZĄDKOWA – wartości mają jasno określony porządek (np.
wykształcenie), oprócz równoważności możliwe są relacje porządkujące
SKALA INTERWAŁOWA (PRZEDZIAŁOWA) – różnice między wartościami mają sensowną interpretację, ale ich iloraz nie ma sensu (np. data urodzenia,
temperatura w stopniach Celsjusza)
SKALA ILORAZOWA (STOSUNKOWA) – nie tylko różnice, ale także ilorazy wielkości mają interpretację (np. masa – coś może być dwa razy cięższe), wielkości w skali ilorazowej można dodawać, odejmować i dzielić przez siebie
Cech statystyczne (zmienne) można mierzyć na różnych skalach pomiarowych, które klasyfikuje się według sposobu, w
jaki można zestawić wyniki dwóch pomiarów
Podstawowe pojęcia (4)
Szereg statystyczny to dane (liczby) odpowiednio uporządkowane otrzymane w wyniku przeprowadzonego badania statystycznego
szczegółowy rozdzielczy czasowy
momentów okresów z cechą
niemierzalną (jakościową) z cechą
mierzalną (ilościową)
geograficzne inne przedziałowe
punktowe
skumulowane proste
skumulowane proste
Szereg szczegółowy
Uporządkowany ciąg wartości badanej cechy statystycznej
Np. wzrost [cm] w pewnej grupie studentów
159; 159,5; 160; 161; 161; 162; 162; 162,5; 162,5; 163; 163; 163;
163; 163,5; 163,5; 164; 165; 165; 167; 167;167,5; 168; 168; 168;
168,5; 169; 169; 169; 169; 169,5; 169,5; 170; 170; 170,5; 170,5;
170,5; 170,5; 171; 172; 172,5; 173; 174; 175; 176; 176; 176,5; 177;
177; 177; 178; 178,5; 179; 179; 179; 180; 180; 181; 181; 182
Szereg rozdzielczy punktowy
Szereg rozdzielczy stanowi zbiorowość statystyczną podzieloną na części (klasy) według określonej cechy z podaniem liczebności każdej z wyodrębnionych klas
Np. wzrost [cm] w pewnej grupie studentów
Szereg rozdzielczy przedziałowy
Np. wzrost [cm] w pewnej grupie studentów
Prezentacja graficzna szeregów
Histogram jest to zbiór prostokątów, których podstawy, wyznaczone na osi odciętych, stanowią rozpiętości poszczególnych przedziałów klasowych, natomiast wysokości są określone na osi rzędnych przez liczebności odpowiadające przedziałom klasowym
Diagram jest łamaną powstałą przez połączenie punktów, których współrzędnymi są środki przedziałów klasowych i odpowiadające im liczebności
Proces badania statystycznego
Badanie statystyczne jest procesem złożonym obejmującym całokształt czynności badawczych zmierzających do poznania zjawisk masowych za pomocą metody statystycznej. Proces ten obejmuje:
• przygotowanie badania
• obserwację statystyczną
• opracowanie statystyczne
• analizę statystyczną
Przygotowanie badania
• sformułowanie problemu badawczego
• określenie i poznanie przedmiotu badania – celu i zakresu badania oraz postawienie hipotez roboczych, które będą weryfikowane
• wybór metody obserwacji (pełna lub częściowa)
• konstrukcja formularza statystycznego (układ pytań, odpowiednie części, koncepcja formularza)
Obserwacja statystyczna
Polega na uchwyceniu interesującego badacza zespołu cech (określonych w formularzu statystycznym)
Materiał pierwotny – materiał źródłowy otrzymany w toku specjalnego badania statystycznego
Materiał wtórny – materiał zebrany do innych celów wykorzystany przez badacza do swoich celów
Opracowanie statystyczne
• kontrola formalna i merytoryczna otrzymanego materiału
• przełożenie treści na liczby
• opracowanie schematów klasyfikacyjnych dla badanych cech
• tablice robocze i wynikowe
• prezentacja graficzna rezultatów badania
Analiza statystyczna
Wykrycie prawidłowości w badanej zbiorowości
- analiza struktury
- analiza współzależności - analiza dynamiki
- analiza przestrzenna
Podsumowanie
zjawiska masowe – prawidłowości
statystyka opisowa – statystyka matematyczna
szeregi statystyczne – szczegółowy, rozdzielczy punktowy, rozdzielczy przedziałowy
Szereg statystyczny – rozkład zmiennej, rozkład cechy (rozkład empiryczny zmiennej)
graficzna prezentacja wyników →→→→ różnorakie sposoby (np. wykresy kołowe)
proces badania statystycznego (przygotowanie badania,
obserwacja statystyczna, opracowanie statystyczne, analiza statystyczna)
Rozkład empiryczny zmiennej
Rozkładem empirycznym zmiennej nazywamy
przyporządkowanie kolejnym wartością zmiennej xi odpowiadających im liczebności ni
szereg statystyczny zmiennej = rozkład zmiennej graficzne przedstawienie rozkładu
Powró t