Zajęcia nr 1.
Szeregi statystyczne, przygotowanie danych
1. Otwórz plik: API_EN.ATM.PM25.MC.M3_DS2_en_excel_v2.xls (źródło: Bank Światowy, https://data.worldbank.org/indicator/EN.ATM.PM25.MC.M3?view=chart dostęp:
22.02.2018)
2. Otwórz plik: API_SP.POP.TOTL_DS2_en_excel_v2.xls (źródło: Bank Światowy, https://data.worldbank.org/indicator/SP.POP.TOTL?end=2017&start=1960 dostęp:
22.02.2018)
3. Stwórz „Nowy arkusz” o nazwie „PM25”, w nowym pliku o nazwie PM25_nazwisko_imię.xlsx (do nowego arkusza będą kopiowane analizowane dane).
4. Do nowego arkusza skopiuj (z arkusza „Metadata – Countries” oraz „Data”) dane dotyczące:
nazwy państwa, oraz średniej rocznej ekspozycji dla roku 2015 (kolumny: B,C z arkusza
„Metadata – Countries” oraz kolumna A oraz BH z arkusza „Data”). Skopiuj dane dotyczące liczby ludności w poszczególnych państwach dla analizowanego roku (z drugiego pliku).
5. Przyporządkuj odpowiednio dane. Zwróć uwagę, że liczba wierszy jest różna w obu arkuszach pliku z danymi dotyczącymi pyłu zawieszonego PM2,5. W „Data” jest o jeden wiersz więcej (wiersz nr 113, „Not classified”) – należy w arkuszu roboczym usunąć ten wiersz przed zespoleniem danych lub odpowiednio przesunąć dane. Zwróć uwagę na strukturę podobnych arkuszy w pliku z liczbą ludności.
6. Porządkujemy arkusz roboczy (PM25). Usuwamy niepotrzebne wiersze na początku arkusza.
Usuwamy wszystkie obserwacje (wiersze) z brakami danych dla badanej zmiennej liczbowej (stężenie pyłu zawieszonego).
7. Wszystkie wiersze z brakami danych dla zmiennych „Region” oraz „IncomeGroup”
przenosimy do nowego arkusza „SPR”. Uwaga! Dla Erytrei brakuje liczby ludności … wartość tę uzupełniamy po dyskusji i analizie danych historycznych lub usuwamy Erytreę z analizy.
(Uwaga! Wykorzystujemy funkcję regresji badając zmianę liczby ludności w latach 2000-2011, wpisujemy wartość: 4913874)
Odpowiedz na pytania, wykonaj polecenia:
1. Precyzyjnie zdefiniuj zmienną (arkusz „Metadata – Indicators”) – badamy PM 2,5.
2. Jak należy analizować dane? Jakie wnioski nasuwają się z analizy definicji zmiennej? Oblicz średnią arytmetyczną badanej zmiennej dla przygotowanych danych i porównaj z
informacjami w arkuszu „SPR”.
3. Zapisz plik i prześlij na Platformę Zdalnej Edukacji Wydziału Organizacji i Zarządzania Politechniki Śląskiej (moodle).
UWAGI!
1. Zwróć uwagę na aktualność danych w rozpatrywanej bazie.
2. Zwróć uwagę jak ważne są definicje danych.
PROBLEMY DO PRZEMYŚLENIA!
1. Czy można zinterpretować iloczyn badanej zmiennej i liczby ludności?