Rola informatyki w naukach ekonomicznych i społecznych
Innowacje i implikacje interdyscyplinarne
redakcja ZBIGNIEW E. ZIELIŃSKI
Wydawnictwo Wyższej Szkoły Handlowej
Kielce 2011
Publikacja wydrukowana została zgodnie z materiałem dostarczonym przez Autorów. Wydawca nie ponosi odpowiedzialności za treść, formę i styl artykułów.
Komitet Naukowy
prof. dr hab. Janusz Lewandowski prof. dr hab. Krzysztof Grysa
dr hab. Wiesław Dziubdziela, prof. WSH
Redaktor Naczelny
prof. zw. dr hab. Tadeusz Grabiński
Redaktor Recenzji
prof. nadzw. dr hab. inż. Wacław Gierulski
Recenzenci
prof. zw. dr hab. Tadeusz Grabiński prof. nadzw. dr hab. inż. Wacław Gierulski prof. dr hab. Mieczysław Muraszkiewicz prof. dr hab. Robert Gajewski prof. dr hab. Zbigniew Osiński prof. dr hab. Grzegorz Kończak doc. dr Tomasz Konopka dr Jarosław Przybytniowski dr Dariusz Żak
dr Michał Adam Leśniewski dr Danuta Mokrosińska
Redakcja
dr Zbigniew E. Zieliński mgr inż. Jarosław Kościelecki mgr Katarzyna Baziuk mgr inż. Artur Janus mgr Urszula Słowik mgr Anna Kukla mgr Piotr Sidor
Wydawca publikacji
Wyższa Szkoła Handlowa im. B. Markowskiego w Kielcach
Projekt „PITWIN – Portal innowacyjnego Transferu Wiedzy w Nauce”
ul. Peryferyjna 15 25‐562 Kielce www.pitwin.edu.pl biuro@pitwin.edu.pl
© Copyright by Wyższa Szkoła Handlowa, Kielce 2011
ISSN 2081‐478X
Nakład 200 egz.
Publikacja została wydana w ramach realizacji projektu „PITWIN – Portal Innowacyjnego Transferu Wiedzy w Nauce”.
Publikacja jest współfinansowana przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Publikacja jest dystrybuowana bezpłatnie dla osób, które zarejestrują się na stronie internetowej projektu www.pitwin.edu.pl (dostępna także w wersji elektronicznej).
Spis treści
Wstęp ... 5
Część I – Technologie informacyjne
E‐learning
1. mgr Olga Łodyga ‐ Nauka języka niemieckiego z zastosowaniem metody SuperMemo ... 9 2. dr Bruno Jacobfeuerborn ‐ E‐Learning ‐ A Tool for Boosting a Netist Society ... 15
Nowe technologie informacyjne
3. mgr Rafał Guzowski ‐ ”Siećpospolita” – cienie i blaski procesu cyfryzacji
w Polsce na tle krajów europejskich ... 23 4. prof. dr hab. Mieczysław Muraszkiewicz ‐ Techniki mobilne, edukacja
i przedsiębiorczość. Studium przypadku – Laboratorium BRAMA ... 32 5. dr Bruno Jacobfeuerborn ‐ ICT Tools for Supporting Innovation
and Entrepreneurship ... 38
Część II – Ekonomia i nauki społeczne
Ekonomia
6. mgr Anna Misztal ‐ Integracja gospodarcza w Unii Europejskiej,
a kryzys w strefie euro ... 49 7. dr Artur Borcuch ‐ Financial System – Historical Overview
and Contemporary Definitions ... 56 8. dr Bogumiła Smolorz ‐ Finansowanie ekoinnowacji kapitałem zwrotnym
i bezzwrotnym w mikro, małych i średnich przedsiębiorstwach ... 62 9. mgr Gabriela Gurgul ‐ Market Structure Analysis of Electronic Payment
Instruments in 1998‐2010 ... 73 10. dr Jarosław Przybytniowski – Insurance Intermediation the European Union.
Selected Issues ... 82 11. mgr Magdalena Konopelko‐Kiżuk ‐ Wybrane instrumenty
strategiczno‐planistyczne służące realizacji polityki rozwoju w gminach ... 87 12. dr hab. Marian Srebrny ‐ Analiza kosztów i korzyści z elektronicznego
systemu rozliczeń podatkowych... 96 13. dr Mirosław Zajdel ‐ Wybrane problemy bezrobocia (na przykładzie
łódzkiej gospodarki okresu transformacji) ... 106 14. mgr Dominika Pazik ‐ Polityka Unii Europejskiej wobec zatrudnienia
osób niepełnosprawnych ... 121 15. mgr Katarzyna Ciepiela ‐ Istota innowacji i konkurencyjności
w rozwoju społeczno‐gospodarczym regionów ... 131 16. mgr Łukasz Kołodziejczyk, mgr Mariusz Wasiak ‐ Model gospodarki opartej
na wiedzy. Wybrane przykłady praktyk outsourcingowych ... 139
Analizy ilościowe
17 dr Bogdan Ludwiczak ‐ Zastosowanie metody wartości zagrożonej
w praktyce pomiaru ryzyka walutowego ... 146 18 mgr Karolina Klimańska ‐ Poziom życia w Polsce i w 19 krajach G20
Część 2.: Dobór i analiza wskaźników społeczno‐ekonomicznych
kształtujących poziom życia ludności ... 156 19 Małgorzata Krzciuk ‐ Symulacyjna analiza szeregu czasowego – połączenie
możliwości IBM SPSS i R ... 183
20 Paweł Domański, Małgorzata Krzciuk, mgr Michał Miłek, Piotr Ziuziański – Badania
ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS ... 191 21 dr Przemysław Kowalik ‐ Metoda unitaryzacji zerowanej
w arkuszach kalkulacyjnych ... 204 22 mgr Marzena Farbaniec, prof. dr hab. Tadeusz Grabiński,
mgr Bartłomiej Zabłocki, mgr Wacław Zając ‐ Analiza wpływu przekształceń
matematycznych na zbiory o zadanym rozkładzie cyfr ... 210
Zarządzanie
23. mgr Anna Pobrotyn ‐ System ocen pracowniczych. Ujęcie teoretyczne ... 219 24. mgr Anna Pobrotyn ‐ Motywacja jako funkcja zarządzania ludźmi.
Ujęcie teoretyczne ... 230
Nauki społeczne
25. mgr Ewa Czubocha ‐ Praca z uczniem zdolnym w szkole jako czynnik
wzrostu gospodarczego ... 241 26. dr Krzysztof Czubocha ‐ Kulturowe uwarunkowania integracji imigrantów
w państwach członkowskich Unii Europejskiej (UE) ... 252 27. dr Paulina Forma ‐ Internet w życiu młodego pokolenia – w opinii studentów
(przyszłych nauczycieli) ... 265 28. dr Małgorzata Wolska‐Długosz ‐ Reklama telewizyjna w życiu codziennym
dziecka – dawniej i dziś ... 277
Prawo
29. dr Dariusz Grzegorz Żak ‐ Online Banking in Polish Law ... 288 30. mgr Agnieszka Lipczyńska ‐ Kontrola zamówień publicznych sprawowana
przez Prezesa Urzędu Zamówień Publicznych ... 301 31. dr adw. Małgorzata Paszkowska ‐ Obowiązki świadczeniodawcy i prawa pacjenta
w zakresie dokumentacji medycznej ... 313
Opinia – prof. nadzw. dr hab. inż. Wacław Gierulski... 325
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
191 Paweł Domański *
Małgorzata Krzciuk **
Michał Miłek ***
Piotr Ziuziański ****
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
Streszczenie: Klasyczne (randomizacyjne) podejście w metodzie reprezentacyjnej jest szeroko znane w firmach zajmujących się badaniami marketingowymi i opinii publicznej. Podejście to może być stosowane jednak wyłącznie w przypadku prób losowych, które znajdują zastosowanie w praktyce biznesowej stosunkowo rzadko. W artykule jest rozważany problem szacowania frakcji i średniej, ale w oparciu o dane z próby nielosowej. Otrzymane dane pochodzą z przeprowadzonego techniką CAWI (Computer‐Assisted Web Interviewing) samodzielnie przygotowanego badania ankietowego studentów Uniwersytetu Ekonomicznego w Katowicach.
W tym przypadku można prawidłowo wnioskować o charakterystykach populacji w oparciu o podejście modelowe w metodzie reprezentacyjnej. Celem artykułu jest przybliżenie podejścia modelowego i przedstawienie samodzielnie napisanych procedur obliczeniowych w języku poleceń programu SPSS. Ponieważ w artykule są prezentowane komendy w języku poleceń SPSS, zdefiniowano wszystkie oznaczania używane w kodzie programu.
Słowa kluczowe: metoda reprezentacyjna, próby nielosowe, CAWI 1. Badanie ankietowe Koła Naukowego Statystyków
Dane wykorzystywane w niniejszym artykule pochodzą z badania ankietowego przeprowadzonego w marcu i kwietniu 2011r. na Uniwersytecie Ekonomicznym w Katowicach przez Koło Naukowe Statystyków (KNS). Należy nadmienić, iż próba ta jest nielosowa, co wymaga skorzystania z podejścia modelowego metody reprezentacyjnej. Ponadto, w celu ustalenia liczebności warstw, skorzystano z danych udostępnionych przez UE Katowice. Samodzielnie przygotowany formularz ankiety jest dostępny na stronie http://kns.ue.katowice.pl/ankieta_s/.
* Paweł Domański posiada tytuł zawodowy licencjat uzyskany na Uniwersytecie Ekonomicznym w Katowicach na Wydziale Zarządzania na kierunku Informatyka i Ekonometria – specjalność Ekonometria i Statystyka. Jest studentem studiów stacjonarnych drugiego stopnia na Wydziale Finansów i Ubezpieczeń tej samej uczelni. Od 2010 r. pełni funkcję przewodniczącego KNS.
** Małgorzata Krzciuk posiada tytuł zawodowy licencjat uzyskany na Uniwersytecie Ekonomicznym w Katowicach na Wydziale Zarządzania na kierunku Informatyka i Ekonometria – specjalność Ekonometria i Statystyka. Jest studentką studiów stacjonarnych drugiego stopnia na Wydziale Finansów i ubezpieczeń Uniwersytetu Ekonomicznego w Katowicach.
*** Michał Miłek jest absolwentem Uniwersytetu Ekonomicznego w Katowicach. Był studentem jednolitych studiów magisterskich na kierunku Informatyka i Ekonometria na wydziale Zarządzania w latach 2006‐2011.
Posiada tytuł magistra uzyskany na tej uczelni. Należał do KNS. Obecnie pracuje jako Analityk zarządzania procesami w ING Banku Śląskim S.A.
****
Piotr Ziuziański posiada tytuł zawodowy licencjat uzyskany na Uniwersytecie Ekonomicznym w Katowicach na Wydziale Zarządzania na kierunku Informatyka i Ekonometria – specjalność Ekonometria i Statystyka. Jest studentem studiów stacjonarnych drugiego stopnia kierunku Informatyka i ekonometria na Wydziale Informatyki i komunikacji w Katowicach oraz studentem pierwszego stopnia kierunku Informatyka na tym samym Wydziale.
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
192
Dane ankietowe zostały zebrane techniką CAWI (Computer‐Assisted Web Interviewing) czyli z wykorzystaniem internetowego kwestionariusza ankiety. Formularz ankiety internetowej stworzony na potrzeby Koła Naukowego Statystyków oparty jest o HTML z wykorzystaniem kaskadowych arkuszy stylów (CSS), które odpowiedzialne są za formatowanie wyglądu strony.
Dane przesyłane są do bazy danych dzięki wykorzystaniu języka programowania PHP.
Do gromadzenia danych wykorzystano system zarządzania bazą danych MySQL rozpowszechniany na licencji GPL. Obecnie rozwijany jest przez firmę Oracle. MySQL przechowuje dane przesłane przez formularz ankiety.
2. Opis danych
Grupę respondentów stanowiło 317 studentów, którzy odpowiadali m.in. na pytania dotyczące średnich miesięcznych wydatków na rozrywkę czy też średnich tygodniowych wydatków na ksero. Proszono także respondentów o wybór najbardziej interesującego ich przedmiotu w szkole średniej. Dodatkowo w ankiecie zawarte były pytania metryczkowe, takie jak: wydział, na którym studiuje respondent (Wydział Ekonomii, Wydział Finansów i Ubezpieczeń, Wydział Informatyki i Komunikacji, Wydział Zarządzania); tryb studiów (stacjonarne, niestacjonarne);
rodzaj studiów (licencjackie, magisterskie, jednolite). Dane te zostały wykorzystane do podzielenia respondentów na warstwy.
Plik danych SPSS został opracowany na podstawie wyeksportowanej tabeli bazy danych MySQL. Zmienna h identyfikująca warstwę powstała przy wykorzystaniu funkcji SPSS (Przekształcenia ► Oblicz wartości). Liczebności warstw to rzeczywiste dane o liczbie studentów na Uniwersytecie Ekonomicznym w Katowicach. Pozostałe zmienne pochodzą z badania KNS. Dane zostały zapisane w pliku prezentowane są w pliku kns_proba.sav
Do obliczeń wykorzystane zostały dane zagregowane. Zostały one utworzone na podstawie wejściowego zbioru danych kns_proba.sav z wykorzystaniem polecenia Dane ► Agreguj.
W efekcie jej zastosowania uzyskano nowe dane, które zapisano jako zbiór o nazwie:
kns_proba_agr.sav. Zadeklarowane opcje zapisane w języku poleceń zaprezentowane są na rysunku 1.
Rysunek 1. Agregacja danych próbkowych.
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
193
W pierwszej kolejności utworzono nowy plik danych, który następnie został wykorzystany do zapisania wyników działania funkcji AGREGATE. Jako czynnik grupujący wskazano identyfikatory przynależności do warstw – zmienna h. Kolejne wartości identyfikatorów identyfikują następujące warstwy: 1 – studenci studiów zaocznych, 2 – studenci studiów dziennych, jednolitych, 3 ‐ studenci studiów dziennych 2. stopnia. Następne liczby odpowiadają poszczególnym wydziałom, na których studiują studenci studiów dziennych 1. stopnia: liczba 4 to Wydział Ekonomii, 5 – Wydział Finansów i Ubezpieczeń, 6 – Wydział Informatyki i Komunikacji, natomiast liczba 7 odpowiada Wydziałowi Zarządzania. Wykorzystanie funkcji AGREGATE pozwoliło na obliczenie wartości średnich i odchyleń standardowych badanych cech w próbie z podziałem na warstwy. Uzyskano informacje o wartości średniej i odchyleniu standardowym dla średnich miesięcznych wydatków na rozrywkę wśród badanych studentów – zmienne rozrywka_mean i rozrywka_sd, średnich tygodniowych wydatków na ksero – zmienne xero_mean i xero_sd, oraz frakcji studentów, którzy jako najbardziej interesujący przedmiot w szkole średniej wskazali matematykę, wraz z odchyleniem standardowym – zmienne matematyka_mean i matematyka_sd. Ponadto do pliku kns_proba_agr.sav dopisano zmienną N, oznaczającą liczebność populacji (liczebność wszystkich studentów UE Katowice studiujących w Katowicach).
Badanie nie obejmowało studentów UE Katowice, studiujących w Bielsku‐Białej i Rybniku.
3. Podejście modelowe w metodzie reprezentacyjnej
Ponieważ rozważane dane pochodzą z próby nielosowej, do analizy danych zebranych za pomocą ankiety zastosowano podejście modelowe. Jest ono szeroko omawiane m.in. w pracy Cassela i in.1 Zakłada się, że populacja U dzieli się na rozłączne warstwy Uh o liczebnościach Nh (h=1,…,H), takie że
1 H
h h
U U
. Dostępne są informacje z próby s, a próbki z warstwsh s Uhmają liczebności
n
h. 2Do analizy przyjęto następujące założenia dotyczące modelu nadpopulacji:
2 2
( ) , ( ) , 1,...,
( , ) 0 , 1,..., , 1,...,
ih h ih h h
i t
E Y D Y dla i U h H
Cov Y Y dla i t t N i N
(1)Do oceny średniej i frakcji w populacji można stosować następujący predyktor dany wzorem3:
1 1 1
1 1 1
ˆ H H nh
h sh h h i
h h i
Y N N Y N N n Y
, (2)a jego ξ‐błąd średniokwadratowy (równy wariancji predykcji ze względu na nieobciążoność) można szacować korzystając z następującej nieobciążonej statystyki:4
2 2 1 2
1
ˆ ˆ
ˆ ( ) ˆ ( ) ( )ˆ
H
h h h h h
h
MSE Y D Y N n N N n
, (3)gdzie 2 1 1 2
1 1
ˆ ( 1) ( )
h h
n n
h h i h i
i i
n Y n Y
.1 Cassel C. M., Särdnal C. E., Wretman J. H.: Foundations of Inference in Survey Sampling, Wyd. John Wiley
&Sons, New York – London – Sydney – Toronto 1977.
2 Wywiał J. 2010. Wprowadzenie do metody reprezentacyjnej. Katowice, str. 113.
3 Ibidem, str. 113.
4 Ibidem, str. 113.
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
194
Populacja studentów biorących udział w badaniu została podzielona na warstwy, w związku z tym do estymacji średniej i frakcji w populacji można zastosować predyktor (por.
Wywiał (2010) s. 56): 5
1 1
ˆ
nhh sh h i
i
Y Y n
Y
(4)Poniżej przedstawiono statystykę6 którą można wykorzystać do oszacowania jego ξ‐błędu średniokwadratowego (równego wariancji predykcji ze względu na nieobciążoność):
2 2
ˆ ˆ
ˆ ( )
hˆ ( )
h h hˆ
hh h
N n MSE Y D Y
N n
, (5) gdzie ˆ
h2zostało zdefiniowane we wzorze (3).4. Szacowanie średniej i frakcji w populacji
Aby oszacować średnią i frakcję w populacji wykorzystano wzór (2). Dokonano tego tworząc nowe zmienne, przy wykorzystaniu funkcji Przekształcenia ► Oblicz Wartości, nazwane:
rozrywka_pred, xero_pred, matematyka_pred. Okno zastosowanej funkcji przedstawia rysunek 2.
Rysunek 2. Okno funkcji Oblicz wartości – tworzenie zmiennych dla wartości predyktora w populacji.
W podobny sposób wyznaczono także ocenę dokładności predyktorów (zgodnie ze wzorem (3)) oraz względny błąd średniokwadratowy wyrażony jako średni błąd predykcji podzielony przez wartość predyktora (rysunek 3). Zadanie to sprowadza się w tym etapie do obliczenia zmiennych rozrywka_eD2_sh, xero_eD2_sh, matematyka_eD2_sh.
5 Ibidem, str. 56.
6 Ibidem, str. 56.
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
195
Rysunek 3. Okno funkcji Oblicz wartości – tworzenie zmiennych do wyznaczenie oceny błędu średniokwadratowego predykcji.
W powyższych krokach obliczono jedynie części sum poszczególnych predyktorów.
Wartości predyktorów wygenerowano w raporcie wybierając z menu Analiza ► Opis statystyczny
► Statystyki opisowe… (Okno opcji funkcji przedstawiają rysunki 4 i 5) Opcja ta domyślnie generuje raport zawierający średnią, odchylenie standardowe oraz wartości maksymalne i minimalne. Ponieważ są to wartości zbędne w opisywanym przykładzie odznaczono ich wyświetlanie w opcjach i wybrano jedynie sumy. Funkcji tej użyto także do otrzymania wartości błędu predykcji.
Rysunek 4. Okno funkcji Statystyki opisowe – tworzenie raportu.
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
196
Rysunek 5. Okno funkcji Statystyki opisowe: Opcje – tworzenie raportu.
Efektem powyższych działań jest utworzenie raportu z dwiema tabelami zawierającymi odpowiednio wartości szacowanych predyktorów w populacji oraz błędów szacunku (rysunek 6).
Rysunek 6. Okno edytora raportów SPSS – wartości predykatorów i ocen wariancji predykcji.
Standardowy wydruk raportu zawiera kilka zbędnych informacji takich jak kolumna N, które usuniętego. Zmieniono też opisy tabel. Ostateczny efekt pracy w edytorze prezentuje rysunek 7.
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
197
Rysunek 7. Okno edytora raportów SPSS – wartości predykatorów i ocen wariancji predykcji po zmianach edycyjnych.
Wyniki przedstawionych analiz zaprezentowano w tabeli 1 i 2.
Tabela 1. Tabela wynikowa oceny predyktora średniej/frakcji w populacji.
Wartości predyktorów Wartość Frakcji w populacji ‐ matematyka 0,37 Średniej w populacji ‐ rozrywka 207,37 Średniej w populacji ‐ xero 6,37 Źródło: opracowanie własne
Na podstawie powyższych danych można powiedzieć, iż szacuje się, że studenci UE w Katowicach:
w 37% zdawali na maturze matematykę na poziomie rozszerzonym,
wydają średnio miesięcznie nieco ponad 207 zł w celach rozrywkowych,
wydają średnio 6,37 zł miesięcznie w punktach xero.
Tabela 2. Tabela wynikowa oceny średniego błędu predykcji w populacji.
Ocena błędów predykcji Wartość
Średniego frakcji – matematyka 0,0003
Średniego wartości średniej – rozrywka 28,1023
Średniego wartości średniej – xero 0,7299
Średniego względnego frakcji – matematyk 0,0009 Średniego względnego wartości średniej – rozrywka 0,1355 Średniego względnego wartości średniej – ksero 0,1145 Źródło: opracowanie własne
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
198
Na podstawie tabeli oceny błędów predykcji można powiedzieć, że:
wartość frakcji studentów, którzy zdawali matematykę rozszerzoną na maturze odchyla się od badanej frakcji w populacji studentów przeciętnie o 0,0003 punktu procentowego. Ocena średniego błędu predykcji stanowi 0,09% wartości predyktora.
wartość średniej kwoty przeznaczanej przez studentów na rozrywkę odchyla się od obserwowanej średniej w populacji studentów o przeciętnie ok. 28,10 zł. Ocena średniego błędu predykcji stanowi 13,55% wartości predyktora.
wartość średniej kwoty wydawanej w punktach xero przez studentów odchyla się od obserwowanej średniej w populacji przeciętnie o ok. 73 grosze. Ocena średniego błędu predykcji stanowi 11,45% wartości predyktora.
5. Ocena średniej i frakcji w warstwach
Dane zawarte w zbiorze kns_proba_agr.sav pozwalają również na uszczegółowienie przeprowadzanej analizy na poszczególne warstwy. Oszacowania średniej i frakcji dla analizowanych zmiennych w poszczególnych warstwach wyznaczyć można na podstawie wzoru (4). Są to, zatem wartości średnie badanych cech w poszczególnych warstwach uzyskane we wstępnym etapie analizy.
Dla zachowania przejrzystości w kolejnych obliczeniach utworzono, za pomocą funkcji Przekształcenia ► Oblicz Wartości, trzy nowe zmienne rozrywka_pred_h, xero_pred_h, matematyka_pred_h, którym przypisano wspomniane wartości średnie (rysunek 8).
Rysunek 8. Okno funkcji Oblicz wartości – tworzenie zmiennych dla wartości predyktora w warstwach.
Opisana powyżej funkcja posłuży także do wyznaczenia miar ocen jakości predykcji. Do oceny błędu średniokwadratowego (oceny wariancji predykcji) zostanie wykorzystana statystyka (5). Nowoutworzone zmienne oznaczono jako rozrywka_eD2_h, xero_eD2_h, matematyka_eD2_h (rysunek 9).
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
199
Rysunek 9. Okno funkcji Oblicz wartości – wyznaczenie oceny błędu średniokwadratowego predykcji w warstwach.
W ten sam sposób wyznaczono ocenę średniego błędu predykcji, będącego pierwiastkiem kwadratowym powyższej zmiennej, oraz ocenę względnego średniego błędu szacunku, wyrażonego jako stosunek średniego błędu predykcji do wartości predyktora (rysunek 10).
Rysunek 10. Okno funkcji Oblicz wartości – wyznaczenie oceny względnego średniego błędu predykcji w warstwach.
Możliwe jest wyświetlenie wyników powyższych analiz w postaci tabeli w pliku raportu SPSS. W tym celu należy wybrać Analiza ► Raporty i zestawienia ► Podsumowanie obserwacji (rysunek 11). Dodatkowo uzupełnienie nowoutworzonych zmiennych o etykiety zawierające pełne nazwy wyznaczanych miar (zakładka Zmienne okna zbioru) pozwoliło na ich łatwą identyfikację w raporcie.
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
200
Rysunek 11. Okno funkcji Podsumowanie obserwacji.
W wyniku zastosowania wspomnianej funkcji w oknie raportu SPSS otrzymano raport przedstawiony na rysunku 12.
Rysunek 12. Okno raportu SPSS – wartości predyktora.
Modyfikując otrzymaną tablicę uzyskano wyniki przedstawione w raporcie na rysunku 13.
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
201 Rysunek 13. Okno raportu SPSS po w prowadzeniu modyfikacji – wartości predyktora.
W podobny sposób stworzyć można tabele wynikowe dla błędów średnio kwadratowych predykcji oraz średnich błędów predykcji i ich wartości względnych (Rysunek 14).
Rysunek 14. Okno raportu SPSS po w prowadzeniu modyfikacji – oceny średnich błędów predykcji.
Wyniki przedstawionych analiz zaprezentowano poniżej w tabelach 3 i 4.
Badania ankietowe w oparciu o próby nielosowe z wykorzystaniem programu SPSS
202
Tabela 3. Tabela wynikowa oceny predyktora średniej i frakcji w warstwach.
Studenci studiów: Wartość predyktora średniej w warstwie ‐
rozrywka xero matematyka
niestacjonarnych 171,43 6,5 0,21
stacjonarnych jednolitych 330 3,92 0,6
stacjonarnych 2. stopnia 191,9 8,76 0,45
stacjonarnych 1. stopnia
W. Ekonomii 177,24 4,72 0,17
stacjonarnych 1. stopnia
W. Finansów i Ubezpieczeń 364,29 6,14 0,86
stacjonarnych 1. stopnia
W. Informatyki i Komunikacji 135,83 8,08 0,38
stacjonarnych 1. stopnia
W. Zarządzania 135,95 6,02 0,29
Źródło: opracowanie własne
Na podstawie otrzymanych wyników ocenia się, iż najwięcej średnio miesięcznie na rozrywkę, bo ponad 360 zł, wydają studenci studiów stacjonarnych 1. stopnia Wydziału Finansów i Ubezpieczeń. Najmniejszą średnią kwotę pieniędzy na ten cel przeznaczają natomiast studenci studiów stacjonarnych 1. stopnia Wydziału Zarządzania oraz Informatyki i Komunikacji, ok. 135 zł.
W przypadku tygodniowych wydatków na ksero ocenia się, że największą kwotę deklarują studenci studiów stacjonarnych 2. stopnia (ok. 9 zł), najmniejszą studenci jednolitych studiów stacjonarnych (nieco poniżej 4 zł).
Ponadto ocenia się, że największy odsetek studentów, których ulubionym przedmiotem w szkole średniej była matematyka odnotowuje się wśród studentów studiów stacjonarnych 1.
stopnia Wydziału Finansów i Ubezpieczeń (prawie 90%), najmniejszy natomiast na Wydziale Ekonomii (mniej niż 20%).
Tabela 4. Oceny średniego błędu predykcji w warstwach.
Studenci studiów: Ocena średniego błędu predykcji ‐
Ocena średniego względnego błędu predykcji ‐ rozrywka xero matematyka rozrywka xero matematyka
niestacjonarnych 29,46 1,7 0,11 0,17 0,26 0,53
stacjonarnych jednolitych 102,49 1,85 0,16 0,31 0,47 0,27
stacjonarnych 2. stopnia 22,29 1,33 0,09 0,12 0,15 0,21
Stacjonarnych 1. stopnia
W. Ekonomii 43,42 0,65 0,07 0,24 0,14 0,41
Stacjonarnych 1. stopnia
W. Finansów i Ubezpieczeń 192,44 2,64 0,14 0,53 0,43 0,17
stacjonarnych 1. stopnia
W. Informatyki i Komunikacji 16,4 2,32 0,1 0,12 0,29 0,26
stacjonarnych 1. stopnia
W. Zarządzania 10,94 0,63 0,03 0,08 0,11 0,1
Źródło: opracowanie własne
Najmniejsze średnie błędy szacunku odnotowano, we wszystkich przypadkach, w warstwie studentów studiów stacjonarnych 1. stopnia Wydziału Zarządzania. Stanowiły one mniej niż 15% wartości oszacowanych predyktorów. Niższe wartości względnych błędów byłyby możliwe do uzyskania w przypadku większej liczebności próby w warstwach.
Paweł Domański, Małgorzata Krzciuk, Michał Miłek, Piotr Ziuziański
203
6. Podsumowanie
W artykule analizowano problem szacowania charakterystyk populacji i warstw w oparciu o próby nielosowe z wykorzystaniem samodzielnie przygotowanych programów w języku poleceń SPSS. Wykorzystano podejście modelowe w metodzie reprezentacyjnej uwzględniając podział populacji na warstwy w zakładanym modelu nadpopulacji. W obliczeniach wykorzystano dane dotyczące studentów Uniwersytetu Ekonomicznego w Katowicach zebrane przez Koło Naukowe Statystyków z wykorzystaniem techniki CAWI.
Bibliografia
1. Cassel C. M., Särdnal C. E., Wretman J. H.: Foundations of Inference in Survey Sampling, Wyd. John Wiley &Sons, New York – London – Sydney – Toronto 1977.
2. Wywiał J., Wprowadzenie do metody reprezentacyjnej, Katowice 2010.
Sampling Surveys Based on the Purposive Samples Using SPSS
The design‐based approach in sampling survey is widely used in market research and opinion poll companies, but it can be used if and only if the sample is random, which is quite rare in practice. In the paper, the problem of mean and fraction prediction is considered, basing on the purposive sample using the model approach in sampling survey. The survey is conducted by using the CAWI method. The purpose of the paper is to present functions in the IBM SPSS Syntax language prepared by the authors.
Keywords: Sampling survey, purposive samples, CAWI