• Nie Znaleziono Wyników

POPULARNE TECHNIKI BADAWCZE Ilościowe

7. Analiza i interpretacja danych

7.1. ABC statystyki – słowniczek badacza

7.1.9. Operat losowania

Definicja Pojęcie często spotykane w opisach badań sondażowych. Oznacza zbiór (wykaz, listę) zawierający informacje o wszystkich elementach danej populacji [patrz podrozdział 7.1.10. „Populacja”, str. 85], z którego dobiera się (losuje) określoną liczbę elementów do badania.

Przykład Operatem badań sondażowych opinii publicznej w Polsce (wykonywanych na losowej próbie adresowej) jest zwykle rejestr PESEL (Powszechny Elektroniczny System Ewi-dencji Ludności).

Warto

pamiętać Operat to inaczej spis wszystkich jednostek, które powinny mieć równe szanse na włączenie do próby badawczej [patrz podrozdział 7.1.11. „Próba”, str. 85]. Każda taka jednostka może występować w operacie tylko raz (inaczej prawdopodobieństwo jej wylosowania byłoby większe niż dla innych jednostek). Optymalnie, operat powinien zawierać dane o wszystkich jednostkach tworzących badaną zbiorowość (populację).

7.1.10. Populacja

Definicja Zbiorowość, której dotyczy dane badanie – ta, do której mają odnosić się jego wyniki. Przykład Populacją, do której odnosi się większość badań opinii publicznej w Polsce, jest

zbioro-wość wszystkich mieszkańców Polski powyżej 15. roku życia. Warto

pamiętać W potocznym języku słowo „populacja” bywa z reguły używane w odniesieniu do zbiorowości ludzkich lub zwierzęcych. W badaniach odnosi się ono do dowolnych elementów stanowiących zbiór, którego dotyczą wyniki badań. Możemy więc mieć do czynienia z populacją samorządów terytorialnych, firm rodzinnych lub kół zębatych (jeśli planujemy badanie próbkowe zmierzające do kontroli jakości tych kół).

7.1.11. Próba

Definicja Zbiorowość uczestników danego badania. Próbę wybiera się (najczęściej z zastosowaniem procedur mających zapewnić losowość wyboru) w celu uzyskania określonej wiedzy nie o samej próbie, ale o populacji, z której ona pochodzi. Przy zastosowaniu odpowiednich procedur doboru próby i realizacji badania, możemy w ten sposób uzyskać wiedzę o po-pulacji bez konieczności badania wszystkich jej przedstawicieli.

W badaniach społecznych wyróżnia się różne rodzaje prób. Jeśli zbadamy wszystkich członków danej populacji (czasami taka strategia jest uzasadniona), mówimy o próbie pełnej. Jeśli „ręcznie” wybieramy jej przedstawicieli na podstawie jakichś kryteriów, mamy do czynienia z próbą celową. Próba, której struktura ma odzwierciedlać strukturę populacji (np. liczebność próby pod względem płci i wieku ma być podobna jak liczebność populacji), nazywana jest próbą reprezentatywną. Jeśli do tego skład próby ustalany jest w sposób losowy, mamy do czynienia z próbą losową lub losową próbą reprezentatywną. Przykład Komunikat „Badanie przeprowadzono na reprezentatywnej, losowej próbie 1000

miesz-kańców Polski w wieku powyżej 15 lat” oznacza, że uczestnicy badania zostali dobrani w sposób losowy (za pomocą matematycznych technik zapewniających wszystkim jednostkom w operacie badawczym ustalone prawdopodobieństwo bycia wybranymi do badania) z operatu, na który składali się wszyscy mieszkańcy Polski powyżej 15. roku życia. W badaniu uczestniczyło 1000 osób, a struktura tej grupy odpowiada ze względu na istotne dla badania kryteria (np. płeć, wiek, miejsce zamieszkania) strukturze popu-lacji wszystkich osób powyżej 15. roku życia w Polsce.

Badanie na próbie zawsze wiąże się z koniecznością szacowania wyników badania dla całej populacji. Wyniki takie są więc zawsze obarczone pewnym błędem [patrz podroz-dział 7.1.2. „Błąd statystyczny”, str. 77] .

Wielkość próby podawana w komunikatach badawczych to z reguły tzw. wielkość „pró-ba zrealizowana”, czyli licz„pró-ba podmiotów (np. osób), które rzeczywiście wzięły udział w badaniu. W praktyce liczba ta stanowi jedynie część (zwykle mniejszą) liczby

pod-Warto

pamiętać miotów zaproszonych do badania, którzy z różnych powodów ostatecznie w nim nie uczestniczą. Im mniejsza jest liczebność próby zrealizowanej w stosunku do wylosowa-nej, tym mniej wiarygodne stają się wyniki badania.

Próba reprezentatywna nie musi mieć charakteru losowego – to często łączone, ale rozłączne pojęcia. Przykładem nielosowej próby reprezentatywnej może być tzw. próba kwotowa, polegająca na zbadaniu odpowiedniej liczby respondentów należących do określonych grup czy kategorii, w proporcjach określanych w stosunku do całej popu-lacji, której dotyczy badanie (np. odpowiadającej udziałowi w populacji liczby osób o określonym wieku i określonej płci). Taka próba spełnia kryteria reprezentatywności, ale nie jest losowa, ponieważ o doborze respondentów nie decyduje wyłącznie ślepy traf (mają na niego wpływ np. ankieterzy, dostępność respondentów w danym miejscu lub czasie itp.). Nielosowy charakter próby sprawia, że nie możemy precyzyjnie oszacować dokładności wyników badania, nawet jeśli jest reprezentatywna. Takie wyniki trudniej jest traktować jako obraz sytuacji w populacji, z której pochodzi próba.

7.1.12. Średnia (arytmetyczna)

Definicja Jedna z najpopularniejszych miar służących ustaleniu przeciętnej wartości danej cechy w określonej grupie czy zbiorze. Oblicza się ją, sumując wartość tej cechy dla wszystkich elementów zbioru, a następnie dzieląc przez jego liczebność.

Przykład Według szacunków GUS przeciętne (średnie) wynagrodzenie w gospodarce narodowej w 2012 roku wyniosło 3521,67 zł. Wartość tę uzyskano, sumując (na podstawie badań przedsiębiorstw) wszystkie uzyskane w danym roku wynagrodzenia osobowe (bez osób wykonujących pracę nakładczą i zatrudnionych za granicą), honoraria, wypłaty z tytułu udziału w zysku i dodatkowe wynagrodzenia roczne w przypadku pracowników sfery bu-dżetowej, a następnie dzieląc tę sumę przez przeciętną liczbę osób zatrudnionych w roku. Warto

pamiętać Średnia arytmetyczna jest bardzo wrażliwa na wartości odstające i skrajne, czyli sytuacje, kiedy wyniki niewielkiej części danego zbioru znacznie różnią się od wyników pozostałych elementów [patrz przykład dotyczący mediany › podrozdział 7.1.6., str. 82]. Jest to typowe dla wielu zjawisk (na przykład rozkładów dotyczących przychodów), co – jak widać po powyższym przykładzie – nie zawsze jest uwzględniane w badaniach. Aby ograniczyć wpływ takich sytuacji na oszacowania, stosuje się rozmaite zabiegi – na przykład zastępuje średnią arytmetyczną medianą [patrz podrozdział 7.1.6. „Media-na”, str. 86] albo oblicza się tzw. średnią obciętą – z wyłączeniem przypadków o najwyż-szych i najniżnajwyż-szych wartościach danej cechy.

Choć pojęcie „średnia” zwykle odnosi się do średniej arytmetycznej, nie jest to jedyny rodzaj średniej. Np. w badaniach szeregów czasowych, kiedy analizuje się przeciętne tempo zmian jakiegoś zjawiska, powszechnie stosowana jest tzw. średnia geometryczna (stosujemy ją, kiedy chcemy wyrównać zakresy zmiennych z różnych pomiarów, dla których liczymy średnią). W niektórych innych zastosowaniach (np. przy obliczaniu średniej dla wartości stosunkowych – takich jak prędkość w km/h) wykorzystuje się średnią harmoniczną.

7.1.13. Ważenie

Definicja Pojęcie odnoszące się do sytuacji, w której chcemy, aby nasze obliczenia uwzględniały różny „wkład” poszczególnych elementów naszego zbioru w badane zjawisko. Na przy-kład w badaniach opinii publicznej zwykle struktura próby badawczej [patrz podroz-dział 7.1.11. „Próba”, str. 85] w mniejszym lub większym stopniu odbiega od struktury populacji, do której badanie się odnosi. Aby wziąć to pod uwagę, stosuje się „wagi”, czyli mnoży liczebność poszczególnych elementów zbioru (osób) przez współczynnik, który koryguje te różnice (taki współczynnik to właśnie „waga”).

Przykład Wyobraźmy sobie badanie dotyczące zarobków, w którym udało nam się zbadać dwukrotnie za mało kobiet w stosunku do populacji, której dotyczy badanie. [patrz podrozdział 7.1.10. „Populacja”, str. 85].

Zakładając, że zarobki kobiet są niższe niż mężczyzn, można przypuszczać, że przecięt-na wartość zarobków uzyskaprzecięt-na przecięt-na podstawie takiego badania będzie zawyżoprzecięt-na w sto-sunku do wartości występującej w populacji (w badaniu uczestniczy więcej mężczyzn niż powinno, a mężczyźni mają przeciętnie wyższe zarobki). W takiej sytuacji, możemy założyć, że każda kobieta uczestnicząca w badaniu będzie w nim liczona podwójnie, a każdy mężczyzna zostanie „podzielony” przez dwa.

Warto

pamiętać Jeśli chcemy zwiększyć znaczenie danego elementu w wynikach, waga będzie większa niż 1, jeśli zmniejszyć – mniejsza niż 1, ale większa niż 0 (pomnożenie przez 0 oznacza w istocie usunięcie danego elementu z analizy – jego znaczenie dla wyników staje się zerowe).