Jak stwierdzono już poprzednio, przy szacowaniu parametrów dla populacji gene
ralnej na podstawie danych z próby występuje zawsze tzw. błąd próby. Znamy jednak wiele metod statystycznych, które umożliwiają taki wybór próby, aby szacowanie pa
rametrów populacyjnych było możliwie precyzyjne. Ma to miejsce tylko wtedy, jeśli każda jednostka losowania (chory, próbka krwi lub moczu) ma ściśle określone praw
dopodobieństwo „dostania się” do próby, przy czym wybór tych jednostek jest zupeł
nie przypadkowy, tzn. losowy. Jeżeli przy wyborze próby zostaną spełnione te dwa warunki, to próbę taką nazywamy losową.
Liczba jednostek w populacji generalnej może być skończona, to znaczy, że ich liczba jest wyraźnie ograniczona (np. liczba chorych w danej klinice). Czasami jednak populacja generalna składać się może z nieskończenie dużej liczby jednostek (np. licz
ba kart szpitalnych w nieokreślonej bliżej jednostce czasu). Przypuśćmy, że jakaś po
pulacja A liczy 1000 osób i że chcemy spośród nich wybrać próbę o liczebności 100 osób. Dokonując wyboru próby z listy, możemy każdą osobę już wybraną wykreślić z wykazu przed dokonaniem wyboru kolejnej osoby. Wylosowana próba nie będzie zatem zawierać żadnych duplikatów, a taką metodę nazywamy losowaniem bez zwra
cania. Jeżeli jednak osoba po wylosowaniu nie zostanie z listy skreślona i będzie brała dalej udział w losowaniu, to wtedy taki wybór nazywamy losowaniem ze zwracaniem lub losowaniem z populacji nieskończonej.
Wzory statystyczne na obliczenie precyzji estymatorów z próby są bardziej złożone w przypadkach losowania z populacji skończonej (tj. bez zwracania). Jeżeli populacja docelowa jest raczej mała lub próba obejmuje dużą część populacji generalnej (po
wiedzmy 10% lub więcej), należy stosować wzory do losowania bez zwracania. Zwy
kle jednak populacja generalna jest tak duża, a liczebność próby (w odsetkach) do po
pulacji generalnej tak mała, że w zasadzie zbiór jednostek populacji możemy traktować jako nieskończony.
Etapy losowania. Przede wszystkim należy bardzo dokładnie zdefiniować popula
cję generalną (docelową). Czasami populacją docelową będą wszyscy chorzy hospita
lizowani w danym szpitalu, czasami wszyscy chorzy na daną chorobę w całej popula
cji, niekiedy znowu zbiór kart chorobowych pacjentów danego rejonu. Następnym etapem jest przygotowanie tzw. „operatu losowania”, przez co rozumiemy kompletny wykaz jednostek wchodzących w skład danej zbiorowości. Trzecim etapem jest ustale
nie odpowiednio do celów badania granicy błędu dla szacowanych parametrów (tole
rancji) i poziomu ufności.
Schemat losowania prosty
Dla przekazania czytelnikowi w sposób poglądowy tego postępowania na małą skalę, przyjmiemy, że chcemy wybrać za pomocą schematu losowania prostego 6 osób spośród zbiorowości 18 chorych z danego oddziału szpitala. Przypiszemy im hipote
tyczne wartości OB i stadium chorobowe (tab. 7.1).
Tabela 7.1. Hipotetyczne wartości OB wśród chorych hospitalizowanych w różnym stadium chorobowym
Stadium choroby
A B C
Lp. OB Lp- OB Lp. OB
1 55 4 27 10 18
2 67 5 32 11 14
3 43 6 24 12 18
7 28 13 14
8 31 14 17
9 26 15 19
16 17
17 16
18 20
Ogółem 3 165 6 168 9 153
Średnia 55,0 28,0 17,0
Dla całości suma wartości OB = 486 średnia OB = 27,0
Dla wybrania w sposób losowy 6 spośród 18 chorych posłużymy się załączonym fragmentem tabeli liczb losowych i stosownie do tego wybierzemy pierwszych 6 róż
nych liczb od 1 do 18 (tab. 7.2).
39 Tabela 7.2. Fragment tabeli liczb losowych
22 57 53 93
19 48 40 21
16 61 02 95
78 36 95 97
03 18 35 69
93 88 16 04
78 09 77 61
23 12 46 85
15 85 37 21
38 38 61 15
Tabela 7.3. Wyniki losowania (wylosowano liczby 16, 3, 15, 18, 9, 12)
Lp. OB
16 17
3 43
15 19
18 20
9 26
12 18
Suma 143
Średnia 23,8
Proszę zwrócić uwagę na to, że wybrana próba losowa jest tylko jednym możliwym przykładem z teoretycznie możliwych bardzo wielu wariantów różnych kombinacji 6 jednostek ze zbioru 18 osób.
Losowanie warstwowe proporcjonalne
Dla przeprowadzenia losowania warstwowego proporcjonalnego (6 osób spośród 18-osobowej grupy) wybralibyśmy 1 chorego z grupy A, 2 osoby z grupy B i 3 z grupy C (tzn. 1/3 część każdej grupy). Spróbujmy znowu skorzystać z tabeli liczb losowych i wybierzmy z pierwszej grupy 1 osobę przy natrafieniu pierwszej z liczb od 1 do 3, z drugiej grupy 2 osoby na podstawie pierwszych dwóch liczb od 4 do 9 oraz z trzeciej grupy 3 osoby na podstawie pierwszych trzech liczb od 10 do 18.
Tabela 7.4. Wyniki losowania warstwowego proporcjonalnego
Warstwa Lp. OB
Grupa A 3 43
Grupa B 9 26
4 27
Grupa C 16 17
15 19
18 20
Suma 152
Średnia 25,3
Estymacja parametru średniego poziomu OB na podstawie doboru losowania war
stwowego lepiej przybliża wynik z próby do wartości rzeczywistej niż przy zastosowa
niu schematu losowania prostego. Dzieje się tak dlatego, że teraz w wybranej próbie mamy proporcjonalną reprezentację 3 grup chorych, które różnią się między sobą strukturą wewnętrzną, w tym przypadku stadium choroby.
Losowanie warstwowe stałej liczby jednostek
Tabela 7.5. Wyniki losowania warstwowego stałej liczby jednostek
Warstwa Lp. OB Poprawka Ogółem
(ważone)
Grupa A 3 43 -
-2 67 -
-110 3/2 165
Grupa B 9 26 -
-4 27 -
-53 6/2 159
Grupa C 16 17 -
-15 19 -
-36 9/2 162
Ogółem 486
Średnia ważona : 486/18 = 27, 0 Losowanie zespołowe
Innym przykładem wyboru losowego jest losowanie zespołowe. Znajduje ono zasto
sowanie szczególnie w odniesieniu do dużych populacji, kiedy poszczególne grupy po
pulacyjne (zespoły) są niejednorodne. Przypuśćmy, że w naszym przypadku wśród 18 osób są np. 3 grupy chorych o niejednorodnej strukturze OB (tab. 7.6). Załóżmy, że po
sługując się znowu tabelą liczb losowych, natrafiliśmy np. na liczbę 03. Stąd do badania został wybrany zespół III (Szpital C), gdzie średnia OB w tej grupie wynosiła 25,5.
W zasadzie najdokładniejsze wyniki badania przy zastosowaniu schematu losowa
nia zespołowego można uzyskać wtedy, jeśli poszczególne zespoły obiektów badania
41 są wewnętrznie dobrze wymieszane, a więc mają strukturę niejednorodną. Przeprowa
dzona estymacja średniej wartości OB na podstawie próby okazała się bliska średniej dla populacji generalnej, dlatego że jednostki w obrębie tego zespołu były dobrze wy
mieszane. Wręcz przeciwnie o efektywności losowania warstwowego decyduje jedno
rodność w obrębie każdej warstwy. Jeżeli losowanie warstwowe jest przeprowadzone w sposób właściwy, to daje dokładniejsze szacunki parametrów niż losowanie zespo
łowe przy tej samej liczebności próby. Niekiedy praktycznie możliwe jednak jest prze
prowadzenie jedynie losowania zespołowego.
Tabela 7.6. Wartości OB w poszczególnych zespołach (szpitalach)
Numer chorych
Szpital A (I) Szpital B (II) Szpital C (III)
Grupa OB Numer
chorych Grupa OB Numer
chorych Grupa OB
1 A 55 2 A 67 3 A 43
4 B 27 6 B 24 8 B 31
5 B 32 7 B 28 9 B 26
10 C 18 13 C 14 16 C 17
11 C 14 14 C 17 17 C 16
12 C 18 15
c
19 18 c 20Ogółem 164 169 153
Średnia 27,3 28,2 25,5
Losowanie systematyczne
Próbę losową 6 chorych wybrać można także przy pomocy tzw. losowania syste
matycznego, które przeprowadza się w następujący sposób. Najpierw należy ustalić jakąś liczbę zawartą między 1 a 3 (18 : 6 = 3). Jeśli jest to 2, to wybór zaczynamy od osoby z numerem 2 i od tego numeru każdą trzecią wybieramy do próby. W tym przy
padku próba wybrana w drodze losowania systematycznego składać się będzie z 6 na
stępujących osób:
1 23 45 67 8 9 10 11 12 13 14 15 16 17 18
Tabela 7.7. Wyniki losowania systematycznego
Numer Grupa
chorych OB
2 A 67
5 B 32
8 B 31
11 C 31
14 C 17
17 C 16
Ogółem 177
Średnia 29,5
Losowanie systematyczne jest technicznie proste, łatwe oraz szybkie i dlatego sto
sowane jest dość często w praktyce. Zastosowanie niektórych metod losowania pociąga za sobą skutki w zakresie precyzji szacunków. Na przykład schemat losowania zespo
łowego wpływa często na zwiększenie zmienności badanej cechy, a przez to w konse
kwencji na wielkość błędu próby. Uwarstwowienie próby jest zawsze wskazane, po
nieważ przez zmniejszenie wariancji badanej cechy w poszczególnych warstwach uzyskujemy większą precyzję oszacowań. Decyzja wyboru schematu losowania wy
maga dobrej znajomości wspomnianych problemów i powinna być podjęta po dokład
nym przemyśleniu celów badania oraz wymaganych nakładów pracy i środków finan
sowych.