ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA IX (1977)
ROBERT BARTOSZYŃSKI (Warszawa)
O pewnym schemacie subiektywnych klasyfikacji przy zmiennych prawdopodobieństwach wyboru
(Praca przyjęta do druku 27.11.1975)
1. Wstęp. Niech A będzie zbiorem, którego elementy będą interpretowane jako klasyfikowane obiekty. Przypuśćmy, że z każdą parą (x, y) EA x A można związać doświadczenie, w którym badana osoba wybiera ten z elementów x, y, który (według jej oceny) ma wyższą wartość pewnej cechy (np. wybiera element preferowany, itp.).
Tego rodzaju sytuacje analizuje się zazwyczaj w terminach tzw. prawdopodobieństw
wyboru p(x, y), przy czym ta ostatnia wielkość interpretowana jest jako prawdo-
podobieństwo, że wybrany zostanie elementy jeżeli wybór dokonywany jest z (upo- rządkowanej) pary (x, y). Można mianowicie pokazać, że przy określonych założe
niach, prawdopodobieństwa wyboru indukują skalę użyteczności (por. np. Davidson i Marschak [4]; Marschak [10]; Debreu [5], [6]; Georgescu-Roegen [7]; Luce [8], [9]; Bartoszyński [3]), lub też że można zbudować pewien schemat subiektywnych klasyfikacji (por. Bartoszyński [1], [2]). Ta ostatnia oparta jest na ciągu „standar- dów" ... , x_ 1, x 0 , x 1 , ... spełniającym warunek: jeżeli O < p(x, Xj) < 1 dla jakichś x EA oraz}, to p(xi-k, x) = p(x, xi +k) = 1 dla wszystkich k ~ 1. Każdy taki ciąg
może wobec tego spełniać rolę „granic" między poszczególnymi kategoriami klasy- fikacji.
W większości prac dotyczących prawdopodobieństw wyboru, zakłada się, że p(x, y) odnosi się do wyborów dokonywanych przez jedną ustaloną osobę. Ze
względu jednak na oczywiste trudności szacowania tych prawdopodobieństw dla pojedynczej osoby, przyjmuje się niekiedy (czasem przemilczając to założenie), że p(x, y) jest jednakowe dla wszystkich osób, i szacuje się te prawdopodobieństwa na podstawie obserwacji wyborów dokonywanych przez grupę osób.
W tej pracy przyjęte będzie założenie, że prawdopodobieństwa wyboru mogą zależeć od osoby wybierającej. W paragrafie 2 zbadane zostaną warunki istnienia schematu klasyfikacji, tj. ciągu standardów spełniającego sformułowane wyżej wyma- ganie. W paragrafie 3 podana zostanie konstrukcja ciągu standardów o maksymalnej liczbie elementów. Wreszcie, w paragrafie 4 ta sarna sytuacja analizowana będzie w terminach zmiennych losowych opisujących wybory, i wskazane będą metody, które mogą dostarczyć informacji o tym, w jakim stopniu prawdopodobieństwa
[35]
wyboru zależą od osób wybierających; metody te będą przy tym oparte na ograni- czonej liczbie obserwacji dla każdej osoby.
2. Ciągi standardów. W dalszym ciągu, A będzie oznaczać zbiór obiektów pod- • dawanych klasyfikacji ze względu na jakąś cechę, a S będzie oznaczać zbiór osób
dokonujących wyborów. Założymy, że w ocenach nie dopuszcza się „remisów", tak że jeżeli Ps(X, y) oznacza prawdopodobieństwo wyboru y jako elementu o wyższej
wartości cechy przez osobę s ES, gdy wybór dokonywany jest z pary (x, y), to I -p
8(X, y) jest prawdopodobieństwem, że w analogicznej sytuacji osoba ta wybierze element x.
Założymy, że prawdopodobieństwaps(x, y) są określone dla wszystkich x, y EA i s E S, i spełniają następujące postulaty.
POSTULAT 1 (symetria). Dla wszystkich s ES oraz x, y EA
(1) Ps(X,y)+pJy,x) = 1.
Zauważmy, że (1) nie jest konsekwencją założenia o braku „remisów". Istotnie,
rozważa się tu pary uporządkowane i nie ma żadnych powodów, aby ps(x, y) i Ps(Y, x)
były między sobą związane jakąś zależnością. Jasne jest jednak, że w sytuacjach praktycznych można łatwo osiągnąć spełnienie (1) drogą randomizacji kolejności (uporządkowania przestrzennego) prezentacji obiektów x i y.
POSTULAT 2 (przechodniość). Dla wszystkich s E S oraz x, y, z E A, jeżeli
Ps(X, y) ~ 1/2 i ps(y, z)~ 1/2, to
(2) Ps(X, z)~ maX[p
8(X, y),ps(y, z)].
Zanim przedstawione zostaną dalsze postulaty, określmy x -<s y jeżeli Ps(X, y) > 1/2 oraz x ,...., s y jeżeli ps(x, y) = 1/2. Z (1) i (2) wynika natychmiast, że ,....,
i.jest relacją równoważności w A, oraz że -<s indukuje liniowe uporządkowanie wszystkich klas
,...., s-równoważności.
Postulat 2 znany jest w literaturze jako mocna stochastyczna przechodniość
(por. Marschak [10]), w odróżnieniu od umiarkowanej i słabej stochastycznej prze-
chodniości; pierwsza z nich określona jest przez zastąpienie „max" w (2) przez
„min", natomiast w drugiej z nich wymaga się tylko, aby ps(x, z) ~ 1/2. Oczywiście
relacje -<si ,...., s spełniają sformułowane wyżej warunki przy obu tych typach prze-
chodniości.
Dla n = 2, 3, . . . będziemy mówić, że t ~ 1 jest n-tym pierwiastkiem z progu
rozróżnialności (dla osoby s ES), jeżeli dla dowolnych x 0 , X 1 , „., Xn warunki ps(xo, X 1) ~ t, ... ,ps(xn-1, X)~ tn
implikują Ps(Xo, Xn) = 1.
Niech B(n, s) będzie zbiorem wszystkich n-tych pierwiastków z progu rozróżnial
ności dla osoby s. Mamy wówczas oczywisty
LEMAT 1. Wszystkie zbiory B(n, s), s ES, n = 2, 3, ... są niepuste i warunki
t E B(n, s), t ~ t' ~ 1 implikują t' E B(n, s).
O pewnym schemacie subiektywnych klasyfikacji 37 Druga teza wynika bezpośrednio z definicji, podczas gdy niepustość wynika stąd, że 1 E B(n, s) na mocy postulatu 2.
Niech
(3) q(n, s) =inf {t: t E B(n, s)}.
Można przypuszczać, że dla każdego s ES mamy bądź q(n, s) = 1 dla wszystkich n, bądź q(n, s) < 1 dla wszystkich n. Tak jednak nie jest, o czym można się prze-
konać na podstawie następującego przykładu.
Niech A = {x 0 , x 1 , x 2 , ••• } będzie zbiorem przeliczalnym i przypuśćmy, że prawdopodobieństwa wyboru wynoszą (opuszczając dla uproszczenia wskaźnik s)
p(Xb Xi+1) = Gj,
p(Xb Xi +2) = bb
p(xh X;+3) = p(x;, X;+4) = ... = 1,
przy czym p(x i, x 1) dla j ~ i otrzymane są na mocy (1); ponadto, niech 1/2<a 1 <a 2 < ... ~1
oraz
a; +i ~ b; < 1 dla wszystkich i.
Dwa ostatnie warunki gwarantują spełnienie (2). Łatwo się przekonać, że każda
liczba t ~ a 1 jest pierwiastkiem trzeciego stopnia z progu rozróżnialności, podczas gdy jedynym pierwiastkiem drugiego stopnia z progu rozróżnialności jest 1 (gdyż
dla każdego s > O istnieje trójka Xj, xi +i, X; + 2 taka, że p(xh xi +i) ~ 1- s, p(x;+1, Xi+2) ~ 1-s i p(X;, X;+2) < I).
Przyjmijmy
(4) q(n) = supą(n,s),
gdzie q(n, s) określone jest przez (3).
Udowodnimy
LEMAT 2.
(5) q(n) ~ q(n+ 1), n = 2, 3, ...
Do wód. Jeżeli q(n) = 1, nierówność (5) jest spełniona; załóżmy więc, że
q(n) = c < 1 i wybierzmy s > O takie że c+ s < 1.
Wybierzmy następnie dowolne s 0 ES i przypuśćmy, że
(6) oraz (7)
Ponieważ c + s > c = sup q(n, s) ~ q(n, s 0), więc nierówności ( 6) implikują
Ps
0(Xo, Xn) = 1 na mocy definicji liczby s q(n, s 0). W połączeniu z (7), relacja ta,
na mocy (2), daje p
80(x 0 , Xn+i) = l, co oznacza że c+s E B(n+ 1, s 0 ). Ponieważ
e jest dowolne, na mocy definicji (3) otrzymujemy q(n + l, s 0 ) ~ c, a z dpwolności s 0 mamy też
q(n+ 1) = supq(n+ 1, s 0 ) ~ c = q(n), co należało okazać.
Tak więc ciąg {q(n)} jest zbieżny; oznaczamy
(8) • q = limq(n).
Możemy obecnie sformułować dwa następne postulaty.
POSTULAT 3 (zgodność). Istnieje a < 1/2 takie, że dla wszystkich x, yE A, jeżeli Ps
0(x, y) = t > 1/2 dla pewnego s 0 , to
(9) infp
5(X, y) ~ t- a.
s
Postulat ten implikuje to, że wszystkie wartości Ps(x, y) dla ustalonych x, y leżą w paśmie o szerokości rJ.. W szczególności, jeżeli dla jakiegoś s 0 jest x -<s
0y przy Ps
0(X, y) > i+ rJ., to X -<s y dla wszystkich s ES.
POSTULAT 4 (pełna rozróżnialność).
(10) q < 1-rJ.,
gdzie 7j jest określona przez (8), a ry_ jest liczbą występującą w postulacie 3.
W sytuacjach praktycznych można rozsądnie oczekiwać spełnienia nawet moc- niejszego warunku, mianowicie limq(n) = 1/2; dla naszych celów jednak warunek (10) będzie wystarczający.
Wybierzmy obecnie r takie, aby (11)
i niech
(12) N= min{n: q(n) < r-rJ.}.
Na mocy (8), (10) i (11) jest N< oo.
Udowodnimy teraz twierdzenie opisujące konstrukcję ciągu, który może służyć
za standardy w klasyfikacji.
TWIERDZENIE 1. Niech . „, x_ 1, x 0 , x 1 , • „ będzie skończonym lub nieskończonym ciągiem elementów A, takim że Psixi, Xj+i) ~ r dla pewnego si ES (j =O, ± 1, „.).
Dla każdego s E S i x EA, jeżeli O < Ps(x, Xi) < l, to (13)
dla wszystkich k ~ 2N.
Do wód. Rozważmy najpierw przypadek 1/2 ~ ps(x, xi) < 1. Ponieważ Ps/Xi, xi+i) ~ r dla wszystkich j, możemy napisać, używając postulatu 3 i relacji
(12) i (4):
O pewnym schemacie subiektywnych klasyfikacji
Mamy zatem następujący ciąg nierówności
(14) (15)
39
i w konsekwencji, na podstawie definicji q(N, s) i ze względu na to, że nierówności
( 15) są ostre, a zatem ha mocy (2)
Stosując wielokrotnie relację (2) otrzymujemy teraz Ps(Xi, xi+k) = 1 dla wszystkich k ~ N, co dowodzi pierwszej części tezy ( 13).
Następnie, musimy mieć
(16) 1
ps(xi-N, x) > 2 ,
gdyż w przypadku przeciwnym, ps(x, Xi-N)~ 1/2, mielibyśmy ps(x, xi) = 1 na mocy udowodnionej już tezy, wbrew założeniu twierdzenia. Postępując jak poprzednio, mamy
Ps(Xi-2N' Xi-2N+1) > q(N, s), Pk(Xi-N-1' Xi-N)> q(N, s),
a zatem Ps(xi- 2 N, Xi-N) = 1. Używając (16), na mocy (2) mamy ps(xi- 2N, x) = 1, i wielokrotne zastosowanie (2) daje drugą część tezy (13).
Dowód w przypadku O < ps(x, xi) ~ 1/2 jest analogiczny.
Tak więc, dla otrzymania ciągu standardów klasyfikacji, wystarcza zbudować dowolny ciąg {xi} spełniający założenia twierdzenia dla pewnego r, dla którego zachodzi relacja (11), a następnie wybrać podciąg wyrazów odległych o co najmniej 2N wskaźników.
3. Maksymalne ciągi standardów. W tym paragrafie przyjęte będą dodatkowe postulaty dla prawdopodobieństw wyboru i podana będzie charakteryzacja ciągów klasyfikacyjnych (tj. ciągów {x 2N} wybranych z ciągów spełniających założenia twierdzenia 1), o maksymalnej liczbie elementów.
POSTULAT 5 (identyczność relacji porządkujących). Dla każdych X, y EA, jeżeli
Ps
0(x, y) > 1/2 dla pewnego s 0 ES, to ps(x, y) > 1/2 dla wszystkich s ES.
Tak więc, wszystkie relacje ,...., s, i wobec tego także wszystkie relacje -<s, pokry-
wają się. W dalszym ciągu będziemy więc opuszczali wskaźnik s.
Można rozsądnie oczekiwać, że postulat 5 będzie spełniony w tych sytuacjach
praktycznych, gdy oceny dotyczą jakiejś cechy fizycznej elementów zbioru A.
Dla r > 1/2 i x e A określmy
(17) A:(x) = {y: ps(x, y) ~ r dla pewnego se S}, A;(x) = {y: ps(y, x) ~ r dla pewnego se S}.
Mamy wówczas
LEMAT 3 Jeżeli y e A:(x) i y -< y', to y' e A:(x), i podobnie, jeżeli y e A;(x);
y' -< y, to y' e A; (x).
Istotnie, jeżeli Ps(x, y) ~ r i Ps(y, y') ~ 1/2, to na mocy (2) mamy Ps(x, y') ~ r,
czyli y' e A:(x), i podobnie dla zbioru A;(x). ·
Tak więc, zbiory A:(x) i A;:(x) są, w pewnym sensie, „półprostymi" w uporządko
waniu <(.
Sformułujemy obecnie ostatni postulat:
POSTULAT 6 (zamkniętość). Jeżeli A:(x) # 0, to istnieje y+ e A:(x) taki, że
Ps(y+, y) ~ 1/2 dla wszystkich si wszystkich y e A:(x). Podobnie, jeżeli A;(x) # 0, to istnieje y- e A;(x) takie, że ps(y, y-) ~ 1/2 dla wszystkich si wszystkich y e A;(x).
Mamy następujący oczywisty
LEMAT 4. Elemen:fy y+ i y- są jednoznaczne z dokładnością do równoważności,....,.
Niech teraz r będzie liczbą spełniającą (11) i ustalmy z 0 EA. Oznaczmy przez L(z 0 , r) klasę wszystkich ciągów ... , x_ 1 , x 0 , x 1 , ... (skończonych lub nie), dla których
(a) Xo ,..;,, Zo,
(b) Psixi, xi+l) ~ r dla pewnego si ES (j = O, ±I, ... )
(innymi słowy, L(z 0 , r) jest klasą wszystkich ciągów spełniających założenia twier- dzenia 1, o ustalonym elemencie x 0 ).
Określmy teraz ciąg ... , x! 1 , x~, xt, ... w sposób następujący:
(1) Jako x~ wybierzmy jakikolwiek element równoważny z 0 •
(2) Przypuśćmy, że k ~ O i że element xt został już skonstruowany. Jeżeli zbiór A:(xt) jest pusty, ciąg {xn kończy się na xt. W przypadku przeciwnym, jako xt+i należy wybrać dowolny element równoważny y+, określonemu w postulacie 5.
(3) W kierunku ujemnych wskaźników, ciąg {x:} rozszerza się przez analogiczną procedurę indukcyjną jak w (2).
Mamy wówczas
LEMAT 5. Ciąg {xj} określony jest jednoznacznie z dokładnością do równo-
ważności ,...., i,jest elementem klasy L(z 0 , r).
Do wód. Druga część tezy wynika bezpośrednio z definicji (17) zbiorów A:(x) i A;(x). Dla dowodu jednoznaczności należy pokazać, że wybór x:+i (dla k ~ O) jest ten sam (z dokładnością do równoważności) dla każdego wyboru xt. Na mocy
lematu 4, wystarcza w tym celu pokazać, że x ,...., y pociąga za sobą A:(x) = A:(y).
Ta ostatnia własność wynika z kolei stąd, że warunek x ,..., y implikuje Ps(x, z) =
= p
5(y, z) dla wszystkich s ES i z EA.
O pewnym schemacie subiektywnych klasyfikacji 41 Istotnie, przypuśćmy że Ps(x, y) = I /2. Bez zmniejszenia ogólności można założyć, że Ps(Y, z)~ 1/2. Na mocy (2) mamy wówczas
(18) Ps(X, z)~ max[ps(x, y),ps(y, z)]~ Ps(Y, z).
Następnie, na mocy (1) mamy też Ps(y, x) = 1/2, i ponieważ Ps(x, z)~ 1/2 z uwagi na (18), możemy napisać
Ps(y, z)~ max[ps(y, x),ps(x, z)]~ ps(x, z), skąd wynika Ps(X, z) = Ps(y, z), co należało okazać.
Na zakończenie tego paragrafu udowodnimy, że ciąg {xj} jest, w pewnym sensie, najdłuższy w klasie L(z 0 , r). Mamy mianowicie
TWIERDZENIE 2. Niech {xi} będzie dm-rolnym ciągiem z klasy L(z 0 , r ). Jeżeli
{xi} mak-ty wyraz, dla k ~ O, to xt jest także określone i Ps(xt, xk) ~ 1 /2 dla wszyst- kich s, i podobnie,jeżeli {xi} ma n-ty wyraz dla n ~ O, to x: jest określone i Ps(Xn, x:) ~
~ 1/2 dla wszystkich s.
D o w ó d. Ze względu na symetrię, wystarcza udowodnić twierdzenie dla k ~ O.
Teza jest prawdziwa dla k = O na mocy konstrukcji. Załóżmy, że jest ona spełniona dla pewnego k ~ O; wobec tego element xt istnieje i mamy Ps(xt, xk) ~ I /2 dla wszystkich s.
Przypuśćmy, że xk+i jest następnym wyrazem ciągu {xi}· Mamy wówczas Psk(xb xk+t) ~ r dla pewnego ski na mocy (2) możemy napisać
Psk(xt, xk +i) ~ max[psk(xt, Xk), Psk(xb xk +i)] ~ Ps/xb Xk+1) ~ r,
co dowodzi, że xk+i e A-;!"(xn Tak więc, zbiór A;:(xt) jest niepusty i xt+i istnieje na mocy postulatu 6. Relacja Ps(xt+ 1, xk+i) ~ 1/2 wynika obecnie z definicji ele- mentu x:+i.
4. Zagadnienia estymacji. W tym para.grafie rozważymy pewne problemy esty- macji związane ze schematem klasyfikacji. Tak więc, przypuśćmy, że mamy rodzinę zmiennych losowych
{19) !F = {T!i>(x,y): x,yeA, seS, i= 1,2, ... },
gdzie każda ni>(x' y) przyjmuje jedną z wartości X, y. Rodzina !F reprezentuje obserwowalne wybory: zdarzenie T}i>(x, y) = x będzie interpretowane jako „przy i-tej prezentacji pary (x, y), osoba s wybrała x jako element o mniejszej wartości badanej cechy".
Niech I c {l, 2, ... }. Założymy, że rodzina !F spełnia następujące warunki:
(i) Jeżeli U, V są rozłącznymi podzbiorami A x A x S x I, to podrodziny
!Fu= {TP>(x,y): (x,y,s,i)e U}
oraz
!Fv = {ni>(x,y): (x,y,s,i)eV}
są niezależne;
(ii) dla i = 1, 2, ...
P{T}i>(x,y) = y} = Ps(x,y).
Wynika stąd w szczególności, że jeżeli i 1 =j:. ii, to dla wszystkich x,y oraz s zmienne losowe TP
1>(x' y) oraz ni
2>(x' y) są niezależne i mają jednakowy rozkład.
Dla dużych zbiorów I, założenia (i) oraz (ii) są oczywiście nierealistyczne, i chodzi wobec tego o zbudowanie metod wnioskowania o prawdopodobieństwach Ps(X, y), które nie wykorzystują „ w pełni" tych założeń. Pokażemy mianowicie, że można
zbudować metody wnioskowania oparte na dwóch obserwacjach wyboru z danej pary dla każdej osoby.
Metody te zawarte są w następujących twierdzeniach (por. Bartoszyński [2]).
Niech<§ = {G 1 , .•. , Gn} będzie układem niezależnych eksperymentów. Załóżmy, że każdy z tych eksperymentów może prowadzić do „sukcesu" lub „porażki",
i niech ai oznacza prawdopodobieństwo sukcesu w eksperymencie Gi. Oznaczmy (20)
Załóżmy, że można przeprowadzić tylko dwie niezależne obserwacje dla każdego
z eksperymentów Ghi niech Xi = I lub O, w zależności od tego, czy pierwsze doświad
czenie dla eksperymentu Gi dało sukces czy porażkę. Podobnie, niech Yi = I lub O w zależności od wyników drugiego doświadczenia.
Niech teraz Zii =Xi Yi i (21)
Mamy wówczas
- 1 L"„
X=- - n
IXi,
i= 1
I - _,-
ri