O pewnym schemacie subiektywnych klasyfikacji przy zmiennych prawdopodobieństwach

(1)

ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA IX (1977)

ROBERT BARTOSZYŃSKI (Warszawa)

O pewnym schemacie subiektywnych klasyfikacji przy zmiennych prawdopodobieństwach wyboru

(Praca przyjęta do druku 27.11.1975)

1. ^Wstęp. Niech A będzie zbiorem, którego elementy będą interpretowane jako klasyfikowane obiekty. Przypuśćmy, że z każdą parą (x, y) EA x A można związać doświadczenie, w którym badana osoba wybiera ten z elementów x, y, który ^(według jej oceny) ma wyższą wartość pewnej cechy (np. wybiera element preferowany, itp.).

Tego rodzaju sytuacje analizuje ^się zazwyczaj w terminach tzw. prawdopodobieństw

wyboru p(x, y), przy czym ta ostatnia wielkość interpretowana jest jako prawdo-

podobieństwo, że wybrany zostanie elementy ^jeżeli wybór dokonywany jest z (upo- rządkowanej) pary (x, y). Można mianowicie pokazać, że przy określonych założe

niach, prawdopodobieństwa wyboru indukują skalę użyteczności (por. np. Davidson i Marschak [4]; Marschak [10]; Debreu [5], [6]; Georgescu-Roegen [7]; Luce [8], [9]; Bartoszyński [3]), lub też że można zbudować pewien schemat subiektywnych klasyfikacji (por. Bartoszyński [1], [2]). Ta ostatnia oparta jest na ciągu „standar- dów" ... , x_ ^1, x 0 , x 1 , ... spełniającym warunek: ^jeżeli O < p(x, Xj) < 1 dla ^jakichś x EA oraz}, to p(xi-k, x) = p(x, xi +k) = 1 dla wszystkich k ^~ 1. ^Każdy taki ^ciąg

może wobec tego spełniać rolę „granic" między poszczególnymi kategoriami klasy- fikacji.

W większości prac dotyczących prawdopodobieństw wyboru, zakłada się, że p(x, y) odnosi się do wyborów dokonywanych przez jedną ustaloną osobę. Ze

względu jednak na oczywiste trudności szacowania tych prawdopodobieństw dla pojedynczej osoby, przyjmuje się niekiedy (czasem przemilczając to założenie), że p(x, y) jest jednakowe dla wszystkich osób, i szacuje ^się te prawdopodobieństwa na podstawie obserwacji wyborów dokonywanych przez grupę osób.

W tej pracy przyjęte będzie założenie, że prawdopodobieństwa wyboru ^mogą zależeć od osoby wybierającej. W paragrafie 2 zbadane zostaną warunki istnienia schematu klasyfikacji, tj. ^ciągu standardów spełniającego sformułowane wyżej wyma- ganie. W paragrafie 3 podana zostanie konstrukcja ^ciągu standardów o maksymalnej liczbie elementów. Wreszcie, w paragrafie 4 ta sarna sytuacja analizowana będzie w terminach zmiennych losowych opisujących wybory, i wskazane będą metody, które mogą dostarczyć informacji o tym, w jakim stopniu prawdopodobieństwa

[35]

(2)

wyboru ^zależą od osób wybierających; metody te ^będą przy tym oparte na ograni- czonej liczbie obserwacji dla każdej osoby.

2. Ciągi standardów. W dalszym ciągu, A będzie oznaczać zbiór obiektów pod- • dawanych klasyfikacji ze ^względu na jakąś cechę, a S będzie oznaczać zbiór osób

dokonujących wyborów. Założymy, że w ocenach nie dopuszcza ^się „remisów", tak ^{że jeżeli} Ps(X, y) oznacza prawdopodobieństwo wyboru y jako elementu o ^wyższej

wartości cechy przez ^osobę s ES, gdy wybór dokonywany jest z pary (x, y), to I -p

8

(X, y) jest prawdopodobieństwem, że w analogicznej sytuacji osoba ta wybierze element x.

Założymy, że prawdopodobieństwaps(x, y) są określone dla wszystkich x, y EA i s E S, i spełniają następujące postulaty.

POSTULAT 1 (symetria). Dla wszystkich s ES oraz x, y EA

(1) Ps(X,y)+pJy,x) = 1.

Zauważmy, że (1) nie jest konsekwencją założenia o braku „remisów". Istotnie,

rozważa się tu pary uporządkowane i nie ma ^żadnych powodów, aby ps(x, y) i Ps(Y, x)

były między sobą związane jakąś zależnością. Jasne jest jednak, że w sytuacjach praktycznych można łatwo osiągnąć spełnienie (1) ^drogą randomizacji kolejności (uporządkowania przestrzennego) prezentacji obiektów x i y.

POSTULAT 2 (przechodniość). Dla wszystkich s E S oraz x, ^{y, z} ^E A, jeżeli

Ps(X, y) ~ 1/2 i ps(y, z)~ 1/2, to

(2) Ps(X, ^z)~ maX[p

8

(X, y),ps(y, z)].

Zanim przedstawione ^zostaną dalsze postulaty, ^określmy x -<s y ^jeżeli Ps(X, y) > 1/2 oraz x ,...., s y jeżeli ps(x, y) = 1/2. Z (1) i (2) wynika natychmiast, że ,....,

^i.

jest relacją równoważności w A, oraz ^że -<s indukuje liniowe uporządkowanie wszystkich klas

,...., s-równoważności.

Postulat 2 znany jest w literaturze jako mocna stochastyczna przechodniość

(por. Marschak [10]), w odróżnieniu od umiarkowanej i słabej stochastycznej prze-

chodniości; pierwsza z nich ^określona jest przez zastąpienie „max" w (2) przez

„min", natomiast w drugiej z nich wymaga ^się tylko, aby ps(x, z) ^~ 1/2. Oczywiście

relacje -<si ,...., s spełniają sformułowane wyżej warunki przy obu tych typach prze-

chodniości.

Dla n = 2, 3, . . . będziemy mówić, że t ~ 1 jest n-tym pierwiastkiem z progu

rozróżnialności (dla osoby s ES), jeżeli dla dowolnych x 0 , X 1 , „., Xn warunki ps(xo, X 1) ~ t, ... ,ps(xn-1, ^X)~ tn

implikują Ps(Xo, Xn) = 1.

Niech B(n, s) ^będzie zbiorem wszystkich n-tych pierwiastków z progu rozróżnial

ności dla osoby s. Mamy wówczas oczywisty

LEMAT 1. Wszystkie zbiory B(n, s), s ES, n = 2, 3, ... ^są niepuste i warunki

t E B(n, s), t ^~ t' ^~ 1 ^implikują t' E B(n, s).

(3)

O pewnym schemacie subiektywnych klasyfikacji 37 Druga teza wynika bezpośrednio z definicji, podczas gdy niepustość wynika stąd, że 1 E B(n, s) na mocy postulatu 2.

Niech

(3) ^q(n, s) =inf {t: t E B(n, s)}.

Można przypuszczać, że dla każdego s ES mamy bądź q(n, s) = 1 dla wszystkich n, ^bądź q(n, s) < 1 dla wszystkich n. Tak jednak nie jest, o czym ^{można się} prze-

konać na podstawie następującego przykładu.

Niech A = {x 0 , x 1 , x 2 , ••• } będzie zbiorem przeliczalnym i przypuśćmy, że prawdopodobieństwa wyboru wynoszą (opuszczając dla uproszczenia wskaźnik s)

p(Xb Xi+1) = ^Gj,

p(Xb Xi +2) = ^bb

p(xh X;+3) = p(x;, X;+4) = ... = 1,

przy czym p(x i, x ₁₎ dla j ^~ i otrzymane są na mocy (1); ponadto, niech 1/2<a 1 <a 2 < ... ^~1

oraz

a; +i ~ b; < 1 dla wszystkich i.

Dwa ostatnie warunki gwarantują spełnienie (2). Łatwo się przekonać, że każda

liczba t ~ a 1 jest pierwiastkiem trzeciego stopnia z progu rozróżnialności, podczas gdy jedynym pierwiastkiem drugiego stopnia z progu rozróżnialności jest 1 (gdyż

dla każdego s > O istnieje trójka Xj, xi +i, X; + ₂ taka, ^że p(xh xi +i) ^~ 1- s, p(x;+1, Xi+2) ~ 1-s i p(X;, X;+2) < I).

Przyjmijmy

(4) q(n) = supą(n,s),

gdzie q(n, s) ^określone jest przez (3).

Udowodnimy

LEMAT 2.

(5) q(n) ^~ q(n+ 1), n = 2, 3, ...

Do wód. Jeżeli q(n) = 1, nierówność (5) jest spełniona; załóżmy więc, że

q(n) = c < 1 i wybierzmy s > O takie że c+ s < 1.

Wybierzmy ^następnie dowolne s ₀ ES i przypuśćmy, że

(6) oraz (7)

Ponieważ c + ^s > c = sup q(n, s) ^~ q(n, s 0), więc nierówności ( 6) implikują

Ps

0

(Xo, Xn) = 1 na mocy definicji liczby s q(n, s 0). W połączeniu z (7), relacja ta,

na mocy (2), daje p

₈₀

(x 0 , Xn+i) = l, co oznacza że c+s ^E B(n+ 1, s 0 ). Ponieważ

(4)

e jest dowolne, na mocy definicji (3) otrzymujemy q(n + l, s 0 ) ~ c, a z dpwolności s 0 mamy ^też

q(n+ 1) = supq(n+ 1, s 0 ) ~ c = q(n), co należało okazać.

Tak więc ciąg {q(n)} jest zbieżny; oznaczamy

(8) • q = limq(n).

Możemy obecnie sformułować dwa następne postulaty.

POSTULAT 3 (zgodność). Istnieje a < 1/2 takie, że dla wszystkich x, yE A, jeżeli Ps

₀

(x, y) = t > 1/2 dla pewnego s 0 , to

(9) infp

5

(X, y) ~ t- a.

s

Postulat ten implikuje to, że wszystkie wartości Ps(x, y) dla ustalonych x, y leżą w paśmie o szerokości rJ.. W szczególności, jeżeli dla jakiegoś s 0 jest x -<s

₀

y przy Ps

₀

(X, y) > i+ rJ., to X -<s y dla wszystkich s ES.

POSTULAT 4 (pełna rozróżnialność).

(10) q < 1-rJ.,

gdzie 7j jest ^określona przez (8), a ^ry_ jest liczbą występującą w postulacie 3.

W sytuacjach praktycznych można rozsądnie oczekiwać spełnienia nawet moc- niejszego warunku, mianowicie limq(n) = 1/2; dla naszych celów jednak warunek (10) będzie wystarczający.

Wybierzmy obecnie r takie, aby (11)

i niech

(12) N= min{n: q(n) < r-rJ.}.

Na mocy (8), (10) i (11) jest N< oo.

Udowodnimy teraz twierdzenie opisujące konstrukcję ciągu, który może służyć

za standardy w klasyfikacji.

TWIERDZENIE 1. Niech . „, x_ ^1, x _{0 ,} x _{1 , •} „ będzie skończonym lub nieskończonym ciągiem elementów A, takim że Psixi, Xj+i) ~ r dla pewnego si ES (j =O, ± ^1, ^„.).

Dla każdego s E S i x EA, jeżeli O < Ps(x, Xi) < l, to (13)

dla wszystkich k ^~ 2N.

Do wód. Rozważmy najpierw przypadek 1/2 ~ ps(x, xi) < 1. Ponieważ Ps/Xi, xi+i) ~ r dla wszystkich j, możemy napisać, używając postulatu 3 i relacji

(12) i (4):

(5)

O pewnym schemacie subiektywnych klasyfikacji

Mamy zatem następujący ciąg nierówności

(14) (15)

39 i w konsekwencji, na podstawie definicji q(N, s) i ze ^względu na to, że nierówności

( 15) są ostre, a zatem ha mocy (2)

Stosując wielokrotnie relację (2) otrzymujemy teraz Ps(Xi, xi+k) = 1 dla wszystkich k ^~ N, co dowodzi pierwszej części tezy ( 13).

Następnie, musimy mieć

(16) 1

ps(xi-N, x) > 2 ,

gdyż w przypadku przeciwnym, ps(x, ^Xi-N)~ 1/2, mielibyśmy ps(x, xi) = 1 na mocy udowodnionej już tezy, wbrew ^założeniu twierdzenia. Postępując jak poprzednio, mamy

Ps(Xi-2N' ^Xi-2N+1) > q(N, s), Pk(Xi-N-1' Xi-N)> q(N, s),

a zatem Ps(xi- 2 ^N, Xi-N) = 1. Używając (16), na mocy (2) mamy ps(xi- 2N, x) = 1, i wielokrotne zastosowanie (2) daje drugą część tezy (13).

Dowód w przypadku O < ps(x, xi) ^~ 1/2 jest analogiczny.

Tak ^więc, dla otrzymania ^ciągu standardów klasyfikacji, wystarcza ^zbudować dowolny ^ciąg {xi} spełniający założenia twierdzenia dla pewnego r, dla którego zachodzi relacja (11), a następnie wybrać podciąg wyrazów odległych o co najmniej 2N wskaźników.

3. Maksymalne ^ciągi standardów. W tym paragrafie przyjęte będą dodatkowe postulaty dla prawdopodobieństw wyboru i podana ^będzie charakteryzacja ^ciągów klasyfikacyjnych (tj. ciągów {x 2N} wybranych z ciągów spełniających założenia twierdzenia 1), o maksymalnej liczbie elementów.

POSTULAT 5 (identyczność relacji porządkujących). Dla ^każdych X, y EA, jeżeli

Ps

0

(x, y) > 1/2 dla pewnego s 0 ES, to ps(x, y) > 1/2 dla wszystkich s ES.

Tak więc, wszystkie relacje ,...., ^s, i wobec tego ^także wszystkie relacje -<s, ^pokry-

wają się. W dalszym ciągu będziemy więc opuszczali wskaźnik s.

Można rozsądnie oczekiwać, że postulat 5 będzie spełniony w tych sytuacjach

praktycznych, gdy oceny dotyczą jakiejś cechy fizycznej elementów zbioru A.

(6)

Dla r > 1/2 i x e A określmy

(17) A:(x) = {y: ps(x, y) ~ r dla pewnego se S}, A;(x) = {y: ps(y, x) ~ r dla pewnego se S}.

Mamy wówczas

LEMAT 3 Jeżeli y e A:(x) i y -< y', to y' e A:(x), i podobnie, jeżeli y e A;(x);

y' -< y, to y' e A; (x).

Istotnie, jeżeli Ps(x, y) ~ r i Ps(y, y') ~ 1/2, to na mocy (2) mamy Ps(x, y') ~ r,

czyli y' e A:(x), i podobnie dla zbioru A;(x). ·

Tak więc, zbiory A:(x) i A;:(x) ^są, w pewnym sensie, „półprostymi" w uporządko

waniu <(.

Sformułujemy obecnie ostatni postulat:

POSTULAT 6 (zamkniętość). Jeżeli A:(x) # 0, to istnieje y+ e A:(x) taki, że

Ps(y+, y) ~ 1/2 dla wszystkich si wszystkich y e A:(x). Podobnie, ^jeżeli A;(x) # 0, to istnieje y- e A;(x) takie, że ps(y, y-) ~ 1/2 dla wszystkich si wszystkich y e A;(x).

Mamy następujący oczywisty

LEMAT 4. Elemen:fy y+ i y- ^są jednoznaczne z dokładnością do równoważności,....,.

Niech teraz r będzie liczbą spełniającą (11) i ustalmy z 0 EA. Oznaczmy przez L(z 0 , r) klasę wszystkich ciągów ... , x_ _{1 ,} x _{0 ,} x _{1 , ...} (skończonych lub nie), dla których

(a) Xo ,..;,, Zo,

(b) Psixi, xi+l) ~ r dla pewnego si ES (j = O, ±I, ... )

(innymi słowy, L(z 0 , r) jest klasą wszystkich ciągów spełniających założenia twier- dzenia 1, o ustalonym elemencie x 0 ).

Określmy teraz ciąg ... , x! 1 , x~, xt, ... w sposób następujący:

(1) Jako x~ wybierzmy jakikolwiek element równoważny z 0 •

(2) Przypuśćmy, że k ^~ O i że element xt został już skonstruowany. Jeżeli zbiór A:(xt) jest pusty, ciąg {xn kończy się na xt. W przypadku przeciwnym, jako xt+i należy wybrać dowolny element równoważny y+, określonemu w postulacie 5.

(3) W kierunku ujemnych wskaźników, ciąg {x:} rozszerza się przez analogiczną procedurę indukcyjną jak w (2).

Mamy wówczas

LEMAT 5. Ciąg {xj} określony jest jednoznacznie z dokładnością do równo-

ważności ,...., i,jest elementem klasy L(z _{0 ,} r).

Do wód. Druga ^część tezy wynika bezpośrednio z definicji (17) zbiorów A:(x) i A;(x). Dla dowodu jednoznaczności należy pokazać, że wybór x:+i (dla k ^~ O) jest ten sam (z dokładnością do równoważności) dla każdego wyboru xt. ^{Na mocy}

lematu 4, wystarcza w tym celu pokazać, że x ,...., y ^pociąga za sobą A:(x) = ^A:(y).

Ta ostatnia własność wynika z kolei ^{stąd, że} warunek x ,..., y implikuje Ps(x, z) =

= p

5

(y, z) dla wszystkich s ES i z EA.

(7)

O pewnym schemacie subiektywnych klasyfikacji 41 Istotnie, przypuśćmy że Ps(x, y) = I /2. Bez zmniejszenia ogólności można założyć, że Ps(Y, ^z)~ 1/2. Na mocy (2) mamy wówczas

(18) Ps(X, ^z)~ max[ps(x, y),ps(y, ^z)]~ Ps(Y, z).

Następnie, na mocy (1) mamy ^też Ps(y, x) = 1/2, i ponieważ Ps(x, ^z)~ 1/2 z uwagi na (18), możemy napisać

Ps(y, ^z)~ max[ps(y, x),ps(x, ^z)]~ ps(x, z), skąd wynika Ps(X, z) = Ps(y, z), co należało okazać.

Na zakończenie tego paragrafu udowodnimy, ^{że ciąg} {xj} jest, w pewnym sensie, najdłuższy w klasie L(z 0 , r). Mamy mianowicie

TWIERDZENIE 2. Niech {xi} ^będzie dm-rolnym ^ciągiem z klasy L(z 0 , r ). Jeżeli

{xi} mak-ty wyraz, dla k ^~ O, to xt jest także określone i Ps(xt, xk) ^~ 1 /2 dla wszyst- kich s, i podobnie,jeżeli {xi} ma n-ty wyraz dla n ^~ O, to x: jest ^określone i Ps(Xn, x:) ^~

~ 1/2 dla wszystkich s.

D o w ó d. Ze ^względu na symetrię, wystarcza ^udowodnić twierdzenie dla k ~ O.

Teza jest prawdziwa dla k = O na mocy konstrukcji. Załóżmy, że jest ona ^spełniona dla pewnego k ^~ O; wobec tego element xt istnieje i mamy Ps(xt, xk) ^~ I /2 dla wszystkich s.

Przypuśćmy, że xk+i jest ^następnym wyrazem ^ciągu {xi}· Mamy wówczas Psk(xb xk+t) ^~ r dla pewnego ski na mocy (2) możemy napisać

Psk(xt, xk +i) ~ max[psk(xt, Xk), Psk(xb xk +i)] ~ Ps/xb Xk+1) ^~ r,

co dowodzi, ^że xk+i e A-;!"(xn Tak ^więc, zbiór A;:(xt) jest niepusty i xt+i istnieje na mocy postulatu 6. Relacja Ps(xt+ 1, xk+i) ^~ 1/2 wynika obecnie z definicji ele- mentu x:+i.

4. Zagadnienia estymacji. W tym para.grafie ^rozważymy pewne problemy esty- macji ^związane ze schematem klasyfikacji. Tak więc, przypuśćmy, że mamy rodzinę zmiennych losowych

{19) !F = {T!i>(x,y): x,yeA, seS, i= 1,2, ... },

gdzie każda ni>(x' y) przyjmuje ^jedną z ^wartości ^X, y. Rodzina !F reprezentuje obserwowalne wybory: zdarzenie T}i>(x, y) = x ^będzie interpretowane jako „przy i-tej prezentacji pary (x, y), osoba s ^wybrała x jako element o mniejszej wartości badanej cechy".

Niech I c {l, 2, ... }. Założymy, że rodzina !F spełnia następujące warunki:

(i) Jeżeli U, V są rozłącznymi podzbiorami A x A x S x I, to podrodziny

!Fu= {TP>(x,y): (x,y,s,i)e U}

oraz

!Fv = {ni>(x,y): (x,y,s,i)eV}

są niezależne;

(ii) dla i = 1, 2, ...

P{T}i>(x,y) = y} = Ps(x,y).

(8)

Wynika ^stąd w szczególności, że jeżeli i 1 =j:. ii, to dla wszystkich x,y oraz s zmienne losowe TP

¹

>(x' y) oraz ni

²

>(x' y) są niezależne i ^mają jednakowy ^rozkład.

Dla ^dużych zbiorów I, ^założenia (i) oraz (ii) są oczywiście nierealistyczne, i chodzi wobec tego o zbudowanie metod wnioskowania o prawdopodobieństwach Ps(X, y), które nie wykorzystują „ w pełni" tych założeń. Pokażemy mianowicie, ^{że można}

zbudować metody wnioskowania oparte na dwóch obserwacjach wyboru z danej pary dla ^każdej osoby.

Metody te zawarte ^są w następujących twierdzeniach (por. Bartoszyński [2]).

Niech<§ = {G 1 , .•. , Gn} będzie układem niezależnych eksperymentów. Załóżmy, że każdy z tych eksperymentów może prowadzić do „sukcesu" lub „porażki",

i niech ai oznacza prawdopodobieństwo sukcesu w eksperymencie Gi. Oznaczmy (20)

Załóżmy, że można przeprowadzić tylko dwie niezależne obserwacje dla każdego

z eksperymentów Ghi niech Xi = I lub O, w zależności od tego, czy pierwsze ^doświad

czenie dla eksperymentu Gi dało sukces czy porażkę. Podobnie, niech Yi = I lub O w zależności od wyników drugiego doświadczenia.

Niech teraz Zii =Xi Yi i (21)

Mamy wówczas

- 1 L"„

X=- - n

^I

Xi,

i= 1

I - _,-

ri

= - -X+ Y

., 2 '

TWIERDZENIE 3. Zmienne losowe r; i ~ są nieobciążonymi estymatorami para- metrów a i ai. Ponadto,. ni(r;) :::::;; I /8n i nim :::::;; cxn "' 3/4n.

Przypuśćmy teraz, ^że system <§ został rozbity na ^rozłączne podsystemy

<§ 1 , <§i, ..• , <§b gdzie <§i składa się z n eksperymentów (tak, ^że n= 11 ₁ + ... +nk).

Niech a<r> i a; ^oznaczają ^parametry ^określone przez (20) i niech ;r będzie określone

przez (21) dla podsystemu q; ^r. Mamy wówczas

TWIERDZENIE 4. Zmienna losowa

1 ,„ n

K =;--n- .i..-J ^ni~ ¹

j= l

spełnia warunek E(K) ^~ O, przy czym E(K) = O wtedy i tylko wtedy gdy a ⁰ > = ...

... = a<k>, Ponadto, jeżeli min(n 1 , ••• , nk) ~ oo, to Di(K):::::;; fln "' 145/54n.

Twierdzenia 3 i 4 mogą być użyte dla oceny zmienności międzyosobniczej prawdo-

podobieństw wyboru, bez konieczności szacowania tych prawdopodobieństw od-

dzielnie dla każdej z osób. Wystarcza mianowicie dla ustalonej pary x, ^y ^E A i zbioru

n osób s 1 , ••• , Sn traktować wybór z pary (X, y) przez ^osobę si jako eksperyment

Gh gdzie sukcesem jest wybór y. Wówczas prawdopodobieństwo sukcesu wynosi

(9)

O pewnym schemacie subiektywnych klasyfikacji 43 p

₅₁

(x, y), i ^mając obserwacje dwóch niezależnych wyborów dla ^każdej osoby można oszacować wielkości

n

p(X, y) = ! L ^Ps

¹

^{(X, y)}

i= 1

oraz

n

a

²

(x, y) = ~ L ^[ps

¹

(x, y)-p(x, y)]2,

i=l

przy czym wariancje estymatorów tych wielkości maleją przy zwiększaniu liczebności

· próbki osób.

Podobnie, twierdzenie 4 może być użyte dla testowania hipotezy o jednakowej

przeciętnej zdolności dyskryminacji dla dwóch lub ^więcej próbek osób.

Prace cytowane

[1] R. Bart os z y ^ń ski, A note on subjective classifications, Rev. Internat. Statist. Inst. 39 (1971), str. 39-45.

[2] - On the construction and evaluation of subjective classifications, Applicationes Mathematicae 12 (1971), str. 1-21.

[3] - A metric structure derived from subjective judgments: scaling under perfect and imperfect discrimination, Econometrica 42 (1974), str. 55-71.

[4] D. Davidson i J. Mars cha k, Experimental tests of a stochastic decision theory, w:

Measurement: Definition and Theories, C. W. Churchman i P. Ratoosh ed., Wiley, New York 1969.

[5] G. Debr e u, Stochastic choice and cardinal utility, Econometrica 26 (1958), str. 440-444.

[6] - Topo/ogical methods in cardinal utility theory, w: Mathematical Methods in the Social Scien- ces, K. J. Arrow, S. Karlin i P. Suppes ed., Stanford University Press 1960.

[7] N. G e o r g e s c u - R o e g e n Threshold in choice and the theory of demand, Econometrica 26 (1958), str. 157-168.

[8) R. D. Luce, A probabilistic theory of utility, Econornetrica 26 (1958), str. 193-224.

[9] - Individua/ choice behavior, Wiley, New York 1959.

[10] J. Mars cha k, Einary clwice constraints and random utility indicators, w: Mathematical

Methods in the Social Sciences, K. J. Arrow, S. Karlin ⁱ P. Suppes ed., Stanford University

Press 1960.

O pewnym schemacie subiektywnych klasyfikacji przy zmiennych prawdopodobieństwach

ROCZNIKI POLSKIEGO TOWARZYSTWA MATEMATYCZNEGO Seria III: MATEMATYKA STOSOWANA IX (1977)

ROBERT BARTOSZYŃSKI (Warszawa)

O pewnym schemacie subiektywnych klasyfikacji przy zmiennych prawdopodobieństwach wyboru

(Praca przyjęta do druku 27.11.1975)

Tego rodzaju sytuacje analizuje się zazwyczaj w terminach tzw. prawdopodobieństw

wyboru p(x, y), przy czym ta ostatnia wielkość interpretowana jest jako prawdo-

podobieństwo, że wybrany zostanie elementy jeżeli wybór dokonywany jest z (upo- rządkowanej) pary (x, y). Można mianowicie pokazać, że przy określonych założe­

może wobec tego spełniać rolę „granic" między poszczególnymi kategoriami klasy- fikacji.

W większości prac dotyczących prawdopodobieństw wyboru, zakłada się, że p(x, y) odnosi się do wyborów dokonywanych przez jedną ustaloną osobę. Ze

[35]

wyboru zależą od osób wybierających; metody te będą przy tym oparte na ograni- czonej liczbie obserwacji dla każdej osoby.

2. Ciągi standardów. W dalszym ciągu, A będzie oznaczać zbiór obiektów pod- • dawanych klasyfikacji ze względu na jakąś cechę, a S będzie oznaczać zbiór osób

dokonujących wyborów. Założymy, że w ocenach nie dopuszcza się „remisów", tak że jeżeli Ps(X, y) oznacza prawdopodobieństwo wyboru y jako elementu o wyższej

wartości cechy przez osobę s ES, gdy wybór dokonywany jest z pary (x, y), to I -p

(X, y) jest prawdopodobieństwem, że w analogicznej sytuacji osoba ta wybierze element x.

Założymy, że prawdopodobieństwaps(x, y) są określone dla wszystkich x, y EA i s E S, i spełniają następujące postulaty.

POSTULAT 1 (symetria). Dla wszystkich s ES oraz x, y EA

(1) Ps(X,y)+pJy,x) = 1.

Zauważmy, że (1) nie jest konsekwencją założenia o braku „remisów". Istotnie,

rozważa się tu pary uporządkowane i nie ma żadnych powodów, aby ps(x, y) i Ps(Y, x)

były między sobą związane jakąś zależnością. Jasne jest jednak, że w sytuacjach praktycznych można łatwo osiągnąć spełnienie (1) drogą randomizacji kolejności (uporządkowania przestrzennego) prezentacji obiektów x i y.

POSTULAT 2 (przechodniość). Dla wszystkich s E S oraz x, y, z E A, jeżeli

Ps(X, y) ~ 1/2 i ps(y, z)~ 1/2, to

(2) Ps(X, z)~ maX[p

(X, y),ps(y, z)].

Zanim przedstawione zostaną dalsze postulaty, określmy x -<s y jeżeli Ps(X, y) > 1/2 oraz x ,...., s y jeżeli ps(x, y) = 1/2. Z (1) i (2) wynika natychmiast, że ,....,

jest relacją równoważności w A, oraz że -<s indukuje liniowe uporządkowanie wszystkich klas

,...., s-równoważności.

Postulat 2 znany jest w literaturze jako mocna stochastyczna przechodniość

(por. Marschak [10]), w odróżnieniu od umiarkowanej i słabej stochastycznej prze-

chodniości; pierwsza z nich określona jest przez zastąpienie „max" w (2) przez

„min", natomiast w drugiej z nich wymaga się tylko, aby ps(x, z) ~ 1/2. Oczywiście

relacje -<si ,...., s spełniają sformułowane wyżej warunki przy obu tych typach prze-

chodniości.

Dla n = 2, 3, . . . będziemy mówić, że t ~ 1 jest n-tym pierwiastkiem z progu

rozróżnialności (dla osoby s ES), jeżeli dla dowolnych x 0 , X 1 , „., Xn warunki ps(xo, X 1) ~ t, ... ,ps(xn-1, X)~ tn

implikują Ps(Xo, Xn) = 1.

Niech B(n, s) będzie zbiorem wszystkich n-tych pierwiastków z progu rozróżnial­

ności dla osoby s. Mamy wówczas oczywisty

LEMAT 1. Wszystkie zbiory B(n, s), s ES, n = 2, 3, ... są niepuste i warunki

t E B(n, s), t ~ t' ~ 1 implikują t' E B(n, s).

O pewnym schemacie subiektywnych klasyfikacji 37 Druga teza wynika bezpośrednio z definicji, podczas gdy niepustość wynika stąd, że 1 E B(n, s) na mocy postulatu 2.

Niech

(3) q(n, s) =inf {t: t E B(n, s)}.

Można przypuszczać, że dla każdego s ES mamy bądź q(n, s) = 1 dla wszystkich n, bądź q(n, s) < 1 dla wszystkich n. Tak jednak nie jest, o czym można się prze-

konać na podstawie następującego przykładu.

Niech A = {x 0 , x 1 , x 2 , ••• } będzie zbiorem przeliczalnym i przypuśćmy, że prawdopodobieństwa wyboru wynoszą (opuszczając dla uproszczenia wskaźnik s)

p(Xb Xi+1) = Gj,

p(Xb Xi +2) = bb

p(xh X;+3) = p(x;, X;+4) = ... = 1,

przy czym p(x i, x 1) dla j ~ i otrzymane są na mocy (1); ponadto, niech 1/2<a 1 <a 2 < ... ~1

oraz

a; +i ~ b; < 1 dla wszystkich i.

Dwa ostatnie warunki gwarantują spełnienie (2). Łatwo się przekonać, że każda

liczba t ~ a 1 jest pierwiastkiem trzeciego stopnia z progu rozróżnialności, podczas gdy jedynym pierwiastkiem drugiego stopnia z progu rozróżnialności jest 1 (gdyż

dla każdego s > O istnieje trójka Xj, xi +i, X; + 2 taka, że p(xh xi +i) ~ 1- s, p(x;+1, Xi+2) ~ 1-s i p(X;, X;+2) < I).

Przyjmijmy

(4) q(n) = supą(n,s),

gdzie q(n, s) określone jest przez (3).

Udowodnimy

LEMAT 2.

(5) q(n) ~ q(n+ 1), n = 2, 3, ...

Do wód. Jeżeli q(n) = 1, nierówność (5) jest spełniona; załóżmy więc, że

q(n) = c < 1 i wybierzmy s > O takie że c+ s < 1.

Wybierzmy następnie dowolne s 0 ES i przypuśćmy, że

(6) oraz (7)

Ponieważ c + s > c = sup q(n, s) ~ q(n, s 0), więc nierówności ( 6) implikują

Ps

(Xo, Xn) = 1 na mocy definicji liczby s q(n, s 0). W połączeniu z (7), relacja ta,

na mocy (2), daje p

(x 0 , Xn+i) = l, co oznacza że c+s E B(n+ 1, s 0 ). Ponieważ

e jest dowolne, na mocy definicji (3) otrzymujemy q(n + l, s 0 ) ~ c, a z dpwolności s 0 mamy też

q(n+ 1) = supq(n+ 1, s 0 ) ~ c = q(n), co należało okazać.

Tak więc ciąg {q(n)} jest zbieżny; oznaczamy

(8) • q = limq(n).

Możemy obecnie sformułować dwa następne postulaty.

POSTULAT 3 (zgodność). Istnieje a < 1/2 takie, że dla wszystkich x, yE A, jeżeli Ps

(x, y) = t > 1/2 dla pewnego s 0 , to

(9) infp

Tego rodzaju sytuacje analizuje ^się zazwyczaj w terminach tzw. prawdopodobieństw

podobieństwo, że wybrany zostanie elementy ^jeżeli wybór dokonywany jest z (upo- rządkowanej) pary (x, y). Można mianowicie pokazać, że przy określonych założe

wyboru ^zależą od osób wybierających; metody te ^będą przy tym oparte na ograni- czonej liczbie obserwacji dla każdej osoby.

2. Ciągi standardów. W dalszym ciągu, A będzie oznaczać zbiór obiektów pod- • dawanych klasyfikacji ze ^względu na jakąś cechę, a S będzie oznaczać zbiór osób

dokonujących wyborów. Założymy, że w ocenach nie dopuszcza ^się „remisów", tak ^{że jeżeli} Ps(X, y) oznacza prawdopodobieństwo wyboru y jako elementu o ^wyższej

wartości cechy przez ^osobę s ES, gdy wybór dokonywany jest z pary (x, y), to I -p

rozważa się tu pary uporządkowane i nie ma ^żadnych powodów, aby ps(x, y) i Ps(Y, x)

były między sobą związane jakąś zależnością. Jasne jest jednak, że w sytuacjach praktycznych można łatwo osiągnąć spełnienie (1) ^drogą randomizacji kolejności (uporządkowania przestrzennego) prezentacji obiektów x i y.

POSTULAT 2 (przechodniość). Dla wszystkich s E S oraz x, ^{y, z} ^E A, jeżeli

(2) Ps(X, ^z)~ maX[p

Zanim przedstawione ^zostaną dalsze postulaty, ^określmy x -<s y ^jeżeli Ps(X, y) > 1/2 oraz x ,...., s y jeżeli ps(x, y) = 1/2. Z (1) i (2) wynika natychmiast, że ,....,

jest relacją równoważności w A, oraz ^że -<s indukuje liniowe uporządkowanie wszystkich klas

chodniości; pierwsza z nich ^określona jest przez zastąpienie „max" w (2) przez

„min", natomiast w drugiej z nich wymaga ^się tylko, aby ps(x, z) ^~ 1/2. Oczywiście

rozróżnialności (dla osoby s ES), jeżeli dla dowolnych x 0 , X 1 , „., Xn warunki ps(xo, X 1) ~ t, ... ,ps(xn-1, ^X)~ tn

Niech B(n, s) ^będzie zbiorem wszystkich n-tych pierwiastków z progu rozróżnial

LEMAT 1. Wszystkie zbiory B(n, s), s ES, n = 2, 3, ... ^są niepuste i warunki

t E B(n, s), t ^~ t' ^~ 1 ^implikują t' E B(n, s).

(3) ^q(n, s) =inf {t: t E B(n, s)}.

Można przypuszczać, że dla każdego s ES mamy bądź q(n, s) = 1 dla wszystkich n, ^bądź q(n, s) < 1 dla wszystkich n. Tak jednak nie jest, o czym ^{można się} prze-

p(Xb Xi+1) = ^Gj,

p(Xb Xi +2) = ^bb

przy czym p(x i, x ₁₎ dla j ^~ i otrzymane są na mocy (1); ponadto, niech 1/2<a 1 <a 2 < ... ^~1

dla każdego s > O istnieje trójka Xj, xi +i, X; + ₂ taka, ^że p(xh xi +i) ^~ 1- s, p(x;+1, Xi+2) ~ 1-s i p(X;, X;+2) < I).

gdzie q(n, s) ^określone jest przez (3).

(5) q(n) ^~ q(n+ 1), n = 2, 3, ...

Wybierzmy ^następnie dowolne s ₀ ES i przypuśćmy, że

Ponieważ c + ^s > c = sup q(n, s) ^~ q(n, s 0), więc nierówności ( 6) implikują

(x 0 , Xn+i) = l, co oznacza że c+s ^E B(n+ 1, s 0 ). Ponieważ

e jest dowolne, na mocy definicji (3) otrzymujemy q(n + l, s 0 ) ~ c, a z dpwolności s 0 mamy ^też

gdzie 7j jest ^określona przez (8), a ^ry_ jest liczbą występującą w postulacie 3.

TWIERDZENIE 1. Niech . „, x_ ^1, x _{0 ,} x _{1 , •} „ będzie skończonym lub nieskończonym ciągiem elementów A, takim że Psixi, Xj+i) ~ r dla pewnego si ES (j =O, ± ^1, ^„.).

dla wszystkich k ^~ 2N.

i w konsekwencji, na podstawie definicji q(N, s) i ze ^względu na to, że nierówności

Stosując wielokrotnie relację (2) otrzymujemy teraz Ps(Xi, xi+k) = 1 dla wszystkich k ^~ N, co dowodzi pierwszej części tezy ( 13).

gdyż w przypadku przeciwnym, ps(x, ^Xi-N)~ 1/2, mielibyśmy ps(x, xi) = 1 na mocy udowodnionej już tezy, wbrew ^założeniu twierdzenia. Postępując jak poprzednio, mamy

Ps(Xi-2N' ^Xi-2N+1) > q(N, s), Pk(Xi-N-1' Xi-N)> q(N, s),

a zatem Ps(xi- 2 ^N, Xi-N) = 1. Używając (16), na mocy (2) mamy ps(xi- 2N, x) = 1, i wielokrotne zastosowanie (2) daje drugą część tezy (13).

Dowód w przypadku O < ps(x, xi) ^~ 1/2 jest analogiczny.

Tak ^więc, dla otrzymania ^ciągu standardów klasyfikacji, wystarcza ^zbudować dowolny ^ciąg {xi} spełniający założenia twierdzenia dla pewnego r, dla którego zachodzi relacja (11), a następnie wybrać podciąg wyrazów odległych o co najmniej 2N wskaźników.

3. Maksymalne ^ciągi standardów. W tym paragrafie przyjęte będą dodatkowe postulaty dla prawdopodobieństw wyboru i podana ^będzie charakteryzacja ^ciągów klasyfikacyjnych (tj. ciągów {x 2N} wybranych z ciągów spełniających założenia twierdzenia 1), o maksymalnej liczbie elementów.

POSTULAT 5 (identyczność relacji porządkujących). Dla ^każdych X, y EA, jeżeli

Tak więc, wszystkie relacje ,...., ^s, i wobec tego ^także wszystkie relacje -<s, ^pokry-

Tak więc, zbiory A:(x) i A;:(x) ^są, w pewnym sensie, „półprostymi" w uporządko

Ps(y+, y) ~ 1/2 dla wszystkich si wszystkich y e A:(x). Podobnie, ^jeżeli A;(x) # 0, to istnieje y- e A;(x) takie, że ps(y, y-) ~ 1/2 dla wszystkich si wszystkich y e A;(x).

LEMAT 4. Elemen:fy y+ i y- ^są jednoznaczne z dokładnością do równoważności,....,.

Niech teraz r będzie liczbą spełniającą (11) i ustalmy z 0 EA. Oznaczmy przez L(z 0 , r) klasę wszystkich ciągów ... , x_ _{1 ,} x _{0 ,} x _{1 , ...} (skończonych lub nie), dla których

(2) Przypuśćmy, że k ^~ O i że element xt został już skonstruowany. Jeżeli zbiór A:(xt) jest pusty, ciąg {xn kończy się na xt. W przypadku przeciwnym, jako xt+i należy wybrać dowolny element równoważny y+, określonemu w postulacie 5.