P re fe re n cj e i fu n kc ja u ży te cz n o śc i
Wartościprawdopodobieństwobliczaneprzypomocysieciprzekonańdostarczają informacjiowzględnychprawdopodobieństwachróżnychzdarzeń,wariantów,itp. Jednakniemówiąjakąnależypodjąćdecyzjęwoparciuotewartości. Czyplandziałaniagwarantującyuzyskanie90%celówzprawdopodobieństwem0.95 jestlepszyniżplangwarantującyuzyskanie95%celówzprawdopodobieństwem0.90? Inteligentnyagentmusimiećreprezentacjęswoichpreferencjidlapodejmowania decyzji.Wtymcelubędziemystosowalipojęciefunkcjiużyteczności(utility)U(S) określającejktórestanysąkorzystniejszedlaagenta.Woczywistysposób,użyteczność jestpojęciemwzględnym,któremożnaokreślićdlakonkretnegoagenta. Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności1Z as ad a M E U
Będziemyzakładali,żeagentposiadającyzestawpreferencjiwyrażonych użytecznościamiiposługującysięprawdopodobieństwemdlaokreślaniafaktów oświecieimożliwychkonsekwencji,działaracjonalniejeśliwybieraakcje maksymalizująceoczekiwanąużyteczność(MEU,MaximumExpectedUtility) uśrednionąpowszystkichmożliwychwynikachtychakcji. OczekiwanaużytecznośćEU(A)niedeterministycznejakcjiAzezbiorem możliwychwyników{Resulti(A)}zprawdopodobieństwamiP(Resulti(A)|Do(A),E), gdzieEzawieracałądostępnąwiedzęagentaoświecie,aDo(A)jeststwierdzeniem wykonaniaakcjiA,jestdanajako: EU(A|E)=X iP(Resulti(A)|Do(A),E)×U(Resulti(A)) Wtymwykładzieprzedstawionezostanąwszystkieelementyobliczaniadecyzjizgodnie zzasadąMEU. Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności2
L o te ri e i pr ef er en cj e
Sytuacjęagentapodejmującegodecyzjewwarunkachniepewnościbędziemynazywali loteriądlapodkreśleniaróżnychmożliwychwynikówzdarzającychsięzróżnymi prawdopodobieństwami.Wynikloteriimożebyćkonkretnymstanemlubkolejnąloterią. Naprzykład,loterięLzdwomamożliwymiwynikami:A zprawdopodobieństwempiBzprawdopodobieństwem 1−pmożemyzapisać: L=[p,A;1−p,B]L
p 1−p
A B Jakopodstawęwyborumiędzyloteriamilubstanamiagentstosujepreferencje: A≻B−AjestpreferowanenadB A∼B−niemawyraźnejpreferencjimiędzyAiB A≻ ∼B−AjestpreferowanenadBlubniemapreferencji Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności3
A ks jo m at y te or ii u ży te cz n o śc i
Przyjmujemy,żepreferencjeagentamusząspełniaćnastępującewłasności,zwane aksjomatamiteoriiużyteczności: porządek (A≻B)∨(B≻A)∨(A∼B) przechodniość (A≻B)∧(B≻C)⇒(A≻C) ciągłość A≻B≻C⇒∃p[p,A;1−p,C]∼B (Ciągłośćoznacza,żejeśliBmapreferencjępomiędzyAiCtoistniejepewne prawdopodobieństwop,dlaktóregoagentniemapreferencjipomiędzywyboremB (napewno),aloteriąpomiędzyAiC.) Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności4podstawianie A∼B⇒[p,A;1−p,C]∼[p,B;1−p,C] (JeśliniemapreferencjipomiędzydwomaloteriamiAiB,toniemaichrównież pomiędzydwomainnymi,bardziejzłożonymiloteriami,któreróżniąsięmiędzysobą tylkowystąpieniemAiB.Własnośćtazachodziniezależnieodtreści iprawdopodobieństwwtychinnychloteriach.) monotoniczność A≻B⇒(p≥q⇔[p,A;1−p,B]≻ ∼[q,A;1−q,B]) (JeśliagentpreferujeAwzględemB,todladwóchloteriizwynikamiAiB preferujerównieżloterię,którazwiększymprawdopodobieństwemdajewynikAniż B.) dekompozycja [p,A;1−p,[q,B;1−q,C]]∼[p,A;(1−p)q,B;(1−p)(1−q),C] (Złożoneloteriemożnazredukowaćdoprostszych,stosującprawa prawdopodobieństwa.) Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności5
Z n ac ze n ie ak sj o m at ów
Aksjomatysątakskonstruowane,żeichnaruszeniemusibyćzwiązanezzachowaniem jawnieirracjonalnym. Wyobraźmysobieagentazsystemempreferencjinaruszającymaksjomat przechodniości:A≻B≻CijednocześnieC≻A: JeśliB≻C,toagentposiadającyCpowinienbyć skłonnyzapłacić1(euro)centaabyosiągnąćB. JeśliA≻B,toagentposiadającyBpowinienbyć skłonnyzapłacić1(euro)centaabyosiągnąćA. JeśliC≻A,toagentposiadającyApowinienbyć skłonnyzapłacić1(euro)centaabyosiągnąćC.A BC
1c1c 1c Takiegoagentamożnabyzatemskłonićdooddaniawszystkichpieniędzyjako konsekwencjiposiadanychprzezniegopreferencji. Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności6
F u n kc je u ży te cz n o śc i
Przedstawioneaksjomatyteoriiużytecznościwrzeczywistościnicniemówią oużytecznościach,ajedynieopreferencjachagenta.Pojęciemwyjściowymdo rozważańnatematpodejmowaniadecyzjiprzezagentówbędąichpreferencje spełniającepowyższeaksjomaty. Wiadomoże,jeślizestawpreferencjiagentaspełniaaksjomatyteoriiużyteczności,to istniejefunkcjarzeczywistaokreślonanazbiorzestanówU:S→ℜ,taka,że: U(A)>U(B)⇔A≻B U(A)=U(B)⇔A∼B TafunkcjaużytecznościprzyjmujedlaloteriiookreślonychwynikachS1,...,Sniich prawdopodobieństwachp1,...pnwartość: U([p1,S1;...;pn,Sn])=X ipiU(Si) Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności7
M o d el ra cj o n al n eg o ag en ta
Ponieważwynikiemniedeterministycznychakcjiagentasąloterie,zatempowyższy wzórmożebyćużytydoobliczeniaoczekiwanejużytecznościtychakcji,ijestrealizacją zasadyMEUwprowadzonejwcześniejwzorem: EU(A|E)=X iP(Resulti(A)|Do(A),E)×U(Resulti(A)) Istnienietejzasadyiteoriiużytecznościnieoznacza,żeracjonalniezachowującysię (czyli:maksymalizującyoczekiwanąwartośćużyteczności)inteligentniagencijawnie obliczajątęfunkcjęijejmaksima.Agencimogąposługiwaćsięróżnymi reprezentacjamiwiedzyisposobamiobliczaniaswoichstrategii.Jednakobserwując poczynaniaracjonalniezachowującegosięagenta,możnazamodelowaćjego preferencjeifunkcjęużyteczności. Podejmowaniedecyzjinapodstawieużyteczności—funkcjeużyteczności8
T eo ri a u ży te cz n o śc i w o d n ie si en iu d o p ie n ię d zy
Rozważmyróżnemożliwefunkcjeużytecznościwodniesieniudostanówopisanych przezilośćposiadanychpieniędzy.Jestsensowneprzyjąć,żefunkcjeużytecznościbędą wtymprzypadkumonotonicznedlakonkretnych(pewnych)sumpieniędzy. Rozważmyprzykład:wygraliśmyteleturniejimamydowyborunagrodęjednego milionazłotych,lubrzutmonetą,iwtedywprzypadkuorłaotrzymamytrzy miliony,alewprzypadkureszkinic.Większośćludziwybrałabypewnymilionna rękę(tylkocozpodatkiem?),alejeślipoliczyćoczekiwanąwartośćpieniężną (EMV)wariantuzrzutemmonetąotrzymamy: 1 2(0zł)+1 2(3,000,000zł)=1,500,000zł podczasgdyEMVdlawariantupewnegowynosi1,000,000zł. Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy9 Cowynikaztegoprzykładu?Spróbujmypoliczyćużytecznościmożliwychstanów wynikowych.OznaczającprzezSkstan,wktórymposiadamypoczątkowokzłotych mamy: EU(rzutmonetą)=1 2U(Sk)+1 2U(Sk+3,000,000) EU(milionnarękę)=U(Sk+1,000,000) Byokreślićużytecznośćposiadaniaróżnychsumpieniędzymożemyprzyjąć,że początkowowiększasumagotówkijestdlanasbardziejużyteczna,np.:U(Sk)=5, U(Sk+1,000,000)=8,U(Sk+3,000,000)=10.WtedyotrzymamyEU(rzutmonetą)=7.5 imamypodstawębyprzyjąćoferowanynampewnymilion. Zdrugiejstrony,gdybyśmyposiadalijużwielemilionów,tomożetewartościwyszłyby inne,iwtedyopłacałobysięmożeprzyjąćrzutmonetąwpowyższejloterii. Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy10P ar ad o ks S t. P et er sb u rg a
Otrzymujemypropozycjęudziałuwgrze(Bernoulli,1738),wktórejrzucamymonetą takdługoażwyrzucimyreszkę,igdynastąpitown-tymrzucietowygrywamy2n złotych.Napewnoopłacasięgraćwtęgrę.Pytaniejednakbrzmi:ilebylibyśmygotowi zapłacićzamożliwośćwzięciawniejudziału?Prawdopodobieństwowyrzuceniareszki wn-tymrzuciewynosi1/2n ,więc: EMV(St.P.)=X iP(Reszkai)MV(Reszkai)=
X i1 2i2i =2 2+4 4+8 8+···=∞ Czytooznacza,żepowinniśmyzapłacićdowolną(skończoną)sumępieniędzyza możliwośćudziałuwtakiejgrze?Niebrzmitopoprawnie,iniebrzmiałorównieżdla Bernoulliego,któryzaproponowałzastosowanielogarytmicznejfunkcjiużytecznościdla pieniędzy,U(Sk)=log2k,dziękiczemuotrzymujemy: EU(St.P.)=
X iP(Reszkai)U(Reszkai)=
X i1 2ilog22i =1 2+1 4+1 8+···=1 Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy11
U ży te cz n o ść p ie n ię d zy d la st u d en ta
Dlakażdejwartościx,określmyprzezgłosowanie,prawdopodobieństwop,przyktórym połowagrupystudenckiejpreferujeloterię[p,$10,000;(1−p),$0]ponadpewną wypłatękwoty$x: p $x0.00.10.20.30.40.50.60.70.80.91.0 050030004000500060007000800090001000010002000 Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy12K rz yw e u ży te cz n o śc i p ie n ię d zy
Przyjmujesię,żeużytecznośćpieniędzyjestlogarytmo-podobnąfunkcją,którajest wklęsładladodatnichwartościmonetarnych.Wbadaniachzlat1960-tychwyznaczono doświadczalniefunkcjęużytecznościpieniędzydlapewnejkonkretnejosoby U(Sk)=−263.31+22.09log(k+150,000): +U +$ −150,000800,000 oooooooooooooo o Dlamałychwartościujemnychfunkcjajestnadalwklęsła,ponieważposiadaniedługu powodujezwykleuludziestanpaniki.Jednakdlabardzodużychwartościdługu funkcjatazdajesięmiećcharakterwypukły,ponieważ„przykrość”zposiadania ogromnegozadłużenianiewzrastaliniowozpoziomemtegozadłużenia. Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy13 Wracającdododatnichwartościmonetarnych,możnastwierdzić,żeagencizwklęsłą funkcjiużytecznościogólniebędąpreferowaćotrzymaniesumyoczekiwanejwygranej zloterii(napewno),niżbraćudziałwtejloterii: U(SL)<U(SEMV(L)) Takiezachowaniemożnanazwaćryzyko-fobią.Obszarwypukłościfunkcji użytecznościdlawielkichwartościdługumożnanazwaćzachowaniem ryzyko-lubnym.Wmałychprzedziałachfunkcjaużytecznościjestnaogółliniowa, iodpowiedniezachowaniejestnazywaneryzyko-obojętnym. Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy14N ie ra cj o n al n o ść
Przyjęciewklęsłej,logarytmo-podobnejfunkcjiużytecznościpieniędzyniewyjaśnia całejpsychologiipodejmowaniadecyzjifinansowychprzezludzi.Okazujesię,że systematycznienaruszająoniaksjomatyużyteczności.Naprzykład,mającwybór międzyloteriamiAiB,orazCiD: A:80%wygrania$4000C:20%wygrania$4000 B:100%wygrania$3000D:25%wygrania$3000 większośćludziwybieraBponadA,aleCponadD.Jednakjeśliprzyjmiemy U($0)=0,topierwszywybóroznacza,że0.8×U($4000)<U($3000),natomiast drugiwybóroznaczacośdokładnieprzeciwnego. Jednymmożliwymwyjaśnieniemtegowynikujestzwykłaniezgodnośćzachowaniasię ludzizaksjomatamiużyteczności.Jednakinnewyjaśnieniejestopartena uwzględnieniupoczuciażalu.Ludziewiedzą,żewprzypadkuloteriiAbędąsięczuli idiotyczniejeśliwybiorą,inastępnieprzegrajątęloterię,wiedząc,żemoglidokonać bezpiecznegoiopłacalnego(choćbymniej)wyboruloteriiB.Wdrugimprzypadkuto poczucieniewystąpi,więczachowaniejestracjonalne. Podejmowaniedecyzjinapodstawieużyteczności—użytecznośćpieniędzy15Z n or m al iz ow an e fu n kc je u ży te cz n o śc i
Zauważmy,żeaksjomatyużytecznościnieokreślająfunkcjiużytecznościjednoznacznie napodstawiesamychpreferencji.Naprzykład,agentposługującysięfunkcją użyteczności:U′(S)=k1+k2U(S)gdziek1ik2sąstałymi(k2>0),będzie zachowywałsięidentyczniedoagentazfunkcjąU(S),jeśliobajagenciposiadająte sameprzekonania. Funkcjęużytecznościmożnazatemprzeskalowaćliniowoiprzesunąćodowolnąwartość wgóręlubwdół,izachowanieagentaniezmienisię.Dlategomożnaposługiwaćsię znormalizowanąfunkcjąużyteczności. Oznaczającprzezu⊥użytecznośćstanu„najgorszejkatastrofy”u⊥=U(S⊥)dla pierwotnejfunkcjiużytecznościU(S),aprzezu⊤użytecznośćstanu„największej nagrody”u⊤=U(S⊤),dlaznormalizowanejfunkcjiużytecznościU′ przyjmiemy U′ (S⊥)=0iU′ (S⊤)=1,natomiastużytecznościstanówpośrednichU′ (S)określamy proszącagentaopodanieprawdopodobieństwap,dlaktóregoagentniemapreferencji pomiędzystanemSaloteriąstandardową[p,S⊤;(1−p),S⊥] U′ (S)=p,gdyS∼[p,S⊤;(1−p),S⊥] Podejmowaniedecyzjinapodstawieużyteczności—normalizacja16P o d ej m ow an ie d ec yz ji
Bayesowskiesieciprzekonańpozwalająnauzyskiwanierozkładówprawdopodobieństw dowolnychzmiennych,przyposiadaniuinformacjiodowolnejkombinacjiinnych zmiennych.Znającdodatkoworozkładużyteczności,możemytęwiedzęzastosować, zwykorzystaniemzasadyMEU. Rozważmyprzykład:czyzabraćzesobąparasolgdywychodzimyzdomu?Parasoljest użytecznytylkowtedy,gdypadadeszcz,pozatymjestuciążliwy,imożnagozgubić. Skądjednakmożemywiedzieć,czybędziepadać?Pewnąwskazówkąjestprognoza pogody. WeatherP(W) sunny0.7 rainy0.3ForecastP(F|sunny)P(F|rainy) good0.80.1 bad0.20.9 WeatherForecast Przyokazjizauważmy,żepowyższasiećjestciekawymprzypadkiemzależności probabilistycznej,którazachodziwkierunkuodwrotnymdochronologii.Pogoda wpływanaprognozę,pomimoiżprognozaokreślanajestwcześniej. Jaktomożliwe?Ototrzebabyzapytaćmeteorologów. Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji17
D ia g ra m y w p ły w ów
Zarównorozważanaakcjajakiużytecznościsytuacjimogąbyćwyrażonenagrafiesieci przekonańjakospecjalnewęzłyakcjiiużyteczności.Siećpowinnazawieraćpołączenia zwęzłówlosowychiwęzłówakcjidowęzłówużyteczności. WeatherP(W) sunny0.7 rainy0.3ForecastP(F|sunny)P(F|rainy) good0.80.1 bad0.20.9 UmbrellaWeatherForecast Utility Umbrella take leave
Weathersunnysunnyrainyrainy Umbrellatakeleavetakeleave Utility20100700 Takierozszerzonesieciprzekonańnazywanesądiagramamiwpływów(influence diagrams)alboteżsieciamidecyzyjnymi(decisionnetworks).Niektórenarzędziado budowyiprzetwarzaniasieciprzekonańobsługująrównieżtakiediagramywpływów. Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji18
O b lic za n ie d ec yz ji
Najpierwrozważmyprzypadekbrakudodatkowychinformacjiopogodzie. WeatherP(W) sunny0.7 rainy0.3ForecastP(F|sunny)P(F|rainy) good0.80.1 bad0.20.9 UmbrellaWeatherForecast Utility Umbrella take leave
Weathersunnysunnyrainyrainy Umbrellatakeleavetakeleave Utility20100700 EU(leave)=P(sunny)∗U(leave,sunny)+P(rainy)∗U(leave,rainy) =0.7∗100+0.3∗0 =70 EU(take)=P(sunny)∗U(take,sunny)+P(rainy)∗U(take,rainy) =0.7∗20+0.3∗70 =35 Wtymprzypadkuwyższąużytecznośćmapozostawienieparasolawdomu. Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji19 Załóżmy,żeznanajestprognozazłejpogody.Rozkładprawdopodobieństwapogody obliczonyprzezsiećwynositeraz:P(sunny,rainy|bad)≈(0.34,0.66). WeatherP(W) sunny0.7 rainy0.3
ForecastP(F|sunny)P(F|rainy) good0.80.1 bad0.20.9 UmbrellaWeather Utility
Forecast=bad Umbrella take leave
Weathersunnysunnyrainyrainy Umbrellatakeleavetakeleave Utility20100700 EU(leave|bad)=P(sunny|bad)∗U(leave,sunny)+P(rainy|bad)∗U(leave,rainy) =0.34∗100+0.66∗0 =34 EU(take|bad)=P(sunny|bad)∗U(take,sunny)+P(rainy|bad)∗U(take,rainy) =0.34∗20+0.66∗70 =53 Wtymprzypadkuwłaściwądecyzjąjestzabranieparasolazesobą. Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji20
K ró tk ie p o d su m ow an ie — py ta n ia sp ra w d za ją ce
1.Rozważproblempacjenta,któryzpewnymprawdopodobieństwemmanowotwór złośliwyirozważanejestpodjęcieterapiiintensywnej.Sytuacjęopisujepokazany poniżejdiagramwpływówzczęściowowypełnionątabelkąużytecznościpacjenta. (a)Wyznacziuzasadnijwracjonalnysposóbbrakująceużyteczności. (b)Obliczwartośćprawdopodobieństwanowotworu,przyktórymdecyzjaoterapii ulegazmianie. utilityPatient’sMalignant cancer Radical therapy
NowotwórLeczenieUżyteczność złośliwyintensywnepacjenta NN100 TN0 NT TT Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji21 2.Rozważproblemstudenta,któryprzystępujedosesjiegzaminacyjnejimożeuczyć siędoegzaminu,bądźpodejśćbezstresowo,próbujączaliczyć„zbiegu”,inietracić czasunauczeniesię. (a)Rozważdwieróżnealternatywnefilozofieżyciowestudenta,iopiszjewartościami użytecznościwskaliod0do100. (b)Dlaprzykładowowybranegoprzedmiotu,określprawdopodobieństwopierwotne zdaniaegzaminu,idlawybranychfilozofiiżyciowychstudentaobliczjegodecyzje zgodnezzasadąMEU. (c)Następnie,traktującuczeniesięjakozmiennąlosowąniezależną,określ warunkowyrozkładprawdopodobieństwazdaniaegzaminuzwybranego poprzednioprzedmiotu.Wybierzprawdopodobieństwobezwarunkoweuczeniasię iobliczwartościoczekiwaneużytecznościdladwóchfilozofii. utilityStudent’s
examPassed Studied hard
ZdałUczyłUżyteczność egzaminsięstudenta NN TN NT TT Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji22
3.Rozważdecyzjęwykupieniaubezpieczeniasamochodu.Ogólniedobrzejestmieć ubezpieczenie,aczkolwiekmożnadyskutowaćczyrównieżjesttowskazane wprzypadkubrakuwypadku.Przyjmijmynastępującymodelzagadnienia: utilityDriver’s
Buy insurance accidentHave
KupBędzieUżyteczność ubezpieczeniewypadekkierowcy NN100 TN100 NT5 TT25 „Wypadek”jestuogólnieniemróżnychrodzajówwypadkówomocnorozbieżnych konsekwencjach.Chcemyzbudowaćdokładniejszymodel,rozróżniającydwaskrajne przypadki:wypadekdrobny,iwypadekpoważny,wktórymludziezostalirannilub zabici.Przyjmijjakieśracjonalnezałożenia,iuzupełnijbrakująceużyteczności wsposóbspójnyzpoprzednimmodelem. utilityDriver’s
Buy insurance accidentFatal
accidentMinor
KupDrobnyPoważnyUżyteczność ubezpieczeniewypadekwypadekkierowcy NNN100 TNN100 NTN TTN NNT TNT NTT TTT Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji23 Podejmowaniedecyzjinapodstawieużyteczności—obliczaniedecyzji24
W ie lo kr o tn e ak cj e i w ie lo kr o tn e u ży te cz n o śc i
Wsieciprzekonańjestzwyklewielewęzłówlosowych,ponieważgłównym przeznaczeniemtakichsiecijestuproszczenieobliczeńprawdopodobieństw warunkowychdlazłożonychprzypadków. Jestzatozupełnienormalnymprzypadkiemgdywdiagramiewpływówistnieje dokładniejedenwęzełdecyzyjnyijedenwęzełużyteczności.Wynikatozfaktu,że diagramywpływówprzedstawiająwiedzęniezbędnądopodjęciapojedynczejdecyzji. Abyokreślićtędecyzjęjednoznacznie,najlepiejmiećjednokryterium. Jednakwielewęzłówakcjimożeznaleźćsięwdiagramiewpływów.Wyrażająone wtedysytuację,gdyagentmusipodjąćtylkojednąztychdecyzji,lubwjednymkroku decyzjęłączną,napodstawieinformacjizsieci.Diagramywpływówniepozwalająna poprawnywybórzestawudecyzji,gdykonsekwencjejednejznichwpływająnakolejne. Zdrugiejstrony,wielokrotneużyteczności,gdysątakie,musząbyćzagregowaneza pomocąjednegozmodeliobliczaniaużytecznościwieloatrybutowej,opisanychponiżej. Podejmowaniedecyzjinapodstawieużyteczności—wielokrotneakcjeiwielokrotneużyteczności25 SymptomsTest resultsOutcomeDisease Suffering TestingTreatment Doctor’s utilityPatient’s utility Napodstawiepowyższejsiecimożnazapisaćpacjentowibadania,lubpodjąćdecyzję oleczeniu,niezależnieodtego,czywynikibadańsądostępneczynie.Niema natomiastmożliwościpodjęciadecyzjiobadaniach,iuwzględniającychskutkitych badańdecyzjioleczeniu,wjednymkroku. Zwróćmyrównieżuwagęnaodrębneobliczanieużytecznościzpunktuwidzenia pacjentailekarza.Pomimoiżdlaobustronważnyjestkońcowywynik,tobiorąone poduwagęjeszczeinneczynniki,wodmiennysposób(np.prestiżlekarzaicierpienie pacjenta).Podejmowanenaichpodstawiedecyzjemogębyćinne. Podejmowaniedecyzjinapodstawieużyteczności—wielokrotneakcjeiwielokrotneużyteczności26
U ży te cz n o śc i w ie lo at ry b u to w e
Wwieluproblemachpraktycznychtrzebauwzględniaćróżnekryteriapoprawności podejmowanychdecyzji,albo,inaczejmówiąc,różnefunkcjeużyteczności,biorącepod uwagęróżneatrybutyrozważanychstanów.Preferencjewynikającezuwzględnienia różnychatrybutówmogąbyćzesobąsprzeczne. Rozważmyprzykładzlokalizacjąlotniska. Czynnikamidouwzględnieniasą:koszty gruntu,komplikacjeprzyjegozakupie, odległośćodcentrummiasta,zwiększony ruchnadrogach,lokalnewarunki pogodowe,iinnezagrożenia.Dlakażdej możliwejlokalizacjimożnaokreślićwartość krytycznychatrybutówtakichjak:koszt całkowity,zagrożeniewypadkami (śmiertelnymi),uciążliwośćruchu lotniczego(hałas),itp.U
Airport Site Deaths Noise Cost
Litigation Construction
Air Traffic Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe27
W ie lo at ry b u to w e fu n kc je u ży te cz n o śc i
Chcemyzbudowaćmodelpodejmowaniadecyzjidlaprzypadkówwieloatrybutowe. BędziemyoznaczaćpodlegająceocenieatrybutystanuprzezX1,X2,...aichwartości x1,x2,....Przyjmiemydlauproszczenia,żewiększewartościatrybutówoznaczają wyższąjakośćrozwiązania,zpunktuwidzeniadanegoatrybutu. Zakładając,żeposzczególneatrybutymająfunkcjeużytecznościoznaczonejako: f1(x1),f2(x2),...możemypróbowaćwyrazićglobalnąfunkcjęużytecznościagenta wzorem: U(x1,x2,...xn)=f(f1(x1),f2(x2),...,fn(xn)) Niestety,naogółfunkcjaf()jesttrudnadoopisaniawjawnysposób.Najpierw rozważymywięcszeregłatwiejszychprzypadkówszczególnych. Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe28Ś ci sł a d o m in ac ja
Zjawiskiemścisłejdominacjinazwiemysytuację,kiedyjedenwybórBposiadakażdy zatrybutówlepszyodinnegowyboruA.Naprzykład,jednalokalizacjalotniskajest tańsza,powodujemniejszeobciążeniedlaśrodowiska(naturalnegoiludzkiego),ijest bezpieczniejszadlalotów.WtedymożemybezwahaniaodrzucićmożliwośćA zdalszychrozważań.Jednakniemożnałatwodokonaćwyborumiędzymożliwościami AaClubAaD(diagrampolewej). 1X2X A
BC D 1X
2X A
B C
This region dominates A Deterministic attributesUncertain attributes Ścisładominacjalubjejbrakmożewystąpićrównieżwwarunkachniepewności,gdy danaakcjadawynikwpostacipewnejdystrybucjiprawdopodobieństwadlawartości atrybutów(diagrampoprawej). Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe29
D o m in ac ja st o ch as ty cz n a
Ścisładominacjaniezdarzasięczęstowpraktyce,iwogólnymprzypadkuwartości atrybutówmogąniebyćznanenapewno.Wtedymożemyposłużyćsięrozkładami prawdopodobieństwa,idominacjąstochastyczną. 00.2
0.4
0.6
0.81
1.2 -6-5.5-5-4.5-4-3.5-3-2.5-2
Probability
Negative cost
S1 S2 0
0.2
0.4
0.6
0.81 -6-5.5-5-4.5-4-3.5-3-2.5-2
Probability
Negative cost
S1 S2 Naprzykład,gdybykosztlokalizacjilotniskawmiejscuS1byłprzewidziany zdystrybucjąnormalnązwartościąoczekiwaną$3,700Miodchyleniemstandardowym $400M,awmiejscuS2zdystrybucjąnormalnązwartościąoczekiwaną$4,000M iodchyleniemstandardowym$350M,toS1dominujestochastycznieS2,cowidać zprzebiegudystrybucjikumulacyjnych. Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe30
JeśliagentrozpatrujedwiemożliweakcjeA1iA2,któreprowadządodystrybucji prawdopodobieństwp1(x)ip2(x)naatrybucieX,tomożemypowiedzieć,żeA1 dominujestochastycznieA2jeśli: ∀xZx −∞p1(x′ )dx′ ≤
Zx −∞p2(x′ )dx′ Wskrajnymprzypadku,możemynawetmiećdlajednegozprzypadków(wynikuakcji A2)wartośćx2atrybutuXpewną(tzn.ze100%prawdopodobieństwem),cowcalenie oznacza,żeakcjaA2powinnabyćpreferowana(ani,żepreferowanapowinnabyćakcja A1zwynikiemwpostacirozkładuprawdopodobieństwadlaatrybutuX). Wzależnościodkonkretnegorozkładuakcjazniepewnymwynikiemmożedominować stochastycznieakcjęzwynikiempewnym,albonaodwrót. Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe31
U ży te cz n o śc i w ie lo at ry b u to w e — pr zy p ad ek d et er m in is ty cz n y
Wogólnymprzypadkużadnadominacjamożeniezachodzić.Jednakatrybutystanu X1iX2mogąbyćniezależnepreferencyjnieodX3jeślipreferencjemiędzy hx1,x2,x3iahx1′,x2′,x3iniezależąodwartościx3. JeślikażdaparaatrybutówXiiXjjestpreferencyjnieniezależnaodkażdego zpozostałychatrybutówXk,totenzbióratrybutówposiadawłasnośćwzajemnej niezależnościpreferencyjnej(MPI—mutualpreferentialindependence). Okazujesię,żewtakimprzypadkuistniejeaddytywnafunkcjawartościopisująca preferencjeagenta: V(S)=X iVi(Xi(S)) Wwieluprzypadkachtaformułapozwalaprawidłowomodelowaćrzeczywiste preferencjeipodejmowanedecyzje. Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe32
U ży te cz n o śc i w ie lo at ry b u to w e — pr zy p ad ek pr o b ab ili st yc zn y
MożnauogólnićwłasnośćMPInaloterie:zbióratrybutówXjestniezależny użytecznościowoodzbioruatrybutówY,jeślipreferencjemiędzyloteriamina atrybutachzXsąniezależneodkonkretnychwartościatrybutówzY.Zbióratrybutów jestwzajemnieniezależnyużytecznościowo(MUI—mutually utility-independent),jeślikażdypodzbiórjegoatrybutówjestniezależny użytecznościowoodpozostałychatrybutów. DlaatrybutówMUIzachowanieagentamożebyćopisanemultiplikatywnąfunkcją użyteczności,którądlaprzypadkutrzyatrybutowegomożnazapisać: U(S)=k1U1(X1(S))+k2U2(X2(S))+k3U3(X3(S)) +k1k2U1(X1(S))U2(X2(S))+k2k3U2(X2(S))U3(X3(S))+k3k1U3(X3(S))U1(X1(S)) +k1k2k3U1(X1(S))U2(X2(S))U3(X3(S)) Wpewnychszczególnychprzypadkachistniejerównieżcałkowicieaddytywnafunkcja użyteczności. Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe33 Podejmowaniedecyzjinapodstawieużyteczności—użytecznościwieloatrybutowe34W ar to ść in fo rm ac ji
Wdotychczasowychrozważaniachprzyjmowaliśmyzałożenie,żecaładostępna informacjajestznanaagentowipodejmującemudecyzje.Tozałożeniejestmało realistyczne.Wpraktycznychprzypadkachpodejmowaniadecyzjijedną znajważniejszychijednocześnienajtrudniejszychkwestiijestnajakiepytania dotycząceproblemunależyzebraćodpowiedzi. Np.lekarzniemawszystkichkluczowychinformacjiopacjenciewchwiligdy zapoznajesięzjegoprzypadkiem.Możezatemzlecićwykonaniepewnychbadań, jednaktakiezbieranieinformacjijestzjednejstronykosztowne,azdrugiej wpływanaopóźnienieleczenia. Ważnośćinformacjizależyoddwóchczynników:(1)czyróżnemożliwewynikibadań mocnowpłynąnapodejmowanądecyzję,i(2)prawdopodobieństwaróżnychwyników. Teoriawartościinformacjipozwalapodejmowaćdecyzje,któreinformacjenależy zebrać. Podejmowaniedecyzjinapodstawieużyteczności—wartośćinformacji35W ar to ść in fo rm ac ji — pr zy kł ad
Załóżmy,żefirmawiertniczarozważamożliwośćwykupuprawwierceniawjednym znobszarówoceanu.Załóżmydalej,żejestpewne,żedokładniewjednymzobszarów położonejestzłoże,któregoeksploatacjaprzyniesiezyskC,natomiastkosztkażdego obszaruwynosiC/n.Zauważmy,żewartośćoczekiwanazyskuEPztejtransakcji wynosi0: EP=1 n C−C n +n−1 n−C n
=0 Załóżmydalej,żepewiengeologwienapewno,czywjednymkonkretnymobszarze jestropa.Jakamożebyćwartośćtejinformacjidlafirmywiertniczej? Rozważmyprzypadki.Zprawdopodobieństwem1 nwybranyobszarzawieraropę, iwtakimprzypadkufirmakupitenobszarizarobiCminusC/nkosztpraw. Wprzeciwnymwypadku,zprawdopodobieństwemn−1 nobszarniezawieraropy,ifirma wiedzącto,kupiinnyobszar,zawierającyropęzprawdopodobieństwem1 n−1,izarobi, byćmoże,C,zoczekiwanąwartościązyskuC/(n−1),ponownieminusC/n: EP′=1 n C−C n +n−1 nC n−1−C n! =C n Wniosek:informacjamawartość,wtymprzypadkurównącenieprawadoeksploatacji złoża. Podejmowaniedecyzjinapodstawieużyteczności—wartośćinformacji36