• Nie Znaleziono Wyników

Definiowanie czynników niepewności i nieprecyzyjności na potrzeby wspomagania diagnozy medycznej

N/A
N/A
Protected

Academic year: 2022

Share "Definiowanie czynników niepewności i nieprecyzyjności na potrzeby wspomagania diagnozy medycznej"

Copied!
18
0
0

Pełen tekst

(1)

ZESZYTY N A U K O W E PO L IT EC H N IK I ŚLĄ SK IEJ Seria: E L E K T R O N IK A z. 12

2000 N r kol. 1492

Ewa STR A SZECK A

Politechnika Śląska, Instytut Elektroniki Joanna STR A SZECK A , C zesław M A RC ISZ

Wojewódzki Szpital Specjalistyczny n r 1 w Tychach, I O ddział Chorób W ew nętrznych

DEFINIOWANIE CZYNNIKÓW NIEPEWNOŚCI I

NIEPRECYZYJNOŚCI NA POTRZEBY WSPOMAGANIA DIAGNOZY MEDYCZNEJ

Streszczenie. W pracy zaproponow ano m odelow anie czynników niepew ności i nie­

precyzyjności reguły typu “j e ż e l i ... to ...” w przypadku jej zastosow ania do w spom agania diagnozy m edycznej. O m ów iono sposoby opisu nieprecyzyjnej przesłanki za pom ocą zbioru rozm ytego i skali. Zastosow ano je d n o litą interpretację nieprecyzyjnej przesłanki, niezależnie od sposobu jej określenia (zbiór rozm yty, skala, w artość 0 lub 1). Z pom ocą teorii D em pstera-S hafera zdefiniow ano pew ność diagnozy (konkluzji). Podano przykład w nioskow ania w e w spom aganiu diagnostyki chorób tarczycy.

DEFINING FACTORS OF UNCETRAINTY AND IMPRECISION FOR MEDICAL DIAGNOSIS SUPPORT

Sum m ary. U ncertainty and im precision factors m odelling for IF-TH EN rules used in medical diagnosis support is proposed in the paper. A m ethod o f interpretation o f an im precise predicate using fuzzy sets or a scale is described. A unified representation o f the im precise predicate, independently from the m anner o f its form ulation (a fuzzy set, a scale, 0 or 1 values) is suggested. C ertainty o f a diagnosis (conclusion) is defined on D epster-Shafer theory. A n exam ple o f reasoning in thyroid gland diagnosis support is provided.

(2)

32 E. Straszecka, J. Straszecka, Cz. M arcisz

1. Wstęp

W spom aganie diagnozy m edycznej w ym aga interpretacji różnorakich czynników niepew ności i nieprecyzyjności. Już samo określanie sym ptom ów choroby pociąga za sobą konieczność zdefiniow ania pojęć typu „szybka akcja serca” czy „w ysokie ciśnienie skurczow e krw i” . P ojęcia te m o g ą być opisane przez zbiory rozm yte. Jednocześnie jednak niektóre objaw y form ułuje się precyzyjnie, np. płeć lub grupę krwi. W ystępują również sym ptom y, które najw ygodniej je st charakteryzować za pom ocą skali, np. ból. W szystkie te m iary opisu ją precyzyjność określenia symptomów.

Reguła diagnostyczna Dane pacjenta

wystąpienie objawu u badanego pacjenta

niepewność

sformułowanie objawu nieprecyzyjność v____________ /

zw iązek m iędzy objaw em a diagnozą^

niepewność

diagnoza niepewność, czasem nieprecyzyjność

R ys.l. Czynniki niepewności i nieprecyzyjności obecne w procesie wspomagania diagnozy medycznej Fig. 1. Factors o f uncertainty and imprecision in medical diagnosis support

N astępnie pojaw ia się problem oceny zależności m iędzy obserw ow anym objaw em a cho­

robą. Z ależność ta w literaturow ych schem atach diagnostycznych często byw a opisyw ana za p o m o cą punktów lub oznaczeń, np. „+” [2, 6 ], Czasam i podaje się w yznaczone na podstaw ie częstości praw dopodobieństw o w ystąpienia objaw u pod w arunkiem choroby, zaś nadzw yczaj rzadko - praw dopodobieństw o choroby pod w arunkiem w ystąpienia objawu.

„S iłę zw iązku” m iędzy sym ptom em a diagnozą należy niew ątpliw ie zdefiniow ać jako stopień pew ności, ja k to przyjęto w w ielu system ach ekspertow ych [7, 9].

D iagnoza m oże być rów nież zdefiniow ana nieprecyzyjnie, lecz w zastosow aniach rzadko m am y do czynienia z takim zapisem wiedzy. Trudno bow iem zaakceptow ać określenie

„lekkie zapalenie płuc” . D latego na ogół w iększe znaczenie m a ją m iary pozw alające określić pew ność diagnozy.

N ieprecyzyjność w sform ułow aniu objawu i niepew ność zw iązku m iędzy objawem a diagnozą s ą cecham i reguły diagnostycznej:

„Jeżeli sym ptom to diagnoza” .

Stanow ią one n ieodłączną część bazy w iedzy system u w spom agania w nioskow ania.

(3)

Definiowanie czynników niepew ności i nieprecyzyjności.. 33

W przypadku uruchom ienia reguły, a w ięc podczas sesji w spom agania diagnozy, m ożna natomiast określić niepew ność diagnozy. D la znanych (być m oże nieprecyzyjnie określonych) objawów obserw ow anych u badanego pacjenta urucham ia się (ang. firing) odpow iednie reguły.

O niepew ności w ystąpienia sym ptom u należy m ów ić w przypadku gdy np. pacjent jest zdenerwowany i nie udziela jasn y ch odpow iedzi, je d n ak konieczne je s t uw zględnienie danych uzyskanych w czasie w yw iadu. T ak w ięc czynniki niepew ności i nieprecyzyjności we wspom aganiu diagnozy m edycznej m ożna zilustrow ać ja k na rys. 1.

W niniejszym artykule zo staną zaproponow ane m etody definiow ania nieprecyzyjności symptomu i niepew ności zw iązku m iędzy objaw em a diagnozą. Z o stan ą także podane przykłady definicji i zaprezentow ana m etoda w nioskow ania przydatna w e w spom aganiu diagnozy m edycznej, oparta na teorii D em pstera-Shafera.

2, Określenie nieprecyzyjności objawu w diagnozie medycznej

Zastosow anie zbiorów rozm ytych w m edycynie je st tyleż celow e, co trudne ze względu na potrzebę uzyskiw ania funkcji przynależności od ekspertów [1], M edycy odnoszą się nieufnie do aparatu m atem atycznego, ze zrozum iałych w zględów nie chcą zagłębiać się w teorię zbiorów rozm ytych. Pozostaje w ięc oprzeć się na osiągalnych źródłach inform acji, którymi w p rzypadku w iedzy m edycznej są:

1) uśrednione w yniki ankiet opracow anych w edług m odelu: „proszę określić norm alne (w ysokie, niskie) w artości param etru m edycznego” ,

2) istniejące opracow ania statystyczne (podaw ane w artykułach naukow ych), 3) szpitalne bazy danych,

4) algorytm y zaw arte w podręcznikach m edycznych, zw łaszcza tzw. testy punktow e (przykładam i m o g ą być: test C rooksa w nadczynności tarczycy [6] czy IN FA R C TEST w określaniu ryzyka zaw ału serca [14]).

Podstaw ow ym problem em w interpretacji nieprecyzyjności objaw u za p om ocą zbioru rozmytego je s t definiow anie dziedziny, czyli przestrzeni zm ienności (ang. „universe o f discourse”) funkcji przynależności. Przykładam i takich kłopotliw ych param etrów m edycznych m o g ą być: ból, drżenie rąk, zadyszka w ysiłkow a. W ydaje się, że trudno je st uniknąć określania abstrakcyjnej skali w przypadku podobnych sym ptom ów . Jednakże

(4)

34 E. Straszecka, J. Straszecka, Cz. M arcisz

przyjęcie „sztucznej” dziedziny dla zbioru rozm ytego prow adzi zw ykle do nienaturalnego, sprzecznego z in tu icją zapisu w iedzy. Znacznie łatw iejsze do zaakceptow ania byłoby przyjęcie dow olnej skali, która następnie m ogłaby być przeliczona na przedział [0, 1].

P roblem em staje się jed n ak w tedy je dnolita interpretacja sym ptom ów „rozm ytych”,

„skalow anych” i podaw anych precyzyjnie przez system w spom agania diagnozy. System ten m a być program em kom puterow ym , tym lepszym , im bardziej elastycznym , co w yklucza, a przynajm niej ogranicza m ożliw ości indyw idualnego rozpatryw ania sym ptom ów w m echa-nizm ie w nioskow ania. W kolejnych punktach niniejszego artykułu proponuje się koncepcję m odelow ania sym ptom ów „rozm ytych” , „skalow anych” i

„precyzyjnych” oraz m etodę jednolitej interpretacji sym ptom ów w procesie wnioskow ania.

2.1. Funkcja p rzyn ależn ości jako średnia z opinii ekspertów Funkcja przynale no ci m o e by okre łona zgodnie z zale no ci :

V = ( 1)

x e S n i = 1

gdzie D j( x ) i= l,...n zw ykle p rzyjm ują w artości ze zbioru {0,1}, a w ięc s ą tradycyjnie określonym i funkcjam i charakterystycznym i zbiorów. Funkcje D, są definiowane heurystycznie przez ekspertów , a następnie uśrednia się je. Oczyw iście, uśrednienie pozw ala określić jed y n ie k ilka punktów dla funkcji przynależności, a następnie należy zastosować aproksym ację je d n y m ze standardow ych

kształtów funkcji przynależności (rys.2 ).

U zyskiw anie funkcji przynależności w pow yższy sposób czasam i je s t trudne, poniew aż lekarze nie są skłonni zaznaczyć innych granic dla param etrów m edycznych, niż norm y przyjęte w literaturze m edycznej, m im o iż w codziennej praktyce inaczej inter­

pretują rezultaty “na granicy norm y”, niż te,

które trafia ją w jej środek. Z pew nością nie m ożna w ten sposób określić funkcji przynależ­

ności dla w yników testów laboratoryjnych.

w y s o k ie ci$n je n je s k u rc z o w e

-Dl m D2

D3.D4 _ D5

Rys.2. Definiowanie funkcji przynależności na podstawie opinii ekspertów

Fig.2. Defining membership functions on experts’

opinions

(5)

Definiowanie czynników niepew ności i nieprecyzyjności. 35

2.2. D efin iow anie funkcji p rzynależności na podstaw ie danych statystycznych

W iększość testów laboratoryjnych je st często w ykonyw ana, tak w ięc stosunkowo łatwo można zgrom adzić dane o populacji ludzi „zdrowych” (tzn. nie cierpiących na chorobę, którą dany test wykryw a), czyli tzw. grupę kontrolną. N a podstaw ie rozkładu praw dopodobieństw a wybranego param etru w grupie kontrolnej m ożna zdefiniow ać funkcje przynależności dla zbioru rozm ytego „ norm alny”, a następnie, poprzez negację, dla zbiorów rozm ytych „niski”

¡„w ysoki” (rys.3). M ożna posłużyć się krzywym i G aussa lub krzyw ym i trapezowymi.

W przypadku krzyw ych G aussa m ożliw e je st również w yznaczenie funkcji przynależności zbiorów „bardzo niski” i „bardzo w ysoki”

poprzez operację w yostrzania. W ystępujące problem y to:

a) w przypadku rzadkich chorób lub scho­

rzeń, których częstość w ystępow ania zależy od regionu (zaw odu, płci, w ieku itp.) opracow ania statystyczne, szczególnie dla grup kontrolnych są zbyt w yryw kow e, aby m ogły być przydatne do w spom agania p odejm ow ania decyzji, b) literaturow e opracow ania statystyczne przeważnie o dnoszą się do dużych populacji, czasam i egzystujących w w arunkach znacznie różniących się od badanej grupy pacjentów , stąd ich w yniki nie m o g ą być w prosty sposób uogólniane.

System y pow inny w ykorzystyw ać dane pochodzące z populacji, na potrzeby której zostały stworzone, poniew aż im trafniej zdefiniow ane s ą funkcje przynależności, tym efektyw niejsze jest w spom aganie diagnozy. Jest to stosunkow o łatw e w przypadku istnienia szpitalnych systemów inform acyjnych lub dużych baz danych. D ostatecznie liczne dane m o g ą być podstaw ą w yznaczenia krzyw ych rozkładu norm alnego lub funkcji przynależności żądanej postaci za po m o cą sieci neuronow ych [3]. Jednakże, ja k w ynika z literatury [8], przynajm niej równie dobrze spraw dzają się m etody polegające na aproksym acji histogram ów danych.

Należy w ięc przypuszczać, że ew entualne niedostatki spow odow ane n iew ielką licznością danych s ą rekom pensow ane poprzez konstruow anie funkcji przynależności dla selektyw nie wybranej populacji - tej w łaśnie, której będzie dotyczyć w spom aganie diagnozy. W skazuje to kolejną isto tn ą zaletę zastosow ania zbiorów rozm ytych w m edycynie - m ożliw ość

Rys.3. Definiowanie funkcji przynależności na podstawie danych statystycznych Fig.3. Defining membership functions on

statistical data

(6)

36 E. Straszecka, J. Straszecka, Cz. M arcisz

w ykorzystania m ało licznych danych, które nie m o g ą być źródłem statystycznie istotnego opisu lub podstaw ą uczenia sieci neuronowej.

2.3. W yk orzystan ie testów punktow ych do identyfikacji funkcji przynależności

P odaw ane w literaturze m edycznej przykłady testów punktow ych stosowanych w procesie diagnozy w raz ze zgrom adzą b azą danych m o g ą być w ykorzystane do autom atycznego w yznaczania reguł Sugeno [12], a co za tym idzie, do określenia funkcji przynależności o kształcie trójkątnym (rys.4). M etoda została szerzej om ów iona w [11].

Pozw ala ona uniezależnić się od bieżącej w spółpracy z ekspertem m edycznym , a co za tym idzie, oszczędzić je g o czas, a także w ykorzystać w szystkie posiadane zaczerpnięte z bazy szpitalnej dane. Przy nieco w iększym nakładzie obliczeniow ym m ożna w yznaczyć funkcje

przynależności w innej postaci (krzywe Gaussa, funkcje trapezow e). W yznaczenie funkcji przynależności w postaci zapro­

ponowanej na rys.4 je st korzystne z punktu w idzenia efektyw ności w spom agania diagno­

zy, poniew aż pozw ala na dobre zróżnico­

w anie reguł odnoszących się do poszczegól­

nych zbiorów rozm ytych. W przypadku funkcji z rys.3 praktycznie nie m a różnic w rezultatach w nioskow ania dla reguł odno­

szących się do niskich i bardzo niskich w artości param etru m edycznego, podczas gdy dla funkcji z rys.4 różne reguły będ ą uaktyw nione dla niskich w artości testu laboratoryjnego i w artości poniżej norm y. Z pom ocą identyfikacji rozm ytej m ożliw e je st także równoczesne w yznaczanie funkcji przynależności dla dw óch zm iennych, np. ciśnienia skurczowego i rozkurczow ego, co rozw iązuje problem definiow ania funkcji przynależności dla złożonych sym ptom ów .

2.4. In terpretow anie objaw ów w sposób precyzyjny i za pom ocą skali

W każdym procesie diagnostycznym w ystępują objaw y, które m u szą być jednoznacznie określone - np. płeć czy grupa krwi. Ich sform ułow anie w języ k u naturalnym nie odbiega od w cześniej om ów ionych sym ptom ów , poniew aż m ożna pow iedzieć „grupa krwi je st B Rh+”, podobnie ja k „ciśnienie skurczow e krwi je st w ysokie” . D latego takie param etry m edyczne

Rys.4. Funkcje przynależności wyznaczane w pro­

cesie identyfikacji rozmytej dla testu punktowego

Fig.4. Membership functions found during fuzzy identification process for a score test

(7)

Definiowanie czynników niepew ności i nieprecyzyjności.. 37

można rozpatryw ać z punktu w idzenia przynależności do odpow iedniego zbioru, która przyjmuje je d n ą z dw óch w artości: 1 lub 0 .

W yróżnia się rów nież objaw y, których w ystępow anie m ożna ocenić w w ybranej skali, jednak trudno zdefiniow ać dla nich dziedzinę. D otyczy to w szystkich ocenianych lecz niemierzalnych param etrów m edycznych, a w ięc bardzo w ielu sym ptom ów stw ierdzanych na podstawie w yw iadu i badania przedm iotow ego. D efiniow anie zbiorów rozm ytych dla tych symptomów je s t pożądane, lecz często trudne, poniew aż najpierw należy przyjąć przedział, w jakim param etr będzie oceniany, następnie zbudow ać na nim zbiory rozm yte. O ile postępowanie takie je s t kłopotliw e, lepiej je st poprzestać na dobraniu dowolnej skali, a następnie przeliczeniu jej na przedział [0,1]. P rzykładem objawów , dla których takie działanie je s t w skazane, m o g ą być: „zw iększona pobudliw ość nerw ow a” , „osłabienie siły mięśniowej” lub „ból” .

3. Zgodność obserwowanego objawu i przesłanki reguły diagnostycznej

N iezależnie od tego, w ja k i sposób sform ułow any je st objaw w regule diagnostycznej, w chwili urucham iania tej reguły dla danych dotyczących konkretnego pacjenta w ażna staje się zgodność tych danych z przesłanką reguły. Z godność ta w przypadku zbioru rozm ytego ma w artość funkcji przynależności, np. zgodność ciśnienia skurczowego krwi 170 mmHg z przesłanką „w ysokie ciśnienie skurczow e” w ynosi: p w y s o k iec iś n ie n ies k u r c z o w e( 170) = 0.8.

W przypadku bólu w skali od 1 do 10, gdy pacjent oceni go na 7, m ożna tę zgodność scharakteryzow ać lic zb ą 0.7. Z godność danych pacjenta (w przeciw ieństw ie do pacjentki) z płcią m ę sk ą w ynosi 1. T ak w ięc dla rozm aicie form ułow anych objaw ów cechą w spólną i jedynie w ażną w dalszych krokach w nioskow ania je s t ow a zgodność, która będzie dalej opisana sym bolem t).

4. Związek między objawem i diagnozą

Z w iązek m iędzy p rzesłanką reguły a jej konkluzją rzadko je st całkow icie pew ny. Jednym z najw iększych osiągnięć system u ekspertow ego M Y CIN było w prow adzenie w spółczynnika pew ności w niosku na podstaw ie przesłanki tzw. CF (ang. C ertainty factor) [9]. W literaturze m edycznej zw iązek ten je s t często opisyw any przez podanie tabel częstościowo w yznaczonego praw dopodobieństw a w ystępow ania objaw u pod w arunkiem choroby i jej

(8)

38 E. Straszecka, J. Straszecka, Cz. M arcisz

braku. S posobem w yrażenia tego zw iązku są rów nież testy punktow e. Testy te można zam odelow ać za p o m o cą następującej reguły:

Jeżeli objaw S je st A , , to su m a := su m a + p , .

R yzyko choroby ocenia się następnie za pom ocą sumy. Jeżeli sum a je st w iększa od pewnego progu, w skazuje to uzasadnione podejrzenie choroby. Testy pom agają ocenić łączny wpływ w ielu objaw ów na diagnozę.

Jak w ynika z pow yższych spostrzeżeń, zw iązek pom iędzy przesłanką reguły a wnioskiem je st określany przez je d n ą liczbę, otrzym yw aną na podstaw ie praw dopodobieństw a, lecz bardzo rzadko b ęd ą cą praw dopodobieństw em w arunkow ym . Liczne założenia zw iązane z tym ostatnim (m. in. N iezależność objawów, w artości praw dopodobieństw a a priori choroby) cz y n ią je nieprzydatnym ja k o m iara om awianego związku. Istnieje jed n ak możliwość w ykorzystania inform acji statystycznych oraz heurystycznych do określenia m iary pewności poprzez zastosow anie teorii D em pstera-Shafera.

3.1. T eoria D em pstera-Shafera w e w spom aganiu diagnozy medycznej

W teorii D em pstera-S hafera [5] wiedza o rozwiązywanym problem ie je st reprezentowana w postaci tzw. funkcji zaufania (oznaczanej przez B el - ang. „ b e lie f’). Teoria stanowi próbę sform alizow ania w nioskow ania „poszlakowego” [13], pozwalającego na w yprowadzenie konkluzji z przesłanek, które są nieprecyzyjne i/lub niekompletne. Określenie funkcji zaufania Bel do hipotezy je st m ożliwe na podstawie zdefiniowanych uprzednio tzw. elementów ogniskow ych, czyli zdań, a w przypadku wnioskow ania - przesłanek, o których posiadamy informacje. Inform acje te w yraża tzw. bazowy rozkład prawdopodobieństwa. M ożna go ustalić na podstaw ie bazy danych lub zaczerpnąć z opracowań literaturowych. Zdania nie m uszą być rozłączne ani elem entarne, dlatego każda inform acja może być w ykorzystana w procesie wnioskowania.

Bazow y rozkład praw dopodobieństw a m je st określony w następujący sposób [5, 13]:

« ( / ) = 0 , (2)

Y J m i a ) = i , a &T

gdzie / oznacza zdanie fałszywe, a T zbiór elem entów ogniskowych. Jeżeli przesłanka b wskazuje na hipotezę a (b=> a), to wartość zaufania do hipotezy a na podstaw ie informacji o b w ylicza się jako:

(9)

Definiowanie czynników niepew ności i nieprecyzyjności. 39

B el{a ) = I m (b ), (b=> a ) = t

(3)

gdzie t oznacza prawdę.

W ram ach teorii D em pstera-Shafera m ożliwe je st łączenie inform acji pochodzącej z dwóch źródeł (dwóch rozkładów bazow ych praw dopodobieństwa), zgodnie ze w zorem [4]:

b A C * f

Bazowy rozkład praw dopodobieństw a m oże stanow ić m iarę wagi poszczególnych objawów w procesie diagnozy. Tak w ięc reguła stanow iąca elem ent bazy w iedzy w ygląda następująco:

Z kolei w artość funkcji zaufania w yliczana ja k o sum a w artości bazow ego rozkładu prawdopodobieństwa dla reguł uruchom ionych po stw ierdzeniu zgodności objawów obserwowanych u pacjenta i z ich przesłankam i daje obraz pew ności diagnozy.

W zastosow aniu m edycznym oblicza się w artość funkcji zaufania przynajm niej dla dwóch diagnoz: „zdrow ie” i „choroba” . Elem entam i ogniskow ym i są ich sym ptom y. N iezw ykle ważny je st brak założeń o niezależności objawów , poniew aż często się zdarza, że ten sam objaw m usi być w czasie w nioskow ania rozpatryw any dw ukrotnie - sam odzielnie oraz w połączeniu z innym sym ptom em . Tw orzy się reguły, które przyporządkow ują sym ptom y do odpow iednich diagnoz. Sym ptom y często odnoszą się do tych sam ych param etrów medycznych, ale do różnych diagnoz, zw łaszcza w przypadku testów laboratoryjnych. W ynik testu w przedziale norm je st sym ptom em zdrowia, pow yżej górnej granicy norm y m oże być objawem jednej choroby, a poniżej dolnej granicy - objawem innej. W ten sposób ustalenie norm pociąga za so b ą określeniem reguł wnioskow ania.

W artość zaufania dla danej diagnozy oblicza się na podstaw ie sym ptom ów obserw ow anych u danego pacjenta. Jednakże u badanego pacjenta zazw yczaj obecne są zarówno sym ptom y potw ierdzające diagnozę (np. „choroba”), ja k rów nież w skazujące na konkurencyjną hipotezę (np. „zdrow ie”). Część objaw ów m oże pozostać nieznana.

Z pow yższej interpretacji w ynika, że najw ażniejszym źródłem inform acji obok reguł diagnostycznych je s t bazow y rozkład praw dopodobieństw a. D latego p o d staw ą w łaściw ego

Y . m i ( b ) m 2(c)

(4)

--- s związ< ---

objaw s. objawen diagnoza

(10)

40 E. Straszecka, J. Straszecka, Cz. Marcisz

w nioskow ania m usi być staranne określenie je g o wartości dla każdego sym ptom u i każdej reguły.

3.2. W yznaczanie bazow ego rozkładu praw dopodobieństwa

W celu w yznaczenia bazowego rozkładu prawdopodobieństwa (brp) należy najpierw zdefiniować sym ptom y i diagnozy. N iech b ęd ą dane dwie diagnozy: choroba (D) i zdrowie (//).

N iech sym ptom będzie zdefiniowany jako param etr medyczny w relacji do normy:

sym ptom = param etr < relacja > norma, np. { para m etr i < n o r m a i } = sdi,

{pa ra m etr, e [norm ai, norm at] } = Sm,

gdzie: n o rm a i, n o rm a t oznaczają odpow iednio doln ą i górną granicę normy.

Przykładow o, test laboratoryjny T 3 je st sym ptom em nadczynności tarczycy, jeśli jego rezultat w ypada pow yżej górnej granicy norm y, w przypadku zaś gdy daje w ynik w przedzia­

le norm górnej i dolnej, je st objawem eutyreozy (zdrowia).

S ym ptom złożony je s t koniunkcją dwóch symptomów:

SDi I aSDiJ = Sd,-

D la uproszczenia oznaczeń załóżm y, że:

{ s m ,... ,ro * } n { s//i,... ,s//„}=0 ,

{SDl> t^Dk}—^ H.

Dla tak zdefiniow anych sym ptom ów m ożna określić bazowy rozkład prawdopodobieństwa spełniający:

m ( f ) = 0 , (5)

Z '" C S«) = 1>

i, € Sd

gdzie / oznacza sym ptom pusty (brak jakiegokolwiek symptomu), a Sd zbiór symptomów (prostych lub złożonych) zw iązanych z diagnoząD .

Proponuje się następujące definicje brp:

1) „płaski” brp:

(11)

Definiowanie czynników niepewności i nieprecyzyjności. 41

oznacza, że wszystkie objaw y sąjed n a k o w o w ażne w procesie diagnozy. Jest to przypadek trywialny, pozwala jednak na m odelow anie w nioskow ania, kiedy nic nie w iadom o o wadze objawów,

2) brp oparty na ocenach heurystycznych lub testach punktow ych. Punktację z podaw anych w literaturze medycznej testów m ożna uw ażać za w artościow anie wagi różnych objawów w diagnozie. M ożna więc zdefiniow ać brp jako:

m0( / ) = 0 ; {sDU ... ¿Dk}=> D , stąd mD(sDl)= , (7) L P o j

¡-1_*

mH( f ) = 0 ; {«01, - , W = > t f . s t ą d m H ( % ) = , 2 ^ Phj y»lri

3) brp oparty na danych statystycznych. M ając do dyspozycji bazę danych brp m ożna określić z wykorzystaniem częstościowej definicji praw dopodobieństw a do obliczeń P(s£>, /D), P (srnhD):

™D( f ) = 0 ; f a m ,. . . ,«m}=> D ,

? (SDi/ D ) - ? ( Sd i/ - , D ) mD{SDi)m

P(«nf / D ) - P(j0, / -lD) > 0

I P W Z J j - P i , * / - ^ ) ] m

j = W

0 w przeciw nym przypadku

Analogicznie definiuje się brp dla diagnozy H. W edług (8) definiuje się brp, gdy w bazie danych dysponujemy grupą kontrolną. O prócz osób zdrow ych do zbioru -,D należy również zaliczyć pacjentów cierpiących na inne choroby niż D. N a przykład o ile D - pacjenci z nadczynnością tarczycy, to ~‘D - pacjenci bez choroby tarczycy lub z niedoczynnością tarczycy. W przypadku braku m ożliw ości ustalenia danych dla grupy kontrolnej (np. dla bardzo rzadkich chorób, które rozpoznaje się na podstaw ie specjalistycznych badań) można zdefiniować brp jako:

= fam , - ,sDk}= > D ,

mD fa Di) “

Pi s m / D ) P i ^ s o i / D ) P (jDi / D ) - P (-i SDi / D ) > 0

I P W 0 ) - P ( - . * » / D ) ] (9)

0 w przeciw nym przypadku

Przy zastosowaniu (8), (9) do obliczeń brp m ożna elim inow ać sym ptom y, które w rozpatry­

wanej populacji w skazują na in n ą diagnozę, niż przyjm uje się to standardach

(12)

42 E. Straszecka, J. Straszecka, Cz. M arcisz

diagnostycznych. D otyczy to zaw sze jed y n ie mniej ważnych, pom ocniczych objawów, lecz gdy je s t ich bardzo w iele w znaczący sposób m o g ą one fałszow ać diagnozę.

O czyw iście, im m niej liczne (mniej doskonałe) dane, tym gorzej określony jest brp.

N iem niej, m ożliw ość uniknięcia przekształcenia P (sm /D ) na P(D/sod zgodnie ze wzorem B ayesa, gdzie potrzebne je st praw dopodobieństw o a priori P(D), je st w ażną korzyścią z zastosow ania w artości brp w m iejsce klasycznego praw dopodobieństw a warunkow ego.

3.3. Ł ączenie bazow ych rozkładów praw dopodobieństw a

Z godnie z (4) m ożna łączyć dw a brp zdefiniow ane dla dw óch baz danych lub dla jednej bazy danych i oceny heurystycznej, obliczając w artość brp dla jednakow o zdefiniow anych sym ptom ów :

X

mn\(sDi) -mDiisoi)

V

/ \ SDiA SDi=SDi __ J W D \ \ S D i ) ' W l D 2 \ S D i ) / 1 A \

m D( s D i) ---^ --- — --- -— --- ^ ---——--- — • ( 10)

su*f Z j mD\VSDj)-mD2\SDj) ntDi(SDj), mD2{sDj)

SDj*SDj*f7=1

*

a oj*i Jm\

.*

Czasam i należy połączyć inform ację pochodzącą z dw óch różnych baz danych o podobnym , lecz nie identycznym sposobie form ułow ania sym ptom ów. W szczególności chodzi o połą­

czenie dw óch baz danych, w których w ystępują odpow iednio zbiory sym ptom ów:

- baza I : { iDi , ... ¿ Dk, s c } ^ A

baza II . {sni. ••• ¿ D k i $Dk+Ił Dk+m D.

Sym ptom Sc = (sDk+1 v ... v sDk+m) zastępuje łączny w pływ sym ptom ów sDk+1, ... ¿Dk+m na diagnozę. A by dokonać łączenia brp obliczonych dla każdej z baz z osobna, należałoby rozpatrzyć koniunkcję Sc z każdym z m ożliw ych podzbiorów {sok+i, ... ¿Dk+m} (oznaczm y go przez Soicm), przy czym : (sDk+i v ... v s Dk+m) a S Dkm = S Dkm- Każdy z sym ptom ów jest jednakow o upraw niony do w ystępow ania w podzbiorach Sokm, a w praktycznych przypadkach w artość brp w bazie II dla dow olnego podzbioru będzie w ielokrotnie m niejsza od w artości brp dla jednego sym ptom u. Będzie ona tym mniejsza, im więcej sym ptom ów będzie stanow iło podzbiór, poniew aż trudno je s t znaleźć pacjentów o podobnych zestaw ach danych. M ożna w ięc przyjąć w ażkie, lecz z punktu w idzenia zastosow ania uzasadnione założenie, że rozpatryw ane b ę d ą tylko podzbiory składające się z jednego symptomu.

W takim przypadku łączny brp m ożna obliczyć jako:

(13)

Definiowanie czynników niepew ności i nieprecyzyjności.. 43

V mp(spi) -

S n * f

X

m D \ ( s D i) - m D 2 (s D i)

____________SDi^SDi^SPi______________________

X m p \ ( s p j ) m p 2 ( s p j ) + X m o \ ( s c ) ' m o i ( s D j )

sDj^sDj*f7=1,-.. k Sdj*sji*fj=k+1..k+n

_______ m p \ ( s p i ) m p 2 ( s p i)__________________ (11)

X

mp\(sDj)‘ mDl(.SDj) spi*fj=h~-.k

_______ mp\(sDi)-mp2(,SDi)

1 +

X

mpi(sc )m p 2 (s p j)

s p j * f j = k + l k + n

X

mp\(spj)-mp2ispj)

S D , * f J = l k

X

m p \ (s p j) m p i( s p j)

S D j * f j = l - k

[i+ H

W zależności (11) w je s t w skaźnikiem obrazującym w agą sym ptom u Sc na tle pozostałych objawów. Podobnie dla reszty sym ptom ów m ożna obliczyć:

/ = Jfc

+ 1

+

n

X mp\(sc)mp2(spi)

w / \ _ SDiASDi=SPj_________________________________

_

Sat f mD SD‘ X mp\(,spj) mp2(spj)+ X mp\(sc ) mp2(spj)

S D j ^ s D j * f j- 1 k s Ą r s s d , * / j = k + [ , . . „ k + m ( 1 2 )

________________________ m p \ ( s ę ) m p 2 ( s p j ) __________________________________ m p 2 ( s p j )

X

mp\(sc) ' mp2(spj)

S D j * f j = l ~ . k

X

mp\(.spj)mp2(spj) 1 + s ą * / j = \ n

X mp\(sc )-mp2(spj) SDj*f j=k+\ k+m

r n

X

mp2(spj) 1 + - W

Z pow yższych zależności w ynika, że daleko idące założenie przynosi w ym ierne korzyści w zastosowaniu: pozw ala ocenić w pływ części sym ptom ów , np. w ydzielonych w postaci testu punktowego na całość diagnozy.

Łączenie brp m ożna, oczyw iście, rozszerzyć opierając się za każdym razem na dwóch rozkładach (np. w ynikow ym z poprzednich dw óch rozkładów oraz brp obliczonym na podstawie bazy II). T a w łaściw ość teorii D em pstera-Shafera czyni j ą niezw ykle p rzydatną we wspomaganiu diagnozy m edycznej, poniew aż pozw ala na uw zględnienie inform acji o leczonej populacji, trendów w innych populacjach oraz ogólnie przyjętych zasad diagnostycznych w ram ach jednego, spójnego procesu w nioskow ania.

4, Obliczanie pewności diagnozy

W artość funkcji zaufania dla diagnozy postaw ionej n a podstaw ie sym ptom ów obserw ow anych u pacjenta m ożna w yznaczyć w sposób pokazany na ry s.5.

(14)

44 E. Straszecka, J. Straszecka, Cz. M arcisz

objaw s t

objaw s k

z w ó z e k m lędzy objaw em a diagnozą

m.

z w ó z e k mlędzy objaw em a diagnozą

m.

objaw s n

z w ó z e k m iędzy objaw em a diagnozą

Rys.5. Obliczanie wartości funkcji zaufania do diagnozy dla objawów zaobserwowanych u pacjenta

Fig.5. Belief function values calculation for symptoms found in a patient

W artość funkcji zaufania (3) ustalaną dla diagnozy D podczas badania pacjenta bez rozpatrywania pewności i precyzyjności symptomów oblicza się jako:

B e l(D ) = I mD {S i) . ( 13) 0 / => D ) = t

W yznaczanie pew ności diagnozy w ią­

że się z uruchom ieniem reguł w nios­

kow ania, których przesłanki zgadzają się z danym i pacjenta w założonym stopniu r|. Z godnie z (13), wartość funkcji zaufania dla diagnozy D m ożna obliczyć opierając się na sym ptom ach w skazujących tę diagnozę, zgodnych z przesłankam i reguł w stopniu t], jako:

B e l(D ) = I m D( s D i) . (14)

( 4 , . = > £ > ) = t

W ten sposób gdy m aleje p , rośnie Bel, a m inim alna i m aksym alna w artość funkcji zaufania ilustrują pew ność diagnozy.

5. Przykład

Jako przykład obliczeń przeprow adzonych z w ykorzystaniem zaproponowanych czynników nieprecyzyjności i niepew ności w diagnozie m edycznej posłuży problem

Rys.6. Funkcje przynależności dla jednego z parametrów labortoryjnych

Fig.6. Membership functions for a laboratory test

Rys.7. Wartości Bel dla czterech pacjentów uzyskane dla różnych wartości progowych ą

Fig.7. Belief values for four patients and several p threshold values

(15)

Definiowanie czynników niepew ności i nieprecyzyjności.. 45

wspomagania diagnozy „zdrow ie” dla grupy 40 „zdrow ych” pacjentów , których dane zostały zebrane pod kątem chorób tarczycy. D la diagnozow anych pacjentów zbadano 10 sym ptom ów prostych i złożonych. Sform ułow ano 10 reguł diagnostycznych. S ym ptom y były zdefiniowane za p o m o c ą zbiorów rozm ytych, w yznaczonych na podstaw ie danych statystycznych dla 3 grup pacjentów : nie cierpiących na choroby tarczycy, z nadczynnością tarczycy i z n ie doczynnością tarczycy. Przykład uzyskanych funkcji przynależności pokaza­

no na rys.6 . O bliczono w artości funkcji zaufania dla r| e [0,1], zm ieniając próg stopnia zgod­

ności co 0.1. Przykładow e trendy w artości B el dla zm ieniającego się progu zgodności r| poka­

zuje rys.7. R eprezentow ana je st tu diagnoza o w ysokim stopniu zaufania, który nie zm ienia się ze zm niejszaniem się ri (pacjent B). M ożna j ą określić ja k o pewną. M niej pew na je st diagnoza dla pacjenta A, m im o iż jej w artość m aksym alna B el je s t w iększa niż w poprzednim przypadku, poniew aż w artość tę otrzym ano dla najniższego r|. D la w yższych wartości progowych zgodności by ła ona znacznie niższa. W przypadku pacjenta C w artości Bel nie potwierdzają diagnozy, poniew aż pozostają one niskie dla w szystkich t), należy przyjąć, że zaufanie do diagnozy „zdrow ie” je s t niskie. D alsze badania będ ą potrzebne, by postaw ić diagnozę dla pacjenta D, g dyż w artości zaufania zm ieniają się znacznie dla zm iany progu.

Należy zauw ażyć, że w łaściw e w spom aganie polega na obliczeniu w artości B el dla różnych diagnoz (np. nadczynność tarczycy, „zdrow ie” , niedoczynność tarczycy) i porów ­ naniu tych w artości. U m ożliw ia to popraw ne w nioskow anie w przypadku gdy znam y niewiele objawów. P rzeprow adzenie tej analizy w ykracza jed n ak poza ramy niniejszego artykułu.

Z analizy w artości m aksym alnych i średnich B el obliczonych dla 40 pacjentów w ynikają omówione dalej w nioski.

Stałą w artość B el (w szystkie objawy jednakow o precyzyjne) w zależności od progow ych wartości r)p (r| > r|p) otrzym ano dla liczby pacjentów w skazanej w drugiej kolum nie tab. 1.

Tabela 1 Tlp Liczba pacjentów ,

dla których 5e/= const

L iczba błędów w diagnozie

0.0 17 4

0.3 22 5

0.5 31 5

0.7 36 7

0.9 40 7

M ożna uw ażać, że diagnoza je st tym pew niejsza, im m niejszym w ahaniom podlegają wartości B el w zależności od progu zgodności. Z tabeli w ynika, że przyjęcie progu 0.5, często

(16)

46 E. Straszecka, J. Straszecka, Cz. M arcisz

obecnego w zastosow aniach ja k o intuicyjna w artość graniczna, zapew nia w łaściw ą jakość diagnozy. W przykładzie przy progu p > 0.5 otrzym ano stałą w artość B el dla 31 pacjentów (77.5% ).

W trzeciej kolum nie ta b .l. scharakteryzow ano rozbieżności między o p in ią lekarzy a rezultatam i obliczeń przy różnych progach r|. Jako popraw ną diagnozę przyjęto Bel > 0.2, poniew aż z jednej strony, ja k w ynika z w cześniejszych dośw iadczeń [10], wartości Bel w yliczane dla zastosow ań m edycznych generalnie s ą znacząco m niejsze od 1, a z drugiej stro­

ny w analizow anym przykładzie niższe wartości diagnozy zasadniczej były podstaw ą do dia­

gnozy konkurencyjnej. Także w przypadku analizy trafności sugestii system u m ożna uznać, że próg 0.5 je s t w łaściw ym poziom em zgodności. N ależy tutaj zauw ażyć, że dla dwóch pacjentów otrzym ano Bel = 0.0 niezależnie od r|, a więc należałoby ich dane pominąć w analizie. W ów czas 92,2% pacjentów byłoby w łaściw ie zaklasyfikow anych dla preferowanego progu T] > 0.5.

M ożna w ięc przyjąć, że zaproponowane czynniki pew ności i precyzyjności we właściwy sposób o p isu ją proces diagnozy.

6. Wnioski

W spom aganie diagnozy m edycznej w ym aga uw zględnienia czynników pew ności i precy­

zyjności. Z aproponow ana m etoda opisu czynników pew ności z zastosow aniem teorii D em pstera-Shafera um ożliw ia zgodny z intuicją i zrozum iały dla lekarzy sposób m odelow ania zw iązku m iędzy objaw em a diagnozą oraz pew ności diagnozy. Pozw ala ona także na w ykorzystanie praw ie każdej dostępnej inform acji wraz z odpow iednim opisem jej jakości (pew ności). Z astosow anie bazow ego rozkładu praw dopodobieństw a zamiast praw dopodobieństw a w arunkow ego, a co za tym idzie, w yelim inow anie z obliczeń praw dopodobieństw a a priori P(D) je st w ażną korzyścią płynącą z zastosow ania tej metody.

M ożliw ość łączenia inform acji pochodzącej z różnych źródeł, a zwłaszcza rozpatrzenie danych specyficznej populacji na tle inform acji literaturow ych czyni tę m etodę istotnie p rzydatną w e w spom aganiu diagnozy m edycznej. N ie bez znaczenia je s t rów nież łatw ość jej im plem entacji w postaci program u kom puterowego.

O prócz czynników pew ności w diagnozie m edycznej w ażna je s t także precyzyjność form ułow ania sym ptom ów . Isto tn ą zaletą je st m ożliw ość zastosow ania zbiorów rozm ytych w procesie w spom agania diagnozy medycznej. Pozw ala to m.in. na w ykorzystanie mało licznych danych, które nie m o g ą być źródłem statystycznie istotnego opisu lub podstaw ą

(17)

Definiowanie czynników niepew ności i nieprecyzyjności.. 47

uczenia sieci neuronow ej. Z aproponow any w niniejszej pracy sposób jednolitej interpretacji objawów „p recyzyjnych”, „skalow anych” i „rozm ytych” przy w prow adzonym pojęciu progu zgodności pozw ala zobiektyw izow ać jakość diagnozy bez kom plikacji obliczeń i przy zachowaniu w artości funkcji zaufania jako m iary jej trafności.

Zaprezentow ana m etoda m oże być przydatna w autom atycznym w spom aganiu diagnozy medycznej dla problem ów cechujących się krótkim , łańcuchem w nioskow ania (sym ptom (y)

=> diagnoza), licznym i param etram i m edycznym i w ystępującym i w e w nioskow aniu oraz koniecznością łączenia inform acji pochodzących z przynajm niej dw óch źródeł. M oże być użyteczną altern aty w ą w obec skom plikow anych system ów ekspertow ych.

Literatura

1. Akay M.: F rom the Guest Editor, IEEE Engineering in M edicine and Biology, A pplication o f F uzzy Logic, Vol. 13 N o 5 ss. 665-666, N ov/D ec 1994.

2. Bartelheim er H., Jones A. (red.): K liniczna diagnostyka czynnościowa. PZW L, W arszawa 1972, ss. 20-21.

3. Bastian A.: Identifying fuzzy rule-based m odels using soft com puting, Proc. E U F IT ’98, ss. 589-593.

4. Bole L., B orodziew icz W., W ójcik M.: Podstawy przetwarzania informacji niepewnej niepełnej. PW N , W arszaw a 1991

5. Gordon J, Shortliffe E. H.: The Dempster-Shafer Theory o f Evidence. Rule -Based Expert Systems. Buchanan B.G ., Shortliffe E.H. edts, Addison Wesley, 1984, ss.272-292.

6. Górnicki T.: Choroby tarczycy, PZW L, W arszaw a 1988, ss. 123-138.

7. Iliad, W idows-B ased Diagnostic D ecision Support Tools for Internal M edicine, User Manual. A pplied M edical Inform atics, M ay 1994.

8. Schuerz M., H ip f G., G rabner G.: A n assessm ent o f different approaches to defining fuzzy m em bership functions sem i-autom atically, in K.-P. Adlassnig; Fuzzy diagnostic and therapeutic D ecision Support Proc. ERU D IT-W orkshop, A ustia, M ay 2000, ss. 129-137.

9. Shortliffe E.H.: C om puter-Based M edical Consultations: MYCIN. Elsevier, N ew York- O xford-Am sterdam 1976.

10. Straszecka E., Straszecka J.: Com puterization o f score tests in medicine - problem s and possible solution. M edical & Biological Engineering & Com puting Vol. 37, Sup. 2, Part I (Proc. E M B E C ’99), pp. 752-753.

(18)

48 E. Straszecka, J. Straszecka, Cz. M arcisz

11. S zczepaniak P. S., L isboa P.J.G., K acprzyk J. (edts): Fuzzy system s in m edicine, Physica- Verlag, H eidelberg 2000, ss. 32-47.

12. T.Takagi, M .Sugeno: Fuzzy Identification o f System s and Its A pplications to M odeling and Control. IEE E Trans, on System s, M an & Cybernetics, V ol.SM C -15, N o .l, pp. 116-

132: Jan./Feb. 1985.

13. W ierzchoń S.T.: M etody reprezentacji i przetw arzania informacji niepewnej w ramach teorii D em pstera-Shafera. Instytut Podstaw Informatyki PAN, 1996.

14. W ydrzyński L.: IN FA R C T E ST -Prognostyczny System Ekspertowy, podręcznik użytkow­

nika. PO LG A T, Polska, 1990.

Recenzent: D r hab. Jó z ef Drewniak

Abstract

The paper aim s at unifying know ledge and certainty description in m edical diagnosis support system s and preserving intuitively right form the point o f view o f a user interpretation o f a predicate and a conclusion o f a diagnostic rule.

M ethods o f sym ptom are imprecision and uncertainty o f dependence betw een a symptom and a diagnosis defining are proposed in the paper. A predicate and a conclusion o f a diagnostic rule are defined and an interpretation o f the predicate imprecision, despite o f its determining as a fuzzy set, a scale or a crisp value 0 or 1 is given. Possibilities and lim itations in fuzzy set m em bership function defining in medical problem s are commented.

A m ethod o f inference based on Dempster-Shafer theory o f evidence, w hich allows using a variety o f inform ation: heuristic, statistic and found on diagnostic algorithms transformation, is presented. Standards for basic probability assignm ent determination in Dem pster-Shafer theory as well as com bining inform ation com ing form different sources are proposed. Results of diagnosis support for patients at thyroid gland diseases risk are shown as an example. Im portant advantages o f the proposed m ethod medical diagnosis support and some limitations in its application are pointed out.

Cytaty

Powiązane dokumenty

Również sekw encje tRNA archebakterii za sa ­ dniczo różnią się od sekw encji tRNA z innych organizm ów (np. trójka iJnpCm, zam iast trójki TtyC* w ramieniu

Z pom iędzy różnych teoryj zdaje się być najbliższą praw dy podana przez M otturę, inżyniera kopalń we W łoszech, a objaśniająca pow stanie siarki reakcyam i

Poniew aż głów nie dorosłe ju ż ow ady dobrze niemi w ładają, podlegają więc napadom po najw iększej części m łode mszyce, d ojrzałe zaś, znoszące ja jk a

w iadają one tyluż wrylewom skały dyjam en- tonośnćj, różniącym się zarówno pow ierz­.. chownością, jak o też bogactwem i

U 150 pozostałych osób, leczonych albo leczących się obecnie, w szystko odbyw a się dotychczas tak samo, ja k u 200 poprzednich.. O pierając się na

Uktad wedtug wynalazku sktada si$ z co najmniej dwoch multiplekserow, z ktorych pierwszy ma trzy typy wejsc, a mianowicie wejscia sygnatu na zywo, wejscia o okreslonej

[r]

Do łańcucha karpackiego należą najwyższe góry w Polsce: Tatry, ciągnące się około 60 kilometrów wzdłuż od zachodu na wschód, a w szerz liczą około 20