Jolanta Cieśla - 2. Źródła informacji i wyszukiwanie 91

P

ewnego razu. . .

Po szkoleniu dla doktorantów w bibliotece medycznej wśród uczestników przepro-wadzono ankietę oceniającą kurs. O części szkolenia dotyczącej wyszukiwania informa-cji studenci wypowiedzieli się dość negatywnie. Opinie brzmiały: nie rozumiem, po co miałbym się tego uczyć, wyszukuję przez słowa kluczowe, szukam ich w tekście i to mi wystarcza  inne sposoby wyszukiwania są zbyt skomplikowane. Szkolący zauwa-żył też, że pomimo wykładu na temat konstrukcji, zakresu i funkcji baz, studenci nadal traktują bibliograﬁczne bazy danych jak wyszukiwarki internetowe. Koordynatorzy szko-leń postanawiają więc przed następnym kursem zmienić zawartość i metody stosowane w nauczaniu technik wyszukiwania w bazach, tak aby obudzić zainteresowanie doktoran-tów i lepiej wykazać korzyści płynące z nabycia głębszej wiedzy o bazach i technikach wyszukiwania.

Wprowadzenie

Język w każdej dziedzinie nauki jest podstawą wymiany myśli i dokonań i musi spełniać wymogi precyzyjnego opisu zjawisk. Stosowanie jednoznacznej terminologii jest nie-zbędnym elementem przekazu naukowego. Wraz z rozwojem nauk medycznych i sztucz-nej inteligencji pojawiają się coraz obszerniejsze słowniki, klasyﬁkacje, tezaurusy, języki informacyjno-wyszukiwawcze, ontologie. Szczególnie w dziedzinie tak obszernej i szybko rozwijającej się jak medycyna stosowanie precyzyjnego słownictwa ma ogromne znacze-nie w komunikacji, opracowaniu zasobów i dostępie do nich. Przeszukiwaznacze-nie rozległych

94 Moduł 2: Źródła informacji i wyszukiwanie

baz danych, notujących dziś miliony publikacji, wymaga od użytkownika stosowania zaawansowanych narzędzi i umiejętności, które pozwalają zbudować jednoznaczne za-pytanie tak, by uzyskać relewantny wynik. Przekazanie wiedzy na temat terminologii lub nauczenie użytkowników wykorzystania słownictwa kontrolowanego nie jest zadaniem prostym.

Niniejszy rozdział zawiera krótkie omówienie rozwoju słownictwa w naukach biome-dycznych, przegląd najczęściej wykorzystywanych klasyﬁkacji oraz opis cech i funkcji słownictwa kontrolowanego. Znajomość tych zagadnień jest dla bibliotekarza uczącego umiejętności informacyjnych niezbędna, zwłaszcza w trakcie szkoleń dotyczących prze-szukiwania baz danych. W tym przypadku kurs powinien objąć co najmniej omówienie roli słownictwa kontrolowanego w procesie wyszukiwania informacji, jego strukturę i zastoso-wania oraz ćwiczenia praktyczne z wyszukizastoso-wania w wybranych bazach danych. Rzadziej będzie to temat oddzielnego szkolenia. W takim przypadku, a także przed bardziej wyma-gającym audytorium (np. składającym się z naukowców), kurs można wzbogacić o wstęp historyczny, przegląd klasyﬁkacji medycznych i informację o trendach w rozwoju termi-nologii. Dobór słowników i baz, jak również stosowanych metod nauczania (zob. Moduł 1.), zależy od uczestników szkolenia i czasu, jaki możemy przeznaczyć na zagadnienia dotyczące terminologii.

2.1.1. Zagadnienia ogólne

Termin a pojęcie

Pojęcie to odpowiednik myślowy przedmiotu  idei, zjawiska, rzeczy. Kiedy pojęcie zo-stanie zdeﬁniowane i nazwane powstaje termin. Termin naukowy można określić jako wyraz lub zestawienie wyrazów o ustalonym umownie precyzyjnym znaczeniu, które jed-noznacznie odzwierciedla pojęcie z obszaru danej dziedziny. Jedno pojęcie może być wyrażone przy pomocy wielu terminów synonimicznych lub bliskoznacznych. Formuło-wanie terminów naukowych powinno uwzględniać kilka uniwersalnych zasad, np. jed-noznaczności i zwięzłości, powszechności (w znaczeniu częstości stosowania, szerokie-go upowszechnienia), poprawności językowej, systematyczneszerokie-go układu (hierarchiczności) (Cimino, 1998). Pojęcia zwykle  często lokalnie  opisywane są przy pomocy jednego preferowanego terminu, podczas gdy pozostałe terminy funkcjonują rzadziej, jako syno-nimy. Tak więc pojęcie może być identyﬁkowane przez grupę terminów, z których każdy może być zastąpiony innym z tej samej grupy i nie zmieni to sensu informacji. Trzeba za-uważyć, że termin preferowany nie musi występować w tej roli na zawsze, często zdarza się, że wypiera go na przykład nazwa krótsza, bardziej precyzyjna lub o uwspółcześnionej pisowni.

Przykład

„A complex disorder characterized by infertility, hirsutism, obesity and various menstrual di-sturbances such as oligomenorrhea; amenorrhea; anovulation” (MeSH scope note)  pojęcie to jest reprezentowane przez terminy:

Polycystic Ovary Syndrome (hasło MeSH od 1985 do dziś) Sclerocystic Ovarian Degeneration

Sclerocystic Ovaries

Sclerocystic Ovary Syndrome

2.1. Pojęcia, terminologia i słownictwo kontrolowane w naukach biomedycznych... 95 Stein-Leventhal Syndrome

W latach 1963–84 przyjętym hasłem MeSH była nazwa Stein-Leventhal Syndrome.

Krótkie przedstawienie rozwoju terminologii medycznej

Język medycyny zachodniej zaczął kształtować się w Grecji, to stamtąd pochodzą najstar-sze znane nam źródła pisane: dzieła Hipokratesa z przełomu V i IV w. p.n.e. Dziedzictwo, jakie przejęliśmy od Greków, po dzień dzisiejszy jest obecne w nazewnictwie medycznym w większości języków nowożytnych:

• kateter (sonda, cewnik, gr. katheter od kathienai  spuszczać)

• cholesterol (chole, cholos  żółć, także gniew, stąd choleryk i melancholia)

• diagnoza (gr. diagnostikos  umiejący rozpoznać, diagnosis  wyróżnianie)

• dializa (gr. dialyien  rozbić, rozpuścić)

Po zdobyciu dominacji przez Rzymian, którzy nie rozwinęli tak dobrze medycyny, greckie terminy medyczne nadal funkcjonowały, ponieważ dla wielu z nich nie istniały odpo-wiedniki łacińskie. Lekarzami wśród Rzymian nadal często byli Grecy. Jednym z nich był Galen, władający łaciną, piszący po grecku. Współcześnie z nim działał Juliusz Pollux, którego słownik nazw anatomicznych, wydany ponownie u progu XVI stulecia, wywarł wpływ na ówczesnych uczonych. Z czasem grecka terminologia ulegała latynizacji, do greckiego rdzenia dodawano łacińskie końcówki. W dziele rzymskiego uczonego Cel-sjusza De medicina (Aulus Cornelius Celsus) pojawia się wiele nazw anatomicznych, które autor przetłumaczył dosłownie z greki. Wpływ medycyny arabskiej i hebrajskiej zaznacza się w terminologii nieporównanie słabiej. W wiekach średnich łacina staje się lingua franca nie tylko w medycynie, lecz ogólnie w komunikacji międzynarodowej. Prace medyczne w całości po łacinie ukazują się w Europie nawet w wieku XIX. Terminologia medyczna, przebywszy drogę często od greki poprzez łacinę do języków narodowych, różnicuje się zgodnie z regułami danego języka, ale ogromna liczba nazw zachowuje pierwotny rdzeń. Gdy dziś ukażą się publikacje pod tytułem Hypoglycemia lub Neuroﬁ-bromatoses  tytuły będą zrozumiałe w ogromnej części świata. Terminologia stale się rozwija, lecz nadal czerpie z greki, nawet gdy chodzi o nazwanie nowoczesnej techniki (np. przy użyciu suﬁksów: scopy od gr. skopein  oglądać lub graphy od gr. graphein  rysować, pisać). Różnica jest taka, że dziś terminologia rozpowszechnia się za pośred-nictwem języka angielskiego, który w naszych czasach jest nowym lingua franca.

Uwaga

W języku polskim naukowa terminologia medyczna zaczęła się rodzić w XIX w. Puryści językowi ścierali się ze zwolennikami utworzenia terminologii międzynarodowej. Częściowo polska terminologia powstawała w sposób arbitralny poprzez publikację słowników medycznych. Podobnie jak w innych językach słowiańskich przyjmowano wiele zapożyczeń lub w obieg wchodził termin będący tłumaczeniem nazwy obcej (kalka, np. Empty sella syndrome). Zaadaptowane wyrażenia to często nazwy o rdzeniu greckim lub łacińskim (Zieliński, 2004).

Uwaga

W sieci dostępne są kursy do nauki podstawowej angielskiej terminologii medycznej, np.:

http://www.free-ed.net/sweethaven/MedTech/MedTerm/default.asp http://www.dmu.edu/medterms/

96 Moduł 2: Źródła informacji i wyszukiwanie

Przegląd klasyﬁkacji medycznych

Próby usystematyzowania terminologii medycznej zaczęto podejmować w XVII w. Za pioniera klasyﬁkacji chorób uważa się Johna Graunta. Badał on śmiertelność wśród londyńskich dzieci i do celów statystycznych stworzył prosty podział przyczyn zgonów wyodrębniając zaledwie kilkanaście kategorii (Chute, 2000). Wiek XVIII przyniósł próby systematycznego układu chorób w dziełach Linneusza (Linnaeus, Genera morborum), Sauvagesa (Nosologia methodica), Williama Cullena (Synopsis nosologiae methodicae).

Jednak należne jej miejsce i zainteresowanie klasyﬁkacja chorób znalazła dopiero w XIX w. dzięki Williamowi Farr, statystykowi. W 1839 r. podkreślał: „The nomenclature is of as much importance in this department of inquiry [medical science] as weights and measures in the physical sciences, and should be settled without delay”(cyt. za History of the development of the ICD).

Podejście zaproponowane przez Farra (podział chorób na pięć grup: epidemiczne, ogólne, lokalne, rozwojowe i choroby powstałe bezpośrednio w wyniku przemocy) stało się punktem wyjścia międzynarodowej listy przyczyn zgonów (International List of Cau-ses of Death), klasyﬁkacji przygotowanej przez Jacquesa Bertillona i zaprezentowanej w 1893 r. Wkrótce też International Statistical Institute przyjął rezolucję, w której reko-mendował stosowanie tej klasyﬁkacji w instytucjach statystycznych w Ameryce Północ-nej i w Europie. Postanowiono też dokonywać rewizji listy co 10 lat zgodnie z postępem medycyny.

Za przełom w utworzeniu klasyﬁkacji międzynarodowej o rzeczywistym i wszech-stronnym wykorzystaniu można uznać rok 1948r., gdy po poprawkach i konsultacjach klasyﬁkacja ta została przyjęta jako International Classiﬁcation of Diseases and Cau-ses of Death-6th Revision. Obecnie obowiązuje ICD-Rewizja 10. ICD długo była jedyną międzynarodową klasyﬁkacją.

Nowa era

Wraz z rozwojem komputeryzacji od lat 50. XX w. podejmowano próby przystosowania nomenklatury medycznej do automatycznego gromadzenia i przetwarzania danych. Kla-syﬁkacje medyczne zaczęły też znajdować zastosowanie w wielu ważnych obszarach, m.in.:

1) w administracji i ﬁnansowaniu ochrony zdrowia, gdzie płatnicy usług medycznych wymagają stosowania określonego systemu kodowania, by na tej podstawie rozliczać się ze świadczeniodawcą;

2) w gromadzeniu i wymianie danych w epidemiologii i statystyce zdrowotnej;

3) w tworzeniu dokumentacji medycznej;

4) w systemach wspomagania decyzji klinicznych (Rosenbloom, 2006);

5) w bibliotekach, które wykorzystują klasyﬁkacje do organizowania zbiorów.

Niektóre systemy klasyﬁkacji mają zasięg międzynarodowy, inne zastosowanie tylko lokalne. Poniżej wymieniono tylko kilka z nich.

• ICD-10 wraz z rodziną towarzyszących klasyﬁkacji pozwala kodować głównie roz-poznania chorób. Służy do opracowywania analiz statystycznych w odniesieniu do zdrowia populacji, porównywania danych, monitorowania zachorowalności, jest również stosowana do analiz ﬁnansowych w ochronie zdrowia.

• ICD-9-Clinical Modiﬁcations było dziełem współpracy środowisk medycznych, agend rządowych i płatników. Umożliwia ona kodowanie procedur medycznych:

2.1. Pojęcia, terminologia i słownictwo kontrolowane w naukach biomedycznych... 97 przedmiotem kodowania jest tu czynność medyczna (nie jednostka chorobowa) wy-konana wobec pacjenta w trakcie procesu diagnostycznego lub terapeutycznego.

• ICPC (International Classiﬁcation for Primary Care) utworzona przez międzyna-rodowe stowarzyszenie lekarzy rodzinnych. ICPC jest mniej szczegółowa niż ICD, pozwala jednak zakodować powód zgłoszenia się pacjenta do lekarza opieki pod-stawowej.

• SNOMED (Systematized Nomenclature of Human and Veterinary Medicine), roz-wijana przez College of American Pathologists. W tym systemie każdą chorobę opisuje się w wielu wymiarach, np. lokalizacja stanu patologicznego, jednostka morfologiczna, czynniki etiologiczne, stosowane procedury, uwarunkowania socjo-logiczne. Dzięki temu można zakodować wszystkie składowe choroby oraz leczenia wraz z wykonanymi procedurami, np. na potrzeby elektronicznej historii choroby danego pacjenta.

Niektóre klasyﬁkacje są standaryzowanym narzędziem rozliczania kosztów leczenia, np.

• DRG (Diagnosis Related Groups). Ta klasyﬁkacja opiera się na ICD-9-Clinical Modiﬁcations i umożliwia przypisanie pacjenta do określonej grupy diagnostycz-nej, jednorodnej w odniesieniu do stanu pacjenta i zastosowanych procedur dia-gnostycznych i leczniczych, a w ten sposób pozwala określić koszt leczenia tego pacjenta.

Przykłady klasyﬁkacji specjalistycznych to:

• TNM (Tumor, Nodus, Metastasis) stosowana w onkologii;

• UMDNS (Universal Medical Devices Nomenclature System)  klasyﬁkacja sprzę-tu medycznego;

• LOINC (Logical Observation Identiﬁers Names and Codes)  dla medycyny labo-ratoryjnej;

• ICNP (International Classiﬁcation for Nursing Practice)  klasyﬁkacja praktyki pielęgniarskiej;

• DSM-IV  rozpowszechniony w psychiatrii Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition  to nie typowa klasyﬁkacja, lecz raczej źródło kryteriów diagnostycznych.

W dziedzinie zdrowia publicznego brak jednej wiodącej terminologii, choć istnieją liczne specjalistyczne lub obejmujące całą dziedzinę tezaurusy (Niedźwiedzka, 2008).

Uwaga

W Polsce wykorzystuje się klasyﬁkacje: ICD-10 i ICD-9-CM (dla procedur), system Jednorodnych Grup Pacjentów wzorowany na DRG (w wersji brytyjskiej HRG – Healthcare Reso-urce Groups) do rozliczeń świadczeniodawców z NFZ. Polska przystąpiła do projektu Euro-DRG, którego celem jest wdrożenie jednolitego systemu jednorodnych grup pacjentów dla całej Unii Europejskiej z uwzględnieniem kontekstu w poszczególnych krajach. Zakończenie projektu prze-widuje się na koniec roku 2011. Klinicyści stosują klasyﬁkację TNM w diagnostyce onkologicznej.

Klasyﬁkacja DSM-IV ma charakter pomocniczy w diagnostyce psychiatrycznej. Na język polski przetłumaczono m.in. SNOMED (wyd. polskie 2001 r.) i DC:0-3R (Diagnostic Classiﬁcation of Mental Health And Development Disorders Of Infancy and Early Childhood  Revised Edition, wyd. polskie 2007 r.). SNOMED znalazł zastosowanie np. w polsko-norweskim projekcie KARDIO-NET, w wyniku którego wdrożono (2010 r.) mobilny system zbierania i transmisji danych pacjentów kardiologicznych.

98 Moduł 2: Źródła informacji i wyszukiwanie

Ontologie

Różne systemy kodowania służą różnym celom i różnym grupom odbiorców. Stworze-nie systemu, który łączyłby różnorodne funkcje to cel ontologii medycznych. Co to jest ontologia? W informatyce ma nieco inne znaczenie niż w ﬁlozoﬁi, choć również zaj-muje się opisem struktury rzeczywistości: oznacza model wybranego wycinka rzeczy-wistości lub inaczej mówiąc sformalizowany opis pewnej domeny świata rzeczywistego, dokonany przy pomocy zbioru pojęć z ich atrybutami oraz relacji między nimi. Poję-cia i relacje muszą być jednoznacznie zdeﬁniowane i możliwe do identyﬁkacji przez systemy informatyczne. Ontologie opisują złożone zależności pomiędzy pojęciami, czer-piąc z rozproszonych źródeł wiedzy. Obejmują wiedzę na temat fragmentu rzeczywistości ustrukturyzowaną w sposób pozwalający na wnioskowanie i wielokrotne wykorzystanie tej wiedzy. Sposobem reprezentacji wiedzy w ontologiach są mapy pojęć (topic maps) lub sieci semantyczne (semantic web). Sieć semantyczna zbudowana jest z grafów, które odzwierciedlają różnorodne powiązania znaczeniowe między pojęciami, np. nadrzędność, podrzędność, synonimię, cechy, konotacje (Robu, 2006). Zob. rozdział 2.3.5.

Przykład

Ontologia instytucji obejmie bazę pracowników, zależności między nimi i ich kompetencje, dokumenty, petentów, procedury, ustaloną terminologię. Przykładem praktycznego podejścia on-tologicznego w medycynie jest ontologia mammograﬁi (Podsiadły-Marczykowska, 2005). Celem tej ontologii było ograniczenie dużej zmienności interpretacji wyników (subiektywności) badania mammograﬁcznego. Dla tego wąskiego wycinka radiologii stworzono model, który wymagał akwi-zycji specjalistycznej wiedzy, usystematyzowania i zdeﬁniowania pojęć istotnych w tej dziedzinie.

Opracowano także specjalny interfejs do redagowania raportów mammograﬁcznych.

Rozległą ontologią jest OBO Foundry (Open Biomedical Ontologies) i powiązana z nią Gene Ontology. Ontologią jest UMLS (Uniﬁed Medical Language System)  wieloletni projekt National Library of Medicine (Bethesda, USA), którego celem jest gromadzenie i rozwijanie semantycznego zasobu nauk biomedycznych w powiązaniu z zasobami informacji. UMLS obejmuje Metathesaurus, na który składają się terminy z ponad stu klasyﬁkacji i nomenklatur, leksykon terminów biomedycznych  Specialist, sieć semantyczną, mapę źródeł informacji o zakresie, lokalizacji i dostępie do baz da-nych, wspomagającą użytkownika w procesie wyszukiwania. Znajdujemy tu dwie główne hierarchie: obiektów (Physical Object and Conceptual Entity) oraz zdarzeń (Event).

Podobne cele zakłada europejski projekt GALEN (Generalised Architecture for Lan-guages, Encyclopaedias and Nomenclatures in Medicine). Projekt GALEN podejmuje następujące wyzwania:

• pogodzenie różnorodności potrzeb w zakresie terminologii z wymogami wymiany informacji;

• uniknięcie lawinowo rosnących kosztów dostosowywania wariantów terminologii;

• ułatwienie zastosowań w medycynie klinicznej;

• wypełnienie luki między szczegółami wymaganymi w opiece nad pacjentem i uogól-nieniami wymaganymi w statystyce, zarządzaniu i nauce;

• dostarczenie wielojęzycznych systemów, które zachowają zasadnicze znaczenie i reprezentację informacji (GALEN, www.openclinical.org/prj galen.html).

GALEN zaliczany jest do trzeciej generacji terminologii, zrywa bowiem z podejściem podawania listy gotowych kodów, jak np. w ICD. W zamian za to, dostarcza model, który

2.1. Pojęcia, terminologia i słownictwo kontrolowane w naukach biomedycznych... 99 bazuje na logicznych kryteriach łączenia prostych pojęć w złożone. Klasyﬁkacja pojęć odbywa się automatycznie.

Ontologie i sieci semantyczne to inny sposób reprezentowania wiedzy i wyszukiwa-nia informacji w rozległych zasobach. Są potrzebne zwłaszcza w dziedzinie tak złożonej jak medycyna, więc są wciąż udoskonalane i prawdopodobnie będą wszechstronnie wy-korzystywane (Bodenreider, 2008).

Uwaga

W skład Metatezaurusa UMLS wchodzi już kilka wersji językowych (tłumaczeń) MeSH:

francuskie, niemieckie, włoskie, japońskie, portugalskie, rosyjskie i hiszpańskie. Także w niektó-rych innych krajach istnieją tłumaczenia MeSH, szeroko stosowane w bazach i katalogach, choć nie wchodzą one jeszcze w skład UMLS, np. polska wersja MeSH. Inne kraje, jak Norwegia, są w trakcie opracowywania własnego tłumaczenia. NLM stworzył też narzędzie BabelMeSH (http://babelmesh.nlm.nih.gov/), które umożliwia przeszukiwanie bazy Medline/PubMed według terminologii w 11 językach (arabski, chiński, angielski, francuski, niemiecki, włoski, japoński, ko-reański, portugalski, rosyjski i hiszpański).

2.1.2.

W dokumencie 2. Źródła informacji i wyszukiwanie 91 (Stron 94-100)