P
ewnego razu. . .Po szkoleniu dla doktorantów w bibliotece medycznej wśród uczestników przepro-wadzono ankietę oceniającą kurs. O części szkolenia dotyczącej wyszukiwania informa-cji studenci wypowiedzieli się dość negatywnie. Opinie brzmiały: nie rozumiem, po co miałbym się tego uczyć, wyszukuję przez słowa kluczowe, szukam ich w tekście i to mi wystarcza inne sposoby wyszukiwania są zbyt skomplikowane. Szkolący zauwa-żył też, że pomimo wykładu na temat konstrukcji, zakresu i funkcji baz, studenci nadal traktują bibliograficzne bazy danych jak wyszukiwarki internetowe. Koordynatorzy szko-leń postanawiają więc przed następnym kursem zmienić zawartość i metody stosowane w nauczaniu technik wyszukiwania w bazach, tak aby obudzić zainteresowanie doktoran-tów i lepiej wykazać korzyści płynące z nabycia głębszej wiedzy o bazach i technikach wyszukiwania.
Wprowadzenie
Język w każdej dziedzinie nauki jest podstawą wymiany myśli i dokonań i musi spełniać wymogi precyzyjnego opisu zjawisk. Stosowanie jednoznacznej terminologii jest nie-zbędnym elementem przekazu naukowego. Wraz z rozwojem nauk medycznych i sztucz-nej inteligencji pojawiają się coraz obszerniejsze słowniki, klasyfikacje, tezaurusy, języki informacyjno-wyszukiwawcze, ontologie. Szczególnie w dziedzinie tak obszernej i szybko rozwijającej się jak medycyna stosowanie precyzyjnego słownictwa ma ogromne znacze-nie w komunikacji, opracowaniu zasobów i dostępie do nich. Przeszukiwaznacze-nie rozległych
93
94 Moduł 2: Źródła informacji i wyszukiwanie
baz danych, notujących dziś miliony publikacji, wymaga od użytkownika stosowania zaawansowanych narzędzi i umiejętności, które pozwalają zbudować jednoznaczne za-pytanie tak, by uzyskać relewantny wynik. Przekazanie wiedzy na temat terminologii lub nauczenie użytkowników wykorzystania słownictwa kontrolowanego nie jest zadaniem prostym.
Niniejszy rozdział zawiera krótkie omówienie rozwoju słownictwa w naukach biome-dycznych, przegląd najczęściej wykorzystywanych klasyfikacji oraz opis cech i funkcji słownictwa kontrolowanego. Znajomość tych zagadnień jest dla bibliotekarza uczącego umiejętności informacyjnych niezbędna, zwłaszcza w trakcie szkoleń dotyczących prze-szukiwania baz danych. W tym przypadku kurs powinien objąć co najmniej omówienie roli słownictwa kontrolowanego w procesie wyszukiwania informacji, jego strukturę i zastoso-wania oraz ćwiczenia praktyczne z wyszukizastoso-wania w wybranych bazach danych. Rzadziej będzie to temat oddzielnego szkolenia. W takim przypadku, a także przed bardziej wyma-gającym audytorium (np. składającym się z naukowców), kurs można wzbogacić o wstęp historyczny, przegląd klasyfikacji medycznych i informację o trendach w rozwoju termi-nologii. Dobór słowników i baz, jak również stosowanych metod nauczania (zob. Moduł 1.), zależy od uczestników szkolenia i czasu, jaki możemy przeznaczyć na zagadnienia dotyczące terminologii.
2.1.1.
Zagadnienia ogólne
Termin a pojęcie
Pojęcie to odpowiednik myślowy przedmiotu idei, zjawiska, rzeczy. Kiedy pojęcie zo-stanie zdefiniowane i nazwane powstaje termin. Termin naukowy można określić jako wyraz lub zestawienie wyrazów o ustalonym umownie precyzyjnym znaczeniu, które jed-noznacznie odzwierciedla pojęcie z obszaru danej dziedziny. Jedno pojęcie może być wyrażone przy pomocy wielu terminów synonimicznych lub bliskoznacznych. Formuło-wanie terminów naukowych powinno uwzględniać kilka uniwersalnych zasad, np. jed-noznaczności i zwięzłości, powszechności (w znaczeniu częstości stosowania, szerokie-go upowszechnienia), poprawności językowej, systematyczneszerokie-go układu (hierarchiczności) (Cimino, 1998). Pojęcia zwykle często lokalnie opisywane są przy pomocy jednego preferowanego terminu, podczas gdy pozostałe terminy funkcjonują rzadziej, jako syno-nimy. Tak więc pojęcie może być identyfikowane przez grupę terminów, z których każdy może być zastąpiony innym z tej samej grupy i nie zmieni to sensu informacji. Trzeba za-uważyć, że termin preferowany nie musi występować w tej roli na zawsze, często zdarza się, że wypiera go na przykład nazwa krótsza, bardziej precyzyjna lub o uwspółcześnionej pisowni.
Przykład
„A complex disorder characterized by infertility, hirsutism, obesity and various menstrual di-sturbances such as oligomenorrhea; amenorrhea; anovulation” (MeSH scope note) pojęcie to jest reprezentowane przez terminy:
Polycystic Ovary Syndrome (hasło MeSH od 1985 do dziś) Sclerocystic Ovarian Degeneration
Sclerocystic Ovaries
Sclerocystic Ovary Syndrome
2.1. Pojęcia, terminologia i słownictwo kontrolowane w naukach biomedycznych... 95 Stein-Leventhal Syndrome
W latach 1963–84 przyjętym hasłem MeSH była nazwa Stein-Leventhal Syndrome.
Krótkie przedstawienie rozwoju terminologii medycznej
Język medycyny zachodniej zaczął kształtować się w Grecji, to stamtąd pochodzą najstar-sze znane nam źródła pisane: dzieła Hipokratesa z przełomu V i IV w. p.n.e. Dziedzictwo, jakie przejęliśmy od Greków, po dzień dzisiejszy jest obecne w nazewnictwie medycznym w większości języków nowożytnych:
• kateter (sonda, cewnik, gr. katheter od kathienai spuszczać)
• cholesterol (chole, cholos żółć, także gniew, stąd choleryk i melancholia)
• diagnoza (gr. diagnostikos umiejący rozpoznać, diagnosis wyróżnianie)
• dializa (gr. dialyien rozbić, rozpuścić)
Po zdobyciu dominacji przez Rzymian, którzy nie rozwinęli tak dobrze medycyny, greckie terminy medyczne nadal funkcjonowały, ponieważ dla wielu z nich nie istniały odpo-wiedniki łacińskie. Lekarzami wśród Rzymian nadal często byli Grecy. Jednym z nich był Galen, władający łaciną, piszący po grecku. Współcześnie z nim działał Juliusz Pollux, którego słownik nazw anatomicznych, wydany ponownie u progu XVI stulecia, wywarł wpływ na ówczesnych uczonych. Z czasem grecka terminologia ulegała latynizacji, do greckiego rdzenia dodawano łacińskie końcówki. W dziele rzymskiego uczonego Cel-sjusza De medicina (Aulus Cornelius Celsus) pojawia się wiele nazw anatomicznych, które autor przetłumaczył dosłownie z greki. Wpływ medycyny arabskiej i hebrajskiej zaznacza się w terminologii nieporównanie słabiej. W wiekach średnich łacina staje się lingua franca nie tylko w medycynie, lecz ogólnie w komunikacji międzynarodowej. Prace medyczne w całości po łacinie ukazują się w Europie nawet w wieku XIX. Terminologia medyczna, przebywszy drogę często od greki poprzez łacinę do języków narodowych, różnicuje się zgodnie z regułami danego języka, ale ogromna liczba nazw zachowuje pierwotny rdzeń. Gdy dziś ukażą się publikacje pod tytułem Hypoglycemia lub Neurofi-bromatoses tytuły będą zrozumiałe w ogromnej części świata. Terminologia stale się rozwija, lecz nadal czerpie z greki, nawet gdy chodzi o nazwanie nowoczesnej techniki (np. przy użyciu sufiksów: scopy od gr. skopein oglądać lub graphy od gr. graphein rysować, pisać). Różnica jest taka, że dziś terminologia rozpowszechnia się za pośred-nictwem języka angielskiego, który w naszych czasach jest nowym lingua franca.
Uwaga
W języku polskim naukowa terminologia medyczna zaczęła się rodzić w XIX w. Puryści językowi ścierali się ze zwolennikami utworzenia terminologii międzynarodowej. Częściowo polska terminologia powstawała w sposób arbitralny poprzez publikację słowników medycznych. Podobnie jak w innych językach słowiańskich przyjmowano wiele zapożyczeń lub w obieg wchodził termin będący tłumaczeniem nazwy obcej (kalka, np. Empty sella syndrome). Zaadaptowane wyrażenia to często nazwy o rdzeniu greckim lub łacińskim (Zieliński, 2004).
Uwaga
W sieci dostępne są kursy do nauki podstawowej angielskiej terminologii medycznej, np.:
http://www.free-ed.net/sweethaven/MedTech/MedTerm/default.asp http://www.dmu.edu/medterms/
96 Moduł 2: Źródła informacji i wyszukiwanie
Przegląd klasyfikacji medycznych
Próby usystematyzowania terminologii medycznej zaczęto podejmować w XVII w. Za pioniera klasyfikacji chorób uważa się Johna Graunta. Badał on śmiertelność wśród londyńskich dzieci i do celów statystycznych stworzył prosty podział przyczyn zgonów wyodrębniając zaledwie kilkanaście kategorii (Chute, 2000). Wiek XVIII przyniósł próby systematycznego układu chorób w dziełach Linneusza (Linnaeus, Genera morborum), Sauvagesa (Nosologia methodica), Williama Cullena (Synopsis nosologiae methodicae).
Jednak należne jej miejsce i zainteresowanie klasyfikacja chorób znalazła dopiero w XIX w. dzięki Williamowi Farr, statystykowi. W 1839 r. podkreślał: „The nomenclature is of as much importance in this department of inquiry [medical science] as weights and measures in the physical sciences, and should be settled without delay”(cyt. za History of the development of the ICD).
Podejście zaproponowane przez Farra (podział chorób na pięć grup: epidemiczne, ogólne, lokalne, rozwojowe i choroby powstałe bezpośrednio w wyniku przemocy) stało się punktem wyjścia międzynarodowej listy przyczyn zgonów (International List of Cau-ses of Death), klasyfikacji przygotowanej przez Jacquesa Bertillona i zaprezentowanej w 1893 r. Wkrótce też International Statistical Institute przyjął rezolucję, w której reko-mendował stosowanie tej klasyfikacji w instytucjach statystycznych w Ameryce Północ-nej i w Europie. Postanowiono też dokonywać rewizji listy co 10 lat zgodnie z postępem medycyny.
Za przełom w utworzeniu klasyfikacji międzynarodowej o rzeczywistym i wszech-stronnym wykorzystaniu można uznać rok 1948r., gdy po poprawkach i konsultacjach klasyfikacja ta została przyjęta jako International Classification of Diseases and Cau-ses of Death-6th Revision. Obecnie obowiązuje ICD-Rewizja 10. ICD długo była jedyną międzynarodową klasyfikacją.
Nowa era
Wraz z rozwojem komputeryzacji od lat 50. XX w. podejmowano próby przystosowania nomenklatury medycznej do automatycznego gromadzenia i przetwarzania danych. Kla-syfikacje medyczne zaczęły też znajdować zastosowanie w wielu ważnych obszarach, m.in.:
1) w administracji i finansowaniu ochrony zdrowia, gdzie płatnicy usług medycznych wymagają stosowania określonego systemu kodowania, by na tej podstawie rozliczać się ze świadczeniodawcą;
2) w gromadzeniu i wymianie danych w epidemiologii i statystyce zdrowotnej;
3) w tworzeniu dokumentacji medycznej;
4) w systemach wspomagania decyzji klinicznych (Rosenbloom, 2006);
5) w bibliotekach, które wykorzystują klasyfikacje do organizowania zbiorów.
Niektóre systemy klasyfikacji mają zasięg międzynarodowy, inne zastosowanie tylko lokalne. Poniżej wymieniono tylko kilka z nich.
• ICD-10 wraz z rodziną towarzyszących klasyfikacji pozwala kodować głównie roz-poznania chorób. Służy do opracowywania analiz statystycznych w odniesieniu do zdrowia populacji, porównywania danych, monitorowania zachorowalności, jest również stosowana do analiz finansowych w ochronie zdrowia.
• ICD-9-Clinical Modifications było dziełem współpracy środowisk medycznych, agend rządowych i płatników. Umożliwia ona kodowanie procedur medycznych:
2.1. Pojęcia, terminologia i słownictwo kontrolowane w naukach biomedycznych... 97 przedmiotem kodowania jest tu czynność medyczna (nie jednostka chorobowa) wy-konana wobec pacjenta w trakcie procesu diagnostycznego lub terapeutycznego.
• ICPC (International Classification for Primary Care) utworzona przez międzyna-rodowe stowarzyszenie lekarzy rodzinnych. ICPC jest mniej szczegółowa niż ICD, pozwala jednak zakodować powód zgłoszenia się pacjenta do lekarza opieki pod-stawowej.
• SNOMED (Systematized Nomenclature of Human and Veterinary Medicine), roz-wijana przez College of American Pathologists. W tym systemie każdą chorobę opisuje się w wielu wymiarach, np. lokalizacja stanu patologicznego, jednostka morfologiczna, czynniki etiologiczne, stosowane procedury, uwarunkowania socjo-logiczne. Dzięki temu można zakodować wszystkie składowe choroby oraz leczenia wraz z wykonanymi procedurami, np. na potrzeby elektronicznej historii choroby danego pacjenta.
Niektóre klasyfikacje są standaryzowanym narzędziem rozliczania kosztów leczenia, np.
• DRG (Diagnosis Related Groups). Ta klasyfikacja opiera się na ICD-9-Clinical Modifications i umożliwia przypisanie pacjenta do określonej grupy diagnostycz-nej, jednorodnej w odniesieniu do stanu pacjenta i zastosowanych procedur dia-gnostycznych i leczniczych, a w ten sposób pozwala określić koszt leczenia tego pacjenta.
Przykłady klasyfikacji specjalistycznych to:
• TNM (Tumor, Nodus, Metastasis) stosowana w onkologii;
• UMDNS (Universal Medical Devices Nomenclature System) klasyfikacja sprzę-tu medycznego;
• LOINC (Logical Observation Identifiers Names and Codes) dla medycyny labo-ratoryjnej;
• ICNP (International Classification for Nursing Practice) klasyfikacja praktyki pielęgniarskiej;
• DSM-IV rozpowszechniony w psychiatrii Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition to nie typowa klasyfikacja, lecz raczej źródło kryteriów diagnostycznych.
W dziedzinie zdrowia publicznego brak jednej wiodącej terminologii, choć istnieją liczne specjalistyczne lub obejmujące całą dziedzinę tezaurusy (Niedźwiedzka, 2008).
Uwaga
W Polsce wykorzystuje się klasyfikacje: ICD-10 i ICD-9-CM (dla procedur), system Jednorodnych Grup Pacjentów wzorowany na DRG (w wersji brytyjskiej HRG – Healthcare Reso-urce Groups) do rozliczeń świadczeniodawców z NFZ. Polska przystąpiła do projektu Euro-DRG, którego celem jest wdrożenie jednolitego systemu jednorodnych grup pacjentów dla całej Unii Europejskiej z uwzględnieniem kontekstu w poszczególnych krajach. Zakończenie projektu prze-widuje się na koniec roku 2011. Klinicyści stosują klasyfikację TNM w diagnostyce onkologicznej.
Klasyfikacja DSM-IV ma charakter pomocniczy w diagnostyce psychiatrycznej. Na język polski przetłumaczono m.in. SNOMED (wyd. polskie 2001 r.) i DC:0-3R (Diagnostic Classification of Mental Health And Development Disorders Of Infancy and Early Childhood Revised Edition, wyd. polskie 2007 r.). SNOMED znalazł zastosowanie np. w polsko-norweskim projekcie KARDIO-NET, w wyniku którego wdrożono (2010 r.) mobilny system zbierania i transmisji danych pacjentów kardiologicznych.
98 Moduł 2: Źródła informacji i wyszukiwanie
Ontologie
Różne systemy kodowania służą różnym celom i różnym grupom odbiorców. Stworze-nie systemu, który łączyłby różnorodne funkcje to cel ontologii medycznych. Co to jest ontologia? W informatyce ma nieco inne znaczenie niż w filozofii, choć również zaj-muje się opisem struktury rzeczywistości: oznacza model wybranego wycinka rzeczy-wistości lub inaczej mówiąc sformalizowany opis pewnej domeny świata rzeczywistego, dokonany przy pomocy zbioru pojęć z ich atrybutami oraz relacji między nimi. Poję-cia i relacje muszą być jednoznacznie zdefiniowane i możliwe do identyfikacji przez systemy informatyczne. Ontologie opisują złożone zależności pomiędzy pojęciami, czer-piąc z rozproszonych źródeł wiedzy. Obejmują wiedzę na temat fragmentu rzeczywistości ustrukturyzowaną w sposób pozwalający na wnioskowanie i wielokrotne wykorzystanie tej wiedzy. Sposobem reprezentacji wiedzy w ontologiach są mapy pojęć (topic maps) lub sieci semantyczne (semantic web). Sieć semantyczna zbudowana jest z grafów, które odzwierciedlają różnorodne powiązania znaczeniowe między pojęciami, np. nadrzędność, podrzędność, synonimię, cechy, konotacje (Robu, 2006). Zob. rozdział 2.3.5.
Przykład
Ontologia instytucji obejmie bazę pracowników, zależności między nimi i ich kompetencje, dokumenty, petentów, procedury, ustaloną terminologię. Przykładem praktycznego podejścia on-tologicznego w medycynie jest ontologia mammografii (Podsiadły-Marczykowska, 2005). Celem tej ontologii było ograniczenie dużej zmienności interpretacji wyników (subiektywności) badania mammograficznego. Dla tego wąskiego wycinka radiologii stworzono model, który wymagał akwi-zycji specjalistycznej wiedzy, usystematyzowania i zdefiniowania pojęć istotnych w tej dziedzinie.
Opracowano także specjalny interfejs do redagowania raportów mammograficznych.
Rozległą ontologią jest OBO Foundry (Open Biomedical Ontologies) i powiązana z nią Gene Ontology. Ontologią jest UMLS (Unified Medical Language System) wieloletni projekt National Library of Medicine (Bethesda, USA), którego celem jest gromadzenie i rozwijanie semantycznego zasobu nauk biomedycznych w powiązaniu z zasobami informacji. UMLS obejmuje Metathesaurus, na który składają się terminy z ponad stu klasyfikacji i nomenklatur, leksykon terminów biomedycznych Specialist, sieć semantyczną, mapę źródeł informacji o zakresie, lokalizacji i dostępie do baz da-nych, wspomagającą użytkownika w procesie wyszukiwania. Znajdujemy tu dwie główne hierarchie: obiektów (Physical Object and Conceptual Entity) oraz zdarzeń (Event).
Podobne cele zakłada europejski projekt GALEN (Generalised Architecture for Lan-guages, Encyclopaedias and Nomenclatures in Medicine). Projekt GALEN podejmuje następujące wyzwania:
• pogodzenie różnorodności potrzeb w zakresie terminologii z wymogami wymiany informacji;
• uniknięcie lawinowo rosnących kosztów dostosowywania wariantów terminologii;
• ułatwienie zastosowań w medycynie klinicznej;
• wypełnienie luki między szczegółami wymaganymi w opiece nad pacjentem i uogól-nieniami wymaganymi w statystyce, zarządzaniu i nauce;
• dostarczenie wielojęzycznych systemów, które zachowają zasadnicze znaczenie i reprezentację informacji (GALEN, www.openclinical.org/prj galen.html).
GALEN zaliczany jest do trzeciej generacji terminologii, zrywa bowiem z podejściem podawania listy gotowych kodów, jak np. w ICD. W zamian za to, dostarcza model, który
2.1. Pojęcia, terminologia i słownictwo kontrolowane w naukach biomedycznych... 99 bazuje na logicznych kryteriach łączenia prostych pojęć w złożone. Klasyfikacja pojęć odbywa się automatycznie.
Ontologie i sieci semantyczne to inny sposób reprezentowania wiedzy i wyszukiwa-nia informacji w rozległych zasobach. Są potrzebne zwłaszcza w dziedzinie tak złożonej jak medycyna, więc są wciąż udoskonalane i prawdopodobnie będą wszechstronnie wy-korzystywane (Bodenreider, 2008).
Uwaga
W skład Metatezaurusa UMLS wchodzi już kilka wersji językowych (tłumaczeń) MeSH:
francuskie, niemieckie, włoskie, japońskie, portugalskie, rosyjskie i hiszpańskie. Także w niektó-rych innych krajach istnieją tłumaczenia MeSH, szeroko stosowane w bazach i katalogach, choć nie wchodzą one jeszcze w skład UMLS, np. polska wersja MeSH. Inne kraje, jak Norwegia, są w trakcie opracowywania własnego tłumaczenia. NLM stworzył też narzędzie BabelMeSH (http://babelmesh.nlm.nih.gov/), które umożliwia przeszukiwanie bazy Medline/PubMed według terminologii w 11 językach (arabski, chiński, angielski, francuski, niemiecki, włoski, japoński, ko-reański, portugalski, rosyjski i hiszpański).