• Nie Znaleziono Wyników

Informatyka Nr 3; miesięcznik profesjonalistów - Digital Library of the Silesian University of Technology

N/A
N/A
Protected

Academic year: 2022

Share "Informatyka Nr 3; miesięcznik profesjonalistów - Digital Library of the Silesian University of Technology"

Copied!
52
0
0

Pełen tekst

(1)

N A JST A RSZE P IS M O IN FO RM A TY CZN E W POLSCE - UKAZUJE SIĘ OD 1965 ROKU

i I I

m iesięcznik profesjonalistów

m

JĘZYK I TECHNOLOGIA

Dw udniow e sem inarium „Język i Te- chnologia’95” zorganizow ane w P o ­ znaniu podczas ubiegłorocznego In- fosystem u, z inicjatywy X III D y­

rektoriatu Generalnego Komisji Eu­

ropejskiej przez U niwersytet A dam a Mickiewicza we w spółpracy z M iędzy­

narodow ym i Targam i Poznańskim i, było p róbą zwrócenia uwagi szeroko rozum ianego środow iska ludzi zwią­

zanych z technologiam i języka n a tu ra ­ lnego (zarówno producentów , konsu­

m entów technologii, jak również od­

powiednie środow iska decydenckie) na miejsce tych technologii w wizji nowoczesnej i wspólnej Europy. P o ­ słanie, które przekazali przybyli na to spotkanie przedstawiciele Komisji Europejskiej, zw raca naszą uwagę na świadomość strategicznej wagi, jak ą m a skuteczność porozum iew ania się w języku naturalnym dla podnoszenia konkurencyjności w biznesie, przem y­

śle i zwiększania spraw ności adm inist­

racji. Przejawem tej świadomości jest program budow y optym alnego środo­

wiska, celem ułatwienia kom unikacji między ludźm i poprzez wykorzystanie Technologii Języka i Informacji (zaró­

wno dla języka mówionego, ja k i pisa­

nego). Celem jest przyczynienie się do socjo-ekonomicznego rozwoju we­

w nątrz Europy, zwiększenia jej kon­

kurencyjności, przy zachow aniu dzie­

dzictwa językowego i kulturow ego z całą jego różnorodnością i bogact­

wem, tak cenionego przez Europej­

czyków i będącego często przedm io­

tem zazdrości innych nacji.

Instancje europejskie, a w szczegól­

ności XIII D yrektoriat G eneralny Komisji Europejskiej, systematycznie, od wielu lat prom ują zaawansowane technologie języka, upatrując w nich, z jednej strony własności przyspiesza­

jących globalny rozwój ekonomiczny a także walorów integracyjnych, które nie naruszą wspom nianego wyżej za­

sobu kulturowego. Jednocześnie pro­

cesy integracyjne, zarów no wewnątrz W spólnoty, jak i pomiędzy nią a k raja­

mi Europy Centralnej i Wschodniej, sprawiają, że te ostatnie, na równi z innymi, są adresatem tej promocji.

Z grom adzone w tym numerze In­

fo rm a tyki publikacje pióra uczestni­

ków wyżej wspomnianego sem ina­

rium m ają przybliżyć problem atykę technologii języka jej czytelnikom, re­

krutującym się z rozm aitych środo­

wisk, w różny sposób związanych z te­

chniką inform atyczną lub po prostu interesujących się nią. Pragniem y zwrócić uwagę na artykuł wstępny pióra Jan a Roukensa z D G XIII (Lu-

xembourg), który oddaje poglądy K o­

misji Europejskiej w zakresie wyko­

rzystywania technologii języka na rzecz integracji europejskiej i tworze­

nia nowego społeczeństwa inform a­

cyjnego.

O dnotujm y tu na marginesie, że przetwarzanie języka naturalnego, ba­

rdzo wcześnie, bo ju ż w latach czter­

dziestych bieżącego stulecia weszło w obszar zainteresowań inform aty­

ków i to jak o jedno z najważniejszych, i jak się okazało, najtrudniejszych za­

dań (słynne M em orandum W arrena W eaver’a z dnia 15 lipca 1949). Osoby zainteresowane korzeniami „prehisto­

rycznymi” naszej dyscypliny zacieka­

wi być może mało znany fakt, że już oto Kartezjusz, w liście do Ojca Mer- senne z 26 października 1629 roku postulował zmechanizowanie i zuni- wersalizowanie tłumaczenia przez wprowadzenie słownika numeryczne­

go, pisząc: „M ettant en son diction­

naire un seul chiffre qui se rapporte à aymer, amare, philein et tous les synonymes [d ’aim er dans toutes les langues] le livre qui sera écrit avec ces caractères [les num éros du code] po­

urra être intreprété p a r tous ceux qui auront ce dictionnaire” (Kładąc w sło­

wniku jeden wspólny znak kodowy dla ,,aym er”, ,,am are”, ,,philein” i wszyst­

kich synonimów [słowa ,,kochać” we wszystkich językach] książka, która zostanie napisana przy użyciu tych zna­

ków, będzie mogła być czytana przez wszystkich posiadających ów słownik).

Zygmunt Vetulani

(2)

3 B S t a P t

I

Szukasz programu, który znacznie ułatwi Ci pracę? Programu, który sprawi, że codzienne zadania można będzie wykonywać 0 wiele szybciej i łatwiej, a czas i energię zaoszczędzone w ten sposób przeznaczyć na ulubione zajęcia?

Znalazłeś - Microsoft Office dla Windows 95 - po polsku!

To zestaw biurowy o nowych m o ż i i w o i c ia c h , dających Ci m o i i i w o i ć spędzania czasu tak, jak lubisz najbardziej.

Jak to m o ż liw e ? To proste:

Microsoft Office dla Windows 95 pozwala pełnią wykorzysty­

wać dostępne funkcje pakietu biurowego, czyniąc zestaw bardziej intuicyjnym w obsłudze.

Office dla Windows 95 pozwala traktować komputer jako narzędzie pracy i nie wymaga, by użytkownicy byli ekspertami od oprogramowania.

Cały pakiet zaprojektowano tak, aby ułatwić dostęp do danych oraz do łączności z komputerami na całym świecie.

Udział w globalnej wymianie informacji stanie się teraz możliwy, Aplikaqe w Office dla Windows 95 są w pełni 3 2 -b ttO W e 1 działają wydajniej. Korzystają ze zwiększonych zasobów syste­

mowych, stabilności i wielozadaniowości Windows 95.

Szybsze jest przewijanie i otwieranie dokumentu.

Excel wykorzystuje możliwości środowiska 32-bitowego, dzięki czemu obliczenia trwają teraz do 50 procent krócej.

Dzięki technologii I n t e l l i S e n s e wykonywanie zadań staje się łatwiejsze i szybsze niż kiedykolwiek.

Przełomowym rozwiązaniem jest również Office links.

Aplikacje Office dla Windows 95 współpracują ze sobą tak, jakby stanowiły jeden program.

Microsoft Office dla Windows 95 - program komputerowy, który daje wiele możliwości Kup go i przekonaj się o tym już dziś!

Microsoft Office 95 po polsku - To się dobrze składa !

Zaprasamy do odwiedzenia polskiej strony W W W firmy Microsoft:

http^www.microsoftcom/poland

M ic r o s o ft-

W H E R E D O Y O U W A N T T O G O T O D A Y ? “

© 1996 Microsoft Corporation. Wszelkie prawa zastrzeżone. Microsoft jest zastrzeżonym znakiem towarowym. D o d atk o w e inform acje - Infoserw is M icrosoft teł. (0-22) 628 69 24.

Przekonaj się, jak wiele możliwości daje

& J P r

Microsoft Office dla W in d o w s 95.

:

(3)

barier:

Ku wielojęzycznemu społeczeństwu informacji w Europie

Jan Roukens

European Commission DG XIII Luxembourg

Poprzez język komunikujemy się społecznie w celu przekazywania informacji i wyrażania uczuć. Elastyczność języka wysuwa się na pierwszy plan w negocjacjach dyplomatycznych i rozmowach handlowych. Jasność języka jest sprawą zasadniczą w instrukcjach instalowania, wykorzystywania i konserwacji urządzeń w przemyśle czy w domu. Rezultaty naukowe i techniczne muszą być komunikowane w języku

zrozumiałym.

Język m a głęboki wpływ na wiele aspektów współczes­

nego społeczeństwa. Języki grają ważną rolę w kul­

tywowaniu spójności społecznej krajów i regionów. Z na­

cząca część wspólnego dziedzictwa kulturalnego narodu ma związek z językiem - na przykład jego poezja czy literatura. Język jest głównym instrum entem , który stano­

wi o funkcjonow aniu demokracji, na przykład przez otw arte debaty i dyskusje, a także przez wolność prasy.

N a płaszczyźnie ekonomicznej języki m ają wpływ na rynek. Pom yślm y o dodatkow ych kosztach przekładu na potrzeby handlu zagranicznego i stosow aniu podtytułów w europejskim przemyśle mediatycznym.

Języki w p o w s t a j ą c y m

s p o łe c z e ń s t w ie in fo r m a c y j n y m

W rewolucji informacyjnej, k tó ra zwiastuje dzisiaj wyła­

nianie się społeczeństwa informacyjnego, kom puterow a informacja i technologie informacji (ICTs) dają jednostce moc natychm iastow ego, w skali światowej, dostępu do informacji przez kom binacje tekstu pisanego, obrazów graficznych i dźwięku. Język będzie, w jakiejś formie, osnową multimedialnej, ekranow o zorientowanej kom u­

nikacji, k tó ra ja k się wydaje, staje się nieodłączną częścią życia zarów no w miejscu pracy, jak i w domu.

N u m e r s p o n s o r o w a n y p rzez K o m is ję E u ro p ejsk ą D G X I I I , L u k sem b u rg

Ponieważ wzrasta rola informacji (tak w biznesie i administracji, jak w badaniach czy nauczaniu), zapew­

nienie każdem u równych możliwości w dostępie do informacji staje się zagadnieniem kluczowym. Rzecz jasna, języki pełnią tu ważną funkcję. Europejska spuściz­

na językow a to w skali U nii Europejskiej ponad 40 języków autochtonicznych bądź głównych ich wariantów mówionych przez 380 milionów obywateli. Szybko ros­

nące wykorzystywanie IC T stw arza tendencję do fawory­

zow ania tych języków, które łatw o poddają się tym technologiom. Jednakże społeczeństwo informacyjne oparte na ograniczonej liczbie języków stw arza ryzyko rozwoju w kierunku dwuwarstwowej społeczności (przed k tó rą ostrzega R aport Bangemanna) złożonej z tych, którzy władają językam i niezbędnymi dla aktywnej p a r­

tycypacji i reszty obywateli.

D la Europy istnieje tu podwójne wyzwanie: utrzym anie jej różnorodności językowej i kulturowej oraz zapew­

nienie jednakow ych warunków do pełnego udziału i k o ­ rzystania z nowej ery informacji zarów no dla biznesu, jak i obywateli. To wyzwanie zostało w pełni uznane przez Unię Europejską podczas szczytu na Corfu, w czerwcu 1994, gdzie zostały podkreślone aspekty lingwistyczne i kulturalne społeczeństwa informacyjnego. Aby m u spro­

stać, ważne jest, by europejskie społeczeństwo informacji pozostało wielojęzyczne. N arody z ich różnymi językami, kulturam i, historią i systemami edukacji, pow inny być zdolne do kom unikow ania się między sobą i ze światem zewnętrznym tak, by móc żyć i pracow ać w sposób efektywny, produktywny, tolerancyjny, dem okratyczny i spójny we wspólnym europejskim domu.

K to w in ie n p o d jąć te w e z w a n ia ?

Europejskie inicjatywy podkreśliły rolę sektora pryw at­

nego w tworzeniu społeczeństwa informacyjnego. Jed ­ nakże, biorąc pod uwagę aspekty językowe, wym agana jest także akcja ze strony sektora publicznego, zarów no na poziomie N arodów Zjednoczonych, jak i Unii E u ro ­ pejskiej. Sektor publiczny powinien zmierzać do za­

chow ania różnorodności językowej przez zagw arantow a­

(4)

nie, że wszystkie języki będą odpow iednio traktow ane przez nowe technologie, i że treść inform acyjna będzie udostępniana w tych jeżykach.

U trzym anie żywotności języków jest zasadniczo sp ra­

wą Państw Narodow ych. Jednakże instytucje europejskie m ogą także pełnić konstruktyw ną rolę. Po pierwsze, potwierdzając, że wszystkie oficjalne języki Unii mają zapewnione właściwe miejsce w funkcjonow aniu tych instytucji. Po drugie, propagując problem atykę językową zarów no wobec publicznych, jak i pryw atnych p o d ­ miotów. Po trzecie, pełniąc rolę katalizatora w zakresie aspektów wielojęzyczności w społeczeństwie informacji.

Instytucje edukacyjne także grają szczególnie ważną rolę w sprawie zachow ania językowej różnorodności.

Uczenie się przynajmniej jednego języka obcego, niezależ­

nie od biegłości w języku ojczystym, staje się wręcz koniecznością dla każdego europejskiego obywatela w powstającym globalnym społeczeństwie informacji.

P od wieloma względami sektor pryw atny dzierży klucz do zapewnienia, że europejskie społeczeństwo informacji będzie prawdziwie wielojęzyczne, ja k o że to właśnie ten sektor zasilił społeczeństwo informacyjne w wielojęzycz­

ną treść. Wielojęzyczne interfejsy zaprojektow ane i wy­

produkow ane przez pryw atne firmy m ogą ułatwić dostęp do informacji pochodzącej ze źródeł międzynarodowych.

W zakresie nauczania języków, prywatne organizacje

m ogą uzupełniać działalność instytucji sektora publicz­

nego. N a przykład tłumaczenie, interpretacja i lokalizacja m ogą być podejm owane przez sektor prywatny. Swój udział m ają także prace badawczo-rozwojowe. D ziałania te, częstokroć sponsorow ane przez program y U nii E u ro ­ pejskiej, dały silne podstaw y naukow e pod technologię języka w Europie.

Plan działania

Wielojęzyczne społeczeństwo inform acyjne nie utworzy się sam o z siebie. Siły rynkowe nie wystarczą dla zapew­

nienia językowej różnorodności i jednakow ych szans dla wszystkich. Sektor publiczny, zarów no P aństw N a ro d o ­ wych, ja k i U nii Europejskiej, będzie musiał stworzyć właściwe w arunki dla wielojęzycznego społeczeństwa informacyjnego, które m a pow stać w Europie przez jasne określenie ram politycznych, trwałe wspieranie właściwe­

go rozwoju technicznego i przez tworzenie precedensów w obszarach objętych jego działaniem.

Jeśli E uropa m a dokonać przejścia do społeczeństwa informacji w taki sposób, aby utrzym ał się jej wielojęzycz­

ny charakter, to niezbędne do tego są wyraźne ram y polityczne. A także akcje dla prom ow ania wielojęzycz­

nego społeczeństwa informacyjnego (pomiędzy U nią E u­

ropejską i Państw am i Członkowskimi, pomiędzy sek­

torem publicznym i pryw atnym , pomiędzy instytucjam i i obywatelami) zorientow ane na zapewnienie pełnego udziału wszystkich zainteresow anych stron - obywateli, biznesu i adm inistracji.

Główne akcje m ogą skupić się na następujących zagad­

nieniach:

■ R ozw inięcie jasnych i stabilnych ram politycznych Proponuje się pow ołanie forum na rzecz multilingwizmu, które m iałoby pom agać państw om członkowskim i K o ­ misji w ustalaniu strategicznych zagadnień oraz for­

m ułow aniu celów i akcji politycznych. D ziałalność tego forum będzie wspierana przez sieć O bserw atoriów Języ­

kowych w całej Unii Europejskiej.

■ P ołożenie w iększego nacisku na naukę języków Większy nacisk na nauczanie języków został położony przez niedawne inicjatywy Unii Europejskiej, takie jak:

program y Sokrates i L eonardo da Vinci, Education and Training, sekcje poświęcone Language Engineering w ra ­ m ach Telematics A pplication Program m e. N a dodatek, jeden z program ów wyselekcjonowanych do współpracy m iędzynarodowej na Konferencji M inisterialnej G-7 (w lutym 1995 r. w Brukseli) ja k o ważny element traktuje nauczanie języków. Aby europejski system kształcenia i sektor pryw atny mogły opierać się na rezultatach takich inicjatyw, m uszą być one podejm ow ane w sposób skoor­

dynowany.

■ B udow a silnego przem ysłu językow ego

„Przem ysł językowy” może być pom yślany ja k o luźne zgrupow anie przemysłów, których pierwszoplanowym zadaniem jest rozwój, produkcja i m arketing produktów wykorzystujących kom putery dla przetw arzania i opero­

wania językiem. Przykładam i takich produktów języko­

wych są opracow ane i w ydaw ane narzędzia takie, jak:

korektory ortograficzne i gram atyczne, narzędzia pom oc­

JĘZYK I TECHNOLOGIA 1995 Seminarium

Poznań, 12-13.04.1995

Uniwersytet A dam a Mickiewicza, M iędzynarodow e T argi Poznańskie, K om isja E uro p ejsk a D G X III

Komitet Programowy

Zygmunt Vetulani /UAM/ (Przewodniczący)

Witold Abramowicz /Akademia Ekonomiczna w Poznaniu/

Stefan Ju rg a /P rorektor Uniwersytetu im. Adama Mickiewicza/

K arsten S trerup /Komisja Europejska DG X III-E /

Bogusław Zalewski AViceprezes MTP/

Zespół Redakcyjny

Zygmunt Vetulani, Witold Abramowicz, Grażyna Vetulani

Sekretariat B arbara Wilczyńska

Adres do korespondencji

Zygmunt Vetulani

Zakład Lingwistyki Informatycznej i Sztucznej Inteligencji UAM ul. Matejki 48/49

6 0 -7 6 9 Poznań teł.: (061)668651 fax.: (061)662992 e-m ail: vetulani@math.amu.edu.pl

2 Inform atyka nr 3, 1996 r.

(5)

nicze w tłum aczeniu - słowniki, banki terminologiczne i systemy translacji. M imo, że wzmocnienie tej dziedziny jest przede wszystkim zadaniem zainteresowanych prze­

mysłów, tak Państw a Członkowskie, ja k i U nia Europejs­

ka powinny pełnić rolę katalizatora wobec wysiłków przemysłu. Jest to szczególnie potrzebne, poniew aż prze­

mysł europejski jest konfrontow any z rynkam i, które są bardziej rozczłonkow ane i mniej zaawansowane, gdy chodzi o popyt (np. USA). Często też dom inują na nich SM E (małe i średnie przedsiębiorstwa), którym brakuje siły finansowej i marketingowej do opanow ania obcych rynków.

■ Prom ocja wielojęzycznej treści

Przemysł dostarczający wiedzę (wydawniczą i audiowizu­

alną) o kluczowym znaczeniu dla pow odzenia europejs­

kiego udziału w społeczeństwie informacji musi być pobudzany w kierunku produkcji wielojęzycznej zaw ar­

tości. Te tem aty będą podjęte w ram ach program ów IN F 0 2 0 0 0 i M ED IA II. W ażnym w arunkiem jest rozwój technik dla redukcji kosztów wersji w poszczególnych językach, dla różnych rynków europejskich. Ekstensywne używanie nowych technologii informacji pozwoli na bardziej integralne podjęcie tego problemu.

■ R ozw ijanie zaaw ansow anego przem ysłu tłum acze­

niow ego

Tłumacze pełnią w ażną rolę w dyplomatycznej, politycz­

nej, naukowej i handlowej kom unikacji mówionej. P o ­ trzeby w zakresie tłum aczenia będą rosły w społeczeńst­

wie informacji, szczególnie w takich dziedzinach, jak wielojęzyczne wideokonferencje. Podobnie, będzie zwięk­

szało się zapotrzebow anie na usługi profesjonalnych tłumaczy, w spom aganych maszynowo. Przemysł tłum a­

czeniowy będzie się rozwijał wym agając przy tym m oder­

nizacji polegającej na zapewnieniu dostępu do wielo­

języcznych narzędzi i zasobów językowych, takich jak słowniki elektroniczne i banki terminologiczne, oraz podsycając wzrastające pow iązania pom iędzy indywidu­

alnymi translatoram i i firmami tłumaczeniowymi. Z o­

staną podjęte działania w kierunku mobilizacji i wzmoc­

nienia europejskiego przemysłu tłumaczeniowego.

■ R ozszerzanie i eksploatacja bazy technologicznej Europejskie badania w zakresie technologii języka są na poziomie światowym, lecz ich kom ercyjne wykorzystanie ma charakter bardziej fragm entaryczny niż w USA czy Japonii. Silna, istniejąca aktualnie baza musi być przenie­

siona do przemysłu celem wytworzenia produktów tech­

nologii języka zbudow anych na podstaw ie solidnej infra­

struktury, w postaci w ielorako wykorzystywalnych zaso­

bów językowych.

■ Walidacja i dystrybucja europejskich zasobów ję­

zykowych

D ostępność podstawowych zasobów, takich jak: słowniki elektroniczne, bazy mowy ciągłej, gram atyki etc. ma zasadnicze znaczenie dla integracji technologii języka i przeradzania się ich w produkty i usługi o znaczeniu handlowym. A ktualnie ich produkcja i wykorzystanie odbywają się w sposób raczej przypadkowy. W USA rząd stymulował pow stanie konsorcjum Danych Językowych celem powierzenia mu problem ów koordynacji pro d u k ­ cji, dystrybucji i standaryzacji zasobów językowych.

W Europie zachodzi potrzeba większej koordynacji i wsparcia. Schemat utw orzony przez Komisję i Państw a

Członkowskie celem umożliwienia szybkiego rozwoju jednojęzycznych i wielojęzycznych zasobów leksykalnych powinien ułatwić niezbędny rozwój infrastruktury. W dal­

szym ciągu, praca z zakresu terminologii winna ulec koordynacji na skalę europejską, aby sprostać sytuacji, w której mamy do czynienia z przynajmniej 50 milionami specyficznych pojęć i term inów dla ok. 200 różnych sektorów słownictwa naukowego, technicznego i hand­

lowego. Europejskie C entrum Koordynacji i Informacji w Zakresie Terminologii może tu odegrać ważną rolę.

■ Społeczeństw o w ykształconych i zaaw ansow anych użytkow ników

W wielojęzycznym społeczeństwie informacji, produkty językowe będą wykorzystywane przez obywateli (w ce­

lach rozrywkowych i informacyjnych), biznes (dla infor­

macji, interpretacji i translacji) i przez sektor publiczny (dla informacji, translacji i dokumentacji), ale tylko wtedy, gdy będzie istniało zapotrzebow anie na takie produkty.

Celem rozwinięcia takiego zapotrzebow ania, trzeba aby różne w spom niane tu grupy były świadome istniejących możliwości. Zbyt często niewiedza o tym co jest dostępne, ham uje popyt na zaaw ansow ane produkty językowe.

Akcje uświadamiające, zorientow ane na w ybraną pub­

liczność mogą pom óc w poprawieniu sytuacji. Tutaj Komisja Europejska ma do odegrania specjalną rolę.

Rozmaite instytucje europejskie m ogą także, przez stoso­

wanie zaawansowanych narzędzi językowych, działać w sposób przykładowy na rzecz tego przemysłu.

■ W spółpraca m iędzynarodowa

Zrów now ażona w spółpraca m iędzynarodow a jest pożą­

dana w celu wymiany wiedzy i danych językowych z uprzemysłowionymi krajam i Ameryki Północnej, Jap o ­ nii, Australii i Wschodniej Azji. Co do krajów, w których używa się języków mówionych pochodzenia europejs­

kiego, wspólne rozwijanie zasobów językowych, narzędzi i zastosow ań byłoby pomocne, biorąc pod uwagę różnice kulturalne i ekonomiczne istniejące między tymi krajam i i ich odpow iednikam i w U nii Europejskiej. W spółpraca z krajam i spoza Unii Europejskiej w Centralnej i W scho­

dniej Europie, w EEA i w basenie M orza Śródziemnego będzie także korzystna w takich przedsięwzięciach, jak wspólne tworzenie infrastruktury lingwistycznej, tłum a­

czenie wspom agane maszynowo i ogólne akcje propagu­

jące na rzecz bliższej, średnio- i dalekosiężnej współpracy.

Istnieje wiele wyzwań. Są różne możliwości. N agroda będzie wysoka. Ogólnoświatowe społeczeństwo infor­

macji rozwija się, E uropa musi więc być gotow a do odegrania swojej roli i, czyniąc to, winna zachować swą tożsam ość charakteryzującą się owocną w spółpracą wie­

lu ludzi o różnych językach i kulturach. Tworzenie wielojęzycznego społeczeństwa informacji w Europie nie tylko stw arza każdemu europejskiem u obywatelowi szan­

sę udziału w tym społeczeństwie, ale także utrw ala silną pozycję Europy w świecie, z korzyścią dla kulturow o i językowo zróżnicowanego globalnego społeczeństwa informacyjnego.

K o n ta k t z A u torem : Jan Roukens

Bat. J. M onnet, Plateau du Kirchbcrg L-2920 Luxem bourg

(6)

Retoryka hipertekstu

Witold Abramowicz

Katedra Informatyki Ekonomiczne) Akademia Ekonomiczna

Poznań

Hipertekst jest sposobem gromadzenia i udostępniania informacji. Tekst jest dzielony na małe fragmenty zwane węzłami. Węzły są w systemach hipertekstu różnie określane:

notecards, cards, frames, pages, boxes, information units, notes, content nodes, statements, messages, articles, hyper-molecules, guidelines, documents. Nazwy te wskazują na interpretacje pojęcia węzeł przez autorów systemów hipertekstu. Hiperteksty stały się modne. Utożsam iane są często z systemami pom ocy realizowanymi jako hipertekst lub z WWW w Internecie.

Węzły są łączone powiązaniam i (links). W yrażają one:

■ związki znaczeniowe, np. informacje w węźle A i węźle B są sprzeczne,

■ związki syntagm atyczne przedstawiające relacje:

- strukturalne pomiędzy węzłami, np. informacje w węźle A precyzują informacje węzła B,

- związane z późniejszym łamaniem (layout) hipertek­

stu dla celów graficznego przedstawienia na papie­

rze, np. informacje w węźle A i węźle B uzupełniają się, pow inny więc być w ydrukow ane na jednej stronie,

■ związki pragm atyczne, np. przed zapoznaniem się z inform acjam i w węźle A czytelnik, który nie zna pojęcia xyz, powinien zapoznać się z inform acjam i w węźle B.

Pow iązania łączą dwa węzły. O kreślając powiązanie m usimy wskazać na początek pow iązania i jego koniec.

Początek i koniec pow iązania mogą być przedstawione przez specjalne form atow anie tekstu (np. inny krój pisma, obram ow anie fragm entu tekstu, przedstawienie go innym kolorem niż pozostałe teksty węzła) lub w wykorzys­

taniem ikon o semantyce dedykowanej powiązaniom.

W skazując na początek pow iązania możemy przejść do węzła zawierającego koniec powiązania. Mówimy, że nawigujemy pomiędzy węzłem A i węzłem B.

Początek i koniec pow iązania mogą być całymi węz­

łami. Takie m odelowanie hipertekstu odpow iada parady­

przykład''^)

Rys. 1. Przykład hipertekstu

gm atowi powiązań. Początkiem lub / i końcem pow iąza­

nia może być fragm ent węzła. Takie modele odpow iadają paradygm atow i hipertekstu.

Rys. 1 przedstaw ia przykład hipertekstu. K ule reprezen­

tują węzły. W lewym górnym węźle opisaliśmy pewną tezę. W ątpliwości z nią związane możemy znaleźć nawi­

gując przez pow iązanie wątpliwość. O d tezy możemy nawigować do antytezy. Pow iązanie argumenty prow adzi do węzła, w którym opisano argum enty przem awiające za antytezą. N awigując powiązaniem przykład znajdziemy przykłady ilustrujące argum enty.

W K atedrze Inform atyki Ekonom icznej Akademii Ekonomicznej w Poznaniu od 1986 roku są prow adzone prace związane z hipertekstem:

■ prace teoretyczne:

- m odelowanie hipertekstu z w ykorzystaniem grafów dwudzielnych,

- zastosow anie zbiorów rozm ytych dla wyszukiwania i nawigacji w hipertekście,

- delinealizacja tekstów m ultilingualnych w hipertek­

sty,

■ badania stosowane:

- pozyskiwanie informacji prawnej w systemach hi­

pertekstu,

- w ykorzystanie hipertekstu dla selektywnego rozpo­

wszechniania informacji - SDI,

- obiektowe m odelowanie hipertekstu dla badań m ar­

ketingowych.

Wielu piszących hiperteksty koncentruje się n a technicz­

nych aspektach w ykorzystania odpow iednich narzędzi program ow ych. Nasze doświadczenia utwierdzają nas w przekonaniu o konieczności prow adzenia bardziej intensywnych prac nad retoryką hipertekstu. Jest to kierunek badań nad technologią języka wzbogacający dotychczasowe osiągnięcia w tym zakresie obejmujące m.in. rozumienie języka naturalnego i generowanie wypo­

wiedzi w języku naturalnym .

C o t o znaczy p isan ie h ip e rte k stu ?

Pisanie hipertekstu to:

■ Takie dopisanie do istniejącego uprzednio hipertekstu węzłów i/lub powiązań, że jest konieczne weryfikowa­

nie jego struktury. Dopisywanie m a najczęściej miejsce w system ach odpow iadających paradygm atow i k a rto ­ teki, które składają się z węzłów odpow iadających dobrze nam znanym fiszkom. W odróżnieniu jednak od nich m ogą być definiowane rekurencyjnie. T ypo­

wymi zastosow aniam i tak rozum ianych hipertekstów są biura, systemy ewidencyjne w spom agające dla przy­

kładu systemy CAD, biblioteki.

■ Tworzenie hiperksiążki. Z arów no książka, ja k i hiper- książka, są tw orzone przez au to ra lub autorów w pew-

4

Inform atyka nr 3, 1996 r.

(7)

nym określonym zam kniętym czasie (tzn. od pewnego m om entu są gotowe i nie m ogą być przez autorów zmieniane). Z hiperksiążką są związane dwie grupy podm iotów : A utorzy tworzą węzły i powiązania. Czy­

telnicy m ogą być pasywni, tzn. m ogą tylko czytać hipertekst. M ogą być także aktywni - tworzyć węzły.

Często w systemach hipertekstu przewiduje się dla aktywnych czytelników specjalny typ węzłów prze­

znaczony do kom entow ania hipertekstu, np. annota- lion. W olno im także tworzyć nowe powiązania.

Typowe zastosow ania hiperksiążek to nau k a i kształ­

cenie, techniczna dokum entacja i adm inistracja [7].

Paradoksem jest, że pisaniu hipertekstów poświęcono w literaturze przedm iotu mniej miejsca niż pozyskiwaniu informacji z hipertekstów i czytaniu w nich. Nie znane mi są badania porów nujące efektywność pisania z wykorzys­

taniem systemu hipertekstu i systemu przetw arzania tekstów. Nie m ożna zatem przytoczyć obiektywnie wery­

fikowalnych argum entów przem awiających za pisaniem w formie tekstu lub hipertekstu.

O d w r o t n o ś ć p isan ia i ro zu m ie n ia

Sztuka pisania interesuje ludzi od tysięcy lat. Już staroży­

tni Grecy rozwinęli ją ja k o zdolność do efektywnego przekazyw ania wiedzy. Posługując się term inologią hi­

pertekstow ą można wskazać, że tradycyjna retoryka rozróżnia im entio, dispositio i elucutio.

■ Im entio polega na grom adzeniu jednostek wiedzy, które później m ają zostać przekazane czytelnikowi.

Jednostki wiedzy odpow iadają hipertekstow ym węz­

łom. Pow staje sieć węzłów odpow iadająca strukturze znaczeniowej grom adzonej wiedzy, a nie przyszłemu tekstowi.

■ N a etapie dispositio tworzy się hierarchiczną strukturę odpow iadającą zamierzonej argumentacji.

a Elucutio odpow iada budow aniu z utworzonej uprzed­

nio hierarchii liniowej struktury tekstu.

Poszczególne etapy nie m ogą być rozum iane jak o niezależne od siebie. D la przykładu, budując strukturę argum entacyjną (ang. dispositio) au to r stwierdza koniecz­

ność uzupełnienia wiedzy wspierającej jego argum entację.

Pow raca zatem do im entio uzupełniając wiedzę lub rewidując swoje poglądy na tem at jej strukturalizacji.

Czytanie tekstu jest procesem odw rotnym . Czytelnik czyta tekst sekwencyjnie. Pierwszym etapem rozum ienia tekstu jest identyfikacja jego liniowej struktury - rozpo­

znanie jednostek informacji. N a tej podstaw ie stara się zrekonstruow ać strukturę argum entacyjną autora. Zi­

dentyfikowane jednostki informacji wiąże w hierarchię.

Struktura argum entacyjna zbudow ana przez czytelnika nie odpow iada jednak z reguły strukturze, ja k ą posłużył się autor, ponieważ:

b Bogactwo pow iązań hierarchii w dispositio nie może być przedstaw ione w jej sekwencyjnej reprezentacji w elucutio. Sprawą au to ra jest wybranie najważniej­

szych powiązań.

■ W iedza au to ra i czytelnika różnią się, zatem obaj inaczej interpretują wiedzę zaw artą w jednostkach informacji.

S truktura argum entacyjna zbudow ana przez czytel­

nika może być podobna do struktury argum entacyjnej autora, jeżeli a u to r popraw nie ocenił wiedzę antycypow a­

nego czytelnika, sposób czytania, podatność na techniki

retoryczne itd. Tekst jest jednak zrozum iały dopiero wtedy, kiedy nowa wiedza jest połączona z dotych­

czasową wiedzą czytelnika. Postrzegając wiedzę czytel­

nika ja k o sieć jednostek informacji uważamy, że nowa wiedza została przysw ojona przez czytelnika, jeżeli wy­

odrębnione w czasie czytania jednostki informacji zostały włączone w sieć jednostek informacji uprzednio znanych czytelnikowi.

r o z u m ie m

przyswajanie

disposito

czytanie

R y s. 2. O d w ro tn o ść p ro c e su p isa n ia i ro z u m ie n ia te k stu

O dw rotność procesu pisania i rozum ienia przedstawia rys. 2. Kule przedstaw iają węzły, strzałki pow iązania. N a górnym rysunku widzimy węzły dowolnie powiązane, z nich tw orzona jest hierarchia, k tó ra jest następnie przekształcana w listę.

T w o r z e n ie z a w a r t o ś c i - inv e n tio

Podstaw ow ym pytaniem , na które musi znaleźć od­

powiedź au to r hipertekstu jest ustalenie - jak i jest węzeł?

Ogólnie przyjęto, że:

■ węzły powinny być poświęcone znaczeniowo spójnym tem atom ; Sugeruje się: pisz krótkie węzły, w każdym koncentruj się n a jednym temacie. Jest to tym istotniej­

sze, że nie powinniśmy zapom inać o wolniejszym czytaniu z m onitora niż tekstu drukow anego;

■ wszystkie pojęcia niezbędne do zrozum ienia informacji zawartej w węźle powinny być wyjaśnione w nim lub w węzłach z nim powiązanych;

■ węzły powinny swoją wielkością odpow iadać rozwią­

zaniom inżynierii oprogram ow ania stosow anym do ich prezentacji.

W czasie tworzenia zaw artości rozróżnia się dwa rodzaje obiektów: węzły zaw artości i węzły powiązań.

Węzły zaw artości zawierają tekst, grafikę lub informacje w dowolnej innej formie. Węzły powiązań wskazują na

(8)

związki zachodzące każdorazow o pomiędzy dw om a węz­

łami zawartości. Stosuje się je wtedy, kiedy związki pomiędzy węzłami zawartości są dla au to ra trudno przedstaw ialne z wykorzystaniem powiązań. Pow iązania są skierowane, tzn. znam y początek powiązania, jego źródło (którym jest węzeł zawartości) i jego koniec (jego cel, którym jest także węzeł zawartości). Dzięki węzłom pow iązań możemy zatem nawigować od źródła do celu.

Rozróżniam y ponadto dwa rodzaje węzłów zawartości:

węzły proste i węzły złożone. Pierwszy rodzaj węzłów zawiera pewną niepodzielną dalej informację. Węzły złożone zawierają węzły zawartości i węzły powiązań.

T w o r z e n ie s tr u k t u r y - d is p o s it io

H ipertekst zawartości zostaje uformowany w strukturę odpowiadającą:

■ wiedzy prezentowanej w tworzonym hipertekście (stru- kturalizacja semantyczna);

■ modelowi antycypow anego czytelnika: jego potrze­

bom informacyjnym, wiedzy przed czytaniem tw orzo­

nego hipertekstu, sposobowi pozyskiwania informacji z hipertekstu (strukturalizacja dla użytkownika);

■ stosowanej retoryce (strukturalizacja retoryczna).

Oczywiście te trzy czynniki wpływają na siebie. Stoso­

w ana retoryka zależy przecież od prezentowanej wiedzy i modelu czytelnika.

O pisano już wiele praktycznych rad do tworzenia prezentacji struktury hipertekstu. W ymieńmy kilka z nich.

M. Bernstein w czasie sem inarium o pisaniu hiperteks­

tu odbywającego się w M ediolanie podczas E C H T ’92, (F ourth ACM Conference on Hypertext) sugerował, by hipertekst rozpoczynał się wzbudzającą zainteresowanie czytelnika stroną tytułow ą - węzłem początkow ym - i kończył się stroną końcow ą - węzłem końcowym - podsum ow ującą cały hipertekst. Takie podejście jest zbliżone do klasycznego strukturalizow ania tekstów: po­

czątek - rozwinięcie - zakończenie. Sugerował on jednak, by elementy dram atyczne były stosow ane z rozwagą.

N adm ierne wykorzystanie różnych mediów, których ła­

dowanie do pamięci we współczesnych systemach zajmuje czas, a zatem nie sprzyja koncentracji na czytanym hipertekście, oraz budow anie nadmiernej liczby powią­

zań, które może wybrać czytelnik, przyczyniają się do obniżenia akceptowalności hipertekstu przez czytelnika.

Jacob Nielsen sugeruje, by wykorzystywać własności hipertekstów dla uzupełniania ich o struktury ułatwiające zorientow anie się w zaw artości węzłów i pow iązań pom ię­

dzy nimi [6]. Należy unikać nadm iernej strukturalizacji hipertekstu przez tworzenie powiązań, co praw da uzasad­

nionych ze znaczeniowego p u nktu widzenia, ale których wykorzystanie przez antycypowanego czytelnika wydaje się mało praw dopodobne. Należy też unikać tw orzenia powiązań pomiędzy węzłami odległymi sobie znaczenio­

wo. N aw et, jeżeli przyszły czytelnik miałby często korzys­

tać z takich powiązań, istnieje duże niebezpieczeństwo ich niezamierzonej interpretacji przez część czytelników. O d ­ powiedzialny a u to r hipertekstu nie powinien zapom inać, że jego zadaniem jest, przez określenie powiązań, wskaza­

nie czytelnikowi priorytetów w czytaniu hipertekstu.

Sugeruje się, by powiązaniam i łączyć częściej informacje elem entarne niż ich syntezy.

W tekstach informacje są prezentow ane explicite i im­

plicite. Pewne informacje są zatem jaw nie przedstaw iane 6

czytelnikowi, inne musi wywnioskować [5]. Proponuje się jed n ak rozgraniczenie pomiędzy w nioskow aniem wy­

nikającym z praw logiki, a wnioskowaniem wynikającym z umiejętności interpretow ania retoryki hipertekstu (przysłowiowe czytanie pom iędzy wierszami).

H ipertekst powstaje często z informacji pochodzących z różnych źródeł. Autorzy hipertekstów m ają jednak tendencje do tw orzenia pow iązań wynikających z infor­

macji z poszczególnych źródeł [7].

Częstą przyczyną kłopotów w nawigacji jest niewystar­

czające rozumienie przez czytelnika znaczenia powiązań pomiędzy węzłami. D latego proponuje się, w sytuacjach, kiedy m am y do czynienia ze szczególnie ważnymi relac­

jam i pomiędzy węzłami, tworzyć wielokrotne pow iązania pomiędzy dw om a węzłami. K ażde z tych powiązań pow inno wyrażać inny aspekt relacji pomiędzy węzłami [5], Propozycja ta jest w wyraźnej sprzeczności z postula­

tem minimalizacji liczby powiązań. Rozwiązanie tego konfliktu zależy od wielu czynników, m.in. od modelu czytelnika, wielkości hipertekstu, m etody i środków tech­

nicznej wizualizacji.

Niegel W oodhead sugeruje, by w hipertekstach o ogra­

niczonych możliwościach nawigacji daw ać możliwość dochodzenia do pewnych węzłów przez wiele powiązań.

N azywa on to zapow iadaniem węzłów. Uważa, że jeżeli czytelnik pragnie zapoznać się z jak ąś w ażną informacją, to au to r powinien zbudow ać powiązanie do niej przy pierwszej merytorycznie uzasadnionej okazji [8].

H ipertekst zaw artości zostanie zatem uzupełniony o obiekty wspom agające strukturalizacje tworzonego hipertekstu. Tak określone składow e hipertekstu zaw ar­

tości m ogą być postrzegane ja k o m ikrostruktury w spo­

m agające późniejsze czytanie, nawigowanie i wyszukiwa­

nie w tw orzonym hipertekście, a także popraw iające jego koherencję.

R ainer H am m w óhner [4] proponuje cztery reguły tw orzenia m ikrostruktur:

1. Z hipertekstu usuń te informacje, które nie są niezbęd­

ne do rozum ienia hipertekstu.

2. U suń te informacje, które m ogą być przez czytel­

nika wywnioskowane z poprzednio przeczytanych węzłów.

3. W przypadku wielokrotnego wystąpienia informacji szczegółowych zastąp je bardziej ogólnymi.

4. N azw a m ikrostruktury wynika z informacji zaw artych w m ikrostrukturze.

Reguły te wydają się być oczywistymi, jednak ich stosowanie budzi wiele wątpliwości. W ogólnym przypad­

ku zakłada się w systemach hipertekstu niezdeterm inow a­

ną kolejność czytania węzłów. T rudno zatem stwierdzić autorow i, czy czytelnik przeczytał węzły, z których może wywnioskować informacje niezbędne do zrozum ienia właśnie czytanego węzła (reguła 2.). M im o że au to r hipertekstu musi założyć model antycypow anego czytel­

nika, trudno m u z całą pewnością stwierdzić czy czytelnik nie jest właśnie zainteresow any szczegółowymi przypad­

kami, a nie ich uogólnieniem (reguła 3.). D latego Niegel W oodhead sugeruje, by przez budow anie pośrednich stopni abstrakcji w prow adzać czytelnika coraz głębiej w rozw ażaną m aterię [8].

D la strukturalizacji hipertekstu zaw artości stosuje się dwa typy węzłów: sekwencji i eksploracji. Listę węzłów w ybranych z hipertekstu zaw artości połączonych pow ią­

zaniam i sekwencji zawierają węzły sekwencji. K ażda lista węzłów jest nazyw ana hiperdokum entem . D opuszcza się przejście z jednego hiperdokum entu do innego. M ożliwa

Inform atyka nr 3, 1996 r.

(9)

jest także zm iana porządku węzłów w hiperdokum encie.

Stosow ane są różne kryteria porządku. N a decyzje o b u ­ dow aniu sekwencji przez a u to ra decydujący wpływ m ają strukturalizacja sem antyczna i retoryczna. Węzeł sekwen­

cji reprezentuje istotną z punktów widzenia znaczenio­

wego, ważności dla przyszłego czytelnika lub przyjętego sposobu pisania hipertekstu część hipertekstu zawartości.

Węzły takie m ogą być czytane tylko w kolejności przewi­

dzianej przez au to ra hipertekstu. Węzły sekwencji m ogą być budow ane rekurencyjnie. Węzły eksploracji zawiera­

ją podobnie ja k węzły sekwencji część hipertekstu zaw ar­

tości. Nie musi być to jednak ju ż sekwencja węzłów, lecz może to być dow olna struktura. Przyszłemu czytelnikowi nie sugeruje się zatem kolejności czytania węzłów. W węź­

le eksploracji wyróżniam y dwa węzły: węzeł początku i węzeł końca. Czytelnik rozpoczyna zatem czytanie węzła eksploracji w jednym wyróżnionym w nim węźle i kończy w innym w skazanym węźle.

Wiele systemów hipertekstu wspom agało budow anie tylko stru k tu r hierarchicznych. Często twierdzono, że dom inującym i pow iązaniam i są pow iązania hierarchicz­

ne. Dopuszcza się jednak pow iązania łączące węzły w poprzek hierarchii. Takie widzenie hipertekstu sugero­

wało rozpoczynanie nawigacji od korzenia, który zawie­

rał najbardziej ogólne informacje. N astępnie czytelnik przez nawigowanie do węzłów leżących niżej w hierarchii zagłębiał się coraz bardziej w problem atykę. Budowanie heterohierarchii pozwalało na alternatyw ne zapoznaw a­

nie się z prezentow aną problem atyką. Takie podejście wydawało się słuszne dla wielu zastosow ań technicznych, np. prezentacji dokum entacji okrętu wojennego w sys­

temie KM S.

T w o r z e n ie prezentacji - e lu c u tio

Tworzenie prezentacji należy w moim przekonaniu roz­

graniczyć na tworzenie prezentacji węzłów i tworzenie prezentacji hipertekstu. N iektórzy autorzy np. [2] uw aża­

ją, że do tw orzenia prezentacji należy określenie technik interakcji z czytelnikiem przez określanie metafor dialogu człowiek - maszyna.

M etody tworzenia prezentacji węzłów m ogą czerpać z szerokich doświadczeń w zakresie np. typografii, kształ­

tow ania nieelektronicznych m ateriałów dydaktycznych, systemów okien (np. Windows), m etod prezentacji sym ­ bolicznych i wizualnej. Trzeba tu jednak podkreślić często m ultim edialny charakter węzłów; nie m ogą być one zatem widziane ja k o teksty umieszczone w strukturze. W ybór właściwego m edium lub mediów ma jednak kluczowe znaczenie dla przyszłej akceptow alności tw orzonego hi­

pertekstu przez czytelników. M ożna tutaj korzystać z do­

świadczeń systemów m ultim edialnych, w których badano wzajemne zależności pom iędzy mediami.

Dotychczas projektow ano strukturę hipertekstu bez zastanaw iania się n ad formą, w jakiej zostanie on ostate­

cznie zaprezentow any czytelnikowi. H ipertekst jest b ar­

dziej złożonym sposobem prezentacji niż tekst, dlatego też nie m ożna korzystać z doświadczeń zdobytych w trakcie elucutio.

Rozróżnia się trzy sposoby prezentacji [3]. W prezen­

tacji tekstowej są pokazyw ane węzły zaw artości uzupeł­

nione wskaźnikam i powiązań. M ogą być one przed­

stawione, na przykład, w formie, „gorących” przycisków.

N azw a prezentacji tekstowej nie pow inna wskazywać, że w tej formie pokazyw ane są tylko teksty. M ogą być to także węzły multim edialne. Istotne jest to, że czytelnik nie widzi struktury hipertekstu, lecz tylko pojedynczy węzeł oraz pow iązania wchodzące i ewentualnie wychodzące z niego. Zaletą tej formy prezentacji jest skoncentrow anie się n a prezentacji zaw artości węzłów. Niew ątpliw ą wadą jest natom iast zrezygnowanie z poważnej części zalet hipertekstu - prezentacji struktury pow iązań pomiędzy węzłami.

Prezentacja graficzna (określana także ja k o prezenta­

cja grafowa) pokazuje oglądany przez nas węzeł jak o węzeł centralny grafu gwiazdy. To znaczy, że widzimy interesujący nas właśnie węzeł i wszystkie powiązania, w których on uczestniczy. N ie widzimy jednak zawartości samego węzła. Prezentacja mieszana pozw ala oglądać równocześnie zaw artości węzła oraz wszystkie lub tylko część pow iązania, w których on uczestniczy.

* * *

Doświadczenia naszego zespołu wskazują, że prace nad retoryką hipertekstu powinny koncentrow ać się na dwóch kierunkach: badaniu ogólnych zasad określania retoryki hipertekstu oraz tworzeniu retoryk związanych z poszczególnymi zastosow aniam i hipertekstu, (np. reto­

ryka dla zastosow ań w dydaktyce [1],

K o n ta k t z A u to rem :

A kadem ia Ekonom iczna, Katedra Informatyki E k on o­

micznej,

Al. N iepodległości 10, 60-967 Poznań te). (0-61) 69-92-61

L IT E R A T U R A

[1 ] A bram ow icz W.: H ypertextgestützte H ypertextausbildung, 6. CIP- K ongreß, C om puter in der Lehre, 6-8 O ktober 1992, Berlin [2] E ncarnaçâo J., H übner W., V äänänen K.: Autorenw erkzeuge für

m ultimediale Inform ationssystem e, Inform atlonstechnik und Tech­

nische Inform atik, Vol. 35, N o. 2, s. 31-38, 1993

[3] H aake J. M., H annem ann J., T huring M.: Ein A nsatz zur O r­

ganisation von H yperdokum enten, M aurer H.(ed.): H ypertext/H ype­

rm ed ia'91, T agung der G l, SI und O CG , G raz, Springer-Verlag 1991 [4] H am m w öhner R.: M acro-O perations for H ypertext Construction,

Jonassen D.H., M andl H. (ed.): Designing H yperm edia for Learning.

Proceedings N A TO Advanced Research W orkshop on Design Hype­

rtext/H yperm edia for Learning. Springer-Verlag, 71-98, 1990 [5] Horacek H.: Einige Ideen zu r besseren Erstellung und zur leichteren

Verwendung von H yperdokum enten, 5. W orkshops H ypertext und K ünstliche Intelligenz, 2-3 Dezember 1993

[6] Nielsen J.: Hypertext and H yperm edia, Academic Press, 1990 [7] Schnupp P.: H ypertext, R. O ldenbourg Verlag, 232, 1992

[8] W oodhead N.: H ypertext and H yperm edia, Theory and A pplications, Addison-W esley 1991.

(10)

Walcownia M Zakłady Gór

- . j s s S S ł

^ * e S 5 s & .

POUFABB ^ ^ ¿ u o h na

P OLA^ , « t ó t o W i c e

p k m k ^ u a .

matyKi

in s ty tU tŚ t o s o ^ a n e j T e o r e ty c z n e j i T e c h n ic z n ®

Centrum

Naukow

|ejnict^

I n s t y t u t S p a W 3 'nlC

ItffiO TECHNICZNO-HANDLOWE, GLIWICE, ui Kościuszki 1c, box 507, tel,/fax (032) 31-51-31,31-57-00,38-80-52,38-80-54,

(11)

Głosowa komunikacja człowiek-komputer w języku naturalnym

Czesław Basztura

Instytut Telekomunlkacll I Akustyki Politechnika W rocław ska

W artykule przedstawiono podstawowe zagadnienia głosowej komunikacji człowiek-komputer, realizowanej w formie języka naturalnego, stanowi on wprowadzenie do problematyki objętej pozostałymi artykułami. Z łożoność tej tematyki wynika z tego, że są to problemy interdyscyplinarne z zakresu akustyki m owy, lingwistyki, w tym fonetyki i fonologii oraz sztucznej inteligencji i informatyki. Omówienie komunikacji głosowej usytuowano na tle zagadnień całościowej interakcji i komunikacji człowieka z komputerami.

Typowy sposób kom unikow ania się człowieka z ko m ­ puterem wymusza to, że przed przetransform ow aniem do środowiska komputerowego określonego zadania, które może być sform ułowane w języku naturalnym lub za pośrednictwem obrazów, musimy się nauczyć nie tylko przynajmniej jednego języka kom puterow ego, ale rów ­ nież zapoznać się ze zwykle opasłym, podręcznikiem użytkow nika. Te ograniczenia m ogą być i są redukow ane przez:

■ Zastąpienie podręczników użytkow nika przez zaim ­ plem entow ane kom puterow o systemy oraz strategie, sukcesywnie przystosow ujące systemy techniczne do użytkow nika i jego wiedzy o systemie i zadaniu.

b W łączenie na większą skalę zastosow ań naturalnej reprezentacji informacji, takiej ja k języki naturalne (mowa), obrazy itp.

pytani e-odpo wi edź nat.język

m cnu-wubór obraz

W YSIW YG m ultimedia

— - Í - — ikom unikacja I

R ys. 1. M o d e l k o m u n ik a c ji c z ło w ie k -k o m p u te r

Referat o zbliżonej treści został wygłoszony na konferencji „Głosowa komunikacja człowiek-komputer", Wrocław, 27-28 października I995r.

N a rysunku 1 pokazano, tworzący zintegrow aną ca­

łość, ludzki i techniczny system interakcyjny człowiek- kom puter. U żytkow nik systemu technicznego m a w um y­

śle model tego systemu, jego strukturę i funkcje. O praco­

wuje również model zadania i adekw atne strategie roz­

wiązujące problem. W nowoczesnych rozwiązaniach, system techniczny jest wzbogacony o program ow o im­

plem entow ane m odele zadań i modele użytkow nika. Za pom ocą tych dw óch m odeli system może być zdolny do przystosow ania się do użytkow nika, jego wiedzy o sys­

temie oraz zadaniu. M im o niewątpliwych ulepszeń w oprogram ow aniu ułatwiającym kom unikację człowie­

ka z kom puterem jest oczywiste, że wąskim gardłem jest sposób w prow adzania i w yprow adzania informacji.

N owoczesne interfejsy człow iek-kom puter m uszą zo­

stać przystosow ane do ludzkich możliwości zmysłowych, m otorycznych i do ludzkiego sposobu rozum ow ania.

Przytoczone w pracy [19] dane (tab. 1) przez K arla Kuepfum uellera wskazują, że nasz system czuciowy jest zdolny do otrzym yw ania ok. 109 bitów/s informacji.

W iększość z nich jest przekazyw ana przez kanał optyczny (87 %), a następnie przez kanał akustyczny (10 %).

T a b e la 1. U d z ia ł po sz czeg ó ln y ch zm ysłów czło w iek a w k o m u n ik a c ji z o to czen iem

Z m ysł L iczb a

k o m ó re k n erw o w y ch

L iczb a w łókien n erw o w y ch

P rzepływ ność (bit/sj

U dział p ro cen to w y

%

W zrok 2 * 108 2 * 10* 2 * 10“ 87

Słuch 3 * 10* 2 * 10" 3,5 * 10* 10

Sm ak 10' 2 * 10J 10

3

W ęch 10' 2 * 10J 100

Zim no 101

10* 104

G orąco 10*

Ciśnienie 5 * 105 Ból 3 * 10"

Pozostałe kanały, przekazujące dane dotyku, sm aku, węchu, bólu, ciepła obejm ują przepływność zaledwie 3 % bitów/s. Nie trzeba tu chyba zaznaczać, że statystycz­

ne zestawienia bitów nie m ówią nic o ważności i stosow- ności przekazywanej informacji. Ludzki centralny układ nerwowy jest zdolny do świadom ego przetw arzania tylko od 10 do 100 bitów /s informacji. W ynika z tego, że pomiędzy odbiorem informacji a centralnym przetw arza­

niem ma miejsce znaczna redukcja danych. W mózgu człowieka dokonuje się swoista korelacja pomiędzy infor­

m acją otrzym aną za pom ocą zmysłów a wcześniej zdoby­

tą, nauczoną i zapam iętaną wiedzą. W przypadku głoso­

wej kom unikacji człowieka z kom puterem rozum ienie oznacza jednoczesne przetworzenie treści i znaczenia

(12)

nadanej informacji głosem, w języku naturalnym , na sekwencję adekw atnych działań i zwrotnej reakcji w po­

staci mowy syntetycznej.

Celem, o najwyższym znaczeniu, jest opracow anie przyjaznych i współpracujących z użytkownikiem głoso­

wych interfejsów kom unikacji człow iek-kom puter w języ­

ku naturalnym . Ludzie kom unikują się między sobą za pośrednictwem wypowiadanych zdań, przez tekst pisany i za pom ocą obrazów (ikony, gesty itp.). Jesteśmy przy­

zwyczajeni do rozpoznaw ania i do spostrzegania, do przetw arzania i interpretow ania obrazów, scen, pisanego i mówionego tekstu, muzyki i hałasu z jakością, nierzad­

ko, trudno osiągalną w technice. D o dialogu z ko m ­ puterem używamy języków form alnych i sterujemy sys­

tem am i kom puterow ym i za pom ocą klawiatury, myszy, joysticka, trackballa, tabliczki graficznej i innych ręcz­

nych technik. W ykorzystują one głównie zmysł wzroku i własności ruchowe ręki operatora. Z codziennej p rak ­ tyki wiadom o, że m owa jest najbardziej efektywnym i powszechnym sposobem kom unikow ania się między ludźmi. Właśnie m owa pow inna stać się jednym z mediów kom unikacji człowieka z kom puterem (rys 2). D otych­

czas, w kom unikacji z kom puteram i, prawie zupełnie nie wykorzystuje się mowy i zmysłu słuchu. Jak w iadom o, do najważniejszych przyczyn takiego stanu rzeczy m ożna zaliczyć:

■ występujące w dziedzinie G K C z-K problem y n au k o ­ we, które wymagają rozwiązania;

■ niedostateczny zakres współpracy specjalistów z dzie­

dzin związanych z G K C z-K ;

■ możliwości w drażania zależne od postępu w techno­

logii procesorów i kom puterów ;

■ jakość i efektywność systemów przetw arzania obrazu i mowy, bardzo często m ało satysfakcjonująca dla użytkowników;

■ głosowe kom unikow anie się z kom puteram i, które jest jeszcze kosztow ne w stosunku do oczekiwanej i wym a­

ganej jakości przekazu informacji.

I Krj I

A R M S M

>

> / \ /

A /C

(D S P ) SYNTEZATOR

' /<^

D S P PARAMETRYZACJA)

...

■*-G

ROZPOZNAWANIE

(KODY) S D

FORMOWANIE DANYCH SYNTEZY

(KODY)

SYSTEM ROZPOZNA WANL TEKSTU 1 WNIOSKOWANIA

BAZA BAZA WIEDZY

DANYCH ZDANEJ

JĘZYKOWYCH DZIEDZINY

R ys. 2. S c h e m a t h ip o te ty c z n e g o m o d elu sy stem u głosow ej k o m u n i­

k acji czło w ie k -k o m p u te r

Podstaw ow e problem y głosowej kom unikacji człowiek -k o m p u te r m ogą być rozw ażane w postaci trzech głów­

nych w spółpracujących systemów:

■ akustycznego wejścia do kom putera,

autom atycznego rozpoznaw ania mówców, inteligentnego systemu dialogowego.

T a b e la 2. P rz y k ła d o w e w arto ści d a n y c h dla w ejść i w yjść in fo rm a c y j­

n y ch (w a rto śc i z a o k rą g lo n e ) [19]

W e jś c ie in fo r m a c y jn e : P rz e p ły w n o ś ć : W y jś c ie in fo r m a c y jn e :

P r z e p ł y w n o ś ć :

K law iatu ra 8 0 - 130 bit/s C z y ta n ie tek stu 1 5 0 - 3 0 0 bit/s P isan ie ręczn e 1 0 - 2 0 bit/s „C z y tan ie ” o b razó w o k . 10^ bit/s M ow a 8 0 -20 0 bit/s S łuch an ie o k . 10^ bit/s D la poró w n an ia:

skan n er ok. 10^ bit/s

D la poró w n an ia:

d ru k ark a laserow a 104 - 106 bit/s

Problem atyka

akustycznego w ejścia do kom putera

Akustyczne wejście do kom putera to system um ożliwiają­

cy wprow adzanie informacji, poleceń i danych głosem, tak aby tą drogą m ożna było inicjować działania kom ­ pu tera analogicznie ja k za pom ocą klaw iatury lub np.

myszy. Realizacja akustycznego wejścia do kom putera wymaga przede wszystkim rozw iązania problem u a u to ­ matycznego rozpoznaw ania mowy (ARM). A utom atycz­

ne rozpoznaw anie mowy należy do wspólnej grupy badań objętych nazw ą analiza i przetw arzanie mowy. B adania te obejm ują również autom atyczne rozpoznaw anie głosów (ARG), syntezę mowy (SM), techniczną analizę mowy oraz akustyczną diagnostykę narządu głosu (część akus­

tycznej diagnostyki medycznej). K om putery i systemy wykorzystujące przekazywane im informacje za pośred­

nictwem sygnału mowy m ają następujące zalety:

■ Sterowanie i przekazywanie danych głosem może być realizowane znacznie szybciej niż za pom ocą klaw iatu­

ry alfanumerycznej, a przekazywanie informacji do maszyny za pom ocą sygnału mowy umożliwia zwol­

nienie rąk operatora.

■ Przekazyw anie informacji głosem może mieć miejsce w różnych nietypowych sytuacjach i położeniach ope­

ratora.

■ Czas reakcji głosowej jest znacznie krótszy niż reakcji ruchowej, co jest ważne w system ach alarm ow ych urucham ianych głosem.

■ U kłady sterow ania głosem pozwoliłyby w znacznym stopniu złagodzić skutki kalectwa ludzi, objawiającego się ograniczeniem zdolności ruchowych rąk lub nóg.

■ Sterowanie głosem nie wym aga od op erato ra specjal­

nego przygotow ania ani treningu.

Rys. 3. Ogólny schem at blokow y system ów A R M

10

Inform atyka nr 3. 1996 r.

(13)

Rozpoznaw anie elementów lingwistycznych przez człowieka opiera się na analizie docierającego do niego akustycznego sygnału mowy, ale również na znajomości kontekstow ych, gram atycznych i semantycznych ograni­

czeń istniejących w danym języku [1, 2,4, 5, 6,1 1 ,1 2 , 23, 26], Autom atyczne rozpoznaw anie mowy ARM , jest realizowane w procesie sekwencji procedur, które m ożna w uproszczeniu zgrupow ać w trzy podstaw ow e bloki (rys.

3);

■ źródło sygnału i blok wstępnego przetw arzania,

■ blok wydzielenia, czyli ekstrakcji param etrów dystyn- ktywnych,

■ blok klasyfikacji.

W bloku wstępnego przetw arzania następuje odbiór sygnału mowy z m ikrofonu, ja k o źródła w tórnego syg­

nału, oraz takie jego wstępne przetworzenie, aby sygnał mógł być przydatny do dalszej obróbki cyfrowej w n a­

stępnym bloku ekstrakcji param etrów . W stępne prze­

tworzenie obejmuje zazwyczaj wzmocnienie sygnału, tak aby jego poziom dopasow ać do zakresu przetw ornika analogowo-cyfrowego (a/c), oraz filtrację sygnału, czyli ograniczenie pasm a częstotliwości od dołu i od góry, tak aby górna częstotliwość pasm a sygnału mowy była co najmniej dw ukrotnie niższa od częstotliwości pobierania próbek przez przetw ornik a/c. W bloku ekstrakcji p a ra ­ m etrów następuje ob ró b k a i analiza sygnału mowy w celu otrzym ania wartości param etrów niosących informację o treści wypowiedzi, ale możliwie niezależnych od in­

dywidualnych cech głosu mówcy. Param etry te to w arto­

ści liczbowe cech fizycznych sygnału, które m uszą mieć właściwości dystynktywne, a więc pozwalające na rozróż­

nienie treści wypowiedzi. Aby otrzym ać takie param etry są urucham iane określone procedury analizy i ekstrakcji, które po zmierzeniu interesujących w artości param etrów odpow iednio je porządkują do postaci w ektora x lub macierzy X. Te uporządkow ane zbiory param etrów są nazywane obrazami całej wypowiedzi lub jej odcinka, czyli segm entu wypowiedzi. Jako param etry opisujące sygnał mowy są wykorzystywane następujące wielkości:

■ param etry liniowego kodow ania predykcyjnego,

■ param etry cepstralne,

■ częstotliwości form antow e, stosunki am plitudow e oraz szerokości pasm form antów,

■ param etry analizy przejść przez zero sygnału mowy,

■ widm o krótkoterm inow e,

■ względne długości czasu wypowiedzi poszczególnych elementów fonetycznych,

■ obw iednia czasowa am plitudy lub natężenie dźwięku w funkcji czasu,

■ charakterystyki prozodyczne itp.

O brazy wypowiedzi są przesyłane do bloku klasyfika­

cji, gdzie odpowiednie procedury dokonują, opierając się na określonym algorytmie, porów nania nadchodzących ciągów obrazów wypowiedzi ze znajdującym i się w p a ­ mięci wzorcami, czyli obrazam i m ającymi uogólnione w artości i opisy danych rozpoznaw anych klas dźwięków.

K lasą m ogą być fonemy, alofony, sylaby, wyrazy lub naw et całe zdania. Duże nadzieje, co wynika z ostatnich naszych badań oraz docierających doniesień literaturo­

wych, pokłada się w przyjęciu, ja k o podstawowych jednostek językow ych diafonów, czyli połączeń między- fonemowych. O brazy wzorcowe oraz inne dodatkow e dane, np. językowe, ułatwiające proces rozpoznaw ania są tworzone wcześniej, w trakcie procesu zwanego uczeniem.

W yniki klasyfikacji w postaci kodu lub ciągów kodowych są w prow adzane i m ogą stać się danym i wejściowymi

systemu dialogowego SD. D o zasadniczych problemów, istotnych przy opracow aniu systemów akustycznego w prow adzania informacji, zalicza się:

■ ustalenie optym alnych zasad tw orzenia dużych słow­

ników, dla ARMIS,

■ w ybór i segmentację explicite na podstaw ow e jed n o ­ stki językowe,

■ aplikację skutecznych m etod ekstrakcji param etrów , lingwistyczne,

■ aplikację algorytm ów uczenia i rozpoznaw ania, uwzględniających rzeczywiste uw arunkow ania działa­

nia ARM (np. łączność przez telefon ), w tym algorytmy Niejawnych M odeli M arko va (H M M ) i sztucznych sieci neuronow ych (ANN),

■ opracow anie systemów autom atycznego rozpoznaw a­

nia mowy ciągłej (AR MC), w tym systemów rozum ie­

nia mowy i w spółpracy z inteligentnym i systemami dialogowymi (SD).

A ktualnie problem autom atycznego rozpoznaw ania izolowanych słów (ARMIS) osiągnął stan możliwości w drażania do konkretnych zastosow ań [7], W ynika to z wysokiego standardu i dostępności k art dźwiękowych oraz oprogram ow ania realizującego dużą efektywność rozpoznaw ania (szczególnie dla małych słowników).

Problem autom atycznego rozpoznaw ania .mowy ciąg­

łej (ARMC), ja k wynika z aktualnych doniesień, jest na świecie w stadium intensywnych prac [19], Prace nad systemami A RM C, w tym o bardzo dużych słownikach, koncentrują się:

■ N a poziomie akustycznym , przez w prowadzenie jak o jednostek językowych polifonów, głównie diafonów, trifonów itd. W ybór dla polifonicznej reprezentacji, ja k o podstaw ow ych jednostek językowych - sylab lub diafonów - umożliwi stworzenie systemów rozpozna­

w ania mowy o bardzo dużych słownikach i o bardzo dużej niezależności od cech osobniczych mówców, trudnych do osiągnięcia przy zastosow aniu tylko kla­

sycznych jednostek, jakim i są fo n em y czy nawet alo­

fo n y [12,14]. D la mowy polskiej jest to nowe zagad­

nienie badawcze i naukowe.

* N a poziom ie m odelow ania - wprowadzenie m odelo­

w ania artykulacyjnego [8] oraz Niejawnych Modeli M arkova, I i/lub II rzędu, do m odelow ania wyrazów i ciągów wyrazowych, opartego na polifonach języka polskiego, pow inno zaow ocow ać popraw ą skuteczno­

ści tych modeli dla mowy spontanicznej. Ten trend jest też zgodny z tendencją prow adzonych aktualnie badań w krajach Unii Zachodnioeuropejskiej [19].

■ N a poziom ie klasyfikacji - zastosow anie sztucznych sieci neuronowych, w hybrydowych zestawieniach A N N /H M M , pow inno popraw ić relacje w układzie:

obrazy param etryczne - uczenie, rozpoznaw anie i ety- kietyzacja jednostek językowych [22, 27],

A u t o m a t y c z n e r o z p o z n a w a n ie m ó w c ó w

O prócz potrzeby rozpoznaw ania treści w niektórych sytuacjach istnieje potrzeba autom atycznego rozpozna­

w ania głosu op erato ra lub rozmówcy. W sygnale mowy oprócz informacji określających treść wypowiedzi, są zaw arte również informacje związane z wewnętrzną stru ­ kturą źródła wiadomości, a wśród nich informacje osob­

nicze charakteryzujące indywidualne cechy głosu mówcy

Cytaty

Powiązane dokumenty

Wśród tych zamówień znalazł się też system Phantomas niemieckiej firmy ZN, służący do przeszukiwań dużych baz danych twarzy, zakupiony przez polską policję i

nie większe możliwości tego modelu w zakresie modelowania semantyki rzeczywistości, wydaje się być bardziej dogodny do modelowania wymiaru czasu rzeczywistości

■ Raport, mimo często sygnalizowanej globalizacji procesów produkcyjnych i informacyjnych, koncentruje się w gruncie rzeczy na rozwoju wewnętrznych rynków Unii Europejskiej

Obecnie zapewnienie jakości oprogramowania znajduje się na poziomie (1) i polega głównie na organizowaniu inspekcji i przeglądów, których celem jest ocena gotowego

prawek błędnych zapisów. Modyfikacje elementów atrybutu są dużo bardziej kłopotliwe w obsłudze niż wstawianie lub wskazywanie na zakończenie istnienia elementu, gdyż często

Innym aspektem badań rynkowych - nie tylko w Polsce - jest to, że zdarzają się badania zamawiane nie po to, aby od­. biorca dowiedział się „prawdy” (cokolwiek by to nie

twarzania interakcyjnego, to ten zakres działania hurtowni danych, który jest dostrzegany przez użytkowników Systemu Wspomaga­. nia Podejmowania

kumentów jest możliwość szukania dokumentu, niezależnie od jego fizycznego miejsca składowania. Dla użytkownika nie ma znaczenia rodzaj bazy danych, w której