• Nie Znaleziono Wyników

ВИДОВЕ ЕЛЕКТРОННИ ТЕРМИНОЛОГИЧНИ РЕСУРСИ И ВЪЗМОЖНОСТИ ЗА ТЯХНАТА УПОТРЕБА

N/A
N/A
Protected

Academic year: 2021

Share "ВИДОВЕ ЕЛЕКТРОННИ ТЕРМИНОЛОГИЧНИ РЕСУРСИ И ВЪЗМОЖНОСТИ ЗА ТЯХНАТА УПОТРЕБА"

Copied!
6
0
0

Pełen tekst

(1)

Екатерина Петкова (София)

ВИДОВЕ ЕЛЕКТРОННИ ТЕРМИНОЛОГИЧНИ РЕСУРСИ И ВЪЗМОЖНОСТИ ЗА

ТЯХНАТА УПОТРЕБА

Abstract: Few types of electronic terminological resources, very different between each other by content, arrangement of components and way of construction, and the possibilities of their application are considered in the article. The basic characteristics of the terminological banks, terminological databases and terminological knowledge bases as well as their components and way of their structuring are examined in order to choose a suitable variant for digitalizing particular terminological archives.

Key words: terminological resources, term banks, databases, knowledge bases Главната цел на това проучване е свързана с необходимостта термино- логичните архиви на Секцията по терминология и терминография към ИБЕ при БАН да бъдат дигитализирани и предоставени за ползване на изследо- ватели, обикновени граждани, организации и др., търсещи по някакъв повод терминологична информация. То илюстрира етапите на запознаването ни с възможностите за използване на информационните технологии за нуждите на терминознанието. Въпреки че проучването засяга въпроси както от термино- логията, така и от автоматичната обработка на естествените езици и автома- тичната обработка на знания, тук интересът ни е насочен главно към начини- те да се подобри отразяването на системността в терминологията. Основната ни задача е да изберем каква разновидност на електронните терминологични ресурси е подходяща като модел за представяне на нашите архиви, какви еле- менти ще съдържа отделната терминологична единица, какви характеристики на понятията ще бъдат застъпени и по какъв начин ще бъдат структурирани.

Затова, преди да пристъпим към нейното решаване, ще направим кратък прег- лед на някои видове електронни терминологични ресурси, включително и на няколко конкретни разработки на терминолози съвместно със специалисти по информационни технологии.

Трябва да се отбележи, че разгледаните тук терминологични ресурси са много разнородни като съдържание, структура, начин на планиране и изграж- дане и възможности за приложение. �е представим накратко следните видо- ве: терминологични банки, терминологични бази данни и терминологични бази знания. Няма да се спираме подробно на отделните компоненти, които те съдържат, а само на основните им характеристики.

(2)

Повечето автори, чиито изследвания ни бяха достъпни досега, дават раз- лични определения на терминологичните банки, на тяхното съдържание и характеристики. В свое проучване Сейгър и Макнаут (Сейгър, Макнаут 1980) разглеждат някои видове терминологични банки и възможните им приложе- ния и обосновават необходимостта от тяхното изграждане. Авторите дефини- рат терминологичната банка като въведена в компютър колекция или сбирка от стандартизирани термини с техни съответствия на два или повече езици, със или без дефиниция. По това време терминологичните банки се използ- ват от относително тесен кръг потребители (главно преводачи) въпреки въз- можностите за приложението им в обработката на информация, изучаване на дадена специална област и др. Според авторите на проучването тези сбир- ки могат да се използват за справки, като основа за създаване на речници, а също и „като контролен инструмент за съдържанието на терминологията и като спомагателен инструмент в информацията и документацията“ (Сейгър и Макнаут 1980).

Друга авторка – С.-Е. Райт (Райт 2001) прави разграничение между тер- минологична банка и терминологична база данни. Терминологичната бан- ка представлява електронно хранилище на терминологични данни, с голям обем и комплексна вътрешна организация, което най-често се характеризира с присъствие на различни по вид, степен на сложност и структура елемен- ти в сравнение с терминологичните бази данни, като напр. многоелементни приложения, интерактивни файлови структури и др. (Фрийдман 1989: 174, 184, цит. по Райт 2001: 878). Терминологичната база данни представлява съвкупност от взаимосвързани файлове с терминологични данни, създадени и обработвани с помощта на програма за обработка на бази данни. Най-чес- то терминологичните бази данни се създават от лица, фирми, организации и под., докато терминологичните банки съдържат терминологичните ресур- си на институции и за създаването им е необходимо държавно финансира- не. Терминологичните бази данни са съставени от записи на данни, нарече- Терминологичните бази данни са съставени от записи на данни, нарече- ни терминологични единици, всяка от които се отнася за отделно понятие и съдържа едни и същи елементи както останалите терминологични единици.

Сред тези елементи са названието на термина, лингвистична информация, характеристики на означеното с термина понятие, информация за останалите свързани с него понятия (термини), административна информация, източни- ци на данните, както и еквиваленти на терминологичното название на един или няколко различни езика (Райт 2001: 878–880).

От своя страна Мейер и нейните сътрудници отделят следните черти на традиционните терминологичните бази данни: те съдържат главно лингвис- тична информация за термините (напр. съответствия на други езици, грама- тична информация и др.); данните за понятията, означени с термините, са неструктурирани, непоследователни и имплицитни и „се ограничават до дефиниция и понякога контексти“ (Мейер и др. 1992: 956). Тези причини обуславят необходимостта от намиране на нови решения за представяне ор-

(3)

ганизацията на понятията в специалните области и насочват проучванията към създаване на понятийни йерархии, „представящи формализирано поня- тийните системи в определена специална област“ (Колковска 2005). Такива понятийни йерархии са понятийните онтологии и терминологичните бази знания. Напр. новият тип терминологично хранилище, разработен от Мейер и нейните сътрудници, представлява съчетание между терминологична бан- ка и база знания и съдържа по-голям набор и „по-систематично структури- рани елементи на знанието от конвенционалните терминологични банки и специализирани речници“ (Мейер и др. 1997: 99). Според определението на авторите терминологичните бази знания представляват високо структурира- ни електронни хранилища на знания, в които характеристиките на понятията и отношенията, в които те влизат помежду си и които ги свързват в системи, са експлицитно изразени (пак там).

Понятието терминологична база знания намира по-нататъшно развитие в следващите разработки на Мейер, в които тя обосновава базирания на зна- ния подход в терминологията като съвместяващ два различни (но допълващи се) аспекта: първият се отнася за съдържателната страна на терминологич- ната база знания и означава, че подходът при изграждането £ следва да бъде

„базиран на знания за дадена научна област“, т.е. работата на терминолозите изисква определено ниво на познания за системата от понятия в научната област и за отношенията между тях; вторият се отнася за формалния начин за представяне на знанията и означава, че резултатите от концептуалния анализ на научната област следва да бъдат „кодирани като знание“ (Мейер и др. 1997:

98), т.е. организацията на понятията и отношенията между тях да бъде пред- ставена систематично и във високо структуриран вид.

Някои учени (напр. Кондамин, Ребейрол 1998) разграничават две отдел- ни направления в разработването на терминологични бази знания. Едното от тях включва специалисти с подготовка в областта на изкуствения интелект, които работят в посока на формализиране на терминологичните данни, като използват т. нар. концептуални графи, представящи начина, по който поняти- ята в дадена подобласт или в отделна нейна част са организирани в система;

поради този подход терминологичните бази знания, разработвани от това на- правление, са определени като формализирани и ориентирани към приложе- нията (application-based and formalized terminology knowledge base). Второто направление включва специалисти с лингвистична и терминологична подго- товка, които се интересуват от извличането на данни от текстове; поради този подход терминологичните бази знания, разработвани от това направление, са определени като корпусно базирани (corpus-based approach to terminology knowledge base). Според Кондамин и Ребейрол вторият тип бази знания, към който принадлежи и разработката на двете авторки, се съставят и използват според конкретните нужди на отделните ползватели, като всеки от тях може да допълва и модифицира дадена корпусно базирана терминологична база знания, за да получи достъп до знанията, съдържащи се в определен корпус,

(4)

може да я използва за създаване на индекс на съдържащите се в даден текст термини, за пренаписване на текст и др.

Възможностите за приложение, които от своя страна предоставят форма- лизираните терминологични бази знания, са от голямо значение при изучава- нето на всяка специална област, затова те са особено ценни и необходими за терминолозите – в помощ при работата им по анализа на системата от поня- тия в даден клон на знанието; могат да бъдат от съществена полза и за препо- давателите по терминология, техническо писане и превод.

Тук за нашите цели (дигитализиране на терминологичните архиви на Секцията по терминология и терминография към ИБЕ при БАН) поради на- чалния етап на проучванията ни смятаме за най-подходящо да се насочим към създаването на терминологична база данни. Съображенията за този избор са няколко. От една страна, те са свързани с желанието заложените сега възмож- ности да позволяват въведените данни по-нататък да могат да се използват за изграждане на терминологични бази знания. От друга страна, поради това, че по принцип терминологичните бази знания имат доста по-сложни цели – от- разяване на знанията за дадена научна област, а именно отразяване на отно- шенията между понятията по систематичен начин и във високо структуриран вид, обикновено те се изграждат първоначално за много тесни научни облас- ти или дори за отделни техни части. От трета страна, за терминологичните архиви, чието въвеждане в електронен вид планираме, е по-подходяща такава разновидност, която да може да обхване знания от различни научни области (напр. поради възможността термин от една област да присъства в перифе- рията на друга специална област). Тези фактори ни дават основание на този етап да изберем като форма за дигитализирането им терминологичните бази данни, при които всяка отделна единица (термин, понятие) съдържа едни и същи компоненти като останалите единици.

Накратко ще обърнем внимание и върху модела на представяне на терми- нологичната единица. Той се опира върху идеята на М. Попова за организи- ране на информацията, отнасяща се за даден термин, под формата на отделни структурно-съдържателни части – модули (Попова 2004; Попова 2006). Няма да се спираме върху обосновката за присъствието на отделните компоненти на терминологичната единица и за тяхното съдържание, а само ще споменем, че концепцията на М. Попова за представяне на терминологичната едини- ца 1. показва как да бъдат подбрани идентифициращите и диференциращите признаци на термина и 2. осигурява такова описание на характеристиките на понятията и на връзките между тях, което отразява както класификационната системност (или родово-видовите отношения и отношенията между видови термини, съподчинени на един родов термин), така и импликационната си- стемност (или отношенията между цяло и негови части и отношенията в пре- дикатно-актантните сцени) (Попова 2006).

Моделът на терминологичната единица в планираните електронни тер- минологични архиви се състои от следните компоненти (модули):

(5)

1. Заглавка на термина

2. Научна / професионална област 3. Лингвистична информация

4. Синонимни термини (ако има такива)

5. Значение / дефиниция – родов признак, диференциални признаци 5.1. При родовите термини:

5.1.1. Препратки към съставните части (СЧ: вж.) – след модула на дефиницията

5.1.2. Препратки към видовите термини (В: вж.) – в края на стати-2. Препратки към видовите термини (В: вж.) – в края на стати-. Препратки към видовите термини (В: вж.) – в края на стати- ята на термина

5.2. При видовите термини:

5.2.1. Препратки към съставните части (СЧ: вж.) – след модула на дефиницията

5.2.2. Препратки към останалите видови термини (Срв. с) – в края на статията на термина

6. Съдържание на термина (някаква част от него)/ енциклопедична ин- формация

7. Асоциативни връзки (Ас: вж.)

8. Антонимни термини (ако има такива)

9. Съответствия на термина на други езици (на по-късен етап)

10. Модул с подходящи текстове, показващи особеностите при функцио-. Модул с подходящи текстове, показващи особеностите при функцио-, показващи особеностите при функцио- нирането на термините

11. Източник

12. Техническа/административна информация (дата на въвеждане; спе- циалистът, въвел данните)

Тъй като разработваните в Секцията по терминология и терминография терминологични архиви имат нееднороден състав, се предвижда попълване- то на отделните модули в състава на всяка терминологична единица да се извършва постепенно, като на първо място се въведат вече събраните данни.

По-нататък те ще бъдат допълвани, а също и модифицирани при откриване на несъответствия при отразяване на системните отношения между понятията.

След привеждането си в електронен вид терминологичните архиви ще могат да се използват за справки за формата и значението на термините, за създаване на речници, както и като материал за изследвания върху различни теоретични и приложни терминологични въпроси.

Очертаната по-горе организация на данните за всеки термин, основава- ща се на концепцията за модулен тип речник (Попова 2006), е едно начално предложение за съдържанието на отделната единица от терминологичната база данни. В по-нататъшни разработки следва да се разгледат начините за формалното представяне на информацията от тези модули. Присъствие- то на изброените модули от данни за всеки термин спомага за постигане на сис темност в описанието на термините от дадена област както в понятийно-

(6)

семантичен, така и в лексикалносемантичен план, чрез което се изпълнява изискването за „базиран на знания“ за специалната област подход към терми- нологията.

ЛИТЕРАТУРА

Колковска 2005: Колковска, С. Модели на концептуално-семантичните отноше- ния между термините в специален (химически) текст с оглед на автоматич- ното им разпознаване. Варна: LiterNet. <http://liternet.bg/publish16/s_kolkovska/

modeli/01.htm>

Кондамин, Ребейрол 1998: Condamines, A., J. Rebeyrolle. CTKB: A Corpus-based ap-Condamines, A., J. Rebeyrolle. CTKB: A Corpus-based ap-, A., J. Rebeyrolle. CTKB: A Corpus-based ap-A., J. Rebeyrolle. CTKB: A Corpus-based ap-., J. Rebeyrolle. CTKB: A Corpus-based ap-J. Rebeyrolle. CTKB: A Corpus-based ap-. Rebeyrolle. CTKB: A Corpus-based ap-Rebeyrolle. CTKB: A Corpus-based ap- proach to a Terminological Knowledge Base. // Computerm’98, First Workshop on Computational Terminology, Montreal, Canada, pp. 29–35.

Мейер и др. 1992: Meyer, I., D. Skuce, L. Bowker, K. Eck. Towards a New Generation of Terminological Resources: An Experiment in Building a Terminological Knowl- edge Base. // Proceedings of the 14th International Conference on Computational Linguistics (COLING’92), Nantes, France, pp. 956–960.

Мейер и др. 1997: Meyer, I., K. Eck, D. Skuce. Systematic Concept Analysis within a Knowledge-Based Approach to Terminology. // Handbook of Terminology Manage- ment. Vol. I.. Eds. S. Wright and G. Budin. Amsterdam / Philadelphia: John Ben- jamins Publishing Company, pp. 98–118.

Попова 2004: Popova, М. A System Approach in Terminography. // Terminology at the Time of Globalization. Ljubljana, с. 33–39.

Попова 2006: Попова, М. Терминологичен речник от модулен тип. // Светът на реч- ника. Светът в речника. Велико Търново: Знак’94, с.106–112.

Райт 2001: Wright, S.-E. Data Categories for Terminology Management. // Handbook of Terminology Management: Application-Oriented Terminology Management. Vol.

II. Amsterdam / Philadelphia: John Benjamins Publishing Company, pp. 552–571, 878–880.

Сейгър, Макнаут 1980: Sager, J. C., J. McNaught. Feasibility study of the establishment of a terminological data bank in the U. K. // Unesco Alsed-LSP Newsletter, Vol. 3, No. 3 (10).

Фрийдман 1989: Freedman, A. The Computer Glossary & The Complete Illustrated Desk Reference. Fourth edition. Point Pleasant, PA: AMACOM.

Cytaty

Powiązane dokumenty

Този процес на адаптацията ясно и нагледно може да се види в таблицата (от дипломната работа на А. Насонова), където са представени нови заемки (16), които още

Възприемането на носа като представител на личността обяснява осмис- лянето на ситуацията, в която човек се освобождава от голяма грижа, затруд- нение или

Един от начините засяга микроструктурата на отделната терминологична единица, показва какви елементи трябва да бъдат включени и как да

Предлогът за като първи член влиза в почти всички възможни комбинации с други предлози във втора позиция, които го допълват при синонимните,

В настоящото научно съобщение са разгледани антропонимични мате- риали от Хасково и Мустафа паша (дн. Свиленград), включени в благо- дарствено

Освен това трябва да се има предвид, че отношението субект : обект на омразата може и да не намира обяснение на повърхнинно равнище (например усещането на неприязън

Сложната същност на СИ, които, от една страна, се отличават от нарицателните, а, от друга страна, имат много общи черти с тях, е причината за това и

Така че към полисемията може да бъде изработен подход, в който едновременно да се прилагат и двата конструкта: от една страна, като инвари- ант