• Nie Znaleziono Wyników

Znaczniki (cechy) semantyczne czasownika oraz rzeczownika

W dokumencie Index of /rozprawy2/10860 (Stron 158-164)

3. BUDOWA SYSTEMU TŁUMACZĄCEGO

3.4. Baza wiedzy językowej

3.4.5. Reprezentacja własności semantyczno-gramatycznych leksemów w bazie

3.4.5.1. Znaczniki (cechy) semantyczne czasownika oraz rzeczownika

Właściwości konotacyjne czasownika przesądzają o mniej lub bardziej rozbudowanym schemacie składniowym. Czasownik konotuje w zależności od znaczenia leksykalnego jeden lub więcej członów podrzędnych w postaci rzeczownika lub zaimka według klucza semantycznych cech selekcyjnych, dla uproszczenia nazywanych znacznikami semantycznymi118. Powstaje w ten sposób dwuczłonowa relacja119: wymagania czasownika spotykają się w określonych kategorialnie ramach z cechami semantycznymi rzeczownika, zob. rys. 59. Istotą tego zjawiska pozostaje korelacja obu części zdania.

W bazie wiedzy językowej znalazły się elementy struktury semantycznej poszczególnych leksemów obu typów, relewantne z punktu widzenia tworzenia jednostek wyższego rzędu, decydujące o wymaganiach łączliwości semantycznej wyrazów w tekście. Proponowane rozwiązanie jest rozwinięciem koncepcji sformułowanej przez autorów

118 Por. podrozdz. 2.2.1.1. niniejszej pracy.

119 Dobrze obrazuje to relacja pióro wpust przy układaniu puzzli (rys. 59) lub składaniu np. klocków lego. Rysunek 59: Poglądowe przedstawienie udziału właściwości składniowo-semantycznych leksemów

Słownika syntaktyczno-generatywnego czasowników polskich pod redakcją Kazimierza

Polańskiego. Pozwala ono na minimalistyczny i jednocześnie użyteczny z punktu widzenia informatycznego opis znaczenia jednostek języka, zredukowany do określonych klas leksykalno-semantycznych. Poza nimi mieści się łączliwość idiomatyczna (jednostkowa), zjawisko wymagające niekategorialnego opisu, np. utarte połączenia wyrazowe, nieregularne składniowo, np.: drzeć z {kimś} koty, burza w szklance wody, mieć

przechlapane itp. Są one odnotowywane w bazie według odrębnych zasad, jako konglomeraty. Jak podkreślają autorzy tego słownika:

„Charakterystyka semantyczna towarzyszy w opisie jednostek ustaleniom na temat łączliwości gramatycznej wyrazów (np. dokonać wyboru ale czytać gazetę). Wybór wyrazów i ich forma w procesie tworzenia wypowiedzeń w znacznej mierze zależą od innych wyrażeń, z którymi więżą się one gramatycznie i semantycznie. Żeby utworzyć zdanie całkowicie poprawne, mówiący musi uwzględnić zasady łączliwości wyrazowej w takiej samej mierze , jak kierować się regułami paradygmatyki gramatycznej szyku itp. Opis gramatyczny języka musi iść w parze z jego opisem leksykalnym, innymi słowy, gramatyka i słownik powinny się wzajemnie uzupełniać.” (Polański 1980 :5).

W ten sposób system generujący tekst jest w stanie wykluczyć jako niemożliwe lub niepoprawne zarówno zdanie *Dżdżownica czyta gazetę, jak i *Jan czyta muszlę. Ściślejsze informacje na ten temat można znaleźć w opracowaniach należących do nurtu językoznawstwa generatywnego, por. np. pracę Ireneusza Bobrowskiego Składniowy

model polszczyzny z 2005 r. (Bobrowski 2005).

Lista ustalonych w praktycznej analizie znaczników objęła łącznie 84 pozycje. W przekonaniu autora obecny zakres znaczników semantycznych prezentowany w pracy jest w miarę kompletny, jednak wymagałoby to dalszej weryfikacji na podstawie szerszego korpusu tekstów języka polskiego, np. Korpusu Języka Polskiego Wydawnictwa Naukowego120 czy Korpusu IPI PAN121. Jednak wykonanie tego zadania wykracza poza możliwości niniejszej pracy. Kierując się względami praktycznymi, badaniami objęto zatem zasób materiału pięciu tomów Słownika syntaktyczno-generatywnego czasowników

polskich, oraz Ilustrowany słownik podstawowy języka polskiego wraz z indeksem pojęciowym wyrazów i ich znaczeń, autorstwa Zofii Kurzowej (Kurzowa, 2005). Włączono

również całość wyekscerpowanego materiału leksykalnego z wymienionych w bibliografii podręczników i opracowań leksykograficznych języka migowego i miganego, zob. bibliografię źródeł wykorzystanych w niniejszej pracy. Takiej procedury wymagał cel opracowania.

Z punktu widzenia tworzenia tekstu (struktur zdaniowych) najważniejszą rolę odgrywają wymagania konotacyjne czasownika. Hierarchiczną strukturę drzewiastą znaczników semantycznych typowych dla leksemów czasownikowych i rzeczownikowych przedstawiono na rysunku nr 60 na str. 162 niniejszej pracy, niżej. Znaczniki semantyczne rzeczownika są symetryczne względem czasownika. Do reprezentacji znaczników w bazie wiedzy językowej użyto popularnej w relacyjnych systemach bazodanowych struktury nested122. Struktura zapisu znacznika semantycznego w dynamicznej bazie wiedzy języka Prolog wygląda następująco:

znacznik(building,35,36,[artifact,minus_abstr_minus_anim,minus_abstr]).

120 http://korpus.pwn.pl/ 121 http://korpus.pl/

Znacznik building przypisywany jest każdemu rzeczownikowi będącemu budowlą, która jest równocześnie dziełem człowieka, zatem zawiera się on w podzbiorze określającym artefakty. Te zaś z kolei są podzbiorem rzeczowników nieożywionych i nieabstrakcyjnych. Przykładami rzeczowników mających w opisie semantycznym ten znacznik są: DOM, SZKOŁA, ZAMEK, MOST, KOLEJKA LINOWA, METRO, PIRAMIDA. Poniżej zamieszczono zapis struktury semantycznej znaczników (por. rys. 60, niżej) w formie dynamicznie wygenerowanych faktów języka Prolog:

classifier(plus_anim, 1, 24, [minus_abstr] ).

classifier(state, 155, 156, [plus_abstr] ).

classifier(food, 112, 113, [minus_abstr_minus_anim,minus_abstr] ).

classifier(drink, 107, 108, [liquid,minus_abstr_minus_anim,minus_abstr] ).

classifier(official_position, 3, 4, [plus_human,plus_anim,minus_abstr] ).

classifier(gas, 104, 105, [minus_abstr_minus_anim,minus_abstr] ).

classifier(loose_substances, 98, 99, [minus_abstr_minus_anim,minus_abstr] ).

classifier(skill, 161, 162, [plus_abstr] ).

classifier(environ_element, 102, 103, [minus_abstr_minus_anim,minus_abstr] ).

classifier(plant, 22, 23, [plus_anim,minus_abstr] ).

classifier(area, 122, 123, [minus_abstr_minus_anim,minus_abstr] ).

classifier(teamhum, 17, 18, [plus_human,plus_anim,minus_abstr] ).

classifier(institution, 5, 6, [plus_human,plus_anim,minus_abstr] ).

classifier(nature_forms, 120, 121, [minus_abstr_minus_anim,minus_abstr] ).

classifier(aroma, 157, 158, [plus_abstr] ).

classifier(source_information, 159, 160, [plus_abstr] ).

classifier(playing, 140, 141, [action,plus_abstr] ).

classifier(mentality, 127, 128, [plus_abstr] ).

classifier(disease, 129, 130, [plus_abstr] ).

classifier(tool_part, 85, 86, [artifact_part,minus_abstr_minus_anim,minus_abstr] ).

classifier(light_source, 63, 64, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(heat_source, 65, 66, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(furniture, 71, 72, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(sport, 67, 68, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(collection, 116, 117, [minus_abstr_minus_anim,minus_abstr] ).

classifier(musical_instrument, 39, 40, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(medicine, 41, 42, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(liquid, 106, 109, [minus_abstr_minus_anim,minus_abstr] ).

classifier(artifact, 34, 83, [minus_abstr_minus_anim,minus_abstr] ).

classifier(furniture_part, 93, 94, [artifact_part,minus_abstr_minus_anim,minus_abstr] ).

classifier(clothing, 51, 52, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(stuff, 110, 111, [minus_abstr_minus_anim,minus_abstr] ).

classifier(artifact_part, 84, 95, [minus_abstr_minus_anim,minus_abstr] ).

classifier(relation, 147, 148, [plus_abstr] ).

classifier(feelingsemotion, 143, 144, [plus_abstr] ).

classifier(personal_name, 152, 153, [invented_name,plus_abstr] ).

classifier(chemicals, 96, 97, [minus_abstr_minus_anim,minus_abstr] ).

classifier(plant_part, 30, 31, [plus_anim_part,minus_abstr] ).

classifier(plus_anim_part, 25, 32, [minus_abstr] ).

classifier(proces, 114, 115, [minus_abstr_minus_anim,minus_abstr] ).

classifier(flying_object, 56, 57, [transport,artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(family, 11, 12, [plus_human,plus_anim,minus_abstr] ).

classifier(inhabitant, 13, 14, [plus_human,plus_anim,minus_abstr] ).

classifier(building, 35, 36, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(amateur, 15, 16, [plus_human,plus_anim,minus_abstr] ).

classifier(animal_part, 28, 29, [plus_anim_part,minus_abstr] ).

classifier(tool, 37, 38, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(human_part, 26, 27, [plus_anim_part,minus_abstr] ).

classifier(floating_object, 58, 59, [transport,artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(colorants, 100, 101, [minus_abstr_minus_anim,minus_abstr] ).

classifier(animal, 20, 21, [plus_anim,minus_abstr] ).

classifier(machine_part, 87, 88, [artifact_part,minus_abstr_minus_anim,minus_abstr] ).

classifier(plus_human, 2, 19, [plus_anim,minus_abstr] ).

classifier(sport_tool, 73, 74, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(mechanical_machine, 46, 47, [machine,artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(money, 53, 54, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(shiny_objects, 79, 80, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(datacarrier, 77, 78, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(electric_machine, 44, 45, [machine,artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(dish_part, 89, 90, [artifact_part,minus_abstr_minus_anim,minus_abstr] ).

classifier(cosmetics, 75, 76, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(machine, 43, 48, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(dish, 49, 50, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(transport, 55, 62, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(invented_name, 151, 154, [plus_abstr] ).

classifier(senses, 145, 146, [plus_abstr] ).

classifier(driving_object, 60, 61, [transport,artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(ownership, 69, 70, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(document, 81, 82, [artifact,minus_abstr_minus_anim,minus_abstr] ).

classifier(action_preparator, 9, 10, [plus_human,plus_anim,minus_abstr] ).

classifier(size, 149, 150, [plus_abstr] ).

classifier(grease, 118, 119, [minus_abstr_minus_anim,minus_abstr] ).

classifier(minus_abstr_minus_anim, 33, 124, [minus_abstr] ).

classifier(period, 135, 136, [plus_abstr] ).

classifier(art_work, 137, 138, [plus_abstr] ).

classifier(action, 139, 142, [plus_abstr] ).

classifier(clothing_part, 91, 92, [artifact_part,minus_abstr_minus_anim,minus_abstr] ).

classifier(sound, 131, 132, [plus_abstr] ).

classifier(information, 133, 134, [plus_abstr] ).

classifier(minus_abstr, 0, 125, [] ).

classifier(semprzym, 164, 165, [] ).

classifier(plus_abstr, 126, 163, [] ).

Należy w tym miejscu odnieść się krótko do koncepcji Stanisława Mędaka (2011), który przedstawił własną, w znacznej mierze oryginalną próbę opisu właściwości składniowych polskiego czasownika w książce: Praktyczny słownik łączliwości

składniowej czasowników. Koncepcję tę w stosunku do Słownika syntaktyczno-generatywnego czasowników polskich pod red. K. Polańskiego wyróżnia podstawowo

sposób notacji pozycji syntaktycznych struktur walencyjnych generowanych danym czasownikiem. Polega to na sygnalizowaniu tych zależności odpowiednią fleksyjnie formą zaimków pytajnych. Por. przykładowy opis leksemu czasownikowego CZYTAĆ123:

Zbliża to postać hasła do doświadczeń zwykłego użytkownika języka124 ale jednocześnie oddala ją od rygoru opisu naukowego w zakresie wymagań semantycznych. Podniesione niedostatki opisu naukowego są wystarczającym powodem dla odrzucenia tej stosunkowo nowej publikacji jako podstawy opisu zdaniotwórczych właściwości czasownika w niniejszej pracy.

123 Por. rys. 28 na str. 99 niniejszej pracy.

124 Publikacja ta jest niezwykle użyteczna jako materiał dydaktyczny do nauki języka polskiego dla obcokrajowców.

W dokumencie Index of /rozprawy2/10860 (Stron 158-164)