• Nie Znaleziono Wyników

О модели естественного языка, основанной на понятии переменных окружений

N/A
N/A
Protected

Academic year: 2021

Share "О модели естественного языка, основанной на понятии переменных окружений"

Copied!
10
0
0

Pełen tekst

(1)

ТНЕ PRAGUEBULLETIN ОР МATHEМATICALLINGUISTICS 26, 1976 О модели естественного языка, основанной на понятии

переменных окружений 1

. '

Janusz S. B~en, Warszawa

Стало уже очевидным, что способность человека владеть языком тесно связана с самим мышлением. Тем не менее, слож- ность естественного языха все еще несколько не дооценивается в лингвистике, включая сюда до известной степени и вычисли- тельную JIИНГВИС'l'ИКУ. Эта недооценка обычно приводит к исполь- зованию относительно примитивных средств формального описания языка. Виноград [16] справедливо считает, что наилучшим тестом для комплексной модели естественного языка явилась бы ее реализация в виде системы, понимающей язык. Существует и

более радикальный подход, утвержда~й, что тексты естествен- ного языка это просто программы, которые выполняются в вашем мозгу [11] • Некоторые интересные аналогии между пониманием языка и обработкой некоторой программы отмечались, например, в [6] • Рассмотрение всех высказываний как императивов ве является совершенно новой идеей; ее можно найти также и в ра- ботах по лингвистике. например, в [15] • Но если мы рассмат- риваем высказывания как программы, мы можем описывать их се- мантику посредством значительно более сложных и точных поня- тиА, чем те, которые когда-либо использовались в лингвистике.

Цель настоящей статьи состоит в обосновании использования мо- дели переменных окружений, предложенной Бобровым и Бегбрейтом

[4] , для семантики естественного языка. Основные идеи этого

1Текст подготовлен на OCHOB~ переВОД8 [1] работы [з].

Aa~op выражает свою глубокую благодарность коллеге Зигмунту Салони за основную, тщательную помощь, ~ию Анатольевичу Шрейдеру - за вещественные и терминологические замечания

(в частности за предложение термина "перемевные окружения").

(2)

••

подхода будут продемонстрированы при обсуждении некоторых хо- рошо известных проблем референции и пресуппозиции. Данная

статья, отражая раннюю стадию развития исследования, касается в основном теоретических вопросов. Первичныепонятия Воброва- -Вегбрейта непосредственно не рассматриваются в ней, однако обеспечиваемая ими гибкость оперирования окружениями является необходимым усховием осуществимости настоящего подхода, кото- рый, как ожидается, может наметить принцип построения систем понимающих дискурс, включая сюда литературный дискурс типа детских сказок, которые рассматривались Черняком (5].

Понятие "ди.скурса" является довольно неопределенным; по- этому необходимо уточнить здесь, что я подразумеваю под этим термином. Я использую его как синоним СВЯ8НОГОтекста и вы- деляю четыре ВО8МОЖНЫХаспекта СВЯ8НОСТИ,соответствупцие на инту~тивном уровне различным типам приемлемости.

Во-первых существует контекстуальная связность, которая реаЛИ8ируется в тексте посредством связей между предложениями и между фразами представляемых специализированными лингвисти- ческими средствами, которые я называю указателями. Они могут быть более или менее произвольно выявлены в каждом Я8ыкео Это - прежде всего местоимения (в широком смысле, включая слова, замещающие наречия и т.д.). Второй важный тип указателей со- стоит из пресуппозиций, которые отличаются от местоимений ДВУМЯсвойствами: они редко встречаются на поверхности текста, и они указывают исключительно на ут~ерждение. Имеются также укsзатели, специфичные для данных языков; например, для

английского языка, следуя подходу Мак Каули (12) и Айсарда [ 9 ] , указателем можно считать прошедшее время. Далее, если в тексте имеется указатель не обладающий значением, то этот текст не является контекстувльно связным. Имеется также

ситуационная связность, т.е. связность текста с ситуацией его конкретного использования; например, предложение

(1) Будьте осторожны, он может укусить вас.

вполне приемлемо, если адресат находится вблизи опасного жи- ВОТНОГО. Введение некоторого рассказчика может превратить такой текст в контекстуально связный путем замены его

- 42 -

(3)

" индексов (относящихся к элементам реального мира) не указатели (относящиеся к более или менее абстрактным элементам тексте).

Ногда е-дресат должен применить свои знания о реальном мире к интерпретации текста как связного, я использую понятие ~- сительной связности. Именно так обстоит дело в тексте

(2) Старший сын Анны уехал из Варшавы учиться в Сорбонну.

(3) Франция это страна, в которой интересно учиться.

Свепения О том, что Сорбонна - это университет во

Франции, представляют собой опущенное звено. Обычно мы можем неэ~ать некоторый текст связным относительно некоторой задан- ной области знаний. Большинство текстов, которые не являются

св~uными с точки зрения уже упомянутых правил, могут все же рассматриваться как связные, если адресат этого желает. Я на- зову такую ситуацию волевой связностью. Воля адресата может выражаться двумя способами. Во-первых, он может присвоить

значение указателю обладающему им прежде. В частности события, наличие которых требуется, исходя из He~OTOpыx пресуппозиций, часто принимаются как истинные, как зто отмечалось, например, БеJIлерт [ 2] , Вержбицкой [15] и недавно Карттуненом [10]

и проиллюстрировано примерами:

(4) Мне хотелось бы представить вас моей жене.

(5) W~ сожалеем, что дети не могут участвовать в выпуск- ных празднествах вместе со своими родителями.

Пресуппозиции приносят совсем·g08УЮ информацию. Во-вто- рых, адресат может прийти к выводу, что указатели и индексы не обладающие значением не имеют отношения к делу; эта проце- дура представляется применимой только к некоторым литера- турным текстам.

M~~!2~!~!!!~

Обсудим теперь некоторые проблемы референции. Начнем с предложения, что каждое лицо (человек или робот), исполь~

зующее естественный язык, воспринимает также некоторые аспекты текущей ситуации, в частности, узнает лиц, участвующих в раз- говоре, и обычно проводит возможные различия между собствен- ным восприятием ситуации и восприятием ее другими. Перифра- зируя это в терминах переменных окружений, мы предполагаем, что глобальным окружением употребляется некоторый особенный

(4)

торое лицо воспринимает и узнает его; представляется данное лицо местными окружениями. Некоторое высказывание восприни-

мается вместе с информацией о ее отправителе и адресате; по- этому она может обрабатываться так, что личные местоимения

"я", "мы", "вы" и т.д. преобразованные в переменные, оценива-

ются соответственно в окружениях отправителя и адресата, обеспечивая их идентификацию. Таким образом, оценка предло- жения (6), сказанного Иваном Петру:

(6) Мне нравится твоя книга.

приписывает ему значение, эквивалентное высказыванию (7) Ивану нравится книга Петра.

обрабатываемому в определенном окружении. Которое из окруже- ний соответствующее, зависит от отношения робота к разговору.

Если он верит Ивану и предполагает, что знания Петра в основ- ном совпадают с его собственными, он может обрабатывать (7) в своем собственном окружении. Но если он хочет следить за развитием всех возможностей, он должен разместить в окруже- нии Петра, содержащем большей частью данные о его поведении, некоторое новое оркужение Ивана, как он описывается Иваном и оценить (7) в нем с тем, чтобы выяснить внушение ~BaHa, а затем снова оценить (7) в окружении знаний Петра для выясне- ния возможного влияния на мысли Петра. Преимущество такого подхода заключается в том, что его можно применять рекурсивно в случае прямой и косвенной речи. Например, в тексте

(8) Володя сказал:

(9) "Ногда я вернулся, Саша уже ожидал меня и спросил:

(10) "Как поживаешь?"

предложение (8) должно обрабатываться в окружениях актуаль- ного адресата и отправителя, (9) - в окружении отправителя и новок окружении Володи цитированного отправителем", а

(10) - в окружении Володи цитированного отправителем" и

"Саши, цитированного Володей, которого цитировал отправитель".

Очевидно, применение "принципа надежности" и рассмотрение всех предложений в одном и том же окружении упрощает органи- зацию памяти и ускоряет обработку.

Интерпретация высказываний с косвенной речью, например,

(11) Володя сказал Саше, что ему нравится его книга.

и вообще высказываний с местоимением 3-0ГО лица значительно

- 44 -

(5)

сложнее., Для ее объяснения мы введем при рассмотрении неко- торых высказываний дополнительные окружения фраз со специаль- ной переменной , похожей на контекст из CONIVER-a [13].

Эта переменная, названная ТЕМА (TOPIC ), в качестве своего значения имеет n-ку и при вЫб~рке данных дает ее первый э~е- мент, при выборке вследствие обратного послеживания дает

последовательные элементы n-ки, а при исчерпании она прини- мает n~KY ТЕМЫ из своего супер-окружения. При обработке не- которого высказывания ТЕМА часто модифицируется путем добавле- ния и перестаНОВКИ ее элементов. Элементами ТЕМЫ ЯВЛЯЮТСЯ указатели на окружения (реальных или фиктивных) личностей и другие структуры данных, представляю ие объекты, а также указатели не другие окружения фрез со своими собственными ТЕМАМИ.Интерпретацию текста с косвенной речью, а также оди- ночных предложений с местоимениями 3-0ГО лица можно описать теперь следупцим образом.

А. Raждая выборка элемента ТЕМЫ уставливает TE~~ так, что выбранный элемент становится первым в n-ке.

Б. ~~естоимения в главном предложении и собственные имена осуществляют немедленный доступ к переменной ТЕМЫ.

В. Осуществление доступа, требуемого местоимениями при- даточного предложения, может быть приостановлено до конца обработки главного предложения, если для них не находится подходящего значения в локальной ТE1~.

Г. Глаголы "говорит", "описывает" и т.д. соэдают окруже- ние предложения с его собственной переменной ТЕМЫ и устанавли- вают указатель на это окружение как первый элемент ТE1~ в окружении глагола.

д. Придаточные ,предложения, вводимые словами "говорит",

"описывает" и т.д., оцениваются в окружении, взятой из ТЕМЫ окружения главного предложения.

Покажем работу приведенных выше правил на примерах.

(12) После того, как Иван вышел из своей квартиры, он пошел в бильярдную.

"Иван" устанавливает TE~W на указателе окружения Ивана;

"своей" оценивается потому, что Б ТЕМЕуже имеется подходящее знрчение; "он" также идентифицируется с Иваном.

(13) После того, как он вышел из своей квартири, Иван пошел в бильярдную.

(6)

"После того, как" вводит придаточное предложение, которое оценивается, но оценка приостанаВJIивается перед обработкой местоимений из-за отсутствия подходящих значений дЛЯ НИХ в ТЕМЕ. "Иван" устанавливает ТЕМУ, обработка придаточного предложения возобновляется после окончания главного предло- жения, и местоимение правильно отождеСТВJIяется с Иваном.

(14) Иван пошел в бильярдную после того, как он вышел из своей квартиры.

Здесь нет трудностей; "Иван" устанавливает TEtl.:y, а место- имения получают доступ к ней.

(15) Он пошел в билья~дную после того, как Иван вышел из квартиры.

"Ов" оценивается немедленно, так как содержится в главном предложении; позтому это слово уже связано, когда "Иван"

устанавливР.ет ТЕМУ. Сильное оmущение, что значение "он"

должно отличаться от "Иван", можно объяснить в терминах вы- числительной эффективности: нет оснований устанавлива ТЕМУ на "Иван", если она имеет уже значение.

(16) Что Иван сказал о Петре?

(17) Он сказал, что

(18) он ПОХОЖ на пьяного жирафа на коньках.

В (16) ТЕМАустанавливается сначала на "Иван", затем "сказал"

создает окружение фразы со своей ТЕМОЙ, установленной в на- чальном состоянии на "Петр", и на "верхушке" своей сС'бствен- ной ТЕМЫустанавливает на него укаэатель.~В (17) идентифици- руется с Иваном, затем "сказал" получает обратно из ТЕМЫ окружение предложения и оценивает в ней (18). Позтому "он"

в (18) связывеется с Петром.

E~2~E~8~~~~~~~_!_2ЦЫ~8~~~~~~~_8~~!E!ЦЦ~!

Неопределенные описания вида:

(19) Это иностранец, который произносит речь сейчас

имеют отчетливый смысл в нашей модели. Они являются оБЪЯВJIе- ниями, использованными для создания соответствующего окруже- ния более общем смысле, структур данных) УСТЭНОВJIенного в начальном состоянии на значения, даваемые дескрипцией; ука- затель НОБОГОокружения вставлен в ТE~~. Поэтому в тексте

- 46 -

(7)

I

J (20) Один юноша провалился на экзамене при поступлении в институт.

(21) Он решил отказаться от дальнейшего обучения.

"он" из (21) может получить правильное значение "юноша", упомянутый в (20). Такая интерпретация неопределеннъ~

дескрипций обладает всеми свойствами оператора Ref , введен- ного с этой целью Беллерт [2]; она согласуется также с ~H- туицией лингвистов, см., например, [15]. Определенные

дескрипции интерпретируются как функции, которые при оценке в правильном окружении принимают требуемые значения. Эта интерпретация подтверждает интуицию Доннелана [ 7 ] , совер- шенно справедливо утверждающего, что определенная дескрипция

сам. по себе не отсылает к чему-либо, а только ее употребле- ние указывает на некоторого референта. Эта интерпретация объясняет также то, почему мы можем сказать

(22) Ее муж добр к ней

И быть понятным} даже если данный мужчина не является мужем данной женщины.

Функции, представляющие определенные дескрипции, могут также запоминаться; такое запоминание соответствует аттри-

бутивному использованию определенной дескрипц_и, как, напримеJ::,

В высказывании

(23) Убийца Смита душевнобольной в том смысле, что

(24) Нем бы ни был ТОТ, кто убил Смита, он душевно- больной.

Для того, чтобы подвести итог нашему обсуждению рефе- ренции, рассмотрим классический английский пример

(25) А Ьоу who saw her kissed а girl _Ьо knew him.

Буквально:

(25а) Парень, который видел ее, поцеловал девушку, которая анала его.

Во-первых, создается окружение ДJIЯ "Ьоу" и указатель к нему вводится в ТЕМУ. ДВJ1ее оценивается "who эаw her"

зв исключением словв "her" , поскольку в ТЕМЕдля этого СЛD~а отсутствует собственное значевие; поэтому обработка этого

предложения приостанавливается. 3атем оценивается оставшвяся часть гжавного преДJIожения, возникает окружение для "girl"

(8)

и ТЕМАсоответственно изменяется. Теперь обработка приоста- ~

новленного предложения может быть возобновлена, оно может оцениве.ТЬСЯ парВJIлельно с предложением "who knew him" ; оба местоимения при этом будут правильно идентифицироваться.

Пресуппоэиции рассматриваrтся как эталоны представления событий; в зависимости от произвольного отношения к тексту, эталон может согласовываться с памятью для поиска существу- ющего события, либо соответствующее событие может быть вклю- чено в память. мы выражаем различие между фактическим и не- фактическим предложениями вида

(26) Иван сожалеет, что сейчас идет дождь (27) Иван полагает, что сейчас идет дождь.

допускэя, что пресуппозиция "сейчас идет дождь" оценивается в окружении рассказчика в случае (26) и в окружении убеждений Ивана в случае (27). Может показаться странным говорить о пресуппозициях нефактических предложений, но в этом имеется смысл; хотя ыы и не ждем, что такая пресуппозиция будет

истинной, мы все же ожидаем, что она соответствует как в (27), чьим-то убеждениям. Окружение убеждений и упомянутое ранее окружение внушений воздействует друг на друга, например, в преДJIожении

(28) Петя лжет, когда он уrверждает, что ему нравится книга Саши.

которое оценивается в виде "Пете нрввится книга Саши" во внушениях Пети и в виде "Пете не нравится книга Саши" в убеж- дениях Пети.

Идея о обработке высказывания оказывается также полезной и в случае пресуппозиции. Статистическая интерпретация

посредством "правил проектирования" связи между пресуппози- цией сложного предложения в целом и пресуппоэиций составля- ющих его предложений не принесла успеха. Недавно предложеный,

более динамичный подход Карттунена [10] может легко быть включен в нашу модель. Например, в следующих предложениях

(29) Если Дин сказал правду, то Никсон также виновен.

(за) Если Хелдеман виновен, то Никсон также виновен.

(З1) Если мисс Вудс уничтожила недостающие ленты, то.

Никсон также виновен.

- 48

(9)

для получения верных результатов антецедентные предложения должны обрабатываться раннее консеквентных предложений.

В (ЗО) пресуппозиция консеквентного предложения удовлетворя- ется антецедентом, в (З1) это также может быть справедливым в 'зависимости от других сведений, имеющихся в окружении оценки.

Заключительные замечания ---

Изложенный подход еще требует существенного развития прежде чем он превратится в формальную модель. Тем не менее, автор глубоко убежден, что эти идеи заслуживают разработки.

Их привлекательность заключается в гибкости возможной интер- претации предложения, которая может учесть различные степени внимания, затраченного на его понимание, различия в отношении слушающего, его ананиях и т.д. Надеем~я, что гибкость может использоваться также и с другой целью: для возможно большего упрощения модели, чтобы она могла эффективно осуществляться.

л и т е р а т у р а

[3]

[5]

ВЕНЬЯ., О модели естественного языка, основанной на множественных сферах. Труды \~ Международной объединенной конференции по искусственому интелекту. Москва 1975, стр. 6.1 - 6.9.

BELLERT1., Оп the logico-semantic structure of utter-

, ,

ances. Wroc1aw-Warszawa-Кrakow-Gdansk:

Ossolineum 1972.

BIEN J.St., Towards а Mu1tip1e Environments Mode1 of Natura1 Language. Advance Рарегв оп the Fourth International Joint Conference оп Artificial Inte11igence. Tbilisi, Georgia, 3-8 Sept.

1975. рр 379-382.

BOBROWD.G. - WEGBREITВ., А Mode1 and stack ation of Multip1e Environments. BBN No 2334. Мarch 1972.

CНARNIAKЕ., Toward а Model of prehension. MIT А1-

implement- Report

Chi1dren ,s Story Сот- ТR-22б, December 1972.

(10)

[11 ]

[15 ] [16 ]

DAVIE3D.J.M. - 13ARD3.D., utterances аа Programs.

Мachine Inte11igence 7, рр 325-340.

DONNELLANК., Reference and Definite Description. In [ 1~ ] , рр 110-114.

FILLМOREC.J. - LANGENDOEND.T. (eds.), 3tudies in Linguistic 3emantics. Ho1t, Rinehart and Winston, Н.У. 1971.

13ARD3.D., What wou1d you have done if ••• Theoretica1 Linguistics, Уо1. 1(1974), Но 3.

КARТТUNENL., Presupposition and Linguistic Context.

Theoretica1 Linguis~i08, Уо1. 1, NQ 1/2,

рр 182-194.

LONGUET-НIGGIN3Н.С., ТЬе A1goritmic Desoription of Natural Language. Proc. R. 300. Lond. В. 182,

(1972), рр 255-276.

МCCAWLEYJ.D., Теnве and Time Reference in Eng1ish.

In [8J.

KcDERМOTTD.,- 3U33МANа., Conniver Reference М8nual.

МIT AI mешоNo 259, Мау 1972.

3TEINВERGD.D. - JAКOBOVIT3L.A., 3emantics. An Inter- disciplinary Reader in Phi1osophy, Linguistics and Psycho1ogy. Cambridge 1971.

WIERZBICКAА., Dociekania semantyczne. Wroclaw-Warszawa- -Кrakow, Ossolineum 1969.

WINOGRADТ., Understanding Natura1 Language. Edinburgh 1972.

- 50 -

Cytaty

Powiązane dokumenty

1 kwietnia 1979 roku przeprowadzono referendum, w którym 98% ludności opowiedziało się za utworzeniem Islamskiej Republiki Iranu.. O wartości przemian świadczy fakt, że

Jakkolwiek autorka zapewnia, że dzieło malarskie Arcimboldiego nie ma nic wspólnego z surrealizmem, a on sam nie może być uznawany za pierwszego surrealistę (Dauxois 1997: 191,

length, spatial variations in ocean surface elevation alone (radiation damping) can result in a stable double inlet system with two inlets open.. Similarly, basin bottom friction

W tym ostatnim wypadku można się jednak pokusić o przypuszczenie, że mogła to być zanotowana w zniekształconej formie informacja o przy- pisywaniu przez Estiów cech

Normalnie każdy z pracujących w archiwum, zarówno archiwista, który stale nad danemi aktami siedzi, jak i pracownik naukowy, któ­ ry jedynie się z niemi styka,

Jakubowskiego i jego działalność n a jp ierw jako- dzielnego artylerzysty (teoretyka a potem praktyka podczas insurekcji 1794 r.) z czasem jeszcze dzielniejszego

Cm entarzysko prawdopodobnie towarzyszyło budowli sakralnej, być może drew nianej cerkwi, na której ślad jednak nie natrafiono.. Cm entarzysko przypuszczalnie

JlenHas KepaMHKa PiopHKOBa ropo/uima, cpe/in KOTOPOH npeoöJiaaaiOT ropmKH „jiaaoaccKoro THna” (pHC. 7), ToawecTBeHHa nocyae nocejieHHH HJibMeHCKoro IIoo3epba (reorpHH,