Филологические
науки/ 3.Теоретические и методологические проблемы исследования языка.
Климов А.Н.
Кузнецкий институт информационных и
управленческих технологий
(Филиал Пензенского государственного
университета), г. Кузнецк, Россия
Проблема неоднозначности при анализе и переводе
текстов с английского языка на русский
Полный формальный семантический и синтаксический анализ
естественно-языковых текстов приводит к большой неоднозначности. Несмотря на
существующий научный интерес к различным методам семантического и синтаксического
анализа, степень научной разработанности проблемы неоднозначности
представляется недостаточной. Ни одна
система автоматического анализа и перевода текста не является совершенной
или хотя бы близкой к таковой.
Перед тем как рассмотреть некоторые примеры
неоднозначности, определимся с самим понятием неоднозначности. Здесь будет
принято следующее определение: поверхностная (выраженная)
форма неоднозначна в отношении
лингвистического процесса, если у
неё есть несколько специфических определяемых процессом интерпретаций,
и результат лингвистического процесса зависит от того, какая из
этих интерпретаций выбрана. Выбор специфической определяемой процессом
интерпретации в контексте будем считать устранением неоднозначности.
Терри Виноград, чьи труды в области автоматической обработки
текстов считаются классическими, выделил следующие типы неоднозначностей:
1) лексическая неоднозначность, которая встречается в предложениях,
содержащих омонимы. Например, “She
is fair.” В рамках данного предложения мы не можем
определить, идет ли речь о женщине со светлыми волосами, о красивой или о
справедливой женщине.
2) структурная неоднозначность, которая возникает в тех
случаях, когда предложение может быть описано более чем одной грамматической
структурой. Примером такой неоднозначности является предложение “They knew
about their mistake.”, где речь может идти как об их собственной ошибке, так и
об ошибке других людей.
3) неоднозначность глубинной структуры, которая возникает в
тех случаях, когда два различающихся по смыслу прочтения предложения могут быть
описаны только одной синтаксической структурой. Например, “Chickens are ready
for dinner.” То ли цыплята будут обедать, то ли их съедят на
обед.
4) семантическая неоднозначность, которая встречается, когда
некоторое слово или словосочетание может выполнять в предложении различные
роли. Например, в предложении “The
English are standoffish.” речь может идти как об англичанах вообще, так и о каких-то
конкретных представителях данной нации.
5) прагматическая неоднозначность, которая возникает, когда
разным случаям соответствует одинаковая
синтаксическая структура. Так в предложении “She dropped
the pen on the
table and broke it.” невозможно
однозначно определить, что именно было сломано - карандаш или стол.
Рассмотрим некоторые случаи синтаксической неоднозначности,
т.е. те случаи, когда предложению или его части может быть приписано две или более
синтаксических структур.
Классическим
примером здесь выступает предложение:
(1) Time flies like an arrow.
(2) a. синтаксическая
категория ("flies")
= глагол (Время летит как стрела.)
b.
синтаксическая категория ("flies") = существительное (Мухи времени
любят стрелку (указатель).) По аналогии с предложением “Fruit
flies like a banana.”
(Дрозофилам нравится банан.)
(3) a.
[Time] [flies] [like an arrow]
b. [Time flies] [like] [an arrow]
Есть
две возможных синтаксических интерпретации "flies" как показано
в (2): глагол и существительное. Результат процесса синтаксического
анализа (парсинга) зависит от того, какая интерпретация
выбрана. При обработке данных (1), синтаксический анализатор выявит
структуру (3a) для варианта с глаголом и структуру (3b) для варианта
с существительным.
Вот ещё
несколько примеров:
(1) He studies buzzes and whistles.
(2) a. синтаксическая
категория ("whistles")
= глагол (Он изучает жужжание и свистит.)
b. синтаксическая
категория ("whistles")
= существительное (Он изучает жужжание и свист.)
(1) That’s past
belief.
(2) a.
синтаксическая категория ("past") = предлог (Это - невероятно.)
b. синтаксическая
категория ("past")
= прилагательное (Это – устаревшее убеждение.)
(1) Flying planes can be dangerous.
(2) a.
синтаксическая категория ("flying") = причастие (Летающие самолёты могут
быть опасны.)
b. синтаксическая
категория ("flying")
= герундий (Летать на самолётах может быть опасно.)
Теперь
рассмотрим семантическую неоднозначность, т.е. случаи семантических переходов
и контекстов, обуславливающих сдвиг значения.
Пример
неоднозначности в семантической классификации - форма "suit" в приведённом
примере.
(1) The suit is in
(2) a.
семантическая категория ("suit") =
юридическая
b. семантическая категория ("suit") = портняжная
(3) a.
Судебный процесс состоится в Лос-Анджелесе.
b. Костюм находится в Лос-Анджелесе.
Есть
две семантические интерпретации как показано в (2): "судебный
процесс" и "совокупность предметов одежды (костюм)"
(среди других интерпретаций). Результат лингвистического процесса
осмысления зависит от того, какая интерпретация выбрана. Некто,
услышав (1), будет интерпретировать это как значение (3a), если выбрана
первая интерпретация, и как значение (3b) если выбрана вторая интерпретация.
Вот ещё
несколько примеров:
(1) Even a poor country has a capital.
(2) a.
семантическая категория ("capital") = финансовая
b. семантическая категория ("capital") = географическая
(3) a.
Даже бедная страна имеет некий капитал.
b. Даже бедная
страна имеет столицу.
(1) He’s got
a
bat.
(2) a.
семантическая категория ("bat") = зоологическая
b. семантическая категория ("bat") = спортивная
(3) a.
У него есть летучая мышь.
b. У него есть
бита.
При
всей сложности проблемы синтаксической и семантической неоднозначности можно отметить,
что приобретение и устранение языковой неоднозначности происходит
легче, когда оно связано с общественным взаимодействием (обменом
информацией в социуме), поскольку мы можем использовать дополнительные
ключи (ориентиры) из нелингвистического контекста, просодии (супрасегментного
средства организации речи), и нашу
способность задавать вопросы, если остаётся возможность неправильного
понимания.
Несмотря
на потенциальные недостатки анализа, базирующегося на исследовании текста, существует широкое
поле для исследования проблемы, и данное исследование имеет важные
последствия для теорий лингвистической репрезентации.
Литература:
1.
Апресян Ю.Д. Дейксис в лексике и грамматике и наивная модель мира //
Семиотика и информатика, вып.
2.
Виноград Т. Работа
с естественными языками // Современный компьютер. М., 1986, с. 90–107.
3. Hinrich
Schutze. Ambiguity resolution in language learning //
Stanford, 1997.