к.т.н И.Л. Коробова

Тамбовский государственный технический университет, Россия

Лингвистическое обеспечение автоматизированной системы

синтеза текста

 

1 Общие сведения о лингвистическом обеспечении

Лингвистическое обеспечение автоматизированной системы представляет собой совокупность языков, включая термины и определения, правила формализации естественного языка и методы сжатия и развертывания текстов, необходимых для выполнения автоматизированного проектирования /3/.

2 Особенности системы лингвистического обеспечения автоматизированной системы синтеза текста

Каждая подсистема автоматизированной системы включает входные, внутренние и промежуточные, выходные языки и языки сопровождения и управления.

Выходным языком системы синтеза текста является последовательность предложений на русском языке. Грамматика выходного языка (Форма Бекуса-Наура) имеет вид:

< текст > ® < список предложений >;

< список предложений > ® < предложение > / < список предложений > < разделитель > < предложение >;

< предложение > ® < список слов >;

< список слов > ® слово / слово { < разделитель > } < список слов >;

< разделитель > ® , / . / ! / ? / … / : / ; / – / слово

Текст состоит из совокупности предложений. Предложение – из слов и разделителей.

Входным языком системы является последовательность функций, которае определяют каркас будущего текста. Грамматика входного языка (Расширенная форма Бекуса-Наура) имеет вид:

< текст > ® < последовательность функций >;

< последовательность функций > ® < функция > { , < функция > };

< функция > ® < элемент > { , < элемент > };

< элемент > ® < подэлемент > { , < подэлемент > };

< подэлемент > ® , / . / ! / ? / … / : / ; / – / слово

Текст состоит из совокупности функций. Под функцией понимается действие: ключевой момент художественного текста, новый раздел технического документа, сложный объект web-документа. Функция соответственно состоит из ряда элементов: незначительных действий, подразделов документа, более простых объектов web-документа. Элемент делится на еще более мелкие составные части.

Грамматика внутреннего языка (Расширенная форма Бекуса-Наура) используется на промежуточных этапах формирования текста /2/ и имеет вид:

< текст > ® < последовательность функций >;

< последовательность функций > ® < функция со значением > { , < функция со значением > };

< функция со значением > ® название функции, пример функции,  < список элементов >;

< список элементов > ® < элемент > {, <элемент >};

< элемент > ® приоритет, название элемента, возможность редактирования, < список подэлементов >;

< список подэлементов > ® < подэлемент > {, < подэлемент >};

<подэлемент> ® приоритет, название подэлемента, падеж, < значение подэлемента >

< значение подэлемента > ® , / . / ! / ? / … / : / ; / – / слово

Язык сопровождения и управления для подсистем «Интерфейс», разработки шаблонов, ввода и редактирования индивидуальных исходных данных текста /3/ представлен различными средствами для осуществления диалога ЭВМ с пользователем: подсказки, множественный выбор из списков, удобный ввод и редактирование данных, возможность выбора при работе с файлами базы знаний.

 

Литература

1 Справочник по САПР/ А.П. Будя, А.Е. Кононюк, Г.П. Куценко и др.; Под ред. В.И. Скурихина – К.: Техника, 1988 – 375 с.

2 Коробова И.Л. Математическое обеспечение подсистемы синтеза текста в САПР/И.Л. Коробова//Вестник Тамбовского государственного технического университета. - 2011. -Т. 17, № 1. -С. 32-36.

3 Коробова, И.Л. Подсистема синтеза текста в САПР/И.Л. Коробова, Н.В. Майстренко// Вестник Тамбовского государственного технического университета. -2009. -Т. 15, № 1. -С. 49-55.