К.т.н. Коробова И.Л.

Тамбовский государственный технический университет, Россия

Методы шаблонизации для автоматизированного синтеза текста

При разработке подсистемы синтеза текста [1, 2,  4] мы ставили задачу формализовать процесс шаблонизации [3], сделать его понятным и применимым в различных процедурах САПР. В связи с этим, наиболее трудоемким оказался процесс описания математического обеспечения.

Математическое обеспечение подсистемы автоматизированного синтеза текста на основе технологии шаблонизации состоит из множества методов, образующих три группы: методы разработки шаблонов, методы генерации текста, методы обеспечения синтаксического анализа и корректировки.

I. Методы разработки шаблонов включают:

1) Методы разработки шаблонов последовательности и связей функций.

Эти методы отвечают за правильное следование функций и правильные связи между ними. Работают они следующим образом: входной информацией является двухмерный массив, состоящий из названия функции и примера функции (конкретное значение функции). Выясняется, присутствует ли в массиве функция, необходимая для существования текста. Если функции нет, то выдается сообщение о вводе функции и совершается выход. Иначе определяется сюжет текста. Здесь сюжет – конкретный вид универсальной логической схемы текста, выделяемый для удобства работы. Далее осуществляется переход на блок формирования шаблона последовательности функций для данного сюжета.

2) Методы разработки шаблонов функций.

Разработка производится для выбранной функции. Функция состоит из набора элементов, характеризующихся названием, приоритетом (положение в предложении), возможностью редактирования (возможно или нет). Предусмотрена возможность добавить или удалить элемент, изменить приоритет элемента (используется сдвиг набора элементов), его редактирование (если возможно).

3) Методы разработки шаблонов элементов функций.

Разработка производится для выбранного элемента функции. Элемент состоит из набора подэлементов, характеризующихся названием, приоритетом (положение в элементе), падежом (если это имя существительное или прилагательное), значением (пример функции для глаголов-действий). Предусмотрена возможность добавить или удалить подэлемент, изменить приоритет подэлемента (используется сдвиг набора подэлементов), изменение значения (если это глагол-действие), изменение падежа (если это имя существительное или прилагательное).

II. Методы генерации текста включают:

1) Методы генерации текста-шаблона, в котором отсутствуют индивидуальные данные.

Производится перебор всех функций набора, начиная с первой. Для каждой функции производится перебор всех элементов в зависимости от приоритета, начиная с наименьшего. Для каждого элемента производится перебор всех подэлементов в зависимости от приоритета, начиная с наименьшего. Для каждого подэлемента производится вывод в текст-шаблон значения подэлемента.

2) Методы генерации текста, в котором присутствуют индивидуальные данные.

Подобны предыдущим методам, но в значения подэлементов, характеризующихся индивидуальными данными, подставляются введенные ранее  индивидуальные данные.

III. Методы обеспечения синтаксического анализа и корректировки.

В COM-сервер MS WordDocument передается текст и в диалоговом режиме производится  проверка правописания, затем производится ручная корректировка текста: в выходном тексте заменяются выбранные пользователем  фрагменты.

Литература:

1.     Коробова И.Л. Автоматизированная система синтеза текста на основе технологии шаблонизации. // Материалы межрегиональной научно-практичес-кой конференции «Информатизация системы образования Тамбовского регио-на». http://club-edu.tambov.ru/main/news/index.php?r=konf1&f=t12

2.     Коробова И.Л., Дьяков И.А. Информационное обеспечение подсистемы синтеза текста при автоматизированном проектировании технологических объектов. // Теплофизика в энергосбережении и управлении качеством: Материалы Шестой международной теплофизической школы. Тамбов, 2007. Ч.2. С. 27-31.

3.     Информатика: Энциклопедический словарь для начинающих/ Сост. Д.А. Поспелов. – М.: Педагогика-Пресс, 1994 – 352 с.

4.     Коробова И.Л., Майстренко Н.В. Подсистема синтеза текста в САПР// Вестник Тамбовского государственного технического университета. 2009, Т.15 №1, С.49-55.