Проф.,
др. техн. наук
А.А.
Жарновский
Адъюнкт,
канд. техн.
наук
Себастьян
Банашек
Адъюнкт,
канд. техн.
наук Анна
Банашек
МЕТОД И
ПРОГРАММНОЕ
ОБЕСПЕЧЕНИЕ
ДЛЯ СОЗДАНИЯ
РАСТРОВЫХ ИНТЕРАКТИВНЫХ
ТУРИСТИЧЕСКИХ
КАРТ С СЕМАНТИЧЕСКИМИ
ДАННЫМИ ОБ
ОБЪЕКТАХ
Резюме
Статья
посвящена
проблеме
записи
семантических
данных об объектах
местности на
растровых
картах и планах.
В
традиционной
геоинформационной
технологии
для дополнения
картографической
основы
семантическими
данными
используется
трехкомпонентная
геореляционная
модель:
векторная
(цифровая)
карта, база
данных с
качественными
и количественными
характеристиками
объектов отображенных
на карте и
правила
идентификации
объектов
(система
кодирования
объектов).
В
статье
описаны
теория и
метод
генерирования
е-символов
для записи
текстов в естественных
языках на
растровых
изображениях,
в т.ч.
растровых
картографических
документах и
цифровых
ортофотокартах. Показано,
что любое
слово в
естественном
языке может
быть записано
как е-символ,
если будет
выбран соответствующий
исходный алфавит.
Определены
алгоритмы и
процедуры
генерации е-символов,
описано
разработанное
авторами
программное
обеспечение,
в т.ч. графический
редактор для
размещения
е-символов на
растровом
изображении,
приведены примеры
создания
интерактивных
туристических
планов и
карт.
Разработанные
методы могут
найти применение
в
геопорталах
и информационных
системах
предназначенных
для массового
пользователя,
которые не
имеют базовой
подготовки в
области
картографии
и ГИС
(нотариусы,
судебные и
административные
работники,
владельцы и
арендаторы
недвижимости
и т.п.).
Ключевые
слова: ГИС,
геоинформационная
технология,
растровая модель,
туристическая
карта, е-символ,
графический
редактор,
программное
обеспечение
ВВЕДЕНИЕ
Современные
ГИС
построены на
трехкомпонентной
основе,
которая включает
в себя (Longley
и др. 2005):
-
цифровую
карту,
отображающую пространственное
положение
объектов
местности,
- базу
данных с
качественными
и количественными
характеристиками
этих
объектов,
-
правила
идентификации
объектов для
установления
связи между
цифровой
картой и
базой данной.
Обычно для
этих целей
используются
системы алфавитно-цифровых
или цифровых
кодов.
Все
эти
компоненты
ГИС мало
зависят от
программной
реализации и
комплекса
технических
средств,
поэтому
детально
описаны в
литературе и
широко
известны.
Существуют
правовые
нормы и
национальные
стандарты,
которые
регулируют
содержание и
форматы
компонентов
ГИС,
технологии
их создания,
а также сбора
и
актуализации
данных, способы
доступа к
данным и их
защиты. В
рамках Европейского
Союза
проводятся
работы над
стандартами
пространственных
данных (INSPIRE) в
соответствии
с директивой
«Directive 2007/2/EC of the European Parliament and of the Council of 14 March 2007».
Следует
заметить, что
при
реализации
запросов
пользователям
ГИС доступно
все множество
данных об
объектах
записанных как в
базе данных,
так и в
файлах цифровой
карты. Однако
результат
запроса в виде
печатного
документа (hard copy)
выдается
пользователю
только в виде
растрового
объектно-графического
документа с
использованием
принтера или
плоттера -план, карта,
ортофотокарта
и др. В связи с
этим,
распечатанные
ГИС-карты
имеют достаточно
ограниченную
сферу
применения
по сравнению
с
возможностями
ГИС.
Семантические
данные
(количественные
и качественные
данные об объектах,
хранящиеся в
базе данных)
могут быть распечатаны
как
отдельный
текстовый
документ.
Заметим
также, что
выходной
объектно-графический
документ,
подобно как и
карта в
технологии WMS
(Европейский
Стандарт ISO 19128: Geographic information: Web map server interface), отображает
только
пространственное
положение
объекта на
карте, но не
содержит семантических
данных из БД. Для
получения
семантических
данных в
технологии WMS применяется
дополнительная
инструкция GetFeatureInfo
или
стилизированный
дескриптор
слоя (SLD).
Для
таких
пользователей,
как
геодезисты, топографы,
картографы,
проектировщики,
работники
кадастровых
служб и т.п.,
разработка
цифровой
карты и
создание базы
семантических
данных с
использованием
ГИС является
одним из
основных
видов их профессиональной
деятельности.
Для массовых
пользователей
(небольшие
девелоперские
фирмы, администраторы
разного
уровня, нотариусы,
оценщики,
управляющие
и владельцы
недвижимости,
работники судов
и налоговой
службы и т.д.)
использование
ГИС с
экономической
и технической
точки зрения
малоэффективно.
Но вместе с
тем, эти
пользователи
представляют
собой
огромный
потенциальный
рынок
продуктов
ГИС, который
нельзя игнорировать.
Задание
заключается
в разработке
на основе ГИС
новых
продуктов
менее технически
сложных в
использовании
и более
дешевых, которые
дают
возможность
получить
данные в том
же объеме,
как и при
использовании
традиционных
ГИС.
Постановка
проблемы
До
настоящего
времени
проблема
записи данных
об объектах,
отображенных
на растровых
объектно-графических
документах
практически
не решена. Использование
условных
знаков
является
частичным
решением проблемы,
решаемой
картографическими
методами, при
наложении
ряда
существенных
ограничений
на их
использование
(Салищев
1944).
Поскольку
исходный
объектно-графический
документ
использует
растровую
модель
графических
данных, то
алфавитно-цифровые
данные
описания
объекта (в
дальнейшем сообщения
или message – англ.)
должны быть
каким-то
образом
также преобразованы
в растровую
форму. Одним
из примеров
записи сообщений в
приемлимой
для решения
проблемы
форме
являются
иероглифы,
используемые,
например, в
китайской
письменности.
Один
иероглиф
содержит, как
правило,
минимум одно
слово
сообщения,
т.е. является
достаточно
компактным
способом
записи
информации,
причем количество
иероглифов
для записи
даже
информационноемкого
сообщения
является в
принципе не
большим. Их сканирование,
т.е.
преобразование
в растровую модель,
является
тривиально
простым заданием,
а полученный
растр может
быть вклеен в
растровый
образно-графический
документ.
Очевидно,
что
иероглифы
являются
продуктом
человеческой
деятельности
в процессе
длительной
эволюции.
Поскольку в
компьютерных
технологиях
процесс
генерации
электронного
символа
должен быть
строго
формализован
с
использованием
определенных
математических
закономерностей
и это дает
возможность
последующего
однозначного
считывания
его с
растрового
изображения
без
применения
методов
распознования
образов.
При
таком
подходе
может быть
разработан принципиально
новый картографический
продукт – интерактивная
семантическая
карта или
план, которые
содержали бы
не только
данные о
пространственном
положении
объектов, но
и достаточно
обширные сообщения
о их
качественных
и
количественных
характеристиках.
Для примера
на кадастровых
картах могли
бы быть размещены
данные о
недвижимости:
владелец,
технические
характеристики
недвижимости,
адрес,
кадастровая
и рыночная
стоимость,
данные об ограничениях
прав на нее и
т.п. Эти
данные могли бы
быть
доступны
пользователям
с использованием
специализированного
браузера для
работы с
интерактивной
семантической
картой. При
этом
пользователю
не нужны
специализированные
знания в
области ГИС,
геодезии и
картографии,
а достаточно
иметь знания
на уровне
географии
средней
школы и уметь
пользоваться
интернетом.
Такие карты могли
бы быть
доступны
пользователям
через геопортал,
наравне с
другими картографическими
продуктами
и
продуктами
ГИС.
Многолетние
исследования
способов
записи
семантических
данных на
растровые
документы, в
том числе на
планы и
карты, позволили
найти решение
проблемы
путем генерирования
е-символов,
которые
создаются по
определенным
математическим
закономерностям
и поэтому
могут быть
прочитаны
однозначно с
использованием
компьютера (¯arnowski 2003).
Для
реализации
одного из
разработанного
авторами
метода создано
программное
обеспечение,
которое
включает в себя:
GZA_Analizator -
анализатор
исходных
текстов,
сообщения которого
должны быть
добавлены на
растровую
карту, и
создание
оптимального
базового алфавита,
GZA_Gen_ Symbols - генератор
е-символов,
EZA_Edytor_MR - графический
редактор для
размещения
е-символов на
карте,
EAZ_Browser_Map_Tourist -
браузер для
работы с
интерактивной
семантической
картой.
Программное
обеспечение
разработано
в программной
среде Delphy для
операционной
системы Windows XP/Vista.
В
качестве
объекта для
проверки
разработанных
методов
выбрана туристическая
карта, на
которой
должны
содержаться
данные о всех
интересных
местах (памятниках
природы,
архитектуры,
истории),
туристических
маршрутах
(пеших,
велосипедных,
конных и
автомобильных),
коммуникации
(вокзалы,
пристани,
остановки
автобусов), а
также инфраструктуре
(отели,
рестораны,
кинотеатры,
бары,
дискотеки и
т.д.).
Е-СИМВОЛ
Определение
1.
Символ е-алфавита –
это
сгенерированный
в соответствии
с определенными
математическими
закономерностями
графический
растровый символ,
который отображает
слово в
исходном
языке без
информационных
потерь.
При
разработке е-символов
принято:
1.
Алфавит (А) является
множеством
символов
некоторой кодовой
таблицы:
(А) = {s ½ s Î {s1, s2, s3, …, sK }}, (1)
где:
К - количество
символов в
алфавите
2.
Буква (а) является
произвольным
символом
алфавита (А):
(а)
Î (А)
(2)
3.
Слово (аа)
является
множеством
букв:
(aa) = {(a) ½(a) Î (A)} (3)
количество
букв в слове
обозначим
через N
4.
Предложение (аа:аа)
является
множеством
букв и слов:
(аа:аа)
= {(a) ½(a) Î (A) (aa) = {(a) ½(a) Î (A)} (4)
где:
«:» - символ-разделитель
слов
5. Текст
является
множеством
предложений:
(аа:аа.
аа:аа.<...>.аа:аа) (5)
где:
«.» -
символ-разделитель
преложений.
Определение
2. Любое
слово естественного
языка может
быть
записано как
е-символ
при выборе
соответствующего
базового
алфавита (А).
Определение
3. Размерность
растра для
генерируемого
е-символа
устанавливается
по одной оси
(например - X)
равной длине
слова, а по
другой (в
этом случае Y) -
равной количеству
символов в
алфавите (А).
Определение
4. Всем
пикселям
растра
приписывается
некоторый
уровень
спектральной
яркости СВ,
например, для
монохроматического
изображения –
255.
Определение
5. Для (а) Î (А) отображением (а) на растре Сij(i=0,1,...,K, j=0,1,...N), является
пиксель с
уровнем
спектральной
яркости СS
(например, для
монохроматического
изображения - 0) и
индексами:
i = Nom(a),
j = Nom(aa),
где:
Nom(a) – порядковый номер
буквы в
алфавите (А),
Nom(aa) –
порядковый
номер (a) в (aa).
K –
размерность
алфавита,
N – количество
букв в слове.
Зададим
алфавит:
(А)={a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z}.
Количество
букв в
алфавите K равняется
26.
Для слова geodezja количество
букв в слове N равна 8. В
соответствии
с
определениями,
описанными
выше,
алгоритм
генерирования
е-символа
может быть
записан в
виде:
S Þ gÞC7,1 =0
Þ e Þ C5,2=0
Þ o Þ C15,3=0
Þd ÞC4,4=0
Þ e ÞC5,5=0
Þ z ÞC26,6=0
Þ j ÞC10,7=0
Þ a ÞC1,8=0
Соответственно,
е-символ
слова geodezja будет
иметь вид, показанный
на рис 1.
Рис.1.
Е-символ
слова geodezja
При
изменении
осей
координат
растрового
образа
следующим
образом: по
оси X –
размерность
алфавита, по
оси Y –
длина слова,
е-символ
слова geodezja будет
иметь вид, показанный
на рис 2.
Рис.
2. Е-символ
слова geodezja при
замене осей
координат
туристические
планы и карты
Туристические
планы и карты
относятся к
категории
тематических
картографических
продуктов. К
ним можно
отнести
любой план
или карту,
которые
предназначены
для туристических
целей и
которые
содержат
информацию
о всех
интересных
местах,
туристических
маршрутах,
средствах
городской коммуникации,
инфраструктуре,
и т.п.
Растровая
карта
является
цифровой
формой
представления
аналоговой
карты в определенной
картографической
проекции и в
определенном
масштабе (Mogi³³o-Suchowera и др. 1998).
Дигитализация
аналоговой
карты выполняется
с
использованием
сканера при малом
разрешении
сканирования,
обычно 300-600 dpi, что
соответствует
графической
точности
плана или
карты. Такие
растровые
планы с
учетом
небольших
затрат времени
на их создание
по сравнению
с векторными
планами (процесс
векторизации
является
трудоемким и дорогостоящим),
могут быть
широко
доступны для
массовых
пользователей.
Одной
из наиболее
часто
используемых
туристических
карт
является
карта дорог
(атлас автомобильных
дорог), в том
числе
электронные
версии
навигационных
дорожных
карт,
используемые
в системах
GPS-навигации.
Масштаб
карты
выбирается в
зависимости
от размера отображаемой
территории,
густоты
дорожной сети,
степени
генерализации
и дополнительных
элементов.
Среди
дорожных карт
можно
выделить:
1. Обзорные
дорожные
карты
масштаба 1:3 000 000 (например,
Европы), на
которых
показаны границы
государств,
главные
дороги и
города.
2.
Карты
отдельных
государств.
Для государства
такого
размера, как
Польша, они
разрабатываются
в масштабах 1:750 000 - 1:1 000 000.
3.
Детальные
дорожные
карты в
масштабе 1:100 000 –
1:500 000 для отдельных
регионов и
областей
государства.
На
дорожных
картах
схематично
показана
топография
местности:
реки, ручьи,
озера и
водохранилища,
железные
дороги, сеть
дорог с
дополнительными
данными для
туристов и
автомобилистов.
К таким данным
относятся
места
стоянок,
бензо-
и
газозаправочные
станции,
гостиницы и
мотели, леса,
заповедники,
исторические
и культурные
памятники,
пограничные
переходы и
т.п. Дополнением
для этих
карт и
атласов могут
быть схемы городов
в более
крупном
масштабе.
План
города
является
специфическим
подвидом
тематической
крупномасштабной
карты, на
которой
отображается
территория
города. В
традиционной
бумажной
форме он может
использоваться
для
различных
целей. Масштаб
плана
выбирается в
зависимости
от площади города,
требуемой
точности
отображения
деталей и
размера
плана -
обычно масштаб
плана
выбирается
в диапазоне
от 1:20 000 до 1:30 000.
На
плане города
кроме сети
улиц с их
названиями
наносятся
важнейшие
объекты: музеи,
памятники
архитектуры,
театры и
кинотеатры,
учебные заведения,
парки,
костелы и
церкви,
отделения полиции,
больницы,
аптеки, заправки
и т.п., а также
автобусные,
трамвайные и
тролейбусные
маршруты,
станции метро.
К плану
обычно
прилагается
список улиц и
важнейших
объектов с привязкой
к сетке
квадратов.
Такие
планы могут
использоваться
в виде традиционного
бумажного
документа,
так и в
электронной
форме в
GPS-навигации
и мобильных
телефонах.
Сегодняшний
уровень развития
информационных
технологий и
общедоступность
цифровых
методов
обработки
графических
документов
открывают
новые возможности
увеличения
информационности
тематических
планов и
карт, в том
числе
дорожных и
туристических,
путем записи
на них
сообщений
чрезвычайно
полезных для
пользователей.
Так
с
использованием
е-символов
содержание
туристической
карты можно
дополнить
любыми
данными.
Например, для
гостиниц и
мотелей
можно записать
ее название,
стандарт,
адрес, номер
телефона,
адрес
электронной
почты и
сайта, данные
о номерах и
ценах. Этот
свидетельствует
об
эластичности
и возможностях
метода, а
также
показывает разницу
между
содержанием
традиционной
и
интерактивной
семантической
картами.
Программное
обеспечение
для создания Растровых
интерактивных
семантических
карт
Анализатор
текстов. Главным
заданием
программы
является анализ
исходного
текста,
сообщения
которого
должны быть размещены
на растровой
карте. В
результате этого
анализа
будет создан
базовый
алфавит, в
котором
будут записаны
только
символы
исходного
текста. Базовый
алфавит,
используемый
для
генерирования
е-символов
и их чтения в
браузере, для
уменьшения
размеров
записываемых
на растровую
карту е-символов
может быть
оптимизирован
на основе
статистического
анализа
частоты
использования
символов в исходном
тексте.
Базовый алфавит
может быть
подобран
индивидуально
для каждого
вида
объектов и
категорий
пользователей,
что
обеспечивает
защиту
данных и
может регулировать
доступ
различных
категорий
пользователей
к интерактивной
семантической
карте.
После
запуска
программы в
окне
появляется
главное меню (рис. 3):
Рис. 3.
Главное окно
программы GZA_Analizator
Опция Czytaj служит
для чтения текста
записанного
в файле
формата ASCII.
При форматировании
текста
используются
специальные
символы: # - признак
конца слова, $ - признак
конца
предложения.
Фрагмент
текста
показан на
рис. 4.
Рис 4.
Пример части
текста с
данными о
гостиницах
После
обработки
текста будет
доступно
подменю Alfabet
для
генерирования
базового алфавита
и его записи
в файле. Для
текста показанного
на рис. 4 будет
сгенерирован
базовый
алфавит:
.#opks12inwzdel0art9 8gy-7hmu()35*/4@ñ
Генератор
е-символов. Главным
заданием программы
является
генерирование
е-символов
в виде
картографического
знака или
цифрового
образа на
основе
базового алфавита
и
предложений
исходного
текста.
Главное
окно
программы
содержит
меню (рис. 5) для
выполнения
следующих
опций: Alfabet - чтение
базового
алфавита, Zdanie -
ввод с
клавиатуры
или чтение
одиночного предложения
из файла, Tekst -
чтение
исходного
текста записанного
в файле и
создание
пустой библиотеки
е-символов,
e-Symbol -
генерирование
одиночного
картографического
знака/цифрового
образа или
библиотеки
картографических
знаков/цифровых
образов, Zamknij -
конец работы
программы.
Рис. 5.
Главное окно
программы GZA_Gen_ Symbols
Примеры
генерирования
е-символа
в виде
картографического
знака (рис. 6А) и
цифрового
образа (рис. 6В)
показаны на
рис. 6.
A B
Рис. 6.
Пример е-символа
для первого
предложения
на рис. 4
Редактор растровых карт. Программа
EZA_Edytor_MR
предназначена
для
редактирования
базовой
растровой
карты с целью
нанесения на
нее е-символов.
Меню программы
(рис. 7)
содержит
подменю: Mapa –
чтение
головной
части файла (hider) и
базовой
карты в
формате .bmp или
.jpeg, Biblioteka -
чтение
библиотеки
картографических
знаков/цифровых
образов, Fragment -
работа с
фрагментом
исходной
карты, Zakoñcz –
завершение
работы с
программой.
Рис. 7. Главное
окно
программы EZA_Edytor_MR
Опция Fragment
дает
возможность
выбора части
плана или карты
для редактирования
(рис. 8).
Рис. 8. Пример фрагмента туристического плана
В верхней
части окна
имеется
дополнительное
графическое
меню с кнопками:
·
увеличения
масштаба
изображения,
·
уменьшение масштаба изображения,
·
центрирования
изображения,
·
выбора е-символа и его
размещения,
·
отмены
операции
размещения,
·
записи
отредактированного
фрагмента.
На рис. 9
показан
фрагмент
интерактивного
семантического
плана с размещенным
е-символом
(семантические
данные о
гостинице).
Рис. 9.
Часть интерактивного семантического плана
Заключение
Использование
е-символов
дает
возможность
расширить
содержание
растровых
тематических
карт информацией,
полезной
пользователям. Практически
это будет
качественно
новый
картографический
продукт –
интерактивный
растровый
семантический
план или
карта.
Технология
их создания
основана на
описанном в
статье
программном
обеспечении,
а для чтения
записанных
на них е-символов и
выдачи
сообщений на
естественном
языке могут
использоваться
стационарные
или
переносные
компьютеры,
мобильные
телефоны, на
которых
заинсталирован
специальный
браузер EAZ_Browser_Map_ZDO.
Описанная
технология значительно
снижает
стоимость
конечного продукта
и упрощает
процесс
записи на
базовую
растровую карту
семантической
информации.
Каждый
пользователь
может
использовать
для
генерации е-символов
свой собственный
базовый
алфавит с
дополнительной
системой
кодирования, что
обеспечивает
защиту
персональных
данных. Этим
способом
может быть
обеспечено использование
одной интерактивной
растровой
семантической
карты
различными
группами
пользователей.
Исследования
выполнены в
рамках
научно-исследовательского
проекта N520 022 31/2971 „Opracowanie symboli SIP-alfabetu i ich zastosowanie w mapach rastrowych i
ortofotomapach cyfrowych"
(Решение Nr 2971/T02/2006/31 Министра
Науки и
Высшего Образования
РП от 02.08.2006 г.).
Литература
1. Longley P. A., Goodchild M. F., Maguire D. J., Rhind D. W. 2005. Geographic
Information Systems and Science, Chichester: Wiley. 2nd Edition
2. Салищев
К. А. 1944. Основы
картоведения,
Геодезиздат,
Москва.
3. ¯arnowski A.
2003. E-jêzyk i generowanie symboli E-jêzyka na podstawie transformacji
„tekst-grafika”, Archiwum Fotogram., Kartogr. i Teledetekcji, vol. 13A,
Wroc³aw.
4. Mogi³³o-Suchowera
S. i in. 1998. Instrukcja techniczna K-1. Mapa zasadnicza: Wydanie 3,
Kordab Polska SP. Z O.O., £ódŸ.
METHOD AND SOFTWARE FOR
CREATION OF RASTER INTERACTIVE TOURIST MAPS WITH SEMANTIC INFORMATION ABOUT OBJECTS
Summary
Reading map
combines reading text signatures and obtaining information in process of transition
from cartographic model into a message in a language (verbal-numerical form).
For GIS-user not only the information from traditional map is accessible, but
also the information gathered and recorded in a semantic database. However
printed GIS-map contains the same information as traditional map. All semantic
data are stored in a database and cannot be read from a hard-copy.
The problem which needs
to be solved here is the manner of attaching semantic data to raster map, in a
way which allows putting such data in raster map and enables its reading from
hard-copy. As the solution of problem mentioned above, the method of writing
down of semantic data in a raster map with use of symbols of the E-alphabet is
described. These symbols guarantee user an opportunity for reading the complete
information included in GIS.
The
important stage in symbol of the E-alphabet generation is the choice of the
basic alphabet. In the article results of research are presented and examples
of maps for tourists.
KEY WORDS: GIS, Raster Map, Semantic Data, Graphic Editor, Maps for
Tourists