Математика/5. Математичне
моделювання
Василенко Ю.А., Бунда В.В., Василенко Е.Ю., Повхан І.Ф.,
Ісак Ю.Ю.,
Головчак І.І., Ковач О.А.
Закарпатський державний університет, Україна
Автоматизація побудови прогностичних математичних моделей
Математичні моделі різних об'єктів (матеріальних, явищ, ситуацій та інше) широко використовуються в останні десятиліття в сучасних інформаційних
технологіях прогнозування важливих параметрів соціально-економічних, природних та технологічних систем. Звідси, як відомо, за
об'єктом дослідження існують
природничі прогнози, науково-технічні та суспільного характеру (або соціального, в широкому розумінні цього
терміну). В природничих прогнозах
взаємозв'язок між передбаченням та передвказівкою незначний, практично дорівнює нулю через неможливість
управління об'єктом (в принципі, тут
можливе тільки пошукове прогнозування). В суспільних прогнозах цей взаємозв'язок настільки вагомий, що
приводить до, так званого, ефекту
самоздійснення або, навпаки, саморуйнування прогнозів діями людини (на
основі мети, планів, програм, проектів та ін.) [1]. Науково-технічні прогнози займають в цьому відношенні деяке проміжкове розташування.
Природничі прогнози поділяються на наступні типи:
1)
гідрологічні (повені, шторми, цунамі, режим стоку води та
ін.);
2)
геологічні (землетруси, лавини, поклади корисних
копалин);
3)
метеорологічні (погоди, повітряних
потоків та ін.);
4)
біологічні (врожайність, явища рослинного і тваринного
світу);
5)
фізико-хімічні прогнози явищ
мікросвіту.
Науково-технічні прогнози (технологічні, інженерні) охоплюють перспективи стану матеріалів і режиму роботи механізмів, машин, пристроїв, електронної апаратури та всіх явищ техносфери. В широкому розумінні — перспективні проблеми розвитку науки, наукових кадрів, а також перспективні проблеми техніки (передусім системи „людина-машина").
Для прогнозування в наш час широко використовуються математичні моделі штучного інтелекту (зокрема математичні моделі розпізнавання образів (РО)). Але кожний з методів РО, взятий окремо, має, як і відомо, певні обмеження при практичному використанні (точність, розпізнання невідомих об’єктів, сфера використання, складність застосування та ін.). Звідси виникає дуже важлива наукова проблема, яка полягає в комплексному використанні декількох методів РО в одній алгоритмічній схемі, яка будується за певними правилами. Ця проблема розв’язана в [3].
На основі цієї схеми в Закарпатському державному університеті (ЗакДУ) побудований програмний комплекс (ПК) універсального характеру, який дозволяє на базі навчаючої вибірки (НВ) побудувати прогнозуючу систему, уникнувши вказаних вище недоліків окремих методів розпізнавання.
Зауважимо, що основною негативною рисою майже всіх відомих методів в теорії РО є те, що під час розв'язування деякої задачі розпізнавання в загальному випадку вони автономно використовуються до кінця рішення, розраховані на значну точність, яка, однак, досягається за достатньо великий проміжок часу. Застосовуються вони, в основному, до нескладних образів, тобто таких, які описуються відносно простими формулами, рівняннями. Головним принциповим недоліком цих методів є те, що вони обмежені в використанні якоюсь однією, закладеною в них концепцією (лінійний розподіл, нелінійний і т.п.), що дуже часто на практиці призводить до значного зниження ефективності. Отже виникає проблема побудови такого методу (схеми), яка б назавжди позбавила цього недоліку, тобто, якщо досягнута, наприклад, точність розпізнавання об’єктів НВ 70% і далі немає її покращення, то необхідно або замінити існуючий алгоритм, або якось покращити його. Вигідніше навіть саме покращити, так як вже були витрачені певні обчислювальні ресурси на застосований алгоритм [2].
У даний час відомо понад 500
алгоритмів РО (їх кількість постійно зростає), які
мають певні обмеження під час використання (точність, швидкодія, пам'ять, надійність тощо), крім того, кожний з алгоритмів може бути застосованим лише для обмеженого класу завдань, що безумовно є слабким
місцем не тільки даних алгоритмів, але й систем розпізнавання, які базуються на них. Крім того, існуючі методи обробки
навчаючих вибірок під час побудови
функції розпізнавання (ФР) не дають змогу досягти потрібного рівня
точності системи розпізнавання та регулювати їх складність у процесі конструювання даних систем. Цей недолік відсутній
у методах побудови систем розпізнавання, які базуються на методі
розгалуженого вибору ознак (РВО). При цьому
головна риса РВО — можливість комплексного використання для розв'язання кожного конкретного завдання побудови
системи багатьох відомих алгоритмів розпізнавання на основі єдиної
методології — оптимальної апроксимації навчаючої вибірки набором узагальнених
ознак (відомих алгоритмів), які входять в деяку систему (оператор), побудовану
в процесі навчання [3].
Авторами створено та апробовано на реальних даних програмний комплекс „Оріон" (далі ПК „Оріон"), який використовує вищевказані нові ідеологічні та методологічні концепції. Це дає можливість застосувати в ньому чисельні методи прогнозування (розпізнавання образів) в якості окремих блоків конструйованої прогностичної системи (аналогічно побудові будинку з готових блоків). Виникає можливість повніше використовувати існуючі методи (надаючи їм, по суті, „друге життя"), що приводить до усунення вищезгаданих недоліків. Опишемо конфігурацію та функціонування ПК „Оріон".
Математичною основою даного ПК є розроблений в Ужгородському національному університеті метод математичного конструювання розпізнаючих систем (РС) на основі розгалуженого
вибору ознак, який в роботах Ю.А. Василенка знайшов свій подальший теоретичний розвиток та програмну
реалізацію у вигляді програмного
генератора „локальних" РС [3]. Ідейна сторона даного методу базується на теорії схем (операторів, що
залежать від скінчених наборів функцій та предикатів), де вперше в
математичних дослідженнях використано алгебраїчний підхід до визначення
обчислювальної схеми [6]. До того часу існував тільки конструктивний підхід, що
можна вважати значним математичним обмеженням, враховуючи великі досягнення
загальної алгебри. На цей факт вказував ще визначний радянський вчений-кібернетики
А.А. Ляпунов у відомих в СРСР збірниках “Проблеми кібернетики”(а також в
особистих розмовах з автором [3]).
Вцілому даний ПК складається з двох основних частин: головної програми управління комплексом та відкритої бібліотеки алгоритмів розпізнавання та класифікації. Цінною особливістю тут є те, що програма-генератор працює вже з готовими алгоритмами для побудови ПК. При чому можна підключати до РС, в принципі, додаткові алгоритми, написані на будь-якій мові програмування, але з дотриманням певних правил та вимог, які забезпечують обмін службовими даними з головною програмою управління. Отже, на кожному кроці конструювання РС можна використовувати довільний з відомих методів розпізнавання [5].
Бібліотека алгоритмів
програми-генератора включає чотири базові (так звані, геометричні)
алгоритми розпізнавання, які базуються на апроксимації кожного класу деякими геометричними фігурами. Причому кожний з алгоритмів
працює в двох режимах — режимі побудови функції розбиття та режимі класифікації. В першому випадку на основі
навчаючої вибірки будується правило класифікації (узагальнена ознака), а
в другому на основі даного правила
проводиться класифікація об'єктів. У вимогах до даного ПК можливе
відхилення від даного правила і реалізація цих етапів в окремих підпрограмах,
які зберігаються у відповідних розділах головної бібліотеки програми-генератора.
Головною особливістю ПК є те, що результатом роботи програми-генератора є повністю автономна РС, яка використовує алгоритми розпізнавання як свої будівельні елементи, тобто дана програма фактично є генератором інших програм. Причому генерація РС може проходити як в автоматичному, так і в інтерактивному режимі. В автоматичному режимі програма сама оцінює ситуації і знаходить найбільш ефективний алгоритм для даного кроку без участі людини. В інтерактивному режимі людина має право втрутитися в процес на будь-якому кроці генерації системи — відкинувши один та зафіксувати інший алгоритм.
Під час розробки даного ПК основною вимогою до нього була „всеоб'ємна" універсальність (в плані ефективності для довільного завдання), універсальність у плані використання довільного алгоритму як будівельного елементу, універсальність у плані мультиплатформності програми, що повинно було виявитися на мові реалізації. Логічно у цьому плані вибрати DELFI або Visual C. Але їх використання, хоча спростило б структуру ПК, та не забезпечило б йому роботу на платформах, відмінних від Windows. Тому вибір був зроблений на користь мови програмування Free Pascal — подальший розвиток класичного Borland Pascal (алгоритми РС на мові С). Слід зазначити, що у внутрішніх бібліотеках програми заради оптимізації коду активно використовувалася мова низького рівня Assembler. Free Pascal — безкоштовний 32-бітовий компілятор з відкритим кодом, який працює під більшістю платформ, в тому числі Windows, Linux, Dos, ВеОS, FreeBSD, QNX, ОS/2, Аtагі St, Commondore Amiga, отже дане питання при такому виборі буде повністю розв'язаним. І для переносу ПК на нову платформу в початковий код програми потрібно внести лише незначні адаптаційні зміни.
Литература:
1.
Рабочая книга по прогнозированию. — М.: Мысль, 1982. — 430с.
2.
Бунда В.В., Василенко Ю.А. та ін. “Штучний
інтелект в соціально-економічних завданнях”, Науковий вісник ЗакДУ, спец.
випуск, Ужгород, 2006, с. 29-32.
3.
Ю.А. Василенко. Математическое
конструирование распознающих систем на основе метода разветвленного выбора
признаков (теория, алгоритмы, реализация, применение), дисс… докт. техн. наук,
Харьков, 1991, 230 с.
4.
Василенко Ю.А., Исак Ю.Ю., Попович
М.Т., Мельник Е.А., Головчак И.И. Определение важности дискретных признаков
(анализ подходов). IV науково-практична конференція; Прага. 2008, – с. 8-12.
5.
А.Б. Глаз.
Параметрическая и структурная адаптация решающих правил в задачах
распознавания, Рига, “Зинатне”, 1988, 170 с.
6.
Вишенько И.В. Схемы, алгоритмы и
многообразия, Ужгородский государственный университет, Ужгород, 1970, 75 с.