Інформаційний пошук в мережі Інтернет: засоби і технології.
Раєвский М.В., Кушніров С.О.
КНУТД ФРІІТ
Інтернет на сьогоднішній день – це величезна
кількість інформації, що відображає всі сторони життя людства. Одним з важливих
питань для тих, хто цікавиться цією інформацією, є можливість знайти її в цій
мережі. Основним засобом відповіді на це питання є "пошукові машини".
Цей термін приховує великий набір спеціальних служб, які забезпечують доступ до
інформації. Але вони також мають свої недоліки.
Основними аспектами ефективного пошуку є: знання
про існуючі машини пошуку; додавання ними відомостей про ресурси мережі;
повідомлення машини властивостей шуканих ресурсів; результат пошуку; залежність
результату і можливість його поліпшення; технологія ефективного пошуку[4; 144].
На сьогоднішій день можна виділити чотири типи
пошукових машин: машини з класифікованими списками ресурсів; машини, що
використовують запити про ресурси; машини-каталоги; мета-машини. Кожна машина
пошуку містить бази даних, що відображують вміст web-сторінок або інших
ресурсів мережі. Результати пошуку, отримані машиною, зазвичай ранжирувані по
мірі зв'язаності з вмістом і формою запиту[1; 10].
Основним принципом роботи алгоритму пошукової
системи є формування рейтингу сайту на підставу ключового запиту. Виходячи з
цього, алгоритмом враховуються наступні чинники для фільтрації: кількість
ключових слів на сайті, кількість ключових слів на сторінці, співвідношення
загального числа слів на сайті до кількості ключових слів на сайті, індекс
цитування, популярність тематики сайту, загальна кількість веб-сторінок сайту, об'єм тексту сайту, об'єм
сайту, вік сайту і ряд інших технічних параметрів, для точнішого пошуку[2; 175].
Завдання підвищення точності пошуку в Інтернеті не
завжди добре вирішується математичними
методами, тому розглядається застосування лексичних функцій.
Лексичні функції – це тривіальні сенси, словесне
вираження яких в тексті залежить від того, при якому конкретному слові цей сенс
виражається. Ця опція реалізована на базі лінгвістичного процесора ЕТАП-3. Її
основна фунция в доповненні двух- або трехсловних пошукових запитів про числове
значення параметра до неповної пропозиції. Алгоритмічна організації перефразовування
заключається в побудові куща перефраз, що грунтується на інформації про
лексичні функції. Якщо яка-небудь лексична функція має декілька значень, то
система перефразовування будує пропозиції по черзі зі всіма значеннями. Такий
спосіб дає можливість збільшити точність результатів пошуку по запитах, що
передбачає чисельні відповіді [3; 322].
Безперечно, дана тема дуже актуальна у наш час,
так як мережа Інтернет з кожним днем усе більше наповнюється новою інформацію і
ії повинні мати можливість знайти. Саме тому, необхідно оптимізовувати, та тим
самим полегшувати пошук інформаціі для користувачів мережі.
Список використаних джерел:
1. Сегалович И. В. Как работают поисковые системы // Мир Internet. – 2002. – № 10. – С.10-12.
2. Когаловский М. Р. Перспективные технологии информационных систем. М. : ДМК Пресс : Компания АйТи, 2003. – С.175-177.
3. Цинман Л.Л., Сизов В.Г. Система ЭТАП: процедуры ослабления синтаксических правил и их использование. - 2009. – С.321-326.
4. Браун, Маркус. Методы поиска информации в Интернете. – 2005. – С.144.