Інформаційний пошук в мережі Інтернет: засоби і технології.

 

Раєвский М.В., Кушніров С.О.

КНУТД ФРІІТ

 

Інтернет на сьогоднішній день – це величезна кількість інформації, що відображає всі сторони життя людства. Одним з важливих питань для тих, хто цікавиться цією інформацією, є можливість знайти її в цій мережі. Основним засобом відповіді на це питання є "пошукові машини". Цей термін приховує великий набір спеціальних служб, які забезпечують доступ до інформації. Але вони також мають свої недоліки.

Основними аспектами ефективного пошуку є: знання про існуючі машини пошуку; додавання ними відомостей про ресурси мережі; повідомлення машини властивостей шуканих ресурсів; результат пошуку; залежність результату і можливість його поліпшення; технологія ефективного пошуку[4; 144]. 

На сьогоднішій день можна виділити чотири типи пошукових машин: машини з класифікованими списками ресурсів; машини, що використовують запити про ресурси; машини-каталоги; мета-машини. Кожна машина пошуку містить бази даних, що відображують вміст web-сторінок або інших ресурсів мережі. Результати пошуку, отримані машиною, зазвичай ранжирувані по мірі зв'язаності з вмістом і формою запиту[1; 10].

Основним принципом роботи алгоритму пошукової системи є формування рейтингу сайту на підставу ключового запиту. Виходячи з цього, алгоритмом враховуються наступні чинники для фільтрації: кількість ключових слів на сайті, кількість ключових слів на сторінці, співвідношення загального числа слів на сайті до кількості ключових слів на сайті, індекс цитування, популярність тематики сайту,  загальна кількість веб-сторінок сайту, об'єм тексту сайту, об'єм сайту, вік сайту і ряд інших технічних параметрів, для точнішого пошуку[2; 175].

Завдання підвищення точності пошуку в Інтернеті не завжди добре вирішується  математичними методами, тому розглядається застосування лексичних функцій.

Лексичні функції – це тривіальні сенси, словесне вираження яких в тексті залежить від того, при якому конкретному слові цей сенс виражається. Ця опція реалізована на базі лінгвістичного процесора ЕТАП-3. Її основна фунция в доповненні двух- або трехсловних пошукових запитів про числове значення параметра до неповної пропозиції. Алгоритмічна організації перефразовування заключається в побудові куща перефраз, що грунтується на інформації про лексичні функції. Якщо яка-небудь лексична функція має декілька значень, то система перефразовування будує пропозиції по черзі зі всіма значеннями. Такий спосіб дає можливість збільшити точність результатів пошуку по запитах, що передбачає чисельні відповіді [3; 322].

Безперечно, дана тема дуже актуальна у наш час, так як мережа Інтернет з кожним днем усе більше наповнюється новою інформацію і ії повинні мати можливість знайти. Саме тому, необхідно оптимізовувати, та тим самим полегшувати пошук інформаціі для користувачів мережі.

 

Список використаних джерел:

1.      Сегалович И.  В.  Как работают поисковые системы  //  Мир  Internet.  – 2002.  – № 10. – С.10-12.

2.      Когаловский М.  Р.  Перспективные технологии информационных систем.  М.   : ДМК Пресс : Компания АйТи, 2003. – С.175-177.

3.      Цинман Л.Л., Сизов В.Г. Система ЭТАП: процедуры ослабления синтаксических правил и их использование. - 2009. – С.321-326.

4.      Браун, Маркус. Методы поиска информации в Интернете. – 2005. – С.144.