WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Пошук за допомогою системи AltaVistа та основні технологічні операції - Реферат

Пошук за допомогою системи AltaVistа та основні технологічні операції - Реферат


Реферат
на тему:
Пошук за допомогою системи AltaVistа та основні технологічні операції
Пошукова машина (система) AltaVista належить корпорації Digital і відкрита для вільного користування в кінці 1995 року. Система була створена для демонстрації по мережі Internet характеристик серверів Alpha. Ця система є найбільш популярною серед усіх пошукових машин. В ній передбачені два варіанти пошуку:
- простий (Simple Search);
- складний (Advanced Search).
Адреса системи: http://www.altavista.com
Розглянемо технології роботи кожного варіанту:
Технологія простого пошуку броузера
Web-сторінка пошукового сервера має два елементи: поле введення запитання та кнопку (або посилання) для відправки запитання. Крім того властиві ще два елементи, що дозволяють уточнити зону пошуку та форму виведення результатів (рис/ 1).
Меню Search, яке випадає на екран, пропонує вибрати систему, в якій буде пошук:
Web - в системі Web;
Usenet - в групах новин.
Меню Display the Results (Показати результати) установлює форму представлення інформації:
In Standart Form - у стандартній формі;
In Compact Form - в компактній формі;
In Detailed Form - в детальній формі.
Рис. 1. Початкова сторінка системи AltaVista
Пошукове запитання формується за допомогою логічних операторів "і", "або", "ні" і т.д. Вони дозволяють з'єднати слова запитання в єдину логічну конструкцію. На жаль, значки, що використовуються для позначення логічних функцій у різних пошукових системах не завжди співпадають. Навіть в межах однієї пошукової машини AltaVista для систем простого й складного пошуку використовується різний синтаксис. В таблиці 6 наведені логічні оператори в системі AltaVista.
Крім булевих операторів, в системі використовуються й інші логічні оператори.
Зірочка (*) після слова.
Цей оператор має значення ВСЕ (або БУДЬ-ЯКИЙ). Наприклад, на запитання russi* будуть знайдені слова: russia, russian, russifi… Цей знак дає пошуковій машині зрозуміти, що вас не цікавлять закінчення слів, воно може бути будь-яким.
Але існують обмеження на використання цього оператора:
1. перед зіркою (*) повинно бути не менше 3-х букв;
2. коли буде знайдено дуже багато документів, наприклад, більше мільйона, то система пошуку не виведе результат.
Подвійні лапки ("").
На противагу до попереднього оператора, цей оператор виділяє певний вираз і наказує пошуковій машині точно відшукати текст, що відповідає написаному.
Наприклад, на запит "fat cat" будуть знайдені всі документи про товстих котів.
Таблиця 6. Логічні оператори в системі Alta Vista
Логічний оператор Простий пошук Складний пошук
Пояснення
Позначення Приклад Позначення Приклад
АБО Пропуск Fat cat OR Fat OR cat Знайти документ, де є слово fat або слово cat
І + +Fat +cat AND FatAND cat Знайти документи, де є слово fat і слово cat
НЕ - Fat -cat NOT Fat NOT cat Знайти документи, де є слово fat, але немає слова cat
БІЛЯ Не використовується NEAR Fat NEAR cat Знайти документи, де слова fat розташовані поряд із словами cat
Складаючи запитання слід бути дуже обережним із пропусками. Між логічним знаком (оператором) та словом пропуску не повинно бути. Але перед наступною групою новин пропуск повинен бути.
Запитання набирається в полі запитань. Для надсилання запитання потрібно натиснути клавішу Submit.
Через певний час у програму перегляду броузера буде завантажена сторінка з результатами пошуку. Результати пошуку, наприклад, будуть представлені записом:
Документи з першого по десятий з приблизно 40000, що задовольняють запит, найбільш точно відповідають перші (documents 1-10 of about 400000 matching the query, best matches first)
Оскільки всі знайдені документи розташовано за рангом, то в перших рядах знаходяться ті, що найбільше відповідають запиту. При бажанні можна зберегти сторінку, записавши її на дискету через меню File.
Технологія складного пошуку
Складний пошук відрізняється від попереднього тим, що в ньому застосовується новий алгоритм складення запитів на нових полях. Замість одного поля з'явилося два текстових поля і ще одне поле для введення дат (рис. 2).
Згідно з таблицею 6 тепер потрібно застосовувати булеві оператори AND, OR, NOT, NEAR для формування запитань, а також оператори зірочка (*), подвійні лапки ("). Крім того, з'явився новий оператор - круглі дужки.
Круглі дужки дозволяють, як в алгебрі, правильно згрупувати складові пошукового запиту. Буде зрозуміліше, якщо уявити оператор AND як знак множення, а OR - як знак додавання.
Складна система дозволяє обмежити пошук документів за якийсь період. Для цього потрібно задати часовий інтервал. Поле Початкова дата (Start Date) потрібне для введення нижньої межі діапазону, а поле Кінцева дата (End Date) - верхньої межі діапазону. Наприклад, 31/Jan/97, 1/Jan/97.
Крім того, у складній системі існує спеціальне поле Критерії сортування результатів (Results Ranking Criteria), що дозволяє задати власний варіант сортування. Наприклад, коли потрібно, щоб першими з'явилися документи, що вміщують якесь певне слово, то це слово заноситься в поле сортування результатів. Тоді всі документи будуть видані у відповідності з цим критерієм.
Рис. 2. Поля для введення складного запиту в Alta Vista
Новий інструментарій системи Live Topics
Цей інструментарій дозволяє очистити та проаналізувати результати пошуку. Система Live Topics аналізує зміст документів, які були знайдені у відповідь на запитання, і виводить на екран монітора таблицю слів, що найчастіше зустрічаються (частотну таблицю).
Можна по-новому відсортувати документи, відмічаючи прямо в списку, які слова потрібно включити в уточнене запитання, а які ні. Система реалізована для різних програм перегляду:
- Visual Live Topics - для програм, що підтримують Java;
- Live Topics - для програм перегляду, що підтримують JavaScript;
- Text - текстовий варіант для будь-яких програм.
Початкова сторінка Live Topics вміщує текстову зону з вашим запитом, таблицю слів, що часто зустрічаються.
Коли поставити хрестик у першому квадраті перед словом, то всі документи, що його вміщують, будуть вилучені зі списку. Хрестик у другому квадраті перенесе документи з цим словом на початок переліку. Після кожного натиснення "мишки" до запитання буде додаватися нове слово (із знаком мінус попереду, коли його потрібно виключити, та зі знаком плюс, коли його потрібно додати).
Коли вибір завершено, натисніть кнопку Submit. Система представить новий перетворений список.
Loading...

 
 

Цікаве