WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Лінгвістичні інформаційні системи - Реферат

Лінгвістичні інформаційні системи - Реферат

бібліографічних записів для вказаних бібліотек.
Що стосується забезпечення "взаєморозуміння" між читачем і ЕК на основі "баз знань", то, наприклад, РДБ пропонує використати формалізовану і модернізовану Бібліотечно-бібліографічну класифікацію (ББК) у машиночитаємому вигляді з предметним входом до неї.
Користувач ЕК уводить гіпотетичний набір понять, висловлених звичайною мовою як пошуковий аргумент. Програмне забезпечення демонструє при виведенні на екран варіанти найменувань ділень класифікації, пов'язаних з цими словами, і показує семантичні відносини між найменуваннями. Потім користувач вибирає потрібну тему (предмет), і система показує на екрані бібліографічні записи. При цьому індекси він може не використовувати.
Цю відповідність між предметами (поняттями, термінами) і найменуваннями ми називаємо "предметним входом, або доступом" в ЕК або класифікації. Предметний доступ може служити засобом з'єднання лексичних одиниць різних природних мов з діленнями різних класифікацій і дескрипторів різних тезаурусів. Користувачзможе побачити найменування ділень з різних класифікацій, пов'язаних з пошуковим аргументом.
Як проект майбутнього, можна уявити собі банк даних, що утримує багатомовний словник слів і словосполучень, які пов'язані з нормативними/авторитетними записами для різних класифікацій і тезаурусів. Використання такого масиву даних корисне при пошуку в чужих базах даних. Бібліотеки не залежатимуть при цьому від відмінностей у мові, типів класифікації власного ЕК і придбаної бази даних або бази даних на чужому комп'ютері. Такий проект може сприяти організації тематичного пошуку в Internet.
Невеликим експериментом у даному напрямі можна вважати випуск у 1995 р. декількома організаціями загального CD-ROM "Класифікаційні системи". Програмне забезпечення, що використовується на цьому диску, дозволяє здійснювати пошук за словом одразу в різних класифікаціях і класифікаторах, отримуючи на екрані список відібраних ділень (рубрик).
Багато бібліотек у наш час вирішили використати в своїх автоматизованих системах тезауруси, але при цьому відчувається, що ними майже не використовується колишній досвід у цій сфері, накопичений при створенні інформаційно-пошукових систем.
Перші пропозиції про використання тезаурусів в інформаційно-пошукових системах з'явилися в 1957 р., а перші тезауруси для підвищення якості пошукових процесів створювалися на початку 60-х рр. У 60-70-ті рр. повністю розроблено теорію інформаційно-пошукових тезаурусів, опубліковано десятки, якщо не сотні, робіт зарубіжних і вітчизняних авторів. У публікаціях пропонуються методичні принципи збору і лексикографічної обробки ключових слів (КС), принципи встановлення семантичних відносин між ними, описується стандартна структура тезауруса.
Ми розглядаємо метод побудови тезаурусів за категоріальним принципом. Він заснований на концептуальній моделі системи знань і використовувався в ряді ІПС.
Мова представлення знань розглядається в структурі людської діяльності, а формалізація семантики складається у вичлененні та формалізованому представленні деяких компонентів діяльності. Спосіб моделювання знань базується на гіпотезі про організацію знань у людській свідомості при пошуку інформації в масиві текстів.
Кожна сфера діяльності людини (галузь науки, техніки, господарства) виділяється з низки інших або за об'єктом діяльності, або за специфікою процесів, що складають дану діяльність, або за засобами здійснення деякого класу процесів. Коротке визначення сфери діяльності можна дати, як правило, за допомогою пари вигляду , або трійки , , в яких один з елементів виступає як ведучий.
У результаті виділяються наступні семантичні категорії елементів: процеси доцільної діяльності, або просто "процеси"; об'єкти діяльності та її засоби, тобто "предмети" як деякі матеріальні або ідеальні сутності (речі, особи, теорії, конструкти і т.д.); елементи, що характеризують "процеси" або "предмети" або що є наслідком їх здійснення, існування, появи ("супутні процеси, явища, стани)", "негативні явища", "характеристики" і "умови".
Подальший розподіл за більш вузькими категоріями виливається у процес побудови ієрархічних дерев відносно до "роду-вигляду".
При цьому в одні й ті самі точки гілок цих дерев попадають ключові слова (КС), семантично умовно еквівалентні в даній сфері знання з погляду інтересів інформаційного пошуку. Вони утворять дескриптори.
Вважаємо, що використання КС і тезаурусів доцільно лише у спеціальних бібліотеках, з каталогами з досить обмеженої тематики. В універсальних бібліотеках це веде або до невиправданих витрат на непомірно трудомісткі розробки, або за їх відсутність - до дуже великих, спочатку непомітних, але незворотних втрат інформації при пошуку.
Аналогічно з теорією актуального розчленовування тексту в лінгвістиці, можна вважати, що, видаючи на екран меню і маски як повідомлення (реми), ЕК задає теми текстів - відповідей користувача. Тексти-відповіді виходять шляхом введення користувачем реми для запропонованої теми у вигляді тексту при заповненні екранних масок або номерів вибраних рядків меню.
Слід зауважити, що екранні тексти, які розробляються для ЕК, виявляються тим більше працездатними, чим, по-перше, повніше і точніше виражають майбутню тему тексту читача і, по-друге, чим менших знакових засобів вираження реми вимагають для формування повноцінного тексту-відповіді читача. Очевидно, що в людино-машинній системі мовної комунікації однозначно зрозуміла тема (про що говориться на даному кроку діалогу) і максимально обмежені способи вираження реми стають однією із застав успіху роботи ЕК при пошуку. ЕК як би веде діалог за системою "підказка читачеві". Маска, меню, HELP і уточнення способів вираження по довідкових базах даних і являють собою не що інше, як чотири типи підказки. Саме в цьому і полягає значення вдосконалення структури діалогів в інформаційних системах.

 
 

Цікаве

Загрузка...