WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Лінгвістичні інформаційні системи - Реферат

Лінгвістичні інформаційні системи - Реферат


Реферат
на тему:
Лінгвістичні інформаційні системи
Не зупиняючись на відмінностях в інтерпретації поняття "лінгвістичне забезпечення" в сучасній проектній документації та класичній інформатиці, розглянемо його розробку для інформаційних, зокрема бібліотечних систем, як одну з прикладних задач комунікативної лінгвістики. При цьому процес роботи користувача із системою в режимі діалогу будемо інтерпретувати як вигляд мовного спілкування між двома комунікантами.
При дослідженні діалогу між двома комунікантами виділяються такі його аспекти, як комунікативна установка (інтенція, намір) розмовляючого, пресупозиціональна вимога спілкування, тобто "загальний фон знань" (база знань) користувача і системи, актуальне розчленовування тексту (тобто співвідношення нового і старого, відомого в структурі його смислового змісту), а також способи знакового вираження значення, що передається, які в сукупності з "фоном знань" забезпечують адекватну передачу інформації, тобто узгодження передаючої та приймаючої частин системи комунікації. Справа в тому, що передаючому (розмовляючому) доводиться моделювати в своїй свідомості того, що приймає (адресата, що розуміє), настроюватися на свого співрозмовника, точніше - на його систему знань, способи вираження значення, комунікативну установку.
При розробці інформаційних систем створюються спеціальні засоби лінгвістичного забезпечення (ЛЗ) банків даних, які за можливістю оптимальним чином формують умови для необхідного "розуміння" в комунікативній системі "людина - машина" та успішного вирішення інформаційно-пошукових задач. Засоби формування цих умов - формати представлення елементів машиночитаємих записів, інформаційно-пошукові мови (ІПМ) для тематичного або фактографічного пошуку і структура діалогу.
Якщо не звертати увагу на який-небудь аспект мовної комунікації користувача і системи, можуть виникати ситуації, коли відмінності в моделюванні ситуації спілкування, нерідко виникаючи і в розмові двох співрозмовників-людей, призведуть до істотних втрат інформації, до шуму при пошуку або іншого несприятливого результату.
Причина звертання в бібліотеку і, зокрема, до електронного каталогу (ЕК) - загальна комунікативна установка читача отримати документи (видання, рукописи), що володіють відомими йому характеристиками: належать певному автору, мають конкретні заголовки, опубліковані даним видавництвом, відповідають певній темі, трактують даний предмет і т.д., або відомості про наявність (місцезнаходження) таких документів.
"Установка" АІБС ЕК як комуніканта може бути лише одна - надати користувачеві максимально сприятливі умови для пошуку і забезпечити пошук необхідної інформації за довільним поєднанням пошукових ознак. Можливі "наміри" читачів розглядаються в ЕК як пошукові задачі. Розробник ЛЗ має в структурі ЛЗ передбачити засоби ідентифікації відповідних пошукових ознак і методи їх виявлення у записах бази даних. Природно, це виливається у розробку передмашинних форматів представлення елементів запису (наприклад, бібліографічних або авторитетних/нормативних) і засобів відображення смислового змісту документів.
Приступаючи до діалогу з ЕК, читач передбачає (можливо, несвідомо, аналогічно із зверненням до людини), як передумову, наявність в електронному каталозі деяких необхідних "знань" енциклопедичного характеру, зокрема, про ієрархічні або асоціативні зв'язки між поняттями. Крім того, читач може вимагати від ЕК "розуміння" (ідентифікації), що таке "автор", "рік видання" або "тема", інакше можуть виникнути непорозуміння, не кажучи вже про значне збільшення часу пошуку за кожною характеристикою шляхом суцільного перегляду машиною бібліографічних записів (БЗ) у базі даних ЕК.
Розумно вважати, що, насамперед, ЕК має пристосуватися до читача, відповідно до своєї "установки", і меншою мірою - читач до каталогу. У зв'язку з цим розробник забезпечує пресупозиціональні умови (попередню домовленість, попередні умови) комунікації, у цьому випадку - загальний фон знань комунікантів.
Знання бібліографічного характеру, як це прийнято в більшості систем, задаються машині у вигляді згаданого передмашинного формату. Так звані "енциклопедичні" знання про структуру предметних сфер фіксуються в спеціальній базі даних ЕК, умовно званій "базою знань", що має вигляд словника-тезауруса або класифікації.
Як правило, в бібліотеках використовуються також такі допоміжні картотеки, або довідники, як "Картотека різночитань іноземних прізвищ", "Найменування організацій" (перейменування організацій, варіанти найменувань, абревіатури) і т.п. Їх введення до електронного каталогу у формі нормативних записів означає формування цілої низки довідкових баз даних як додаткової пресупозиціональної умови успішного спілкування читача з ЕК. Дійсно, фіксація допустимих способів вираження одного і того самого поняття дає читачеві та ЕК шляхом звертання того або іншого з них до довідкових баз даних забезпечити однозначність вираження і сприйняття значення в діалозі. Таку ж саму роль узгодження лексики спілкування із системою виконують переліки допустимих значень окремих елементів БЗ. Слушні приклади - переліки кодів назв країн, видів носіїв, кодів мов і т.д. Тут необхідність взаємодії бібліотек є безперечною.
Щодо підготовки форматів, співпраця бібліотек в Україні і між бібліотеками різних країн є досить розвиненою. Прикладами можуть служити міжнародні конференції та семінари з форматів UNIMARC і USMARC, робочі групи з підготовки комунікативних форматів для бібліографічних і нормативних (авторитетних) записів на основі UNIMARC-форматів для відповідних записів.
Зараз, відповідно до спеціальної угоди, РДБ України (Республіканська державна бібліотека) бере участь у спільних дослідженнях з фахівцями Бібліотеки Конгресу США, Національної бібліотеки Канади і Британської бібліотеки, спрямованих на зближення форматів з метою створення єдиного формату представлення елементів

 
 

Цікаве

Загрузка...