WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаМовознавство, Філологія → Методика створення автоматизованої системи морфемно-словотвірного аналізу (АСМСА) слів української мови - Реферат

Методика створення автоматизованої системи морфемно-словотвірного аналізу (АСМСА) слів української мови - Реферат


Реферат на тему:
Методика створення автоматизованої системи морфемно-словотвірного аналізу (АСМСА) слів української мови
Розвиток теорії морфеміки та словотвору в україністиці ("Словотвірна морфеміка сучасної української мови"[1], "Типи морфемних структур суфіксальних послідовностей у дієслівних основах української мови"[2], "Сучасна українська літературна мова. Морфеміка. Словотвір. Морфонологія"[3], "Флективна система дієслова в сучасній українській мові"[4] та ін.), а також застосування комп'ютерних технологій у лінгвістичних дослідженнях ставлять нові лексикографічні завдання - укладання електронних морфемних та словотвірних словників різних типів, спрямованих як на користувача-філолога, так і на пересічного користувача.
Сьогодні україністика не представлена деякими типами словників, зокрема немає словотвірного словника, а відомі морфемні словники "Морфемний аналіз: Словник-довідник" І.Т. Яценка та "Морфемний словник" Л.М. Полюги обмежені неповною репрезентацією лексичного фонду української мови і не відображають тих теоретичних напрацювань, які сьогодні назріли в галузі морфеміки та словотвору.Посталі лінгвістичні проблеми можуть бути вирішеними на базі дослідження повного лексичного фонду української мови, що можливо тільки на основі створення параметризованих лексикографічних комп'ютерних баз даних, які не відкидають проблемних випадків морфемного та словотвірного аналізу, як це часто робиться при укладанні різноманітних словників, а намагаються розв'язати їх на великих лексичних масивах та на базі сучасних лінгвістичних теорій. Такі комп'ютерні бази даних повинні бути оснащені надійними пошуково-класифікаційними лінгвістичними інструментами - програмними аналізаторами, які забезпечать ефективний аналіз мовного матеріалу.
У сучасній лексикографічній практиці все частіше використовуються комп'ютерні методики для укладання різноманітних словників традиційного типу а також ставиться завдання створення автоматизованих лексикографічних баз даних. За допомогою ЕОМ були укладені морфемні словники російської мови: частотний словник З.Ф.Оліверіуса "Морфемы русского языка"[5], кореневий словник Д.С.Уорта "Русский словообразовательный словарь"[6]; морфемний словник чеської мови за редакцією Е.Славічкової[7]. В україністиці на базі автоматизованої системи морфемно-словотвірного фонду української мови був укладений Словник афіксальних морфем української мови (Карпіловська Е.А., Карпіловський В.С.,Клименко Н.Ф., Недозим Т.І)[8] та автоматизована система Морфемно-словотвірний фонд української мови.
Досвід комп'ютерної лексикографії має і колектив лінгвістів лабораторії комп'ютерної лінгвістики Київського університету: сьогодні в активі лабораторії маємо Частотний словник сучасної української поетичної мови; Ідеографічний словник української фразеології; Граматичний словник українських дієслів; Українсько-італійський словник українських дієслів; Тезаурус (словник синонімів) української мови; Електронний підручник української мови. Морфологія. Використовуючи такий чималий досвід, лінгвісти лабораторії розпочали роботу над створенням системи морфемно-словотвірного аналізу (скорочено АСМСА) в рамках масштабного проекту створення національної словникової бази Українського мовно-інформаційного фонду НАН України за Указом Перзидента України № 967 від 07.08.99. Ця система спрямована на розв'язання поставлених проблем у галузі морфеміки і словотвору, про які йшлося вище.
Система морфемно-словотвірного аналізу української мови орієнтована на вирішення таких завдань:
1) створення:
- електронної версії морфемного словника української мови;
- електронної версії словотвірного словника української мови;
2) створення:
- автоматизованої системи морфемного аналізу;
- автоматизованої системи словотвірного аналізу.
Поставлені завдання зумовлюють структурацію системи АСМСА на два модулі та чотири блоки:
1) морфемний модуль, де аналізується морфна структура словоформ; 2) словотвірний модуль, де аналізується словотвірна структура словоформ. Кожен модуль складається з двох блоків: 1) блок-словник; 2) блок-аналізатор. Структуру АСМСА можна представити у вигляді такої блок-схеми:
морфемний модуль словотвірний модуль
словник аналізатор словник аналізатор
Модульна будова відображає об'єктивну логіку функціонування мовної системи:
1) в аспекті мовної онтології модульна будова зумовлюється ієрархічними відношеннями між одиницями морфемного та словникового мовного рівнів. Ці ієрархічні відношення регламентуються закономірностями словотвірного мовного механізму, що використовує в процесі утворення слів одиниці нижчого мовного рівня - морфи;
2) в гносеологічному аспекті структура системи АСМСА зумовлюється різними завданнями, методикою та одиницями двох типів лінгвістичного аналізу:
а) морфемний аналіз ставить завдання - визначити морфну структуру словоформ, а словотвірний - визначити спосіб словотвору;
б) структурними одиницями морфемного аналізу є морфи, а словотвірного - словотвірний формант та твірна база;
в) методика морфемного аналізу вимагає дотримання принципу додаткової дистрибуції у визначенні морфної структури слова, методика словотвірного аналізу базується на встановленні відношень словотірної мотивації у визначенні способу творення похідного слова.
Кожен модуль складається із двох блоків, визначення яких було зумовлене різними типами завдань:
1) створювані електронні словники розглядаються як комп'ютерні бази даних із морфеміки та словотвору.
2) морфемний та словотвірний аналізатори розглядаються як надійні лінгвістичні інструменти мовознавчих досліджень, що здатні працювати в режимах пошуку інформації, класифікації мовного матеріалу, проведення морфемного та словотвірного аналізів.
Як показує блок-схема АСМСА, передбачається така логіка виконання завдань: укладання морфемного електронного словника (1), на базі якого створюється морфемний аналізатор (2), що виконує функцію лінгвістичного інструмента-класифікатора у процесі укладання електронного словотвірного словника української мови (3), на базі якого будується система автоматизованого словотвірного аналізу (4).
Така послідовність поставлених завдань зумовлена робочою гіпотезою, що побудова словотвірного гнізда як статті словотвірного електронного словника здійснюється на базі вибірки всіх спільнокореневих слів мови. Створення вибірок спільнокореневих слів є надзвичайно складним завданням, на виконання якого лінгвіст повинен витратити дуже багато часу. Тому на першому етапі укладання словотвірного словника необхідно створити комп'ютерну програму (морфемний аналізатор), яка б автоматизувала процес вибірки і за короткий термін виконала роботу лінгвіста.
Отже, першочерговим завданням у створенні системи АСМСА є укладання електронного морфемного словника української мови. Морфемний словникукладається на основі комп'ютерної бази даних, що нараховує ? 170 тис. слів української мови, представлених у графемному записі. База даних була доповнена омонімами з визначеними лексичними значеннями, оскільки ці слова можуть відрізнятися морфними структурами, а якщо і не відрізняються, то в будь-якому випадку це - 2 різних слова, і вони повинні обидва бути введеними до морфемної бази даних та до словотвірних гнізд як дві лексичні одиниці мови.
Інформаційний макет словника та його базова ідеологія визначалися специфікою електронного характеру словника та перспективою створення на його базі автоматизованої системи морфемного аналізу. Тому у словнику було обрано формалізовані принципи опису морфних структур слів, за основу

 
 

Цікаве

Загрузка...