WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаМовознавство, Філологія → Автоматизована система морфемно-словотвірного аналізу як інструмент лінгвістичних досліджень - Реферат

Автоматизована система морфемно-словотвірного аналізу як інструмент лінгвістичних досліджень - Реферат

програмну процедуру: заледеніти / P2R5І7S8F10 - де латинськими літерами позначається тип морфа P - префікс, R - корінь, S - суфікс, F - флексія, І - інтерфікс, X - постфікс, а цифрами - межі морфа через порядковий номер (із початку слова) кінцевої графеми кожного морфа R4I5R8S9F10 - льод-о-різ-*-* (позначка нульового афікса також визначається як графема). Формалізований опис морфної структури слова у вигляді програмної процедури відображає функціональну закономірність організації слова на морфемному рівні - PRІSF, а субстанціальне вираження цієї структури представлено через кількісно-графемну модель (за - 2; лед - 5; ен - 7; і - 8; ти - 10). Графемно-цифрові межі морфів в інтерфейсі словника подані через латинську літеру за порядковим номером в алфавіті:R4I5R8S9F10 = RD(4)IE(5)RH(8)SJ(9)FK(10). Автоматично сформована програмна процедура моделі морфної структури, пов?язана з формою вираження кожного слова МБД, дає повну лінгвістичну інформацію про морф, його структурні відношення з іншими морфами і визначається як робоча одиниця морфемної бази даних (представленої lex-файлом).
Згідно із розробленими принципами формалізації морфемний аналіз проводився за допомогою зручного комп'ютерного інструмента, роботу якого забезпечує файл morfem.exe. Кожне слово lex-файлу представляється на окремій комп'ютерній картці
Рис.1.
Кожне поле електронної картки виконує свою функцію:
1 поле. дуло. Екран картки, на якому висвітлюється слово (Рис.1). Визначення морфної структури слова здійснюється в такий спосіб: на екрані є рухомий курсор, який пересувається мишею вліво або вправо по графемному запису слова; навівши курсор на місце морфного шва, потрібно мишею актуалізувати віконце, в якому висвітлюються позиційно-функціональні типи морфів; вибравши мишею потрібний тип морфа, можна автоматично приписати йому позначку у верхньому індексі слова (Рис.2).
Рис.2
2. поле. № слова у морфемній базі даних (МБД), що дозволяє здійснювати навігацію по lex-файлу (Рис.1).
3. поле.<<>> - правобічна навігація. Дозволяє перейти до наступного слова у МБД (Рис.1).
5. поле. Reset. Дозволяє виправити інформацію про морфну структуру слова (Рис.1).
6. поле. Save. Дозволяє запам'ятати інформацію про визначену морфну структуру слова у вигляді програмної процедури. Запис інформації здійснюється на res.ini - файли у такому вигляді:
Рис.3
У процесі укладання електронного морфемного словника було враховано, що коренева система української мови характеризується високим ступенем омонімії та аломорфії, тому до однієї спільнокореневої вибірки можуть потрапити слова з омонімічними коренями, а слова з аломорфами одного кореня можуть бути згруповані в різні спільнокореневі класи.
В електронному морфемному словнику проблему аломорфії коренів було вирішено у такий спосіб: кожному кореневому морфу, що характеризується різними морфонологічними змінами , було приписано аломорф цього кореня у непохідному слові, тобто його первинний аломорф, який умовно у межах МБД можна назвати інваріантним коренем: за-лед-еніти - лід, льод-овий - лід. Інформація про інваріантний кореневий аломорф приписується кожному аломорфу однієї кореневої морфеми, що дозволяє автоматизувати ідентифікацію тотожних за значенням кореневих морфів, які субстанціально відрізняються хоча б однією графемою.
Омонімія кореневих морфів була знята приписуванням кожному омонімічному кореневому морфу цифрового коду, який дозволяє визначати корені-омоніми як різні одиниці морфемної бази даних: у іменнику вод-а визначається корінь вод1, а у дієслові вод-и-ти - корінь вод2.
Інформація про аломорфію та омонімію аналізованого морфа записується у 7-му полі картки файлу morfem.exe: Корінь - дул1 (Рис.1), а потім автоматично приписується до аналізованого слова з визначеною морфною структурою (програмною процедурою) у res.ini - файлі (Рис.3).
Паралельно з автоматизованим формуванням lex-файлу в Access створюється ще дві бази даних: база аломорфічних коренів та база омонімічних коренів. Зв'язок із цими БД здійснюється також через електронну картку файлу morfem.exe:
8 поле. Аналізований корінь. Це поле знаходиться у правому верхньому кутку картки (Рис.1). Для висвітлення на картці інформації про аломорфію та омонімію кореня це поле можна використовувати у двох режимах морфемного аналізатора: 1) у цьому віконці автоматично висвітлюється корінь, межі якого визначені у 1-му полі; 2) у разі потреби тут необхідно надрукувати корінь, інформацію про аломорфію або омонімію якого хоче отримати користувач-лінгвіст.
9 поле. Go (Рис.1). Натисканням миші на цю кнопку, актуалізується зв'язок кореня 8-го поля електронної картки з БД омонімічних та аломорфічних коренів. Інформація про корені-омоніми та кореневі аломорфи висвітлюється у 10-му та 11-му полях:
10 поле. Аломорфічні корені - дул1-о|дуль, дул2-я|дуль. Подається інформація про аломорфію аналізованого кореневого морфа (Рис.1).
11 поле. Омонімічні корені - дул1|дуло, дул2|дуля, дул3|дуліб, дул4|дулівка. Подається інформація про омонімічні кореневі морфи (Рис.1).
12 поле - Коментар, у якому подається необхідна для проведення морфемного аналізу інформація про лексичне значення омонімів, етимологічне тлумачення запозиченої лексики, пояснення складних випадків морфемного аналізу, тощо (Рис.1).
На сьогодні завершено роботу над створенням морфемного модуля АСМСА у робочому варіанті, який складається з трьох баз даних: 1) бази морфних структур слів ? 170 тис. слів; 2) бази аломорфічних коренів (? 2500 коренів); 3) бази омонімічних коренів (? 3100 коренів). Укладання морфемного словника та використання морфемного модуля в режимі лінгвістичного аналізу забезпечується автоматизованим інструментом, функції якого представлені на електронній картці файлу morfem.exe. Морфемний електронний словник потребує верифікації.
Формалізація морфних структур слів через їх опис у термінах програмних процедур МБД дозволила створити на основі цієї бази даних автоматизовану систему лінгвістичного аналізу, здатну виконувати цілий ряд завдань:
" групувати лексику у спільнокореневі та спільноафіксальні класи;
" класифікувати лексику за кількісно-морфними
Loading...

 
 

Цікаве