WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаМовознавство, Філологія → Автоматизована система морфемно-словотвірного аналізу як інструмент лінгвістичних досліджень - Реферат

Автоматизована система морфемно-словотвірного аналізу як інструмент лінгвістичних досліджень - Реферат

моделями;
" створювати кореневі та афіксальні словники;
" проводити морфемний аналіз вихідних словоформ.
У першу чергу морфемний аналізатор буде використано у процесі укладання електронного словотвірного словника української мови для виконання двох завдань: 1) автоматизованого групування лексики у спільнокореневі вибірки; 2) автоматизованої класифікації лексики у межах кожного спільнокореневого класу за кількісно-морфними моделями.
Групування лексики у спільнокореневі вибірки здійснюється за процедурою ідентифікації кореневих морфів, визначених у словах морфемної бази. У межах кожної спільнокореневої вибірки проводиться класифікація слів за кількісно-афіксальними моделями морфних структур слів. Кожна вибірка спільнокореневої лексики формує у межах АСМСА окреме поле, в якому моделі морфних структур слів із збереженою, але не актуалізованою інформацією про граматичний код, програмну процедуру, морфонологічні варіанти кореня, омонімічний код кореня та коментар, автоматизовано класифікуються за кількісно-морфними моделями. Враховуючи принципи словотвірної похідності про те, що: 1) морфологічні способи словотвору передбачають кількісно-афіксальне зростання морфної структури мотивованої основи словотвірної пари; 2) інтерфікси не вважаються словотвірними формантами і додаються у процесі словотвору до словотвірних суфіксів та префіксів; 3) складні слова переважно належать до першого такту словотвору - було розроблено формалізовані принципи опису словотвірних з'?язків між мотивуючим та мотивованим cловами, що дозволяєавтоматично побудувати робочу гіпотезу-модель словотвірного гнізда, в якому кожен наступний словотвірний такт репрезентує слова з кількісно складнішими афіксальними структурами основ, ніж попередній словотвірний такт. Тобто, група слів кожної кількісно-афіксальної моделі основи слова є гіпотетичним тактом словотвірного гнізда.
Інструментарій цієї класифікації теж представлено на електронній картці файлу morfem.exe:
13. поле. ?ree. (Рис.1). Ця кнопка дозволяє зробити перехід від морфемної бази даних до словотвірної чи навпаки. У 8-му полі - Аналізований корінь - набирається слово, що гіпотетично вважається 1-им мотивуючим словом словотвірного гнізда, а потім натискається кнопка Find.
14. поле. Find. (Рис.1). Натисканням цієї кнопки здійснюється автоматизоване групування спільнокореневої лексики та класифікація за словотвірними тактами гіпотетичного словотвірного гнізда, яке у вигляді дерева залежностей висвітлюється на екрані картки:
Рис.4
Приклад демонструє частину словотвірного гнізда слів із коренем -голод-. Кожна гілка словотвірного дерева відображає зв'язки словотвірної мотивації між вузловим словом, позначеним квадратиком з + чи - , із словами, що закінчують гілки цього ж вузла. Знак "+" вказує, що слово вузлове, тобто від нього відходить гілка, а знак "-" вказує, що ця гілка вже розгорнута. Моделювання структурно-мотиваційних зв'язків між словами межуючих словотвірних тактів здійснюється через встановлення відповідності між цифровими кодами слів морфемної бази даних: голодувати * голодування (28871 - 28872), голодувати * поголодувати (28871 -113329).
Класифікація слів спільнокореневої вибірки за словотвірними тактами є лише лінгвістичною гіпотезою, яка вимагає перевірки. Ставляться завдання: 1) перевірити правильність групування слів у спільнокореневі вибірки та розташування їх за словотвірними тактами; 2) в кожному похідному слові визначити словотвірну основу та словотвірний формант; 3) дописати інформацію про морфонологічні процеси, що відбуваються у кожному такті словотвору.
На цьому етапі робота проводитиметься лінгвістом, який використовує свої знання як носій української мови та як фахівець-мовознавець і будує словотвірне гніздо. Лінгвіст, копіюючи слово, у межах спільнокореневої вибірки зможе, у разі потреби, переносити його у той чи інший словотвірний такт за принципом словотвірної похідності.
Формалізований опис морфних структур, запропонований при укладанні електронного морфемного словника, дозволяє використовувати МБД як інструмент у проведенні автоматизованого морфемного аналізу на базі вихідних слофоформ тексту через поєднання МБД з іншими електронними лексикографічними системами. Зокрема морфемний аналізатор було використано для аналізу лексики Частотного словника сучасної української поетичної мови (ЧССПМ) - www.proling.com. Для цього було зроблено ідентифікаційний перехід між базами даних двох електронних словників: словоформа, взята з поетичних текстів, автоматично перетворюється у вихідну форму морфологічної парадигми слова і через відповідність граматичних кодів, які ідентичні в обох БД, та субстанціальне вираження вихідна форма Частотного словника зіставляється з робочою одиницею lex- файлу МБД. Таким чином у кожній вихідній формі слова ЧССПМ можна визначити морфну структуру.
Інтерфейс ЧССПМ був доповнений командами, які забезпечують здійснення різноманітних класифікаційних завдань у межах вибірки кожного поета ЧССПМ:
- визначати типи морфних структур слів у вигляді моделей морфструктур МБД;
- класифікувати лексику поетичної вибірки поета за визначеними морфструктурами;
- укладати афіксальні та кореневі словники поетичної вибірки поета, актуалізуючи інформацію про слова, в яких ці морфи зустрілися.
Методологія проведення формалізованого лінгвістичного аналізу в АСМСА є узагальненням теоретичних і прикладних ідей сучасного мовознавства, що робить АСМСА надзвичайно ефективним і раціональним інструментом для фахівців-філологів у лінгвістичних дослідженнях та будь-яких користувачів. Ця методика може бути використана як еталонна при укладанні різноманітних електронних словників, картотек, автоматизованій класифікації лінгвістичного матеріалу, побудові навчальних комп'ютерних тренажерів, тестів тощо. АСМСА може розглядатися як джерельна база для укладання різноманітних електронних та паперових словників з морфеміки і словотвору, зокрема словника коренів, словника афіксів та ін., оскільки ця автоматизована система репрезентує великий лексичний матеріал (? 170 тис. слів), що дозволяє говорити про повноту лінгвістичного опису морфемної і словотвірної систем української мови.

 
 

Цікаве

Загрузка...