WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Дослідники автоматичного перекладу... - Реферат

Дослідники автоматичного перекладу... - Реферат

Коледж комп'ютерних наукРеферат
на тему:
"Дослідники автоматичного перекладу В.Інгве, Д.М.Йейтс, М.Мастерман, Є. фон Глазерсфельд: їх праці та внесок в розвиток автоматичного перекладу"
Виконала
студентка ДКТ-5
Фіялка Світлана
Коломия - 2001
Зміст:
Обчислювальні машини і переклад. В.Інгве 3
Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс. 7
"Мультістор" - система кореляційного аналізу для англійської мови. Е. фон Глаузерсфельд 12
Полуавтоматичний переклад з англійської на французьку мови: система "Людина - машинний тезаурус". М.Мастерман 17
Обчислювальні машини і переклад. В.Інгве
Німецікий дослідник автоматичного перекладу Віктор Інгве вважав, що для подолання труднощів при перекладі треба ретельно вивчати морфологію та синтаксис відповідних мов, а також розробляти повний перелік елементарних одиниць кожної мови.
Опис мови повинен бути статичним, а програма для обчислювальної машини - динамічною. Тому В.Інгве пропонував, щоб дані про мовні факти вводилися в машину у вигляді переліків або таблиць - окремо від програми, що орієнтована на обробку цих даних. Такий розподіл є вдалим тому, що вже існують створені лінгвістами описи різних мов.
В своїй роботі по генерації англійських речень, він використовував традиційні методи опису мови. Зокрема для описів синтаксису була застосована модель безпосередньо складових (речення послідовно ділиться на все менші частини: спочатку виділяється група підмета та присудка, кожна з яких, в свою чергу, складається з двох або більше частин; ділення продовжується поки не дійдемо до слів або морфем).
В даній роботі опис мови подається в чотирьох таблицях і орієнтований на породження англійських фраз за допомогою універсальної обчислювальної машини. Машина породжує фразу, рухаючись від вузла до вузла. На кожному кроці є робочий вузол, який визначає наступний крок. Якщо робочий вузол зображений у вигляді кола, то це означає наявність декількох рівноправних альтернатив, і машина робить вибір за допомогою таблиці випадкових чисел. Якщо робочий вузол зображений у вигляді ромба, то наступний крок визначається однозначно. Якщо робочий вузол поданий у вигляді квадрату, то за наступний робочий вузол вибирається вузол, що розташований зліва під ним, а той, що справа - запам'ятовується. Якщо робочий вузол - трикутник, то принцип дії той же, що і з квадратом, але вузол, що запам'ятовується, використовується в більш пізніх перетвореннях. Кожне слово в прямокутнику - це слово фрази; після розміщення цього слова у тексті вибирається новий робочий вузол.
Багато фраз, які породжуються цією програмою безглузді, оскільки дана програма породжує тільки граматично, а не семантично правильні фрази. Проте вона є зручним засобом для перевірки точності лінгвістичного опису мови. Якщо деякі породжені фрази - граматично невірні, таблиці можна змінювати та виправляти. Якби ця програма була пристосована для перекладу, то вибір слів залежав би від перекладного тексту.
За допомогою цієї програми можна отримувати фрази будь-якої довжини. Це можливо тому, що вибір вузла може здійснюватися рекурсивно.
Починаючи породжувати яку-небудь двучленну конструкцію, програма повинна запам'ятовувати один вузол, для того щоб після породження першого члена конструкції, породити також і друкий. При цьому можуть бути отримані фрази великої довжини, і виникають значні вимоги до оперативної пам'яті комп'ютера.
Існують дві структури породження запам'ятованих вузлів. При регресивній структурі машина іде вниз по дереву, розгортаючи вузли, наприклад 1, 2, 3, 4 і запам'ятовуючи певну кількість вузлів; потім вона повинна повернутися, щоб розгорнути запам'ятовані вузли. Глибина регресивної структури дорівнює кількості запам'ятованих вузлів. При прогресивній структурі машина іде вниз по дереву, не повертаючись назад і записуючи на кожному кроці в оперативну пам'ять лише один вузол. Машина обробляє вузол на основній гілці дерева, потім приймається за запам'ятований вузол, а потім знову повертається до основної гілки. Отже, зростання глибини регресивної структури призводить до необхідності використання більшого об'єму пам'яті, тоді як прогресивна структура може мати довільний розмір і не вимагати при цьому збільшення об'єму пам'яті.
Існує два рішення щодо подолання проблеми нестачі оперативної пам'яті. Перше - оснастити програму відповідним сигналізатором, який буде повідомляти про заповнення оперативної пам'яті. В цей час повинен бути обмежений вибір наступного вузла таким чином, щоб вузли, які треба запам'ятовувати, не з'являлися до тих пір, поки не звільниться пам'ять. Інша можливість - зробити граматику таким чином, щоб вона могла породжувати прогресивні структури довільного розміру, а регресивні структури - певної довжини. Проте такі обмеження незручні, оскільки можуть дуже ускладнити граматику.
Для визначення правильного рішення були ще раз ретельно розглянуті конструкції англійської мови, і був зроблений висновок, що багато властивостей мови спрямовані на те, щоб обмежити глибину фраз приблизно до 7. З цього В.Інгве висунув гіпотезу, що всі мови мають морфологічні та синтаксичні механізми, що служать для обмеження глибини синтаксичних конструкцій. Крім того, психологами встановлено, що об'єм оперативної пам'яті людини також дорівнює 7 одиниць. Людина не може запам'ятати відразу, а потім відтворити більше 7 випадкових цифр або слів.
Одним з способів обмеження глибини конструкцій в англійській мові є бінарний поділ речення. Наприклад, речення поділяється на групу підмета і групу присудка, а вже група присудка на дієслово та, наприклад, додаток. Якщо поділити речення відразу на три частини, то потрібно запам'ятовувати не один, а два вузли. Взагалі лінгвісти відмічають, що мова надає перевагу бінарним конструкціям.
Іншим способом обмеження глибини конструкцій, що більш властивий аглютинативним мовам, є аффіксація, за допомогою якої можна поєднати різні елементи в одне довге слово.
Разом з засобами обмеження глибини конструкцій англійська мова має механізми, що дозволяють зберігати виразність, не дивлячись на жорстке обмеження
Loading...

 
 

Цікаве