WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Мова та метамова - Реферат

Мова та метамова - Реферат


Реферат на тему:
Мова та метамова
1. Мова: вирази та їх семантика
У попередніх розділах було описано означення, вирази й оператори мови Паскаль. Очевидно, всі вони мають визначену структуру, або синтаксис. Не можна, наприклад, ім'я типу в означенні записати перед іменами змінних, або написати вираз із двома відкриваючими й однією закриваючою дужками. Якщо в нашій програмі будуть подібні дурниці, то її трансляція завершиться невдало, і замість машинної програми ми одержимо образливі повідомлення про помилки.
Очевидно, що правила запису Паскаль-програм існують, і якимсь чином вони втілені в трансляторі його авторами. Але щоб "навчити комп'ютер" хоча б відрізняти правильні програми від неправильних, необхідно чітке формулювання правил їхнього запису. Ось чому ми почнемо знайомитися з формальними системами описання структури конструкцій мов програмування.
Мова Паскаль, як і всяка мова, - це система позначень, призначена для передачі якогось змісту. Кожна мова починається з алфавіту і містить у собі правила утворення найпростіших виразів мови (лексем) і правила побудови складніших виразів із більш простих. Ці дві групи правил називаються відповідно лексичною та синтаксичною системами мови.
Виразам мови, починаючи від найпростіших, ставиться у відповідність позначений ними зміст, що й є їхньою семантикою. Наприклад, у мовах програмування семантика числової сталої - це число, подане в комп'ютері, семантика імені змінної - це ділянка пам'яті, стани якої можна змінювати, семантика оператора - дії комп'ютера з виконання цього оператора.
Правила, за якими виразам мови зіставляється зміст, утворюють семантичну систему мови. Розуміти мову - значить уміти зіставити виразу його зміст. Можна сказати, що комп'ютер "розуміє" мову Паскаль за допомогою "перекладача" - програми-транслятора (утім, translator і є англійське "перекладач").
Все сказане стосується не лише мов програмування. І природні мови, і мови запису нот, креслень або географічних карт теж мають алфавіт та правила побудови й "осмислення" виразів. Усім добре знайомі описи структури "правильних" виразів цих мов, починаючи від букварів і шкільних підручників з граматики.
Існують такі описання структури і для мов програмування, причому структура в них задається свого роду формулами, тобто з "математичною точністю". Вивчення однієї з таких систем опису структури ми й почнемо.
2. Метамова БНФ
У кожній мові є своя система понять. Наприклад, будь-який конкретний оператор є представником загального поняття "оператор", будь-яке ім'я - представником поняття "ім'я" тощо. Представники понять, тобто конкретні оператори або імена - це вирази деякої структури (синтаксису). Наприклад, усі імена - це послідовності букв і цифр, що починаються з букви, цілі сталі - послідовності цифр, а кожний оператор присвоювання складається з імені, знака ":=" і виразу. Остання фраза по суті містить три правила: вони описують синтаксис представників понять "ім'я", "стала", "оператор присвоювання" і називаються синтаксичними.
Дамо синтаксичним правилам чіткішу форму. Позначимо поняття словами в . Це позначення розглядається як неподільне і називається нетермінальним символом, або нетерміналом, наприклад, або . Символи й лексеми мови будемо брати в 'апострофи' або виділяти жирним шрифтом, наприклад, program або ':='. Вони також розглядаються як неподільні і називаються термінальними символами, або терміналами.
Відзначимо, що "термінальний" означає "остаточний", тобто термінали - це і є "остаточні" символи мови. "Нетермінальний", тобто "неостаточний", символ не є символом мови. Він є позначенням представників якогось поняття, а їх структура повинна бути описана синтаксичними правилами. Наприклад, вигляд терміналів '+', ':=' або program зафіксовано в мові Паскаль, а структуру представників понять або треба описати.
Послідовність, складена з терміналів і нетерміналів, називається метавиразом, наприклад, ':=' . Елементи метавиразу, тобто нермінальні й нетермінальні символи, для наочності іноді будемо відокремлювати пропусками. Порожню послідовність позначимо кутовими дужками .
Перепишемо фразу "оператор присвоювання складається з імені, знака ":=" і виразу" із новими позначеннями так:
має структуру ':=' .
Замість слів "має структуру" поставимо знак "::=" і одержимо щось схоже на формулу:
::= ':=' .
Взагалі, усяку фразу вигляду
має структуру
можна переписати в такому вигляді:
::= .
Синтаксичні правила, записані у вигляді ::= , називаються формами Бекуса-Наура, за прізвищами тих, хто їх придумав. Форми Бекуса-Наура скорочено називаються БНФ. Поняття, записане в БНФ ліворуч від "::=", називається її лівою частиною, а метавираз праворуч - правою. Знак "::=" не є символом мови й називається метасимволом.
Сама по собі БНФ
::= ':='
задає лише загальну структуру кожного з представників поняття "оператор присвоювання", але не їх конкретний вигляд. Для цього треба описати структуру представників понять і . Пригадаємо: "ім'я - це послідовність букв і цифр, що починається з букви". У цій фразі виникають одразу два нові поняття - і . Перепишемо її у вигляді БНФ
::=.
На цьому поки що зупинимося. Очевидно, для описання синтаксису останніх двох понять потрібні будуть свої БНФ, можливо, з новими поняттями. У всякому разі, зараз ми припустимо, що
синтаксис виразів мови задається деякою сукупністю БНФ, або синтаксичних правил.
А тепер почнемо уточнювати, яким саме чином сукупність БНФ задає синтаксис виразів мови.
Приклад 1. Розглянемо мову, виразами в якій є речення, що складаються з підмета й присудка. Підмет, крім того, може мати означення (а може і не мати). Цим означенням може бути одне зі слів - злющий або великий, підметом - комар або слон, присудком - дзижчить або тупотить. Побудуємо сукупність БНФ, що задають синтаксис речень.
Спочатку введемо додаткові позначення. Якщо структура представників якогось поняття задається кількома БНФ, то об'єднаємо їх, записавши альтернативні праві частини в однім правилі й відокремивши символом "|". Цей символ позначає слово "або"; він також є метасимволом.
З цими позначеннями очевидні такі БНФ:
::= великий | злющий
::= комар | слон
::= дзижчить | тупотить
Підмет у реченні може бути як із означенням, так і без нього. Введемо поняття і БНФ
::= |
Тоді структура речення задається такою БНФ:
::= Р
Серед понять мови виділяється головне; воно позначається спеціальним початковим нетерміналом. Очевидно, що в нашій мові, наприклад, головним поняттям є речення, а в мові Паскаль - програма.
Означимо тепер такі поняття, як послідовність терміналів, вивідна з початкового нетермінала, і формальна мова, задана сукупністю БНФ.
Якщо замінити початковий нетермінал (позначимо його S) на праву частину правила, у якому S ліворуч, то одержимо послідовність символів (терміналів і нетерміналів), щоназивається вивідною з S. У прикладі 10.1 такою є
Якщо у вивідної з S послідовності замінити якийсь нетермінал на відповідну йому праву частину, то одержимо послідовність, що теж називається вивідною з S, тощо. Наприклад,
,
тупотить,
злющий тупотить,
злющий комар тупотить
(тут кожна послідовність символів утворювалася з попередньої заміною одного з нетерміналів на праву частину правила).
Вивідні з S послідовності, що складаються лише з терміналів, називаються вивідними виразами. Саме вони є представниками головного поняття мови. Наприклад, послідовність злющий комар тупотить є вивідним виразом і представником головного поняття - речення.
Нарешті, формальна мова, задана сукупністю БНФ - це множина вивідних виразів.
У прикладі 1 формальна мова утворена всіма можливими реченнями. Зауважимо, що всього їх 12: 8 із означеннями і 4 без них.
Крім поняття виводимості з початкового нетермінала, використовується також поняття виводимості з довільної послідовності терміналів і
Loading...

 
 

Цікаве