WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Архітектура нейронної мережі - Реферат

Архітектура нейронної мережі - Реферат

зв'язками інформація з подальших шарів передається на попередні. Мережі прямого розповсюдження є статичними в тому розумінні, що на заданий вхід вони виробляють одну сукупність вихідних значень, яка не залежить від попереднього стану мережі. Мережі зі зворотними зв'язками є динамічними, оскільки в них модифікуються входи нейронів, що призводить до зміни стану мережі. Для правильної роботи зворотні зв'язки повинні містити елементи затримки TDL (time delay link - ланка затримки часу). Використання TDL рівносильне диференціюванню в аналогових системах, тому вони застосовуються не тільки у колах зворотних зв'язків. Наприклад, для реалізації цифрових фільтрів (типово динамічні системи) використовують мережі ADALINE [9] (ADAptive LInear NEtwork - адаптовані нейронні мережі) в яких TDL знаходяться в колах прямого проходження сигналів. Мережі , які містять TDL і/або зворотні зв'язки, називаються рекурентними.
В даній курсовій роботі використовується нейронна мережа прямого розповсюдження, існують кілька різних парадигм даної нейронної мережі, які отримали широке розповсюдження. Далі коротко охарактеризуємо одну із парадигм нейронної мережі прямого розповсюдження, а саме лінійну мережу за допомогою якої можна успішно розв'язати поставлене завдання курсової роботи.
2.2.1 Лінійні мережі
Лінійні нейронні мережі [3, 4, c.89] по своїй структурі аналогічні персептрону і відрізняються лише функцією активації, яка є лінійною (PURELIN). Вихід лінійної мережі може приймати будь-яке значення, тоді як вихід персептрона обмежений значеннями 0 або 1. Лінійні мережі, здатні вирішувати тільки лінійно відділені завдання класифікації, проте в них використовується інше правило навчання, засноване на методі найменших квадратів, яке є набагато ефективнішим, ніж правило навчання персептрона "дельта". Настройка параметрів виконується так, щоб забезпечити мінімум помилки. Поверхня помилки як функція входів має єдиний мінімум, і визначення цього мінімуму не викликає труднощів. На відміну від персептрона настройка лінійної мережі може бути виконана за допомогою як процедури адаптації, так і процедури навчання. В останньому випадку використовується правило WH (Widrow - Hoff) навчання Б. Уїдроу і М. Хоффа
Рисунок 2.2 - Модель лінійного нейрона з двома входами
Крім того, лінійні нейронні мережі можуть використовуватись в адаптивному режимі. Вони дозволяють коректувати ваги і зсуви нейронів під час вступу на вхід кожного нового елементу навчальної множини і тому широко застосовуються при рішенні задач фільтрації сигналів і в системах управління. Такі адаптивні мережі отримали назву ADALINE (ADAptiv LInear neuron NEtworks). Основоположною роботою в цій області є книга Б. Уїдроу і С. Стернcа в якій вони і ввели скорочення ADALINE.
3 ПРОЕКТУВАННЯ НЕЙРОННОЇ МЕРЕЖІ
3.1 Формування вхідних і цільових даних для навчання мережі
Для навчання мережі необхідно сформувати масиви вхідних даних p, цільових даних t, а також масив даних, призначений для тестування мережі з метою перевірки якості навчання.
Для визначення вхідного детермінованого процесу, необхідно знайти реакцію коливної ланки на одиничний стрибок. Коливна ланка другого порядку має таку перехідну характеристику:
(3.1)
де - перехідна характеристика ланки; - коефіцієнт підсилення; - коефіцієнт, який відображає ступінь затухання; - постійна часу; - показник Лапласа.
Для моделювання перехідної характеристики в MATLAB потрібно записати такий оператор, як [5]. Так як перехідна характеристика ланки - це реакція ланки на одиничний стрибок, то для реалізації цього використаємо такий оператор, як , де - це функція ланки, а - час, протягом якого моделюється перехідна характеристика ланки. Задаємо час , так щоб він охопив час перехідного процесу (згідно завдання ), - вектор значень перехідної характеристики на проміжку часу .
Оскільки задача мережі - це прогнозування стану системи, то вхідним вектором буде значення перехідної характеристики на проміжку , а для цільових значень, тобто значень перехідної характеристики в наступний момент часу, будуть значення на проміжку . Кількість елементів вхідного та вихідного векторів зменшиться до .
Для тестування мережі можна використати ті самі масиви даних, що й для навчання, при умові, що перед процедурою тестування ці масиви будуть оновлені. Тобто потрібно ще раз запустити m-файл, який відповідає за формування вхідних та цільових даних.
Детальніше всі основні команди, що використовуються для формування вхідних даних приведені у відповідному m-файлі (див. додаток А).
3.2 Створення нейронної мережі
Створення мережі полягає у розробці і створенні комп'ютерної моделі, яка в подальшому може навчатися і потім використовуватись для моделювання. За допомогою GUI NNTool можуть бути створені тільки окремі типи одно- та двохшарових мереж (персептрон, радіальна базисна мережа, мережа з прямим розповсюдженням сигналу, мережі Кохонена, Елмана і Хопфільда тощо). Тоді як у робочому вікні MATLAB за допомогою функції NETWORK можна створити будь-яку мережу користувача.
В даній курсовій роботі для передбачення значення часової функції за її попередніми значеннями використовується адаптуюча лінійна нейронна мережа ADALINE (ADAptive Linear Neuron networks) [4,9]. Лінійні мережі - це мережі в яких функція активації є лінійною. Правило навчання лінійних мереж засновано на методі найменших квадратів. Налаштування параметрів даної мережі виконується таким чином, щоб забезпечити мінімум похибки. Вихід лінійної мережі може приймати будь-яке значення, водночас вихід персептрона обмежується значеннями 0 та 1. Адаптуюча лінійна нейронна мережа ADALINE дозволяє корегувати ваги та зміщення при подачі на вхід кожного нового елемента вхідного масиву даних для навчання.
На рисунку 3.1 представлена узагальнена схема нейронної мережі:
Рисунок 3.1 - Узагальнена схема нейронної мережі
Деякий сигнал поступає на лінію затримки так, що на її виході формуються 2 сигнали:p(t-1), p(t-2), так як для формування входу застосовується динамічна ланка другого порядку, то в мережі буде використано лінію затримки з двома блоками.
Лінійна мережа створюється за допомогою функції [4]. Перший вхідний аргумент задає діапазон зміни елементів вектора входу, другий аргумент вказує на те, що мережа має єдиний вихід, третій - лінія затримки на вході, оскільки прогнозування відбувається на два кроки вперед, четвертий - швидкість навчання мережі.
3.3 Навчання нейронної мережі
Після того, як при створенні мережі визначені кількість шарів і кількість нейронів у кожному з них, необхідно знайти значення ваг і зміщень кожного з нейронів, тобто здійснити настройку параметрів моделі. Це може бути досягнуто за допомогою процедури навчання мережі. Вона зводиться, як правило, до мінімізації помилки, яку мережа допускає при пред'явленні до неї всіх даних навчання. У процесі навчання може з'явитися вибір: типу навчання (без вчителя, з вчителем); процедури навчання: ADAPT (адаптувати - метод для об'єктів класу network (проект мережі), при якому значення ваг і зміщень нейронів поновлюються після кожного пред'явлення до мережі вектора входу) або TRAIN (навчати - метод для об'єктів класу network, при якому значення ваг і зміщень нейронів поновлюються тільки після пред'явлення до мережі закінченої послідовності векторів входу); функції адаптації або навчання, що визначає алгоритм навчання, та параметрів цих функцій; кількості циклів або епох навчання тощо. Правильний вибір перелічених можливостей є доволі складною задачею. Тому при першому застосуванні доцільно вибирати опції, призначені за умовчанням, які часто залишаються придатними і для дослідження кінцевого варіанта системи.
Для навчання мережі застосуємо алгоритм навчання з вчителем [2], оскільки задається цільовий масив, навчання здійснюється з використанням функції ADAPT, також для навчання
Loading...

 
 

Цікаве