WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Визначення оптимальних змішаних стратегій підприємств на базі теорії ігор - Курсова робота

Визначення оптимальних змішаних стратегій підприємств на базі теорії ігор - Курсова робота

V, незалежно від того, яких стратегій дотримується інший гравець, якщо тільки він не виходить за межі своїх активних стратегій. Тому, для досягнення найбільшого гарантованого виграшу другому гравцеві також необхідно дотримуватися своєї оптимальної змішаної стратегії.
2.1.5. Вирішення матричних ігор із змішаним розширенням методами лінійного програмування
Вирішення матричної гри із змішаним розширенням - це визначення оптимальних змішаних стратегій, тобто знаходження таких значень вірогідності вибору чистих стратегій для обох гравців, при яких вони досягають найбільшого виграшу.
Для матричної гри, платіжна матриця якої показана на рис. 3, Vн Vв, визначимо такі значення вірогідності вибору стратегій для гравця 1 (p1, p2, ..., pm) і для гравця 2 (q1, q2, ..., qn), при яких гравці досягали б свого максимально гарантованого виграшу.
Якщо один з гравців дотримується своєї оптимальної стратегії, то, по умові завдання, його виграш не може бути менше ціни гри V. Тому дане завдання може бути представлена для гравців у вигляді наступних систем лінійних нерівностей:
Для першого гравця:
Для другого гравця:
Щоб визначити значення V, розділимо обидві частини кожного з рівнянь на V. Величину pi/V позначимо через xi, а qj/V - через yj.
Для гравця 1 отримаємо наступну систему нерівностей, з якої знайдемо значення 1/v:
Для гравця 1 необхідно знайти максимальну ціну гри (V). Отже, значення 1/V повинне прагнути до мінімуму.
Цільова функція завдання матиме наступний вигляд:
min Z = min 1/V = min (x1 + x2 + … + xm)
Для гравця 2 отримаємо наступну систему нерівностей, з якої знайдемо значення 1/v:
Для гравця 2 необхідно знайти мінімальну ціну гри (V). Отже, значення 1/V повинне прагнути до максимуму.
Цільова функція завдання матиме наступний вигляд:
max Z = max 1/V = max (y1 + y2 + ... + yn)
Всі змінні в даних системах лінійних нерівностей повинні бути ненегативними: xi = pi/V, а yi = qj/V. Значення pi і qj не можуть бути негативними, оскільки є значеннями вірогідності вибору стратегій гравців. Тому необхідно, щоб значення ціни гри V не було негативним. Ціна гри обчислюється на основі коефіцієнтів виграшів платіжної матриці. Тому, для того, щоб гарантувати умову позитивності для всіх змінних, необхідно, щоб всі коефіцієнти матриці були ненегативними. Цього можна добитися, додавши перед початком рішення завдання до кожного коефіцієнта матриці число K, відповідне модулю найменшого негативного коефіцієнта матриці. Тоді в ході рішення задачі буде визначена не ціна гри, а величина V* = V + K.
Для вирішення завдань лінійного програмування використовується симплекс-метод. В результаті рішення визначаються значення цільових функцій (для обох гравців ці значення співпадають), а також значення змінних xi і yj .
Величина V* визначається по формулі: V* = 1/z.
Значення вірогідності вибору стратегій визначаються: для гравця 1: Pi = xiV*, а для гравця 2: qi = yiV*.
Для визначення ціни гри V з величини V* необхідно відняти число K.
2.1.6. Основні чинники, що визначають величину ефекту прогнозу станів навколишнього середовища і значень виграшу ЛПР
На основі методів вирішення статистичних ігор можна сформулювати деякі підходи до вирішення різноманітних прикладних економічних завдань. Одне з таких завдань - визначення економічного ефекту інформації.
Для будь-якого економічного завдання, що вирішується з використанням статистичних ігор, може бути сформульоване абсолютне мінімальне значення виграшу A0, який ЛПР отримає в якнайгіршій для себе ситуації. Ця величина може бути рівна, наприклад, сумі витрат на виробництво продукції при нульовій виручці від її реалізації, максимально можливим втратам, що виникли унаслідок ухваленого рішення, і так далі Дана величина завжди може бути оцінена і її значення завжди звичайно. Це дозволяє привести будь-яку платіжну матрицю статистичної гри до умови позитивності коефіцієнтів. Умову позитивності гарантує визначення будь-якого значення виграшу як позитивної величини. Крім того, дотримання даної умови дозволяє визначити величину додаткового виграшу за рахунок підвищення достовірності інформації.
В процесі ухвалення рішення для визначення найбільш вигідної стратегії ЛПР необхідно враховувати можливі стани навколишнього середовища і визначати їх вірогідність. ЛПР складає прогноз розвитку ситуації FA, відповідно до якого кожен стан навколишнього середовища SJA має вірогідність pjA. Даний прогноз може реалізуватися з достовірністю uA (під достовірністю прогнозу тут слід розуміти частку прогнозів, що реалізувалися, від всіх раніше складених прогнозів за умови, що якщо прогноз не реалізувався, то виграш буде рівний мінімально гарантованій величині).
Прагнучи підвищити достовірність прогнозу, ЛПР може скористатися послугами консультаційної служби, що має більший досвід в дослідженні даної наочної області. Консультаційна служба складає прогноз розвитку ситуації FB (FB > FA), відповідно до якого кожен стан навколишнього середовища SJB має вірогідність pjB. Даний прогноз може реалізуватися з достовірністю uB (uB > uA).
Для вирішення завдання визначення економічного ефекту прогнозу консультаційної служби приймемо наступні три умови:
1. За відсутності якої-небудь інформації щодо величини виграшу і вірогідності станів навколишнього середовища (u = 0) ЛПР може зробити єдине припущення - про те, що величина виграшу при будь-якому рішенні буде не менша A0, яке, після приведення платіжної матриці до ненегативної форми, рівно нулю.
2. Ухвалення ЛПР прогнозу з достовірністю u гарантує йому величину середнього виграшу відповідно до вибраної ним стратегії з вірогідністю u і величину виграшу A0 з вірогідністю 1-u.
3. Рішення задачі визначення ефекту прогнозу консультаційної служби має сенс, лише якщо uB > uA.
Визначення ЛПР найбільш вигідної стратегії за прогнозом FB дозволяє йому отримати додатковий виграш за рахунок:
1. зміни ухвалюваного рішення;
2. підвищення достовірності прогнозу.
В умовах, коли значення параметра достовірності прогнозу менше одиниці, для визначення найбільш вигідних стратегій використовується критерій Ходжа-Лемана.
При визначені оптимальної стратегії за критерієм Ходжа-Лемана вводиться параметр достовірності інформації про розподіл ймовірностей станів природи значення якого знаходиться на проміжку [0;1].
Платіжна матриця доповнюється стовпцем Wi коефіцієнти якого обчислюються за формулою:
,
де u - параметр достовірності, Pj - ймовірність стану Sj .
Оптимальною вважається та стратегія, яка задовільняє умові: .
Величина додаткового виграшу, що отримується унаслідок зміни ухвалюваного рішення Vx, може бути визначена по формулі:
Vx = uB(Vf - Vr) ,
де Vf - величина виграшу ЛПР, отриманого при виборі найбільш вигідної стратегії за прогнозомFB; Vr - величина виграшу, яку ЛПР фактично отримає відповідно до прогнозу FB, якщо він вибере найбільш вигідну
Loading...

 
 

Цікаве