WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаЕкономічна теорія → Верифікація моделі - Реферат

Верифікація моделі - Реферат


Реферат на тему:
Верифікація моделі
Показники якості моделі
У класичному регресійному аналізі вважається, що функція регресії відома до оцінювання параметрів, тобто регресійна модель специфікована правильно. Однак в емпіричних економічних і соціальних дослідженнях не завжди відомо, скільки факторів має бути введено в модель і яка форма залежності краще описує реальні зв'язки. Щоб забезпечити найбільш адекватне відтворення досліджуваного явища чи процесу необхідно вибрати регресійну функцію серед багатьох варіантів, використовуючи спеціальні критерії якості моделі.
Для перевірки коректності побудови моделі визначають насамперед:
. стандартну похибку рівняння;
. коефіцієнт детермінації;
. коефіцієнт множинної кореляції;
. стандартну похибку параметрів.
Зауважимо, що зазначені показники отримують на підставі конкретних статистичних даних, тобто кожна з цих характеристик є вибірковою характеристикою і тому мас бути перевірена на значущість за допомогою спеціальних статистичних критеріїв.
Стандартна похибка рівняння (точкова оцінка емпіричної дисперсії залишків) характеризує абсолютну величину розкиду випадкової складової рівняння і обчислюється за формулою
Поправка на число ступенів свободи дає незміщену оцінку дисперсії залишків:
Зрозуміло, що перевага віддається моделям, у яких стандартна похибка рівняння менша порівняно з іншими моделями. Однак така оцінка якості має суттєвий недолік: через те що для неї не визначено верхню межу, порівняння різних моделей за цим критерієм досить проблематичне.
Коефіцієнт детермінації R2 показує, яка частина руху залежної змінної описується даним регресійним рівнянням, і обчислюється за формулою
; у - середнє значення залежної змінної,
На значення коефіцієнта детермінації впливає кількість факторів, що враховано в моделі. Уведення в модель кожної нової змінної збільшує значення коефіцієнта детермінації. Тому щоб запобігти невиправданому розширенню моделі й мати змогу порівнювати моделі з різною кількістю факторів, уводять спеціальний оцінений коефіцієнт детермінації
де а2и - незміщена оцінка дисперсії залишків; а2у - незміщена оцінка дисперсії залежної змінної, а2 =------Y (уі - у)2.
п-1 і=1
Неважко помітити, що обидва коефіцієнти пов'язані такою залеж-ністю:
Обчислений у такий спосіб коефіцієнт детермінації називається скоригованим за Тейлом і позначається RT. Крім того застосовують також коригування за Амемією, яке виконується за формулою "
Обчислений у такий спосіб коефіцієнт детермінації називається скоригованим за Амемією і позначається RA.
Обидва коефіцієнти RT2 і R2A враховують той факт, що уведення в модель кожного нового регресора зменшує число ступенів свободи. А для застосування статистичних критеріїв перевірки якості отриманих результатів ступенів свободи бажано мати якомога більше.
Очевидно, для кожного RT2 і R2A виконується нерівність R2 < R2, тобто зі збільшенням кількості факторів моделі оцінені коефіцієнти
детермінації зростають повільніше, ніж R2. Крім того, якщо R2 =1, то і R2 = 1. Якщо R2 прямує до нуля, оцінені коефіцієнти стають від'ємними. Така властивість скоригованих коефіцієнтів детермінації дає змогу більш об'єктивно оцінювати якість моделей з різною
кількістю факторів, причому в разі застосування коефіцієнта R2A (скоригованого за Амемією) перевага однозначно віддається рівнянню з меншою кількістю регресорів.
Зауваження. Коефіцієнт детермінації має ще два рівноцінних означення. За першим, коефіцієнт детермінації R2 дорівнює квадрату емпіричного коефіцієнта кореляції між двома рядами спостережень (теоретичними значеннями регресанда Уі та його розрахунковими значеннями уі, і = 1, 2,..., п) і обчислюється за формулою
За другим, коефіцієнт детермінації R2 дорівнює відношенню суми квадратів відхилень розрахункових значень регресанда від його середнього значення до суми квадратів відхилень спостережених зна-чень регресанда від того самого середнього значення:
В обох випадках сума ? обчислюється за всіма спостереженнями і = 1, 2,..., п.
Коефіцієнт множинної кореляції R (R) визначає міру зв'язку залежної змінної з усіма незалежними факторами і є коренем квадратним з відповідного коефіцієнта детермінації: R = R (R = yR ).
Стандартна похибка рівняння, коефіцієнт детермінації та множинної кореляції є характеристиками, за якими перевіряється правильність вибору незалежних змінних моделі. При порівнянні регресійних рівнянь з різною кількістю незалежних змінних вирішальними критеріями є стандартна похибка рівняння (найменша) та коефіцієнт детермінації (якомога ближчий до одиниці і з більшим числом ступенів свободи).
Перевірка значущості та довірчі інтервали
Розглянуті показники якості моделі побудовані за даними спостережень, тобто є деякими вибірковими характеристиками генеральної сукупності. З математичної статистики відомо, що будь-яка статистика (функція від елементів вибірки) має бути перевірена на значущість. Іншими словами, за допомогою спеціальних критеріїв необхідно встановити, чи зумовлено значення цієї функції лише похибками вимірювання, чи вона відображає якусь суттєву (значущу) інформацію. Неперевірений статистичний результат є лише деякою гіпотезою, яка може бути прийнята чи відхилена.
Нагадаємо, що перевірка гіпотез у загальному випадку виконується в такому порядку: для кожної задачі добирається деяка випадкова величина, що має відомий чи близький до відомого закон розподілу. Функція від елементів вибірки є конкретною реалізацією цієї випадкової величини.
Зауваження. У задачах регресійного аналізу важливе значення має припущення про нормальний розподіл випадкових величин, що задіяні в даній моделі. Певні перетворення нормально розподілених величин забезпечують їх розподіл за законом Стьюдента чи за законом Фішера: на підставі першого з них визначаються довірчі інтервали, а другий дає змогу оцінювати відношення двох випадкових величин.
Стосовно кожного статистичного результату висувається так звана нульова гіпотеза (про рівність нулю деякої випадкової величини) і альтернативна до неї гіпотеза (про її суттєву відмінність від нуля). У нульовій гіпотезі формулюють результат, який бажано відхилити, а в альтернативній, яка інакше називається експериментальною, - той, що його необхідно підтвердити.
Зауваження. Рівність двох величин у загальному випадку може розглядатися як рівність нулю їх різниці.
За заданим рівнем значущості множина допустимих значень розбивається на дві неперетинні множини: одна містить значення випадкової величини, імовірність досягнення яких перевищує заданий рівень значущості, а інша - критична область - визначає ті значення, що досягаються рідко (імовірність потрапити до такої області нижча від заданого рівня), і розташована вона, як правило, на "хвостах розподілу".
Залежно від альтернативної гіпотези критична область може складатися з одного чи двох проміжків на числовій осі. Це буде один проміжок(правий чи лівий "хвіст" розподілу), якщо зазначається напрямок нерівності (більше або менше деякої величини), і два проміжки (обидва "хвости" розподілу), якщо встановлюється нерівність (не дорівнює певній величині).
За даними спостережень обчислюється значення відповідної статистики - функції від елементів вибірки. Якщо ця величина потрапляє до критичної області, це означає, що сталася практично неможлива подія, тобто подія, що має дуже малу ймовірність, а отже, від нульової гіпотези слід відмовитися і віддати перевагу
Loading...

 
 

Цікаве