WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаІнформатика, Компютерні науки → Кореляційно-регресивний аналіз - Реферат

Кореляційно-регресивний аналіз - Реферат


Реферат на тему:
Кореляційно-регресивний аналіз
Основне завдання кореляційного і регресійного методів аналізу полягає в аналізі статистичних даних для виявлення математичної залежності між досліджуваними ознаками і встановлення за допомогою коефіцієнтів кореляції порівняльної оцінки щільності взаємозв'язку, який має певний числовий вираз.
Кореляційний і регресійний методи аналізу вирішують два основних завдання:
- визначають за допомогою рівнянь регресії аналітичну форму зв'язку між варіацією ознак Х і У;
- встановлюють ступінь щільності зв'язку між ознаками.
Найчастіше трапляються такі типи зв'язків:
- факторна ознака безпосередньо пов'язана з результативною;
- результативна ознака визначається комплексом діючих факторів;
- дві результативні ознаки спричинені дією однієї загальної причини.
Розглянемо особливості побудови регресійної моделі. Спочатку на прикладі лінійної моделі за допомогою засобу Пошук рішення продемонструємо методику побудови рівняння регресії для однієї залежної й однієї незалежної змінних. Хоча розглянута модель має дуже специфічний вигляд, запропонований підхід дозволяє досліджувати будь-яке рівняння регресії. Потім ми розглянемо функції робочого листа, що безпосередньо обчислюють різні характеристики лінійного і експонентного рівняння регресії, що дозволяють значно спростити процедуру регресійного аналізу для цих найбільше часто використовуваних на практиці моделей.
5.5.1. Побудова рівняння регресії на прикладі лінійної моделі
Розглянемо приклад використання нелінійної оптимізації за допомогою засобу Пошук рішення на прикладі побудови лінійного рівняння регресії.
Ви менеджер фірми по продажах шин до автомобілів і постійно ведете облік продажів. У вашому розпорядженні є дві величини, що спостерігаються: х - номер тижня, у - число проданих шин (тис.шт.) (табл. 5.9). Фірма зовсім молода, була створена десять тижнів назад, і тому у вашому розпорядженні є статистика тільки за цей дуже обмежений проміжок часу.
Таблиця 5.9- Значення величин, що спостерігаються
Величин спостереження Значення
х 1 2 3 4 5 6 7 8 9 10
у 6 8 12 14 15 18 18 17 19 21
Ви хочете спочатку змоделювати ту динаміку продажів, що має місце, а на основі побудованої моделі потім спробувати заглянути в майбутнє, тобто спрогнозувати очікуваний обсяг продажів на найближчі тижні. Як модель ви вирішили взяти найпростішу, тобто лінійну. Таким чином, треба побудувати лінійну модель , що щонайкраще описує значення, які спостерігаються. Звичайно, а и b підбираються так, щоб мінімізувати суму квадратів різниць теоретичних і спостережуваних значень залежної змінної (у), тобто мінімізувати
де n - число спостережень (у даному випадку п = 10).
Для рішення цієї задачі:
1. Заповніть чарунки А2:В11 (рис. 5.19).
2. Відведіть під змінні а и b чарунки D2 і Е2.
3. В чарунку F2 уведіть функцію мінімізації (це формула масиву, тому не забудьте завершити її введення натисканням комбінації клавіш ++).
{=СУММ((В2:В11-D2*А2:А11-E2)^2) }
4. Виберіть команду Сервіс | Пошук рішення. Діалогове вікно Пошук рішення заповните, як показано на мал. 5.19. Відзначимо, що на змінні а и b не накладаються ніяких обмежень.
Рис. 5.19 - Вихідні дані для побудови лінійної моделі діалогове вікно "Пошук рішення"
5. Натисніть кнопку Виконати. У результаті обчислень засіб Пошук рішення знайде а = 1,527272655 і b = 6,400000616 (див. рис. 5.20).
Рис. 5.20 - Теоретичне значення спостережуваної величини і коефіцієнти рівняння регресії
Параметри а і b лінійної моделі у = ах + b з попереднього прикладу можна визначити за допомогою функцій НАКЛОН (SLOPE) і ОТРЕЗОК (INTERCEPT).
Функція НАКЛОН (SLOPE) визначає коефіцієнт нахилу лінійного тренду, а функція ОТРЕЗОК (INTERCEPT) - точку перетину лінії лінійного тренду з віссю ординат.
Синтаксис:
НАКЛОН (поч_знач_у; поч_знач_х)
ОТРЕЗОК ((поч_знач_у; поч_знач_х)
- поч_знач_у - масив відомих значень залежної величини, що спостерігається;
- поч_знач_х - масив відомих значень незалежної величини, що спостерігається. Якщо поч_знач_х опущені, то передбачається, що це масив {1; 2; 3; ...} такого ж розміру, як і поч_знач_у.
Функції НАКЛОН і ОТРЕЗОК обчислюють результат за наступними формулами:
,
,
де , .
В чарунках D5 і Е5 (рис. 5.20) знайдені значення а і Ь, відповідно, за формулами
= НАКЛОН (В2:В11;А2:А11),
= ОТРЕЗОК (В2:В11;А2:А11).
Знайшовши коефіцієнти рівняння регресії, на їх основі легко визначити теоретичні значення величини, що спостерігається. Для цього:
1. Введіть в чарунку С2 формулу
=$D$5*A2+$E$5
2. Виберіть чарунку С2, розташуєте покажчик миші на маркері заповнення і протягніть його на діапазон С3:С11.
Теоретичне значення можна також обчислити за допомогою функції ПРЕДСКАЗ (FORECAST), не визначаючи попередньо коефіцієнти лінійної моделі у фіксованій точці.
Синтаксис:
ПРЕДСКАЗ (х; поч_знач_у; поч_знач__х)
- х - точка даних, для якої прогнозується значення;
- поч_знач_у - масив відомих значень залежної величини, що спостерігається;
- поч_знач_х - масив відомих значень незалежної величини, що спостерігається. Якщо поч_знач_х опущені, то передбачається, що це масив {1; 2; 3; ...} такого ж розміру, як і поч_знач_у.
Наприклад, теоретичне значення в чарунці С2 можна було б також визначити по формулі
=ПРЕДСКАЗ(А2;$В$2:$В$11;$А$2:$А$11)
Функція ТЕНДЕНЦИЯ (TREND) обчислює значення рівняння лінійної регресії для цілого діапазону значень незалежної змінної як для випадку одновимірного, так і багатовимірного рівняння регресії. Багатовимірна лінійна модель регресії має вид:
Синтаксис:
ТЕНДЕНЦИЯ (поч_знач_у; поч_знач_х; нов_знач_х; константа)
- поч_знач_у - масив відомих значень залежної величини, що спостерігається;
- поч_знач_х - масив відомих значень незалежної величини, що спостерігається. Якщо поч_знач_х опущені, то передбачається, що це масив {1; 2; 3; ...} такого ж розміру, як і поч_знач_у;
- нов_знач_х - нові значення х, для яких ТЕНДЕНЦИЯ повертає відповідні значення у;
- константа - логічне значення, що вказує, чи потрібно, щоб константа b дорівнювала 0. Якщо константа має значення ИСТИНА чи опущена, то b обчислюється звичайним чином. Якщо константа має значення ЛОЖЬ, то b дорівнює 0.
Якщо будується багатовимірна лінійна модель, то поч_энач_х і нов_знач__х повинні містити стовпець (чи рядок) для кожної незалежної змінної. Якщо нов_знач_х опущені, то передбачається, що вони збігаються з поч_знач_х.
Функція ЛИНЕЙН (LINEST) вертає масив {mn, ..., m1, b} значень параметрів рівняння багатомірної лінійної регресії.
Синтаксис:
ЛИНЕЙН (поч_знач_у; поч_знач_х; константа; стат)
- поч_энач_у - масив відомих значень залежної величини, що спостерігається;
- поч_знач_х - масив відомих значень незалежної величини, що спостерігається. Якщопоч_знач_х опущені, то передбачається, що це масив {1; 2; 3; ...} такого ж розміру, як і поч_знач_у;
- константа - логічне значення, що вказує, чи потрібно, щоб константа b була рівна 0. Якщо константа має значення ИСТИНА чи опущена, то b обчислюється звичайним чином. Якщо константа має значення ЛОЖЬ, то b покладається рівним 0;
- стат - логічне значення, що вказує, потрібно чи повернути додаткову статистику по регресії, наприклад коефіцієнт кореляції. Якщо стат має значення ИСТИНА, то функція ЛИНЕЙН повертає додаткову регресійну статистику. Якщо стат має значення ЛОЖЬ чи опущена, то функція ЛИНЕЙН повертає тільки значення
Loading...

 
 

Цікаве