WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаМатематика, Геометрія, Статистика → Вибірковий метод. Статистична перевірка гіпотез - Реферат

Вибірковий метод. Статистична перевірка гіпотез - Реферат

Як видно з формул, розмір граничної похибки залежить:

  • від варіації ознаки 2;

  • обсягу вибірки n;

  • частки вибірки в генеральній сукупності ;

  • узятого рівня ймовірності, якому відповідає квантиль t.

Чим більша варіація ознаки в генеральній сукупності, тим більша в середньому похибка вибірки. Залежність похибки від обсягу вибіркової сукупності обернено пропорційна. Щоб зменшити похибку вибірки вдвічі, обсяг останньої має зрости в 4 рази. При безповторному доборі похибка буде тим менша, чим більша частка обстеженої сукупності . Очевидно, при суцільному спостереженні похибка репрезентативності відсутня ( = 0).

При малих вибірках (n < 30 ), у розрахунках стандартних похибок використовують вибіркові оцінки дисперсій . Квантилі t визначають за розподілом імовірностей Стьюдента. У табл. 6.3 наведено деякі значення квантилів t розподілу Стьюдента для ймовірності 0,95 і числа ступенів свободи, тобто числа незалежних величин, необхідних для визначення даної характеристики, k = n – 1. При n > 30 квантилі розподілу Стьюдента і нормального розподілу збігаються.

Розглянемо методику вибіркового оцінювання середньої та частки на прикладі обстеження 225 домогосподарств регіону. За результатами 1%-ної вибірки 70% грошового доходу домогосподарства витрачають на харчування. Середньодушові витрати на харчування за місяць становлять 82 грн. при дисперсії 8510.

Визначимо межі середньодушових витрат на харчування з імовірністю 0,954 (t = 2).

Гранична похибка

грн.

Це дає підставу стверджувати з імовірністю 0,954, що середньодушові витрати на харчування в цілому по регіону щонайменше 69,7 грн. і не перевищують 94,3 грн.:

.

Перш ніж визначити граничну похибку частки витрат на харчування, необхідно обчислити її дисперсію:

= 0,7(1 – 0,7) = 0,21.

Гранична похибка

або 6,1%.

Щодо інтервалу можливих значень частки витрат на харчування в генеральній сукупності, то межі його становлять 63,9 і 76,1%:

.

У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї самої ознаки в різних сукупностях.

Такі порівняння виконують за допомогою відносної похибки, яка показує, на скільки процентів вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої — це коефіцієнт варіації вибіркових середніх:

.

Її розмір можна визначити також на основі коефіцієнта варіації ознаки Vx:

для повторної вибірки

;

для безповторної вибірки

.

Так, у нашому прикладі відносна похибка середньодушових витрат на харчування

.

Такий самий результат дає розрахунок відносної похибки на основі коефіцієнта варіації :

;

Вибіркову похибку частки також слід порівнювати з часткою р. Адже одна і та сама похибка = 2% для р = 80% є малою, для р = 40% — допустимою, для р = 10% — завеликою. Відносну похибку частки обчислюють за формулою

.

У нашому прикладі відносна похибка частки витрат на харчування становить 4,36%:

,

що значно менше порівняно з похибкою середньодушових витрат на харчування (7,5%).

Отже, відносну похибку можна використати для порівняння вибіркових оцінок різних ознак. На практиці достатнім рівнем точності вважається Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку .

Різновиди вибірок

Формування вибірки — не безладний процес. Ця дія виконується за певними правилами. Передусім визначається основа вибірки. У сукупностях, які складаються з "фізичних" елементів, одиниця основи може репрезентувати або окремий елемент сукупності, або певне їх угруповання. Наприклад, вивчається використання комбайнів. Загальна їх кількість N розподілена за М бригадами, кожна з них має Nj комбайнів. Одиницею основи вибірки може бути комбайн або бригада. Відповідно формується вибіркова сукупність: у першому випадку вибирається n комбайнів із загального їх числа N, у другому — m бригад із загального їх числа M.

Найпростішою основою вибірки є перелік елементів генеральної сукупності, пронумерований від 1 до N. Простими вважаються також набори звітів, анкет, карток тощо.

На практиці досліджувані сукупності мають, як правило, не одну, а низку альтернативних основ для вибірки. Наукове обґрунтування та правильний вибір основи — перша передумова забезпечення репрезентативності результатів вибіркового спостереження.

Від основи вибірки залежить спосіб добору елементів сукупності для обстеження. Найчастіше використовують способи добору: простий випадковий, механічний, розшарований (районований), серійний.

Простий випадковий добір провадиться жеребкуванням або за допомогою таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності, який передбачаєпопередню досить складну підготовку до формування вибірки. Для жеребкування на кожну одиницю генеральної сукупності необхідно заготувати відповідну фішку; при використанні таблиць випадкових чисел усі елементи цієї сукупності мають бути пронумеровані. У великих за обсягом сукупностях така робота здебільшого недоцільна, а часом і неможлива. Тому на практиці застосовуються інші різновиди випадкових вибірок.

Механічний добір. Основа вибірки — упорядкована множина елементів сукупності. Добір елементів здійснюється через рівні інтервали. Крок інтервалу обчислюється діленням обсягу сукупності N на передбачений обсяг вибірки n. Початковий елемент вибірки визначається як випадкове число всередині першого інтервалу, другий елемент залежить від початкового числа й кроку інтервалу. Так, для частки вибірки кроком інтервалу є число =, тобто у вибірку має потрапити кожний двадцятий елемент. Якщо початковий елемент — випадкове число 7, то другим елементом буде 7 + 20 = 27, третім — 27 + 20 = 47 і т. д.

Механічна вибірка порівняно з простою випадковою ефективніша, її простіше здійснити. Проте за наявності циклічних коливань значень ознаки, цикл коливань яких збігається з інтервалом, можливий зсув вибіркових оцінок. Похибку механічної вибірки обчислюють за формулою похибки безповторної вибірки.

Вивчаючи безперервні в часі процеси, зокрема технологічні (структури затрат робочого часу, використання виробничого устаткування), проводять моментні спостереження. Суть їх — у періодичній фіксації стану процесу на певні моменти часу, які вибирають за схемою випадкової або механічної вибірки (через певні інтервали часу).

На етапі підготовки моментних спостережень визначають перелік можливих варіантів стану процесу, наприклад перелік причин простоїв устаткування. Під час обстеження певної сукупності одиниць устаткування, скажімо, верстатів, у визначені моменти часу фіксується, працює r-й верстат чи ні (якщо ні, зазначаються причини простою). Припустимо, що в цеху працюють 10 верстатів і за 8-годинну зміну через кожні півгодини проводилась реєстрація використання цих верстатів. Було зроблено 160 записів (2 8 10), у 144 випадках зазначено, що верстат працював, у 16 — не працював. Частка працюючих верстатів становить 0,9, дисперсія частки — 0,9  0,1 = 0,09. Із імовірністю 0,954 гранична похибка вибірки , або 4,6%. Отже, частка працюючих верстатів за зміну становила не менш як 90 – 4,6 = 85,4%.

Щодо повноти охоплення елементів сукупності, то моментне спостереження суцільне, воно вибіркове впродовж часу, бо охоплює не весь час роботи устаткування, а лише певні моменти. У разі правильної організації моментні обстеження забезпечують досить точні результати швидко і з меншими витратами, ніж при суцільному спостереженні.

Розшарований (районований, типовий) добір — це спосіб формування вибірки з урахуванням структури генеральної сукупності. На відміну від простого випадкового та механічного добору, які проводяться в цілому по генеральній сукупності, розшарований передбачає її попередню структуризацію й незалежний добір елементів у кожній складовій. Обсягом розшарованої вибірки є сума частинних вибірок , тобто , де m — число складових (груп, типових районів тощо).

Похибку розшарованої вибірки обчислюють, використовуючи середню з групових дисперсій . Якщо сформовані групи об'єднують "схожі" елементи, а групові середні величини помітно різні, варіація ознаки в групах буде значно меншою, ніж по сукупності. У такому разі <, а отже, похибка розшарованої вибірки порівняно з простою випадковою чи механічною буде менша:

.

Для того щоб забезпечити більшу точність розшарованої вибірки, слід обґрунтувати ознаку розшарування сукупності, число складових частин m, обсяг частинних вибірок і спосіб добору. Зменшення варіації ознаки при розшаруванні сукупності можливе за умови, що ознака розшарування сукупності корелює з ознакою, характеристики якої оцінюються. ці ознаки співвідносяться як причина й наслідок.

Loading...

 
 

Цікаве