WWW.REFERATCENTRAL.ORG.UA - Я ТУТ НАВЧАЮСЬ

... відкритий, безкоштовний архів рефератів, курсових, дипломних робіт

ГоловнаМатематика, Геометрія, Статистика → Вибірковий метод. Статистична перевірка гіпотез - Реферат

Вибірковий метод. Статистична перевірка гіпотез - Реферат

Реферат на тему:

Вибірковий метод. Статистична перевірка гіпотез

Суть вибіркового спостереження

Вибіркове спостереження— такий вид несуцільного спостереження, при якому обстежуються не всі елементи сукупності, що вивчається, а лише певним чином дібрана їх частина. Сукупність, з якої вибирають елементи для обстеження, називається генеральною, а сукупність, яку безпосередньо обстежують, — вибірковою. Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності.

Практика вибіркових спостережень досить різноманітна. Це обстеження домогосподарств, маркетингові дослідження, аудиторські перевірки великих фірм, вивчення громадської думки тощо. При обстеженні невеликої частини генеральної сукупності зменшуються помилки реєстрації, можна розширити й деталізувати програму обстеження. З іншого боку, вибіркове спостереження забезпечує економію матеріальних, трудових, фінансових ресурсів і часу.

При вивченні певного кола соціально-економічних явищ вибіркове спостереження єдино можливе. Це стосується передусім перевірки якості продукції (жирності молока, чистоти та вологості зерна, міцності пряжі тощо). Часом вибіркове спостереження поєднується із суцільним. Наприклад, при перепису населення кожна четверта одиниця спостереження дає докладнішу інформацію. Крім того, вибірковий метод використовують для прискореної обробки матеріалів суцільного спостереження та перевірки правильності даних переписів і одноразових обстежень.

Об'єктивною гарантією того, що вибірка репрезентує (представляє) всю сукупність, є додержання наукових принципів організації та проведення спостереження, насамперед неупередженого, об'єктивного підходу до вибору елементів для обстеження. Принцип випадковості вибору забезпечує всім елементам генеральної сукупності рівні можливості потрапити у вибірку.

Якщо генеральна сукупність містить N елементів, а для обстеження потрібно вибрати з них частину n, то число можливих вибірок

.

Усі вони мають однакову ймовірність , але кожна з них несе в собі певну похибку, що відбиває факт випадковості вибору. Оскільки вибіркова сукупність не точно відтворює склад генеральної сукупності, то й вибіркові оцінки не збігаються з відповідними характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності: для середньої — це різниця між генеральною та вибірковою середніми, для частки — різниця між генеральною і вибірковою р частками, для дисперсії — відношення генеральної та вибіркової дисперсій тощо.

За причинами виникнення похибки репрезентативностіподіляються на тенденційні(систематичні) та випадкові. Тенденційні похибки виникають, коли при формуванні вибіркової сукупності порушений принцип випадковості (упереджений вибір елементів, недосконала основа вибірки тощо). Ці похибки для всіх елементів сукупності однонапрямлені і призводять до зсунення результатів обстеження.

Випадкові похибки — це наслідок випадковості вибору елементів для дослідження і пов'язаних з цим розбіжностей між структурами вибіркової та генеральної сукупностей щодо ознак, які вивчаються.

При організації вибіркового обстеження важливо уникнути тенденційних похибок. Незсуненість — одна з вимог до будь-якої вибіркової оцінки. Притаманних вибірковому спостереженню випадкових похибок уникнути неможливо, проте теорія вибіркового методу дає математичну основу для обчислення таких похибок та регулювання їх розміру.

Згідно з генеральною граничною теоремою за умови достатньо великого обсягу вибірки розподіл вибіркових середніх (і часток), незалежно від розподілу генеральної сукупності, асимптотично наближається до нормального. Більшість значень вибіркових середніх зосереджується навколо генеральної середньої, а отже, найбільшу ймовірність мають відхилення, близькі до нуля. Чим більше відхилення, тим менша його ймовірність. Для будь-якої ймовірності існує межа відхилень вибіркової середньої від генеральної. Використовуючи властивості нормального розподілу, для однієї конкретної вибірки можна визначити:

  • похибки репрезентативності — середню та граничну для взятої ймовірності;

  • імовірність того, що похибка вибірки не перевищить допустимого рівня;

  • обсяг вибірки, який забезпечить потрібну точність результатів для взятої ймовірності.

Кінцева мета будь-якого вибіркового спостереження — поширення його характеристик на генеральну сукупність. Для середньої та частки визначаються межі можливих їх значень у генеральній сукупності з певною ймовірністю — довірчі межі. Якщо метою вибіркового обстеження є визначення обсягових показників генеральної сукупності — обсягів значень ознаки , то вибіркова середня поширюється на генеральну сукупність прямим перерахунком: .

Наприклад, загальна посівна площа під круп'яними культурами в районі становить 2000 га. За даними вибіркового обстеження середня врожайність круп'яних культур — 22,5 ц/га, похибка середньої — 0,5 ц/га. Отже, можливий обсяг валового збору зерна з цієї площі буде не менший за 44 тис. ц [(2000 (22,5 – 0,5)]. Максимальний валовий збір — 46 тис. ц [(2000 (22,5 + 0,5)].

коли вибіркове спостереження проводиться з метою уточнення результатів суцільного спостереження, застосовується метод коефіцієнтів. Наприклад, після щорічного перепису худоби, що належить населенню, проводиться 10%-ний вибірковий контроль, мета якого — визначити частку недообліку худоби. За даними перепису в районі налічується 10000 корів. У домогосподарствах, які потрапили до контрольної вибірки, за переписом 200 корів, а за даними перевірки — 205. Отже, частка недообліку корів становить . Це і є той коефіцієнт, на який слід скоригувати результати перепису: 10000 1,025 = 10250 корів.

Вибіркові оцінки середньої та частки

У статистиці використовують два типи оцінок параметрів генеральної сукупності — точкові та інтервальні. Точкова оцінка — це значення параметра за даними вибірки: вибіркова середня та вибіркова частка р. Інтервальною оцінкою називають інтервал значень параметра, розрахований за даними вибірки для певної ймовірності, тобто довірчий інтервал. Чим менший довірчий інтервал, тим точніша вибіркова оцінка.

Межі довірчого інтервалу визначаються на основі точкової оцінки та граничної похибки вибірки :

для середньої

;

для частки

,

де  — стандартна (середня) похибка вибірки; t — квантиль розподілу ймовірностей (довірче число).

Стандартна похибка вибірки  є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Як доведено в теорії вибіркового методу, дисперсія вибіркових середніх у n раз менша від дисперсії ознаки в генеральній сукупності, тобто . Оскільки на практиці генеральна дисперсія ознаки невідома, у розрахунках можна використати вибіркову незсунену оцінку дисперсії: для повторної вибірки , для безповторної . Отже, формули стандартної похибки:

для повторної вибірки

,

для безповторної вибірки

.

Щодо практичного використання наведених формул слід урахувати таке:

а) дисперсія частки , де р і q — частки вибіркової сукупності, яким відповідно властива і невластива ознака;

б) у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому береться до уваги лише у вибірках з невеликою кількістю елементів;

в) коригуючий множник для безповторної вибірки , тобто при малих величинах (наприклад, для 2 чи 5%-ної вибірки) наближається до 1, а тому розрахунок можна виконувати за формулою для повторної вибірки; при 10%-ній вибірці коригуючий множник становить 0,949, при 20%-ній — 0,894.

Гранична похибка вибірки — це максимально можлива похибка для взятої ймовірності F(x). Довірче число t показує, як співвідносяться гранична та стандартна похибки. Як бачимо з рис. 6.1, з імовірністю 0,683 гранична похибка не вийде за межі стандартної , з імовірністю 0,954 вона не перевищить  2, з імовірністю 0,997 —  3. На практиці найчастіше застосовують імовірність 0,954 (на рис. 6.1 незаштрихована частина площини).

Рис. 6.1. Співвідношення ймовірностей та ширини довірчих меж

З урахуванням сказаного формули граничних похибок середньої та частки записують так:

Повторна вибірка

Безповторна вибірка

для середньої

;

;

для частки

;

.

Loading...

 
 

Цікаве