Головна » Наука та освіта » Довірчий інтервал. Що це таке і як його можна використовувати?

Довірчий інтервал. Що це таке і як його можна використовувати?



Довірчий інтервал прийшов до нас з області статистики. Це певний діапазон, який служить для оцінки невідомого параметра з високим ступенем надійності. Найпростіше це буде пояснити на прикладі.

Припустимо, потрібно досліджувати будь-яку випадкову величину, наприклад, швидкість відгуку сервера на запит клієнта. Кожен раз, коли користувач набирає адресу конкретного сайту, сервер реагує на це з різною швидкістю. Таким чином, досліджуване час відгуку має випадковий характер. Так от, довірчий інтервал дозволяє визначити межі цього параметра, і потім можна буде стверджувати, що з імовірністю в 95% швидкість реакції сервера перебуватиме в розрахованому нами діапазоні.

Або ж потрібно дізнатися, якій кількості людей відомо про торгову марку фірми. Коли буде підрахований довірчий інтервал, то можна буде, наприклад, сказати що з 95% часткою ймовірності частка споживачів, які знають про дану торговельну марку, знаходиться в діапазоні від 27% до 34%.

З цим терміном тісно пов'язана така величина, як довірча ймовірність. Вона являє собою ймовірність того, що шуканий параметр входить в довірчий інтервал. Від цієї величини залежить те, наскільки великим виявиться наш шуканий діапазон. Чим більше значення вона приймає, тим вже стає довірчий інтервал, і навпаки. Зазвичай її встановлюють рівною 90%, 95% або 99%. Величина 95% найбільш популярна.

На даний показник також впливає дисперсія спостережень і розмір вибірки. Його визначення засноване на тому припущенні, що досліджуваний ознака підпорядковується нормальному закону розподілу. Це твердження відоме також як Закон Гаусса. Згідно з ним, нормальним називається такий розподіл всіх ймовірностей неперервної випадкової величини, яке можна описати щільністю ймовірностей. Якщо припущення про нормальний розподіл виявилося помилковим, то оцінка може виявитися невірною.

Спочатку розберемося з тим, як обчислити довірчий інтервал для математичного сподівання. Тут можливі два випадки. Дисперсія (ступінь розкиду випадкової величини) може бути відома або ні. Якщо вона відома, то наш довірчий інтервал обчислюється за допомогою наступної формули:

хср - t * /(sqrt (n)) <= α <= хср + t*σ /(sqrt(n)), где

- ознака,

t - параметр з таблиці розподілу Лапласа,

sqrt (n) - квадратний корінь загального обсягу вибірки,

- квадратний корінь дисперсії.

Якщо дисперсія невідома, то її можна розрахувати, якщо нам відомі всі значення шуканого ознаки. Для цього використовується наступна формула:

2 = х2ср - (хср) 2 де

х2ср - середнє значення квадратів досліджуваної ознаки,

(Хср) 2 - квадрат середнього значення даної ознаки.

Формула, за якою в цьому випадку розраховується довірчий інтервал трохи змінюється:

хср - t * s /(sqrt (n)) <= α <= хср + t*s /(sqrt(n)), где

хср - вибіркове середнє,

- ознака,

t - параметр, який знаходять за допомогою таблиці розподілу Стьюдента t = t (; n-1),

sqrt (n) - квадратний корінь загального обсягу вибірки,

s - квадратний корінь дисперсії.

Розглянь такий приклад. Припустимо, що за результатами 7 замірів була визначена середня величина досліджуваної ознаки, рівна 30 і дисперсія вибірки, рівна 36. Потрібно знайти з вірогідністю в 99% довірчий інтервал, який містить справжнє значення вимірюваного параметра.

Спочатку визначимо чому одно t: t = t (099; 7-1) = 3.71. Використовуємо наведену вище формулу, отримуємо:

хср - t * s /(sqrt (n)) <= α <= хср + t*s /(sqrt(n))

30 - 3.71 * 36 /(sqrt (7)) <= α <= 30 + 3.71*36 /(sqrt(7))

21.587<= α <= 38.413

Довірчий інтервал для дисперсії розраховується як у випадку з відомим середнім, так і тоді, коли немає ніяких даних про математичне сподівання, а відомо лише значення точкової незміщеної оцінки дисперсії. Ми не будемо наводити тут формули його розрахунку, так як вони досить складні і при бажанні їх завжди можна знайти в мережі.

Відзначимо лише, що довірчий інтервал зручно визначати за допомогою програми Excel або мережевого сервісу, який так і називається.