Зміст
- Тип необхідних даних
- Тест на придатність
- Розрахунок статистики Chi-квадрата
- Інтерпретація статистики Chi-Square
Прогнози тестування експериментів Ці прогнози часто є числовими, тобто, коли вчені збирають дані, вони очікують, що цифри розбиватимуться певним чином. Дані в реальному світі рідко відповідають точним прогнозам, які роблять вчені, тому вченим потрібен тест, щоб сказати їм, чи різниця між спостережуваними та очікуваними числами є випадковою випадковістю чи через якийсь непередбачуваний фактор, який змусить ученого скорегувати основну теорію . Тест на квадрат-чі - це статистичний інструмент, який вчені використовують для цього.
Тип необхідних даних
Для використання тесту на квадрат-чі потрібні категоричні дані. Прикладом категоричних даних є кількість людей, які відповіли на питання "так" проти кількості людей, які відповіли на питання "ні" (дві категорії), або кількість жаб у популяції, які зелені, жовті або сірі ( три категорії). Ви не можете використовувати тест-чи-квадрат на постійних даних, наприклад, які можуть бути зібрані з опитування, запитуючи людей, наскільки вони високі. З такого опитування ви отримаєте широкий діапазон висот. Однак, якщо ви розділили висоти на категорії, такі як "до 6 футів у висоту" та "6 футів у висоту і більше", ви можете використати тест-квадрат на даних.
Тест на придатність
Тест на придатність - це звичайний і, можливо, найпростіший тест, виконаний за допомогою статистики хі-квадрат. Під час тесту на корисність вчений робить конкретний прогноз щодо цифр, які вона очікує побачити у кожній категорії своїх даних. Потім вона збирає дані в реальному світі - називаються спостережувані дані - і використовує тест чі-квадрата, щоб побачити, чи відповідають спостережувані дані її очікуванням.
Наприклад, уявіть, що біолог вивчає закономірності спадкування у виду жаби. Серед 100 потомства набору батьків жаб, генетична модель біологів спонукає її очікувати 25 жовтих потомства, 50 зелених нащадків та 25 сірих потомства. Насправді вона зауважує - 20 жовтих нащадків, 52 зелених потомства та 28 сірих потомства. Чи підтримується її передбачення чи її генетична модель невірна? Вона може скористатися тестом чи-квадрата, щоб дізнатися це.
Розрахунок статистики Chi-квадрата
Починайте обчислювати статистику хі-квадрата з віднімання кожного очікуваного значення від його відповідного спостережуваного значення та порівняння кожного результату. Розрахунок для прикладу жаб'ячого потомства виглядав би так:
жовтий = (20 - 25) ^ 2 = 25 зелений = (52 - 50) ^ 2 = 4 сірий = (28 - 25) ^ 2 = 9
Тепер поділіть кожен результат на відповідне очікуване значення.
жовтий = 25 ÷ 25 = 1 зелений = 4 ÷ 50 = 0,08 сірий = 9 ÷ 25 = 0,36
Нарешті, складіть відповіді з попереднього кроку.
чи-квадрат = 1 + 0,08 + 0,36 = 1,44
Інтерпретація статистики Chi-Square
Статистична таблиця чі-квадратів говорить вам, наскільки ваші спостережувані значення відрізнялися від прогнозованих значень. Чим більше число, тим більша різниця. Ви можете визначити, чи є ваше значення квадратного чі занадто високим або низьким, щоб підтримати ваш прогноз, побачивши, чи є воно нижче певного критичне значення на таблиці розподілу чі-квадрат. Ця таблиця відповідає величинам чи-квадрата з ймовірностями, що називаються р-значення. Зокрема, таблиця повідомляє вам про ймовірність того, що різниці між вашими спостережуваними та очікуваними значеннями просто обумовлені випадковим випадком або наявністю якогось іншого фактора. Для тесту на придатність, якщо значення р становить 0,05 або менше, ви повинні відхилити своє передбачення.
Ви повинні визначити ступенів свободи (df) у ваших даних, перш ніж ви зможете знайти критичне значення chi-квадрата в таблиці розподілу. Ступені свободи обчислюються відніманням 1 від кількості категорій у ваших даних. У цьому прикладі є три категорії, тому є 2 ступеня свободи. Погляд на цю таблицю розподілу чі-квадратів говорить вам, що для 2-х ступенів свободи критичне значення для ймовірності 0,05 становить 5,99. Це означає, що, якщо обчислене значення вашої квадратики менше 5,99, ваші очікувані значення, а отже, і основна теорія, є дійсними та підтримуються. Оскільки статистика хі-квадрата для даних потомства жаби становила 1,44, біолог може прийняти її генетичну модель.