Як зробити тест Chi-Square

Posted on
Автор: Judy Howell
Дата Створення: 4 Липня 2021
Дата Оновлення: 14 Листопад 2024
Anonim
Расчет точного теста Фишера в excel
Відеоролик: Расчет точного теста Фишера в excel

Зміст

Прогнози тестування експериментів Ці прогнози часто є числовими, тобто, коли вчені збирають дані, вони очікують, що цифри розбиватимуться певним чином. Дані в реальному світі рідко відповідають точним прогнозам, які роблять вчені, тому вченим потрібен тест, щоб сказати їм, чи різниця між спостережуваними та очікуваними числами є випадковою випадковістю чи через якийсь непередбачуваний фактор, який змусить ученого скорегувати основну теорію . Тест на квадрат-чі - це статистичний інструмент, який вчені використовують для цього.

Тип необхідних даних

Для використання тесту на квадрат-чі потрібні категоричні дані. Прикладом категоричних даних є кількість людей, які відповіли на питання "так" проти кількості людей, які відповіли на питання "ні" (дві категорії), або кількість жаб у популяції, які зелені, жовті або сірі ( три категорії). Ви не можете використовувати тест-чи-квадрат на постійних даних, наприклад, які можуть бути зібрані з опитування, запитуючи людей, наскільки вони високі. З такого опитування ви отримаєте широкий діапазон висот. Однак, якщо ви розділили висоти на категорії, такі як "до 6 футів у висоту" та "6 футів у висоту і більше", ви можете використати тест-квадрат на даних.

Тест на придатність

Тест на придатність - це звичайний і, можливо, найпростіший тест, виконаний за допомогою статистики хі-квадрат. Під час тесту на корисність вчений робить конкретний прогноз щодо цифр, які вона очікує побачити у кожній категорії своїх даних. Потім вона збирає дані в реальному світі - називаються спостережувані дані - і використовує тест чі-квадрата, щоб побачити, чи відповідають спостережувані дані її очікуванням.

Наприклад, уявіть, що біолог вивчає закономірності спадкування у виду жаби. Серед 100 потомства набору батьків жаб, генетична модель біологів спонукає її очікувати 25 жовтих потомства, 50 зелених нащадків та 25 сірих потомства. Насправді вона зауважує - 20 жовтих нащадків, 52 зелених потомства та 28 сірих потомства. Чи підтримується її передбачення чи її генетична модель невірна? Вона може скористатися тестом чи-квадрата, щоб дізнатися це.

Розрахунок статистики Chi-квадрата

Починайте обчислювати статистику хі-квадрата з віднімання кожного очікуваного значення від його відповідного спостережуваного значення та порівняння кожного результату. Розрахунок для прикладу жаб'ячого потомства виглядав би так:

жовтий = (20 - 25) ^ 2 = 25 зелений = (52 - 50) ^ 2 = 4 сірий = (28 - 25) ^ 2 = 9

Тепер поділіть кожен результат на відповідне очікуване значення.

жовтий = 25 ÷ 25 = 1 зелений = 4 ÷ 50 = 0,08 сірий = 9 ÷ 25 = 0,36

Нарешті, складіть відповіді з попереднього кроку.

чи-квадрат = 1 + 0,08 + 0,36 = 1,44

Інтерпретація статистики Chi-Square

Статистична таблиця чі-квадратів говорить вам, наскільки ваші спостережувані значення відрізнялися від прогнозованих значень. Чим більше число, тим більша різниця. Ви можете визначити, чи є ваше значення квадратного чі занадто високим або низьким, щоб підтримати ваш прогноз, побачивши, чи є воно нижче певного критичне значення на таблиці розподілу чі-квадрат. Ця таблиця відповідає величинам чи-квадрата з ймовірностями, що називаються р-значення. Зокрема, таблиця повідомляє вам про ймовірність того, що різниці між вашими спостережуваними та очікуваними значеннями просто обумовлені випадковим випадком або наявністю якогось іншого фактора. Для тесту на придатність, якщо значення р становить 0,05 або менше, ви повинні відхилити своє передбачення.

Ви повинні визначити ступенів свободи (df) у ваших даних, перш ніж ви зможете знайти критичне значення chi-квадрата в таблиці розподілу. Ступені свободи обчислюються відніманням 1 від кількості категорій у ваших даних. У цьому прикладі є три категорії, тому є 2 ступеня свободи. Погляд на цю таблицю розподілу чі-квадратів говорить вам, що для 2-х ступенів свободи критичне значення для ймовірності 0,05 становить 5,99. Це означає, що, якщо обчислене значення вашої квадратики менше 5,99, ваші очікувані значення, а отже, і основна теорія, є дійсними та підтримуються. Оскільки статистика хі-квадрата для даних потомства жаби становила 1,44, біолог може прийняти її генетичну модель.