Як обчислити міжквартирний діапазон

Posted on
Автор: Monica Porter
Дата Створення: 22 Березень 2021
Дата Оновлення: 3 Липня 2024
Anonim
Як обчислити міжквартирний діапазон - Наука
Як обчислити міжквартирний діапазон - Наука

Зміст

Інтерквартильний діапазон, який часто скорочується як IQR, представляє діапазон від 25-го перцентилету до 75-го перцентилету або середнього 50 відсотка будь-якого даного набору даних. Інтерквартильний діапазон можна використовувати для визначення середнього діапазону результативності тесту: ви можете використовувати його, щоб побачити, де більшість людей забиває певний тест, або визначити, скільки грошей складає кожен середній працівник у компанії щомісяця . Міжквартильний діапазон може бути більш ефективним інструментом аналізу даних, ніж середнє значення або медіана набору даних, оскільки дозволяє ідентифікувати діапазон дисперсії, а не просто одне число.

TL; DR (Занадто довго; Не читав)

Міжквартильний діапазон (IQR) являє собою середні 50 відсотків набору даних. Щоб обчислити це, спочатку впорядкуйте свої дані від найменшого до найбільшого, а потім визначте свої перші та треті квартальні позиції за допомогою формул (N + 1) / 4 та 3 * (N + 1) / 4 відповідно, де N - число балів у наборі даних. Нарешті, відніміть перший квартал від третього кварталу, щоб визначити міжквартильний діапазон для набору даних.

Замовити дані

Розрахунок міжквартирного діапазону - це просте завдання, але перед розрахунком вам потрібно буде оформити різні точки вашого набору даних. Для цього почніть з упорядкування точок даних від найменших до найбільших. Наприклад, якби ваші точки даних були 10, 19, 8, 4, 9, 12, 15, 11 і 20, ви будете переставляти їх так: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Після того, як ваші точки даних упорядковані таким чином, ви можете перейти до наступного кроку.

Визначте позицію першого чверті

Далі визначте позицію першого кварті за такою формулою: (N + 1) / 4, де N - кількість точок у наборі даних. Якщо перший квартал падає між двома числами, візьміть середнє значення двох чисел як ваш перший квартальний бал. У наведеному вище прикладі, оскільки існує дев'ять точок даних, вам слід додати від 1 до 9, щоб отримати 10, а потім розділити на 4, щоб отримати 2,5. Оскільки перший квартал падає між другим і третім значенням, ви отримаєте середнє значення 8 і 9, щоб отримати першу квартильну позицію 8,5.

Визначте позицію третьої чверті

Після того, як ви визначили свій перший квартал, визначте позицію третього кварталу, використовуючи наступну формулу: 3 * (N + 1) / 4, де N знову кількість точок у наборі даних. Так само, якщо третій квартал потрапляє між двома числами, просто візьміть середнє так, як було б під час обчислення першого квартального бала. У наведеному вище прикладі, оскільки існує дев'ять точок даних, ви додасте від 1 до 9, щоб отримати 10, помножте на 3, щоб отримати 30, а потім розділити на 4, щоб отримати 7,5. Оскільки перший квартал падає між сьомим та восьмим значенням, ви отримаєте в середньому 15 і 19, щоб отримати третю чверть балів 17.

Обчисліть міжквартирний діапазон

Після того, як ви визначили свій перший і третій квартилі, обчисліть міжквартильний діапазон, віднімаючи значення першого квантилу від значення третього кварталу. Завершуючи приклад, використаний протягом цієї статті, ви віднімете 8,5 з 17, щоб виявити, що міжквартильний діапазон набору даних дорівнює 8,5.

Переваги та недоліки IQR

Міжквартильний діапазон має перевагу в тому, що він може ідентифікувати та усунути залишків на обох кінцях набору даних. IQR також є хорошим показником варіацій у випадках косого розповсюдження даних, і цей метод обчислення IQR може працювати для згрупованих наборів даних, якщо ви використовуєте накопичувальний розподіл частоти для організації точок даних. Формула міжквартильного діапазону для згрупованих даних така ж, як і для негрупованих даних, причому IQR дорівнює значенню першого чверті, відніманому від значення третього кварталу. Однак він має ряд недоліків порівняно зі стандартним відхиленням: меншою чутливістю до кількох крайніх балів та стабільністю вибірки, яка не така сильна, як стандартне відхилення.