Зміст
Зовнішнє значення - це значення в наборі даних, яке далеке від інших значень. Випускники можуть бути спричинені експериментальними помилками або помилками вимірювання, або великою кількістю населення. У перших випадках може бути бажаним ідентифікувати людей, що вижили, та видалити їх із даних, перш ніж проводити статистичний аналіз, оскільки вони можуть скинути результати, щоб вони точно не представляли вибіркову сукупність. Найпростіший спосіб визначити людей, що не впадають у життя, - за допомогою методу «Квартиль».
Сортуйте дані у порядку зростання. Наприклад, візьміть набір даних {4, 5, 2, 3, 15, 3, 3, 5}. Відсортовано, приклад набору даних дорівнює {2, 3, 3, 3, 4, 5, 5, 15}.
Знайдіть медіану. Це число, на яке половина точок даних більша, а половина менша. Якщо є парне число точок даних, середні дві є усередненими. Для прикладу набору даних середні точки - 3 та 4, тому медіана становить (3 + 4) / 2 = 3,5.
Знайдіть верхній квартал, Q2; це точка даних, на якій 25 відсотків даних більше. Якщо набір даних є рівним, середнє значення становить 2 бали навколо кварталу. Для прикладу набору даних це (5 + 5) / 2 = 5.
Знайдіть нижній квартал, Q1; це точка даних, в якій 25 відсотків даних менше. Якщо набір даних є рівним, середнє значення становить 2 бали навколо кварталу. Для прикладу даних (3 + 3) / 2 = 3.
Віднімаємо нижній квартиль від вищого квартиля, щоб отримати міжквартильний діапазон, IQ. Для прикладу набору даних Q2 - Q1 = 5 - 3 = 2.
Помножте міжквартильний діапазон на 1,5. Додайте це до верхнього кварталу і відніміть його від нижнього квартиля. Будь-яка точка даних за межами цих значень є незначною стороною. Для набору прикладів 1,5 х 2 = 3; таким чином, 3 - 3 = 0 і 5 + 3 = 8. Отже, будь-яке значення, менше 0 або більше 8, було б м'яким перевершенням. Це означає, що 15 кваліфікуються як легкі люди.
Помножте міжквартильний діапазон на 3. Додайте його до верхнього кватилію і відніміть його від нижнього кватилію. Будь-яка точка даних за межами цих значень надзвичайно чужа. Для набору прикладів 3 х 2 = 6; таким чином, 3 - 6 = –3 та 5 + 6 = 11. Отже, будь-яке значення менше –3 або більше 11 було б надзвичайно чужим. Це означає, що 15 кваліфікуються як екстремальний аутлер.