Будь-який набір даних, накопичений для статистичних цілей, наприклад, дані перепису США, містить інформацію, яка потребує підсумовування та агрегації. Перерахувати такі ознаки, наприклад, як індивідуальні доходи та розміри сім'ї, майже неможливо. Статистики використовують графіки розподілу частоти для відображення даних всебічно. Наприклад, гістограма ділить дані на інтервали класів і підраховує частоту, з якою трапляються всі члени, що належать до цього інтервалу класів.Хоча немає жорстких правил щодо обчислення розміру та кількості інтервалів класу, є деякі корисні загальноприйняті критерії.
Обчисліть діапазон даних, тобто різницю між найвищими та найнижчими точками даних. Наприклад, припустимо, що високооплачувана особа в США заробляє 30 мільярдів доларів на рік, а найнижча заробляє нуль. Діапазон дорівнює 30 - 0, що дорівнює 30 мільярдам доларів.
Визначте кількість класів за розміром вибірки. Як правило, п’ять-сім класів застосовують для розміру вибірки до 50, вісім-10 класів для розміру вибірки між 50 і 100, 10 - 15 класів для розміру вибірки між 100 і 250 та 15 - 20 класів для розміру вибірки більше 250.
Обчисліть інтервал класів за такою формулою: Інтервал класів = діапазон ÷ кількість класів. Якщо у прикладі розподілу доходу 15 класів доходу, напрацьовуйте 30 ÷ 15 = 2 мільярди доларів. Часто статистики ігнорують надзвичайно високі та низькі показники та зосереджуються на середніх частотах. З цієї причини розподіл доходу в США представлений меншими інтервалами в 10000 доларів США, а доходи перевищують певний показник, як правило, мільйон, зібрані разом за один класний інтервал.
Використовуйте свій розсуд при розрахунку інтервалу класу. Святий грааль такої графіки, як гістограма, - це передати релевантну інформацію змістовно і просто. Виберіть інтервали для занять, щоб донести інформацію, яку ви вважаєте гідною уваги читачів.