Як інтерпретувати графік розсіювання

Posted on
Автор: Randy Alexander
Дата Створення: 2 Квітень 2021
Дата Оновлення: 1 Травень 2024
Anonim
Урок 7. Диаграммы в Excel для начинающих
Відеоролик: Урок 7. Диаграммы в Excel для начинающих

Діаграма розсіяння є важливим діагностичним інструментом в арсеналі статистиків, отриманим шляхом графіки двох змінних один проти одного. Це дозволяє статистику оглядати змінні та формувати робочу гіпотезу про їх взаємозв'язок. З цієї причини його зазвичай малюють перед проведенням регресійного аналізу. Згодом статистик перевіряє гіпотезу за допомогою регресійного аналізу та визначає ознаку та точну величину зв'язку. Крім того, графік розкидання допомагає виявити залишків - значення, які ненормально віддалені від більшості даних у вибірці. Усунення інших людей допомагає вдосконалити регресійну модель.

    Перевірте наявність негативних зв’язків між двома змінними на графіку розсіювання. Якщо низькі значення першої змінної відповідають високим значенням другої змінної, існує негативна кореляція. У цьому випадку лінія, проведена через точки даних, має від'ємний нахил.

    Вивчіть графік розсіювання на предмет позитивного зв’язку між змінними. Якщо низькі значення першої змінної в графіці розсіювання відповідають низьким значенням другої, а високі значення першої аналогічно відповідають високим значенням другої, змінні мають позитивну кореляцію. У цьому випадку лінія, проведена через точки даних, має позитивний нахил.

    Перевірте графік розсіювання на відсутність зв’язку між змінними. Якщо точки даних на графіці розсіяння розподіляються випадковим чином, не маючи явної залежності між ними, вони не мають кореляції, або невеликої, статистично незначної кореляції. У цьому випадку лінія, проведена через точки даних, горизонтальна з нахилом, рівним нулю.

    Встановіть лінію через точки даних і вивчіть її форму, щоб оцінити характер взаємозв'язку між двома змінними. Пряма лінія трактується як лінійне відношення, вигнута форма передбачає квадратичне відношення, а лінія, що лежить відносно плоскою перед тим, як раптом стріляти вгору або вниз, трактується як експоненціальна залежність.

    Вивчіть графік розсіювання для інших людей, значень, які лежать ненормально далеко від кластера точок даних. Аутлієри спотворюють зв'язок між змінними. Усуньте їх, але лише в тому випадку, якщо їх відсутність не впливає на аналіз взаємозв'язку між двома змінними.