Кореляція між двома змінними описує ймовірність того, що зміна однієї змінної спричинить пропорційну зміну іншої змінної. Висока кореляція між двома змінними дозволяє припустити, що вони поділяють загальну причину або зміна однієї зі змінних безпосередньо відповідає за зміну іншої змінної. Значення Pearsons r використовується для кількісної оцінки кореляції між двома дискретними змінними.
Позначте змінну, яку, на вашу думку, викликає зміна іншої змінної як x (незалежна змінна) та інша змінна y (залежна змінна).
Побудуйте таблицю з п'ятьма стовпцями та стільки ж рядків, скільки є точок даних для x та y. Позначте стовпчики А-Е зліва направо.
Заповніть у кожному рядку наступні значення для кожної (x, y) точки даних у першому стовпчику - значення x у колонці A, значення x у колонці B, значення y у стовпці C, значення y y квадрата у колонці D, а значення x разів y у стовпці E.
Складіть підсумковий рядок в самому дні таблиці і поставте суму всіх значень кожного стовпця у відповідну комірку.
Обчисліть добуток кінцевих комірок у стовпцях A і C.
Помножте кінцеву комірку у стовпці Е на кількість точок даних.
Відніміть значення, отримане на етапі 5, від значення, отриманого на етапі 6, і підкресліть відповідь.
Помножте кінцеву комірку стовпця В на кількість точок даних. Відніміть із цього значення квадрат значення кінцевої комірки стовпця А.
Помножте кінцеву комірку стовпця D на кількість точок даних і відніміть квадрат значення кінцевої комірки стовпця С.
Помножте значення, знайдені на етапі 8 і 9 разом, а потім візьміть квадратний корінь результату.
Розділіть значення, отримане на етапі 7 (його слід підкреслити) на значення, отримане на кроці 10. Це Пірсонс r, також відомий як коефіцієнт кореляції. Якщо r близький до 1, існує сильна позитивна кореляція. Якщо r близький до -1, існує сильна негативна кореляція. Якщо r близький до 0, існує слабка кореляція.