Зміст
Пошук сили зв’язку між двома змінними - важливий навик для вчених усіх типів. Якщо дві змінні співвідносяться між собою, це показує, що між ними існує зв’язок. Позитивна кореляція означає, що коли одна змінна збільшується, інша теж робить, а негативна кореляція означає, що коли одна змінна збільшується, інша зменшується. Кореляції не доказують причинно-наслідкову зв’язку, хоча можливо, що подальші тести виявлять причинно-наслідковий зв’язок між змінними. Коефіцієнт кореляції R показує міцність взаємозв'язку між двома змінними та позитивну чи негативну кореляцію.
TL; DR (Занадто довго; Не читав)
Виклик однієї змінної х і одна змінна у. Обчисліть значення R використовуючи формулу:
R = ÷ √ {}
Де н - ваш розмір вибірки.
Складіть таблицю своїх даних. Це повинно включати один стовпець для номера учасника, один стовпець для першої змінної (позначений міткою) х) та один стовпчик для другої змінної (позначений міткою) у). Наприклад, якщо ви хочете побачити, чи існує кореляція між висотою та розміром взуття, один стовпець ідентифікує кожну людину, яку ви вимірюєте, один стовпець відображатиме висоту кожної людини, а інший - розмір взуття. Зробіть три додаткові стовпчики, один для xy, один для х2 і один за у2.
Використовуйте свої дані для заповнення трьох додаткових стовпців. Наприклад, уявіть, що ваша перша людина має висоту 75 дюймів і має розмір 12 футів. The х (висота) стовпець буде 75, а у (розмір взуття) відображатиметься 12. Вам потрібно знайти xy, х2 і у2. Отже, використовуючи цей приклад:
xy = 75 × 12 = 900
х2 = 752 = 5,625
у2 = 122 = 144
Проведіть ці розрахунки для кожної людини, для якої у вас є дані.
Створіть новий рядок у нижній частині таблиці для підсумків кожного стовпця. Додайте разом усі х значення, всі у значення, всі xy значення, всі х2 Значення та все у2 значень, а потім помістіть результати внизу відповідного стовпця у новому рядку. Ви можете позначити новий рядок «сумою» або використовувати символ sigma (Σ).
Ви знайдете R з ваших даних за формулою:
R = ÷ √ {}
Це виглядає трохи непросто, тож ви можете розділити його на дві частини, які ми назвемо с і т.
s = n (Σxy) - (Σx) (Σy)
t = √ {}
У цих рівняннях н - кількість учасників (розмір вибірки). Решта частин рівняння - це суми, які ви обчислили на останньому кроці. Так для с, помножте розмір вашого зразка на суму xy стовпця, а потім віднімаємо суму х стовпчик, помножений на суму у стовпчик з цього.
Для т, є чотири основні етапи. Спочатку порахуйте н помножене на суму вашого х2 , а потім відніміть суму вашої х стовпець у квадраті (помножений на себе) від цього значення. По-друге, зробіть точно те саме, але з сумою у2 стовпця та суму у стовпчик квадратний на місці х частини (тобто n × Σy2 -). По-третє, помножте ці два результати (для хз і уз) разом. По-четверте, візьміть квадратний корінь цієї відповіді.
Якщо ви працювали по частинах, ви можете розрахувати R як просто R = s ÷ t. Ви отримаєте відповідь між -1 та 1. Позитивна відповідь показує позитивну кореляцію, і все, що перевищує 0,7, як правило, вважається міцним зв’язком. Негативна відповідь показує негативну кореляцію, і все, що перевищує 0,7, вважається сильним негативним зв’язком. Аналогічно ± 0,5 вважається помірною залежністю, а ± 0,3 вважається слабкою. Все, що є близьким до 0, свідчить про відсутність кореляції.