Зміст
Підбираючи пряму лінію до набору даних, вам може бути цікаво визначити, наскільки отримана лінія відповідає даним. Один із способів зробити це - обчислити суму помилок квадратів (SSE). Це значення забезпечує міру того, наскільки найкраще наближається рядок до набору даних. SSE є важливим для аналізу експериментальних даних і визначається лише за допомогою декількох коротких кроків.
Знайдіть рядок, який найкраще підходить для моделювання даних за допомогою регресії. Лінія, що найкраще підходить, має вигляд y = ax + b, де a і b - параметри, які потрібно визначити. Визначити ці параметри можна за допомогою простого лінійного регресійного аналізу. Наприклад, припустимо, що лінія найкращого розміру має вигляд y = 0,8x + 7.
Використовуйте рівняння, щоб визначити значення кожного y-значення, передбачене лінією, що найкраще відповідає. Це можна зробити, замінивши кожне значення x в рівняння рядка. Наприклад, якщо x дорівнює 1, заміщення цього в рівняння y = 0,8x + 7 дає 7,8 для значення y.
Визначте середнє значення, передбачене за допомогою рівняння найкращого рівняння. Це можна зробити, підсумовуючи всі y-значення, передбачені рівняннями, і діливши отримане число на число значень. Наприклад, якщо значення дорівнюють 7,8, 8,6 і 9,4, то підсумовування цих значень дає 25,8, а ділення цього числа на кількість значень 3 у цьому випадку дає 8,6.
Відняти кожне з окремих значень від середнього значення і квадратне число, що отримане. У нашому прикладі, якщо відняти значення 7,8 від середнього 8,6, отримане число дорівнює 0,8. Підрівнювання цього значення дає 0,64.
Підсумовуйте всі значення у квадраті за кроком 4. Якщо застосувати вказівки на кроці 4 до всіх трьох значень у нашому прикладі, ви знайдете значення 0,64, 0 та 0,64. Підсумовування цих значень дає 1,28. Це сума помилок квадратів.