Недоліки лінійної регресії

Posted on
Автор: Peter Berry
Дата Створення: 19 Серпень 2021
Дата Оновлення: 12 Травень 2024
Anonim
Парная регрессия: линейная зависимость
Відеоролик: Парная регрессия: линейная зависимость

Зміст

Лінійна регресія - це статистичний метод дослідження зв’язку між залежною змінною, позначається як у, і одна або більше незалежних змінних, позначених як х. Залежна змінна повинна бути безперервною, оскільки вона може приймати будь-яке значення або принаймні близьке до безперервної. Незалежні змінні можуть бути будь-якого типу. Хоча лінійна регресія сама по собі не може виявити причинну причину, на залежну змінну зазвичай впливають незалежні змінні.

Лінійна регресія обмежена лінійними відносинами

За своєю природою лінійна регресія розглядає лише лінійні зв’язки між залежними та незалежними змінними. Тобто передбачається, що між ними існує прямолінійний зв’язок. Іноді це неправильно. Наприклад, взаємозв'язок між доходом і віком викривлений, тобто дохід має тенденцію до зростання в ранніх частинах дорослого життя, вирівнюється в подальшому дорослому віці і знижується після виходу на пенсію. Ви можете сказати, чи це проблема, переглянувши графічні зображення стосунків.

Лінійна регресія дивиться лише на середнє значення залежної змінної

Лінійна регресія розглядає залежність між середнім значенням залежної змінної та незалежними змінними. Наприклад, якщо подивитися на взаємозв'язок ваги народження немовлят та материнських особливостей, таких як вік, лінійна регресія буде розглядати середню вагу немовлят, народжених матерями різного віку. Однак іноді потрібно дивитись на крайності залежної змінної, наприклад, немовлята піддаються ризику, коли їх вага є низьким, тому ви хочете подивитися на крайнощі в цьому прикладі.

Так само як середнє значення не є повним описом однієї змінної, лінійна регресія не є повним описом зв'язків між змінними. Ви можете вирішити цю проблему, використовуючи квантильну регресію.

Лінійна регресія чутлива до людей, що переживають люди

Активісти - це дані, які дивують. Аутлієри можуть бути одноваріантними (на основі однієї змінної) або багатоваріантними. Якщо ви дивитесь на вік і дохід, одноманітні люди, що перебувають у віці, будуть такими, як людина, якій 118 років, або людина, яка за минулий рік заробила 12 мільйонів доларів. Багатоваріантним екслієром буде 18-річний, який заробив 200 000 доларів. У цьому випадку ні вік, ні дохід не є надзвичайно екстремальними, але дуже мало 18-річних людей заробляють стільки грошей.

Активні люди можуть мати величезний вплив на регресію. Ви можете вирішити цю проблему, запитуючи статистичні дані про вплив зі свого статистичного програмного забезпечення.

Дані повинні бути незалежними

Лінійна регресія передбачає, що дані незалежні. Це означає, що оцінки одного предмета (наприклад, людини) не мають нічого спільного з оцінкою іншого. Це часто, але не завжди, розумно. Два поширених випадки, коли це не має сенсу - це групування у просторі та часі.

Класичний приклад кластеризації в просторі - це результати тестів учнів, коли у вас є учні різних класів, класів, шкіл та шкільних районів. Учні одного класу, як правило, багато в чому схожі, тобто вони часто походять з одних і тих же мікрорайонів, мають однакових вчителів і т. Д. Таким чином, вони не є незалежними.

Прикладами кластеризації в часі є будь-які дослідження, де ви вимірюєте одні і ті ж предмети кілька разів. Наприклад, під час вивчення дієти та ваги ви можете виміряти кожну людину кілька разів. Ці дані не є незалежними, оскільки те, що людина зважує в один раз, пов'язане з тим, що він зважує в інших випадках. Один із способів впоратися з цим - це багаторівневі моделі.