Зміст
Множинна регресія використовується для дослідження зв'язку між декількома незалежними змінними та залежною змінною. Хоча множинні регресійні моделі дозволяють аналізувати відносний вплив цих незалежних чи прогнозових змінних на залежну чи критерійну змінну, ці часто складні набори даних можуть призвести до помилкових висновків, якщо вони не аналізуються належним чином.
Приклади множинної регресії
Агент з нерухомості може використати багатократну регресію для аналізу вартості будинків. Наприклад, вона могла використовувати як незалежні змінні розміри будинків, їхній вік, кількість спалень, середню ціну житла в мікрорайоні та близькість до шкіл. Розмірковуючи їх у моделі множинної регресії, вона могла б використовувати ці фактори, щоб побачити їх співвідношення до цін на будинки як критерій змінної.
Іншим прикладом використання моделі множинної регресії може бути хтось із кадрових ресурсів, що визначає зарплату керівних посад - критеріальна змінна. Змінними прогнозами можуть бути стаж кожного керівника, середня кількість відпрацьованих годин, кількість керованих людей та бюджет управління менеджерів.
Переваги множинної регресії
Є два основні переваги аналізу даних за допомогою моделі множинної регресії. Перший - це можливість визначати відносний вплив однієї або декількох змінних предиктора на значення критерію. Агент з нерухомості міг би встановити, що розмір будинків та кількість спалень мають сильне співвідношення з ціною житла, тоді як близькість до шкіл взагалі не має кореляційного зв’язку або навіть негативного співвідношення, якщо це в першу чергу пенсія. громада.
Друга перевага - це можливість ідентифікувати інших людей або аномалії. Наприклад, переглядаючи дані, пов’язані із зарплатою керівництва, керівник управління персоналом міг виявити, що кількість відпрацьованих годин, розмір відділу та його бюджет мали сильне співвідношення із зарплатою, тоді як стаж цього не робив. Крім того, може бути, що всі перераховані значення прогнозів співвідносяться з кожною зарплатою, що перевіряється, за винятком одного менеджера, який переплачується порівняно з іншими.
Недоліки множинної регресії
Будь-який недолік використання моделі множинної регресії зазвичай зводиться до даних, що використовуються. Два приклади цього - використання неповних даних та хибний висновок, що кореляція є причиною.
Наприклад, переглядаючи ціну будинків, припустимо, агент з нерухомості розглянув лише 10 будинків, сім з яких були придбані молодими батьками. У цьому випадку взаємозв'язок між близькістю шкіл може змусити її вважати, що це вплине на ціну продажу всіх будинків, які продаються в громаді. Це ілюструє дефекти неповних даних. Якби вона використовувала більшу вибірку, вона могла б встановити, що із 100 проданих будинків лише десять відсотків цінностей будинків стосуються близькості до шкіл. Якби вона використовувала покупців у віці як прогнозовану цінність, вона могла б виявити, що молодші покупці готові платити більше за будинки в громаді, ніж старші покупці.
На прикладі зарплати керівництву, припустимо, був один абітурієнт, який мав менший бюджет, менший стаж роботи і з меншим кількістю персоналу для управління, але заробляв більше, ніж хто-небудь інший. Менеджер з персоналу може переглянути дані та зробити висновок, що ця особа переплачується. Однак цей висновок був би помилковим, якби він не брав до уваги, що цей менеджер керував веб-сайтом компаній та мав високо затребуваний набір навичок у безпеці мережі.