Зміст
Кластерний аналіз та факторний аналіз - два статистичні методи аналізу даних. Ці дві форми аналізу широко використовуються в природничих науках та науках про поведінку. Як кластерний аналіз, так і факторний аналіз дозволяють користувачеві групувати частини даних у "кластери" або на "фактори", залежно від типу аналізу. Деякі дослідники, що знають про методи кластерного та факторного аналізу, можуть вважати, що ці два типи аналізу загалом схожі. Хоча кластерний аналіз та аналіз факторів здаються схожими на поверхні, вони різняться різними способами, включаючи загальні цілі та застосування.
Об'єктивна
Кластерний аналіз та аналіз факторів мають різні цілі. Звичайною метою факторного аналізу є пояснення співвідношення в наборі даних та співвідношення змінних між собою, тоді як мета кластерного аналізу - усунення неоднорідності в кожному наборі даних. У дусі кластерний аналіз є формою категоризації, тоді як факторний аналіз - це форма спрощення.
Складність
Складність - це одне питання, за яким факторний аналіз та аналіз кластерів відрізняються: розмір даних впливає на кожен аналіз по-різному. Зі збільшенням набору даних аналіз кластерів стає обчислювально нерозбірливим. Це вірно, оскільки кількість точок даних в кластерному аналізі безпосередньо пов'язана з кількістю можливих кластерних рішень. Наприклад, кількість способів поділу двадцяти об’єктів на 4 кластери однакового розміру становить понад 488 мільйонів. Це робить неможливими прямі обчислювальні методи, включаючи категорію методів, до яких належить факторний аналіз.
Рішення
Незважаючи на те, що рішення як факторного аналізу, так і проблем кластерного аналізу певною мірою є суб'єктивними, факторний аналіз дозволяє досліднику отримати «найкраще» рішення, в тому сенсі, що дослідник може оптимізувати певний аспект рішення (ортогональність, простота інтерпретація тощо). Це не так для кластерного аналізу, оскільки всі алгоритми, які могли б дати найкраще рішення кластерного аналізу, обчислювально неефективні. Отже, дослідники, що використовують кластерний аналіз, не можуть гарантувати оптимального рішення.
Програми
Факторний аналіз та аналіз кластерів відрізняються тим, як вони застосовуються до реальних даних. Оскільки факторний аналіз має можливість зменшити непростий набір змінних до набагато меншого набору факторів, він підходить для спрощення складних моделей. Факторний аналіз також має підтверджуюче використання, в якому дослідник може розробити набір гіпотез щодо взаємозв'язку змінних даних. Потім дослідник може запустити факторний аналіз на наборі даних, щоб підтвердити або спростувати ці гіпотези. Кластерний аналіз, з іншого боку, підходить для класифікації об'єктів за певними критеріями. Наприклад, дослідник може виміряти певні аспекти групи нововиявлених рослин і розмістити ці рослини у категоріях видів, використовуючи кластерний аналіз.