Зміст
Коли ви проводите експеримент, який дає ряд спостережуваних значень, які ви хочете порівняти з теоретичними значеннями, то середньоквадратичне відхилення (RMSD) або середньоквадратична помилка (RMSE) дозволяє кількісно оцінити це порівняння. Ви обчислюєте RMSD, знаходячи квадратний корінь середньої квадратичної помилки.
Формула RMSD
Для серії спостережень ви обчислюєте середню квадратичну помилку, знаходячи різницю між кожним експериментальним чи спостережуваним значенням та теоретичним чи передбачуваним значенням, порівнюючи кожну різницю, додаючи їх і діливши їх на кількість спостережуваних значень чи передбачуваних значень .
Це робить формулу RMSD:
{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}для хе очікувані значення, хо спостережувані значення та н загальна кількість значень.
Цей метод знаходження різниці (або відхилення), розподілення кожної різниці, підсумовування їх та ділення на кількість точок даних (як це було б при знаходженні середнього набору даних), а потім взяття квадратного кореня результату: що дає величині свою назву, "середньоквадратичне відхилення". Ви можете скористатися таким покроковим підходом, щоб обчислити RMSD в Excel, що чудово підходить для великих наборів даних.
Стандартне відхилення
Стандартне відхилення вимірює, наскільки набір даних змінюється в собі. Ви можете обчислити його, використовуючи (Σ (х - μ)2 / н)1/2 для кожного значення х для н значення з μ ("mu") середній. Зауважте, що це та сама формула для RMSD, але замість очікуваних та спостережуваних значень даних ви використовуєте саме значення даних та середнє значення для набору даних відповідно. Використовуючи цей опис, ви можете порівняти середньоквадратичну помилку кореня та стандартне відхилення.
Це означає, що, хоча вона має формулу, схожу на RMSD, стандартне відхилення вимірює специфічний гіпотетичний експериментальний сценарій, в якому очікувані значення - це усе середнє значення набору даних.
У цьому гіпотетичному сценарії величина всередині квадратного кореня (Σ (х - μ)2 / н) називається дисперсія, як розподіляються дані навколо середнього. Визначення дисперсії дозволяє порівняти набір даних із конкретними розподілами, які, як ви очікували, отримаєте, грунтуючись на попередніх знаннях.
Що вам каже RMSD
RMSD дає конкретний, уніфікований спосіб визначення, наскільки помилки, наскільки прогнозовані значення відрізняються від спостережуваних значень для експериментів. Чим нижчий показник RMSD, тим точнішими є експериментальні результати до теоретичних прогнозів. Вони дозволяють кількісно визначити, як різні джерела помилок впливають на спостережувані експериментальні результати, наприклад, опір повітря, що впливає на коливання маятника або поверхневий натяг між рідиною та її ємністю, не даючи їй текти.
Ви також можете переконатися, що RMSD відображає діапазон набору даних, поділяючи його на різницю між максимальним спостережуваним експериментальним значенням і мінімальним для отримання нормалізоване середньоквадратичне відхилення або помилка.
У галузі молекулярного стикування, в якій дослідники порівнюють теоретично створену комп'ютером структуру біомолекул з тією, що отримана в результаті експериментів, RMSD може виміряти, наскільки тісно експериментальні результати відображають теоретичні моделі. Чим більше експериментальних результатів здатне відтворити те, що прогнозують теоретичні моделі, тим нижчий показник RMSD.
RMSD в практичних налаштуваннях
Окрім прикладу стикування молекулярних сполук, метеорологи використовують RMSD для визначення того, наскільки тісно математичні моделі клімату прогнозують атмосферні явища. Біоінформатики, вчені, які вивчають біологію за допомогою комп'ютерних засобів, визначають, як відстані між атомними положеннями білкових молекул змінюються від середньої відстані цих атомів у білках, використовуючи RMSD як міру точності.
Економісти використовують RMSD, щоб визначити, наскільки тісно економічні моделі відповідають розміреним або спостережуваним результатам економічної діяльності. Психологи використовують RMSD для порівняння спостережуваної поведінки психологічних чи психологічних явищ із обчислювальними моделями.
Нейрологи використовують його для визначення того, як системи, засновані на штучній чи біологічній основі, можуть вчитися в порівнянні з моделями навчання. Комп'ютерні вчені, що вивчають зображення та зір, порівнюють ефективність того, наскільки модель може реконструювати зображення до оригінальних зображень різними методами.