Как найти среднеквадратическое отклонение

Воскресенье, 6 ноября, 2016

В данной статье я расскажу о том, как найти среднеквадратическое отклонение. Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом \sigma (греческая буква «сигма»).

Формула для расчета \sigma довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Порода собаки Рост в миллиметрах
Ротвейлер 600
Бульдог 470
Такса 170
Пудель 430
Мопс 300

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение. Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее  =\frac{600+470+170+430+300}{5} = 394 мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего:

    \[ \begin{array}{l} 1: 600-394 = 206 \\ 2: 470-394 = 76 \\ 3: 170-394 = -224\\ 4: 430-394 = 36\\ 5: 300-394 = -94 \end{array} \]

Наконец, чтобы вычислить дисперсию, каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Дисперсия = \frac{206^2+76^2+(-224)^2+36^2+(-94)^2}{5} = 21704 мм2.

Таким образом, дисперсия составляет 21704 мм2.

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

\sigma = \sqrt{21704} \approx 147 мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть N значений, то:

  • Когда мы имеем дело с генеральной совокупностью при вычислении дисперсии, мы делим на N (как и было сделано в рассмотренном нами примере).
  • Когда мы имеем дело с выборкой, при вычислении дисперсии делим на N-1.

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = \frac{108520}{4}=27130 мм2.

При этом стандартное отклонение по выборке равно \sqrt{27130} = 165 мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

\frac{4+4-4-4}{4}=0.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

\frac{4+4+|-4|+|-4|}{4} = \frac{4+4+4+4}{4}=4.

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

\frac{7+1+|-6|+|-2|}{4} = \frac{7+1+6+2}{4}=4.

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

\sqrt{\frac{4^2+4^2+(-4)^2+(-4)^2}{4}}=4.

Для второго примера получится:

\sqrt{\frac{7^2+1^2+(-6)^2+(-2)^2}{4}}=4.74.

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал репетитор по математике в Москве, Сергей Валерьевич

Комментарии

  1. Наталья:

    Спасибо большое! все очень понятно.

  2. Аноним:

    Благодарю! Все ясно.

  3. Аноним:

    Прекрасное объяснение!

  4. Женя:

    Супер! Спасибо

  5. СНВ:

    Доступно даже для жертв ебнепутинского образования.)) Спасибо.

    1. Аноним:

      В какой школе Вы учились?

  6. Асима:

    Прошла много ссылок, но только здесь нашла доступное объяснение

  7. Наталья:

    Большое спасибо! Нигде еще не встречала такого разъяснения. Как в школе: все разжевали, осталось только в рот положить!

  8. Аноним:

    Большое спасибо!

  9. андрей:

    Благодарю, а то постоянно забываю как это считать( ну оно и логично, потому что редко это требуется).

  10. Аноним:

    чотка) аж голова заболела от этих цифр)))))))

  11. аноним:

    спасибо

  12. Виктория:

    Благодарю за логичные и последовательные объяснения. Корректно ли использовать среднеквадратическое отклонение, если нужно разделить весь обьем данных на 3 группы (низкие, средние, высокие показатели)? В примере с собаками: выделить группу низких, собак среднего роста и высоких?

    1. Амир:

      ранжирование
      например в excel есть такая функция
      РАНГ(число; ссылка; [порядок])
      Возвращает ранг числа в списке чисел: его порядковый номер относительно других чисел в списке.

      1. Александр:

        Причем тут ранжирование? Ранжирование относится к порядковой шкале. С числами этой шкалы нельзя производить арифметические действия (складывать, вычитать, умножать, делить), выводить среднеарифметические значения. С помощью шкал порядка можно измерять качественные, не имеющие строгой коли-чественной меры, показатели.

    2. Александр:

      В этом случае Вы делите всех собак на три группы, устанавливая (произвольно) граничные значения. Например, собаки ростом до 30 см, 31- 50 см, 51 см и выше. Далее определяете среднее квадратическое отклонение по каждой группе.

  13. Юрий:

    Спасибо!! Вы талант!!! Четко, по делу, без воды, с прекрасными примерами!!!

  14. Den:

    очень понятно, спасибо

  15. Аноним:

    Спасибо!!!

  16. Людмила:

    Большое спасибо. Все понятно

  17. Михаил:

    Молодец! Все просто и доходчиво, подкреплено примерами.

  18. Надежда:

    Все гениальное просто! Спасибо!

  19. Галина:

    Спасибо, очень доходчиво и понятно!

  20. Екатерина:

    Спасибо, с Вашим объяснением все понятно

  21. Сергей:

    Спасибо за подробное объяснение. То что надо отупевшему за много лет после школы человеку.

  22. Дядя Миша:

    Никогда не думал что мне на старости лет понадобится статистика. Спасибо, все очень понятно!

  23. Виктор:

    мне 85 лет, внук учится в 8 кл. он не мог понять сути
    формулы определения стандартного отклонения. Благодаря Вам мы поняли. Большое спасибо за то, что так доступно объяснили!

  24. татьяна:

    Спасибо!

  25. Аноним:

    Огромное спасибо, очень доступно

  26. Анна:

    Большое спасибо. Доступное объяснение и понятный пример.

  27. Диман:

    Спасибо Вам!

  28. Игорь:

    Спасибо, самое доступное объяснение из всех, которые мне встречались на просторах интернета!

  29. владимир:

    согласен спасибо

  30. таня:

    Большое спасибо !

  31. Аноним:

    Большое спасибо! Все очень доступно!

  32. Сергей:

    Спасибо! Я всегда подозревал, что ротвейлер и такса — ненормальные собаки) Теперь это доказано математически

  33. Юрий:

    Я, как всегда, тупица и задаю самые дурацкие вопросы, но по-моему, в Вашем примере должно быть:
    (7+1+(-6)+(-2))/4 = 0, а у Вас = 4
    Извините, что записал в строку, но я думаю, все поняли, о чем я. Разумеется, Вы все равно правы!
    У меня вопрос, а сколько будет в выражении:
    20 — 18±3 = 2±?
    Именно так, поскольку 20 — это теоретическое значение, в 18±3 измеренное с ошибкой, а нужно получить их разность.

  34. Дмитрий:

    Дисперсия = \frac{206^2+76^2+(-224)^2+36^2+(-94)^2}{5} = 21704 мм2
    у меня дисперсия получилась -1900,8 мм2

Добавить комментарий для Александр Cancel reply