Среднеквадратичное отклонение выборки. Показатели вариации

Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является среднее квадратичес­кое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень ко­леблемости данного ряда выше.

Методика расчета среднего квадратического отклонения включает следующие этапы:

1. Находят среднюю арифметическую величину (Μ).

2. Определяют отклонения отдельных вариант от средней арифмети­ческой (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю.

3. Возводят каждое отклонение в квадрат d 2 .

4. Перемножают квадраты отклонений на соответствующие частоты d 2 *p.

5. Находят сумму произведений å(d 2 *p)

6. Вычисляют среднее квадратическое отклонение по формуле:

При n больше 30,или при n меньше либо равно 30, где n - число всех вариант.

Значение среднего квадратичного отклонения:

1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.

2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.

Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.

Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.



Установлено, что при нормальном распределении признака:

68,3% значений вариант находится в пределах М±1s

95,5% значений вариант находится в пределах М±2s

99,7% значений вариант находится в пределах М±3s

3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М±1s обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1s указывает на отклонение изучаемого параметра от нормы.

4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды

5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.

Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

Коэффициент вариации вычисляется по формуле:

Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

Среднеквадрати́ческое отклоне́ние (синонимы: среднее квадрати́ческое отклоне́ние , среднеквадрати́чное отклоне́ние , квадрати́чное отклоне́ние ; близкие термины: станда́ртное отклоне́ние , станда́ртный разбро́с ) - в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания . При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическое совокупности выборок.

Энциклопедичный YouTube

  • 1 / 5

    Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического , при построении доверительных интервалов , при статистической проверке гипотез , при измерении линейной взаимосвязи между случайными величинами. Определяется как квадратный корень из дисперсии случайной величины .

    Среднеквадратическое отклонение:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; {\displaystyle s={\sqrt {{\frac {n}{n-1}}\sigma ^{2}}}={\sqrt {{\frac {1}{n-1}}\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}};}
    • Примечание: Очень часто встречаются разночтения в названиях СКО (Среднеквадратического отклонения) и СТО (Стандартного отклонения) с их формулами. Например, в модуле numPy языка программирования Python функция std() описывается как "standart deviation", в то время как формула отражает СКО (деление на корень из выборки). В Excel же функция СТАНДОТКЛОН() другая (деление на корень из n-1).

    Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии) s {\displaystyle s} :

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . {\displaystyle \sigma ={\sqrt {{\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}}.}

    где σ 2 {\displaystyle \sigma ^{2}} - дисперсия ; x i {\displaystyle x_{i}} - i -й элемент выборки; n {\displaystyle n} - объём выборки; - среднее арифметическое выборки:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}(x_{1}+\ldots +x_{n}).}

    Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной .

    В соответствии с ГОСТ Р 8.736-2011 среднеквадратическое отклонение считается по второй формуле данного раздела. Пожалуйста, сверьте результаты.

    Правило трёх сигм

    Правило трёх сигм ( 3 σ {\displaystyle 3\sigma } ) - практически все значения нормально распределённой случайной величины лежат в интервале (x ¯ − 3 σ ; x ¯ + 3 σ) {\displaystyle \left({\bar {x}}-3\sigma ;{\bar {x}}+3\sigma \right)} . Более строго - приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина x ¯ {\displaystyle {\bar {x}}} истинная, а не полученная в результате обработки выборки).

    Если же истинная величина x ¯ {\displaystyle {\bar {x}}} неизвестна, то следует пользоваться не σ {\displaystyle \sigma } , а s . Таким образом, правило трёх сигм преобразуется в правило трёх s .

    Интерпретация величины среднеквадратического отклонения

    Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

    Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения - значения внутри множества сильно расходятся со средним значением.

    В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить. отождествляется с риском портфеля.

    Климат

    Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой на равнине. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

    Спорт

    Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

    Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

  • 6. План статистического исследования, его содержание. 7. Программа статистического исследования, ее содержание.
  • 8. Статистическая совокупность, ее групповые свойства, виды. Требования к выборочной совокупности.
  • 25. Статистические таблицы, их виды и требования, предъявляемые к ним.
  • 9. Сбор статистического материала.
  • 10. Основные операции разработки статистического материала.
  • 11. Анализ результатов статистического исследования.
  • 12. Внедрение результатов статистического исследования в практику
  • 13. Абсолютные величины, их применение в здравоохранении.
  • 14. Относительные величины, их применение в анализе деятельности
  • 15. Вариационные ряды, их виды, значение. 16. Величины, характеризующие вариационный ряд.
  • 17. Методы расчета средних величин, значение.
  • 18. Среднее квадратическое отклонение, методика расчета, значение.
  • 19. Ошибка репрезентативности средних величин, методика расчета, значение. 20. Ошибка репрезентативности относительных величин, методика расчета, значение.
  • 21. Оценка достоверности разности статистических величин.
  • 23. Понятие о корреляционном анализе.
  • 24. Графические изображения результатов статистического исследования, виды.
  • 26. Динамические ряды, показатели, вычисление и применение в медицине.
  • 27. Общественное здоровье населения, показатели, значение. 28. Факторы, влияющие на здоровье населения. Формула здоровья.
  • 29. Разделы демографии, её значение для здравоохранения.
  • 30. Статика населения, показатели, их значение. 31. Возрастная структура населения, типы, социальное значение.
  • 33. Динамика населения, виды, показатели, медико-социальное значение.
  • 34. Естественное движение населения, показатели, закономерности, медико-социальное значение.
  • 35. Рождаемость, уровни, методика расчета, анализ и медико-социальные аспекты ее регулирования.
  • 36. Смертность населения, показатели, уровни, методика расчета, анализ и медико-социальное значение.
  • 37. Младенческая смертность, причины, возрастные особенности, методика расчета.
  • 38. Перинатальная смертность, методика расчета, уровни, структура, причины, медико-социальное значение.
  • 40. Воспроизводство населения, типы, показатели, методика расчета.
  • 42. Заболеваемость, показатели, структура, методы изучения.
  • 43. Международная статистическая классификация болезней и проблем, связанных со здоровьем, значение, принципы построения.
  • 3) Заболевания у госпитализированных больных
  • 4) Заболевания с временной утратой трудоспособности (см. Вопрос 58).
  • 45. Заболеваемость с временной утратой трудоспособности, причины, показатели. 46. Изучение заболеваемости с временной утратой трудоспособности.Полицевой учет заболеваемости.
  • 47. Профилактические медицинские осмотры, виды, порядок проведения, документы.
  • 48. Изучение заболеваемости по обращаемости за медицинской помощью.
  • 51. Физическое развитие, методика изучения, медико-социальное значение.
  • 52. Инвалидность населения, причины, показатели, медико-социальное значение. 102. Инвалидность, порядок установления и документы оформления.
  • 54. Болезни системы кровообращения, их медико-социальная значимость и обусловленность. Организация кардиологической службы. Первичная профилактика.
  • 55. Новообразования, их медико-социальная значимость и обусловленность. Организация онкологической службы. Первичная профилактика.
  • 59. Психические расстройства, их медико-социальная значимость и обусловленность. Организация психоневрологической помощи. Первичная профилактика.
  • 60. Алкоголизм и наркомания, их медико-социальная значимость и обусловленность. Организация наркологической помощи. Первичнаяпрофилактика.
  • 61. Принципы государственной политики Республики Беларусь в области здравоохранения.
  • 62. Виды, формы, условия медицинской помощи.
  • 63. Первичная медицинская помощь, принципы, организационная структура, значение, перспективы развития.
  • 65. Регистратура, ее функции. Формы записи на прием к врачу.
  • 68. Врач общей практики, функции, содержание работы, особенности втэ.
  • 76. Приемное отделение, задачи, организационная структура.
  • 80. Стационарзамещающие технологии, виды, принципы работы, значение
  • 103. Медико-реабилитационная экспертная комиссия, ее состав и функции.
  • 104. Медицинская, социальная и трудовая реабилитация инвалидов.
  • II этап – территориальное медицинское объединение (тмо).
  • III этап – областная больница и медицинские учреждения области.
  • 109. Профилактика – важнейший принцип здравоохранения, ее формы и уровни.
  • 113. Здоровый образ жизни, его компоненты, медико-социальное значение. 114. Формирование здорового образа жизни, направления.
  • 115. Методы и средства гигиенического воспитания и обучения населения. 116. Характеристика методов гигиенического воспитания, преимущества и недостатки.
  • 117. Охрана материнства и детства, ее социальное значение, государственные мероприятия в рб.
  • 122. Детская больница, особенности госпитализации, структуры и организация работы. 123. Анализ деятельности детской больницы.
  • 124. Женская консультация, ее структура, задачи и организация работы. 125. Основная медицинская документация и показатели работы женской консультации.
  • 126. Родильный дом, структура, организация приема беременных, рожениц и родильниц. 127. Основная медицинская документация и показатели работы родильного дома.
  • 18. Среднее квадратическое отклонение, методика расчета, значение.

    Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является среднее квадратичес­кое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень ко­леблемости данного ряда выше.

    Методика расчета среднего квадратического отклонения включает следующие этапы:

    1. Находят среднюю арифметическую величину (Μ).

    2. Определяют отклонения отдельных вариант от средней арифмети­ческой (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю.

    3. Возводят каждое отклонение в квадрат d 2 .

    4. Перемножают квадраты отклонений на соответствующие частоты d 2 *p.

    5. Находят сумму произведений (d 2 *p)

    6. Вычисляют среднее квадратическое отклонение по формуле:

    при n больше 30, или при n меньше либо равно 30, где n - число всех вариант.

    Значение среднего квадратичного отклонения:

    1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.

    2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.

    Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.

    Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.

    Установлено, что при нормальном распределении признака:

    68,3% значений вариант находится в пределах М1

    95,5% значений вариант находится в пределах М2

    99,7% значений вариант находится в пределах М3

    3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М1 обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1 указывает на отклонение изучаемого параметра от нормы.

    4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды

    5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.

    Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

    Коэффициент вариации вычисляется по формуле:

    Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

    "

    Основными критериями разнообразия признака в статистической совокупности являются: лимит, амплитуда, среднее квадратическое отклонение, коэффициент осцилляции и коэффициент вариации. На предыдущем занятии обсуждалось, что средние величины дают лишь обобщающую характеристику изучаемого признака в совокупности и не учитывают значения отдельных его вариант: минимальное и максимальное значения, выше среднего, ниже среднего и т.д.

    Пример. Средние величины двух разных числовых последовательностей: -100; -20; 100; 20 и 0,1; -0,2; 0,1 абсолютно одинаковы и равны О. Однако, диапазоны разброса данных этих последовательностей относительного среднего значения сильно различны.

    Определение перечисленных критериев разнообразия признака прежде всего осуществляется с учетом его значения у отдельных элементов статистической совокупности.

    Показатели измерения вариации признака бывают абсолютные и относительные . К абсолютным показателям вариации относят: размах вариации, лимит, среднее квадратическое отклонение, дисперсию. Коэффициент вариации и коэффициент осцилляции относятся к относительным показателям вариации.

    Лимит (lim)– это критерий, который определяется крайними значениями вариант в вариационном ряду. Другими словами, данный критерий ограничивается минимальной и максимальной величинами признака:

    Амплитуда (Am) или размах вариации – это разность крайних вариант. Расчет данного критерия осуществляется путем вычитания из максимального значения признака его минимального значения, что позволяет оценить степень разброса вариант:

    Недостатком лимита и амплитуды как критериев вариабельности является то, что они полностью зависят от крайних значений признака в вариационном ряду. При этом не учитываются колебания значений признака внутри ряда.

    Наиболее полную характеристику разнообразия признака в статистической совокупности дает среднее квадратическое отклонение (сигма), которое является общей мерой отклонения вариант от своей средней величины. Среднее квадратическое отклонение часто называют также стандартным отклонением .

    В основе среднего квадратического отклонения лежит сопоставление каждой варианты со средней арифметической данной совокупности. Так как в совокупности всегда будут варианты как меньше, так и больше, чем она, то сумма отклонений , имеющих знак "", будет погашаться суммой отклонений, имеющих знак "", т.е. сумма всех отклонений равна нулю. Для того, чтобы избежать влияния знаков разностей берут отклонения вариант от среднего арифметического в квадрате, т.е. . Сумма квадратов отклонений не равняется нулю. Чтобы получить коэффициент, способный измерить изменчивость, берут среднее от суммы квадратов – это величина носит название дисперсии:

    По смыслу, дисперсия – это средний квадрат отклонений индивидуальных значений признака от его средней величины. Дисперсия квадрат среднего квадратического отклонения .

    Дисперсия является размерной величиной (именованной). Так, если варианты числового ряда выражены в метрах, то дисперсия дает квадратные метры; если варианты выражены в килограммах, то дисперсия дает квадрат этой меры (кг 2), и т.д.

    Среднее квадратическое отклонение – квадратный корень из дисперсии:

    В том случае, если число элементов совокупности , то при расчете дисперсии и среднего квадратического отклонения в знаменателе дроби вместо необходимо ставить .

    Расчет среднего квадратического отклонения можно разбить на шесть этапов, которые необходимо осуществить в определенной последовательности:

    Применение среднеквадратического отклонения:

    а) для суждения о колеблемости вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков.

    б) для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила «трех сигм» . В интервале (М±3σ) находится 99,7% всех вариант ряда, в интервале (М±2σ) - 95,5% и в интервале (М±1σ) - 68,3% вариант ряда (рис.1).

    в) для выявления «выскакивающих» вариант

    г) для определения параметров нормы и патологии с помощью сигмальных оценок

    д) для расчета коэффициента вариации

    е) для расчета средней ошибки средней арифметической величины.

    Для характеристики любой генеральной совокупности, имеющей нормальный тип распределения , достаточно знать два параметра: среднюю арифметическую и среднее квадратическое отклонение.

    Рисунок 1. Правило «трех сигм»

    Пример.

    В педиатрии среднеквадратическое отклонение используется для оценки физического развития детей путем сравнения данных конкретного ребенка с соответствующими стандартными показателями. За стандарт принимаются средние арифметические показатели физического развития здоровых детей. Сравнение показателей со стандартами проводят по специальным таблицам, в которых стандарты приводятся вместе с соответствующими им сигмальными шкалами. Считается, что если показатель физического развития ребенка находится в пределах стандарт (среднее арифметическое) ±σ, то физическое развитие ребенка (по этому показателю) соответствует норме. Если показатель находится в пределах стандарт ±2σ, то имеется незначительное отклонение от нормы. Если показатель выходит за эти границы, то физическое развитие ребенка резко отличается от нормы (возможна патология).

    Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации, выраженные в относительных величинах. Коэффициент осцилляции - это отношение размаха вариации к средней величине признака. Коэффициент вариации - это отношение среднего квадратического отклонения к средней величине признака. Как правило, эти величины выражаются в процентах.

    Формулы расчета относительных показателей вариации:

    Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака. Чем больше V , тем более изменчив признак.

    В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Арифметически отношение σ и средней арифметической нивелирует влияние абсолютной величины этих характеристик, а процентное соотношение делает коэффициент вариации величиной безразмерной (неименованной).

    Полученное значение коэффициента вариации оценивается в соответствии с ориентировочными градациями степени разнообразия признака:

    Слабое - до 10 %

    Среднее - 10 - 20 %

    Сильное - более 20 %

    Использование коэффициента вариации целесообразно в случаях, когда приходится сравнивать признаки разные по своей величине и размерности.

    Отличие коэффициента вариации от других критериев разброса наглядно демонстрирует пример .

    Таблица 1

    Состав работников промышленного предприятия

    На основании приведенных в примере статистических характеристик можно сделать вывод об относительной однородности возрастного состава и образовательного уровня работников предприятия при низкой профессиональной устойчивости обследованного контингента. Нетрудно заметить, что попытка судить об этих социальных тенденциях по среднему квадратическому отклонению привела бы к ошибочному заключению, а попытка сравнения учетных признаков «стаж работы» и «возраст» с учетным признаком «образование» вообще была бы некорректной из-за разнородности этих признаков.

    Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.

    Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.

    Абсолютные показатели вариации включают:

    Размах вариации (R)

    Размах вариации — это разность между максимальным и минимальным значениями признака

    Он показывает пределы, в которых изменяется величина признака в изучаемой .

    Пример . Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.
    Решение: размах вариации = 9 — 2 = 7 лет.

    Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

    При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

    Среднее линейное и квадратическое отклонение

    Среднее линейное отклонение — это из абсолютных отклонений отдельных значений признака от средней.

    Среднее линейное отклонение простое:

    Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

    В нашем примере: лет;

    Ответ: 2,4 года.

    Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

    Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

    Среднее квадратическое отклонение

    Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). () равно квадратному корню из среднего квадрата отклонений отдельных значений признака от :

    Среднее квадратическое отклонение простое:

    Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

    Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

    Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

    Дисперсия

    Дисперсия - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.

    Дисперсия простая:

    В нашем примере:

    Дисперсия взвешенная:

    Более удобно вычислять дисперсию по формуле:

    которая получается из основной путем несложных преобразований. В этом случае средний квадрат отклонений равен средней из квадратов значений признака минус квадрат средней.

    Для несгрупиированных данных:

    Для сгруппированных данных:

    Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие — нулем (0). Долю единиц, обладающих изучаемым признаком, обозначают буквой , а долю единиц, не обладающих этим признаком — через . Учитывая, что p + q = 1 (отсюда q = 1 — p), а среднее значение альтернативного признака равно

    ,

    средний квадрат отклонений

    Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством (), на долю единиц, данным свойством не обладающих ().

    Максимальное значение средний квадрат отклонения (дисперсия) принимает в случае равенства долей, т.е. когда т.е. . Нижняя граница этого показателя равна нулю, что соответствует ситуации, при которой в совокупности отсутствует вариация. Среднее квадратическое отклонение альтернативного признака:

    Так, если в изготовленной партии 3% изделий оказались нестандартными, то дисперсия доли нестандартных изделий , а среднее квадратическое отклонение или 17,1%.

    Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической.

    Относительные показатели вариации

    Относительные показатели вариации включают:

    Сравнение вариации нескольких совокупностей по одному и тому же признаку, а тем более по различным признакам с помощью абсолютных показателей не представляется возможным. В этих случаях для сравнительной оценки степени различия строят относительные показатели вариации. Они вычисляются как отношения абсолютных показателей вариации к средней:

    Рассчитываются и другие относительные характеристики. Например, для оценки вариации в случае асимметрического распределения вычисляют отношение среднего линейного отклонения к медиан

    так как благодаря свойству медианы сумма абсолютных отклонений признака от ее величины всегда меньше, чем от любой другой.

    В качестве относительной меры рассеивания, оценивающей вариацию центральной части совокупности, вычисляют относительное квартильное отклонение , где — средний квартиль полусуммы разности третьего (или верхнего) квартиля () и первого (или нижнего) квартиля ().

    На практике чаще всего вычисляют коэффициент вариации. Нижней границей этого показателя является нуль, верхнего предела он не имеет, однако известно, что с увеличением вариации признака увеличивается и его значение. Коэффициент вариации является в известном смысле критерием однородности совокупности (в случае нормального распределения).

    Рассчитаем коэффициент вариации на основе среднего квадратического отклонения для следующего примера. Расход сырья на единицу продукции составил (кг): по одной технологии при , а по другой — при. Непосредственное сравнение величины средних квадратических отклонений могло бы привести к неверному представлению о том, что вариация расхода сырья по первой технологии интенсивнее, чем по второй (. Относительная мера вариации ( позволяет сделать противоположный вывод

    Пример расчета показателей вариации

    На этапе отбора кандидатов для участия в осуществлении сложного проекта фирма объявлила конкурс профессионалов. Распределение претендентов по опыту работы показало средующие результаты:

    Вычислим средний производственный опыт работы, лет

    Рассчитаем дисперсию по продолжительности опыта работы

    Такой же результат получается, если использовать для расчета другую формулу расчета дисперсии

    Вычислим среднее квадратическое отклонение, лет:

    Определим коэффициент вариации, %:

    Правило сложения дисперсий

    Для оценки влияния факторов, определяющих вариацию, используют прием группировки: совокупность разбивают на группы, выбрав в качестве группировочного признака один из определяющих факторов. Тогда наряду с общей дисперсией, рассчитанной по всей совокупности, вычисляют внутигрупповую дисперсию (или среднюю из групповых) и межгрупповую дисперсию (или дисперсию групповых средних).

    Общая дисперсия характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий.

    Межгрупповая дисперсия измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:

    Внутригрупповая дисперсия оценивает вариацию признака, сложившуюся по влиянием других, неучитываемых в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий.

    Все три дисперсии () связаны между собой следующим равенством, которое известно как правило сложения дисперсий:

    на этом соотношении строятся показатели, оценивающие влияние признака группировки на образование общей вариации. К ним относятся эмпирический коэффициент детерминации () и эмпирическое корреляционное отношение ()

    () характеризует долю межгрупоовой дисперсии в общей дисперсии:

    и показывает насколько вариация признака в совокупности обусловлена фактором группировки.

    Эмпирическое корреляционное отношение (!!\eta = \sqrt{ \frac{\delta^2}{\sigma^2} }

    оценивает тесноту связи между изучаемым и группировочным признаками. Предельными значениями являются нуль и единица. Чем ближе к единице, тем теснее связь.

    Пример. Стоимость 1 кв.м общей площади (усл.ед) на рынке жилья по десяти 17-м домам улучшенной планировки составляла:

    При этом известно, что первые пять домов были построены вблизи делового центра, а остальные — на значительном расстоянии от него.

    Для рассчета общей дисперсии вычислим среднюю стоимость 1 кв.м. общей площади: Общую дисперсию определим по формуле:

    Вычислим среднюю стоимость 1 кв.м. и дисперсию по этому показателю для каждой группы домов, отличающихся месторасположением относительно центра города:

    а) для домов, построенных вблизи центра:

    б) для домов, построенных далеко от центра:

    Вариация стоимости 1 кв.м. общей площади, вызванная изменением местоположения домов, определяется величиной межгрупповой дисперсии :

    Вариация стоимости 1 кв.м. общей площади, обусловленная изменением остальных неучитываемых нами показателей, измеряется величиной внутригрупповой дисперсии

    Найденные дисперссии в сумме дают величину общей дисперсии

    Эмпирический коэффициент детерминации :

    показывает, что дисперсия стоимости 1.кв.м. общей площади на рынке жилья на 81,8% объясняется различиями в расположении новостроек по отношению к деловому центру и на 18,2% — другими факторами.

    Эмприческое корреляционное отношение свидетельствует о существенном влиянии на стоимость жилья месторасположения домов.

    Правило сложения дисперсий для доли признака записывается так:

    а три вида дисперсий доли для сгруппированных данных определяется по следующим формулам:

    общая дисперсия:

    Формулы межгрупповой и внутригрупповой дисперсий:

    Характеристики формы распределения

    Для получения представления о форме распределения используются показатели среднего уровня ( , ), показатели вариации, ассиметрии и эксцесса.

    В симметричных распределениях средняя арифметическая, мода и медиана совпадают (. Если это равенство нарушается — распределение ассиметрично.

    Простейшим показателем ассиметрии является разность , которая в случае правосторонней ассиметрии положительна, а при левосторонней — отрицательна.

    Ассиметричное распределение

    Для сравнения ассиметрии нескольких рядов вычисляется относительный показатель

    В качестве обобщающих характеристик вариации используются центральные моменты распределения -го порядка , соответствующие степени, в которую возводятся отклонения отдельных значений признака от средней арифметической:

    Для несгруппированных данных:

    Для сгруппированных данных:

    Момент первого порядка согласно свойству средней арифметической равен нулю .

    Момент второго порядка является дисперсией .

    Моменты третьего и четвертого порядков используются для построения показателей, оценивающих особенности формы эмпирических распределений.

    С помощью момента третьего порядка измеряют степень скошенности или ассиметричности распределения.

    — коэффициент ассиметрии

    В симметричных распределениях , как все центральные моменты нечетного порядка.Неравенство нулю центрального момента третьего порядка указывает на асимметричность распределения. При этом, если , то асимметрия правосторонняя и относительно максимальной ординаты вытянута правая ветвь; если , то асимметрия левосторонняя (на графике это соответствует вытянутости левой ветви).

    Для характеристики островершинности или плосковершинности распределения вычисляют отношение момента четвертого порядка () к среднеквадратическому отклонению в четвертой степени (). Для нормального распределения , поэтому эксцесс находят по формуле:

    Для нормального распределения обращается в нуль. Для островершинных распределений , для плосковершинных .

    Эксцесс распределения

    Кроме показателей, рассмотренных выше, обобщающей характеристикой вариации в однородной совокупности служит определенный порядок в изменении частот распределения в соответствии с изменениями величины изучаемого признака, называемый закономерностью распределения .

    Характер (тип) закономерности распределения может быть выявлен путем построения вариационного ряда на основании большого объема наблюдений, а также такого выбора числа групп и величины интегралов, при котором наиболее отчетливо могла бы проявиться закономерность.

    Анализ вариационных рядов предполагает выявление характера распределения (как результата действия механизма вариации), установление функции распределения, проверку соответствия эмпирического распределения теоретическому.

    Эмпирическое распределение , полученное на основе данных наблюдения, графически изображается эмпирической кривой распределения с помощью полигона.

    На практике встречаются различные типы распределений, среди которых можно выделить симметричные и асимметричные, одновершинные и многовершинные.

    Установить тип распределения, означает выразить механизм формирования закономерности в аналитической форме. Многим явлениям и их признакам свойственны характерные формы распределения, которые аппроксимируются соответствующими кривыми. При всем многообразии форм распределения наибольшее распространение в качестве теоретических получили нормальное распределение, распределение Пауссона, биноминальное распределение и др.

    Особое место в изучении вариации принадлежит нормальному закону, благодаря его математическим свойствам. Для нормального закона выполняется правило трех сигм, по которому вариация индивидуальных значений признака находится в пределах от величины средней. При этом в границах находится около 70% всех единиц, а в пределах — 95%.

    Оценка соответствия эмпирического и теоретического распределений производится с помощью критериев согласия, среди которых широко известны критерии Пирсона, Романовского, Ястремского, Колмогорова.



Понравилась статья? Поделиться с друзьями: