Наиболее распространенной формой статистических показателей, используемой в экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени.
Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности, ведь значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть и случайные.
Приведем примеры экономических показателей, основанных на вычислении средней величины и раскрывающих ее сущность:
- расчет средней заработной платы работников предприятия осуществляется делением общего фонда заработной платы на число работников;
- средний размер вклада в банке находят делением суммы вкладов в денежном выражении на количество вкладов;
- для определения средней дневной выработки одного работника необходимо объем работ (количество деталей), выполненных работником за определенный период разделить на число дней в этом периоде.
Виды средних величин, используемых в статистике
Рассмотрим основные виды средних величин, используемых при решении социально-эконмических и аналитических задач.
Средняя арифметическая простая вычисляется по формуле:
Средняя арифметическая простая используется в тех случаях, когда расчет осуществляется по не сгруппированным данным. Пример применения формулы средней арифметической простой представлен в задаче 1.
Средняя арифметическая взвешенная определяется по формуле:
При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться по несколько раз. В подобных случаях расчет средней производится по сгруппированным данным или вариационным рядам. Пример применения формулы средней арифметической взвешенной представлен в задаче 2.
Средняя гармоническая простая определяется по формуле:
Средние гармонические используются тогда, когда по экономическому содержанию имеется информация для числителя, а для знаменателя ее необходимо предварительно определить.
Средняя гармоническая взвешенная определяется по формуле:
Данная формула используется для расчета средних показателей не только в статике, но и в динамике, когда известны индивидуальные значения признака и веса W за ряд временных интервалов. Пример применения формулы средней гармонической взвешенной представлен в задаче 3.
Средняя геометрическая простая (невзвешенная) опеределяется по формуле:
Наиболее широкое применение этот вид средней получил в анализе динамики для определения среднего темпа роста.
Средняя квадратическая простая (невзвешенная) опеределяется по формуле:
Средняя квадратическая лежит в основе вычислений ряда сводных расчетных показателей.
Наиболее часто используемыми в экономической практике структурными средними являются мода и медиана. Мода (Мо) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. Медианой (Ме) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Пример определения медианы и моды для дискретного ряда чисел представлен в задаче 1.
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.
где Хо — нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту); i — величина модального интервала; f Мо — частота модального интервала; f Мо-1 — частота интервала, предшествующего модальному; f Мо+1 — частота интервала, следующего за модальным.
Хо — нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот); i — величина медианного интервала; Sme-1 — накопленная частота интервала, предшествующего медианному; f Me — частота медианного интервала.
Примеры решения задач по теме «Средние величины в статистике»
Задача 1. Дан ряд чисел: 15; 15; 12; 14; 13. Найдите размах, среднее арифметическое, медиану и моду этого ряда.
1) Размах ряда чисел – это разность между наибольшим и наименьшим из этих чисел. В данном случае размах равен R = 15-12 = 3
2) Среднее арифметическое данного ряда находим по формуле средней арифметической простой. Хср = (15+15+12+14+13)/5=13,8
3) Для определения медианы необходимо предложенный ряд упорядочить – расположить числа, например, в порядке возрастания: 12; 13; 14; 15; 15.
Медиана нечетного количества чисел в дискретном ряде – это число, записанное посередине. Медиана четного количества чисел – это среднее арифметическое двух чисел, находящихся посередине.
Поскольку в нашем случае количество чисел ряда нечетноне, то Ме = 14.
4) Мода дискретного ряда чисел – это число, которое встречается в данном ряде чаще других. Так как число 15 встречается в нашем ряде чаще других, то Мо = 15.
Задача 2. Имеется информация о численности студентов ВУЗов города и удельном весе (%) обучающихся студентов на коммерческой основе:
Определить: 1) средний удельный вес студентов ВУЗов, обучающихся на коммерческой основе; 2) число этих студентов.
Для решения расширим предложенную таблицу:
Средний удельный вес студентов ВУЗов, обучающихся на коммерческой основе определим по формуле средней арифметической взвешенной: Хср = (15×15+3×10+7×20) / (15+3+7) = 15,8%.
Ответ. Средний удельный вес студентов ВУЗов, обучающихся на коммерческой основе равен 15,8%, число этих студентов – 3 950 человек.
Задача 3. Сумма невыплаченной своевременно задолженности по кредитам на 1 июля составила 92,4 млн. денежных единиц. По отдельным отраслям экономики она распределялась следующим образом:
Определить средний процент невыплаченной своевременно задолженности. Обоснуйте выбор формы средней.
Поскольку на различных предприятиях сумма задолженности по кредитам разная при разных удельных весах, то применим формулу средней гармонической взвешенной.
Ответ. Средний процент невыплаченной своевременно задолженности равен 18,48%.
Другие статьи по данной теме:
Список использованных источников
- Белобородова С.С. и др. Теория статистики: Типовые задачи с контрольными заданиями. Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2001;
- Минашкин В.Г. и др. Курс лекций по теории статистики. / Московский международный институт эконометрики, информатики, финансов и права. — М., 2003;
- Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005;
- Фёдорова Л.Н., Фёдорова А.Е. Методические указания по написанию контрольной работы по курсу «Статистика» для студентов экономических специальностей: УрГЭУ, 2007;
2012-2015 © Лана Забродская (в Google+). При копировании материалов сайта ссылка на источник обязательна
Средние величины и показатели вариации
Понятие и виды средних величин
Средняя величина — это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.
К структурным средним относятся мода и медиана, но наиболее часто применяются степенные средние различных видов.
Степенные средние величины
Степенные средние могут быть простыми и взвешенными.
Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:
Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:
где X – значения отдельных статистических величин или середин группировочных интервалов;
m — показатель степени, от значения которого зависят следующие виды степенных средних величин:
Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.
Средняя арифметическая
Средняя арифметическая — это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:
где X — значения величин, для которых необходимо рассчитать среднее значение; N — общее количество значений X (число единиц в изучаемой совокупности). Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической простой: (3+4+4+5)/4 = 16/4 = 4.
Средняя арифметическая взвешенная имеет следующий вид:
где f — количество величин с одинаковым значением X (частота). Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической взвешенной: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.
Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X отсутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X.
Например, на предприятии 10 работников со стажем работы до 3 лет, 20 — со стажем от 3 до 5 лет, 5 работников — со стажем более 5 лет. Тогда рассчитаем средний стаж работников по формуле средней арифметической взвешенной, приняв в качестве X середины интервалов стажа (2, 4 и 6 лет):
(2*10+4*20+6*5)/(10+20+5) = 3,71 года.
Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.
Средняя гармоническая
Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:
Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой:
Например, автомобиль ехал из пункта А в пункт Б со скоростью 90 км/ч, а обратно — со скоростью 110 км/ч. Для определения средней скорости применим формулу средней гармонической простой, так как в примере дано расстояние w1=w2 (расстояние из пункта А в пункт Б такое, же как и из Б в А), которое равно произведению скорости (X) на время (f). Средняя скорость = (1+1)/(1/90+1/110) = 99 км/ч.
Средняя геометрическая
Средняя геометрическая применяется при определении средних относительных изменений, о чем сказано в теме Ряды динамики. Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X.
Например, в период с 2005 по 2008 годы индекс инфляции в России составлял: в 2005 году — 1,109; в 2006 — 1,0&0; в 2007 — 1,119; в 2008 — 1,133. Так как индекс инфляции — это относительное изменение (индекс динамики), то рассчитывать среднее значение нужно по средней геометрической: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, то есть за период с 2005 по 2008 ежегодно цены росли в среднем на 11,26%. Ошибочный расчет по средней арифметической дал бы неверный результат 11,28%.
Средняя квадратическая
Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений.
Главной сферой применения квадратической средней является измерение вариации значений X, о чем пойдет речь позднее в этой лекции.
Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.
Структурные средние величины
Статистическая мода — это наиболее часто повторяющееся значение величины X в статистической совокупности.
Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.
Например, на предприятии работает 16 человек: 4 из них — со стажем 1 год, 3 человека — со стажем 2 года, 5 — со стажем 3 года и 4 человека — со стажем 4 года. Таким образом, модальный стаж Мо=3 года, поскольку частота этого значения максимальна (f=5).
Если X задан равными интервалами, то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле:
ХНМо – нижняя граница модального интервала;
hМо – размах модального интервала (разность между его верхней и нижней границей);
fМо – частота модального интервала;
fМо-1 – частота интервала, предшествующего модальному;
fМо+1 – частота интервала, следующего за модальным. Например, на предприятии 10 работников со стажем работы до 3 лет, 20 — со стажем от 3 до 5 лет, 5 работников — со стажем более 5 лет. Рассчитаем модальный стаж работы в модальном интервале от 3 до 5 лет: Мо = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (года).
Если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.
Статистическая медиана
Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой — меньше медианы.
Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).
Например, имеются данные о возрасте студентов-заочников в группе из 10 человек — X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 лет. Эти данные уже упорядочены по возрастанию, а их количество N=10 — четное, поэтому медиана будет находиться между X с номерами 0,5*10=5 и (0,5*10+1)=6, которым соответствуют значения X5=21 и X6=23, тогда медиана: Ме = (21+23)/2 = 22 (года).
Если X задан в виде равных интервалов, то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле:
где Ме – медиана;
ХНМе – нижняя граница медианного интервала;
hМе – размах медианного интервала (разность между его верхней и нижней границей);
fМе – частота медианного интервала;
fМе-1 – сумма частот интервалов, предшествующих медианному. В ранее рассмотренном примере при расчете модального стажа (на предприятии 10 работников со стажем работы до 3 лет, 20 — со стажем от 3 до 5 лет, 5 работников — со стажем более 5 лет) рассчитаем медианный стаж. Половина общего числа работников составляет (10+20+5)/2 = 17,5 и находится в интервале от 3 до 5 лет, а в первом интервале до 3 лет — только 10 работников, а в первых двух — (10+20)=30, что больше 17,5, значит интервал от 3 до 5 лет — медианный. Внутри него определяем условное значение медианы: Ме = 3+2*(0,5*30-10)/20 = 3,5 (года).
Также как и в случае с модой, при определении медианы если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.
Размах вариации
Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:
Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.
Cреднее линейное отклонение
Cреднее линейное отклонение — это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой — получим среднее линейное отклонение простое:
Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4. Рассчитаем среднее линейное отклонение простое: Л = (|3-4|+|4-4|+|4-4|+|5-4|)/4 = 0,5.
Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной — получим среднее линейное отклонение взвешенное:
Вернемся к примеру про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4 и среднее линейное отклонение простое = 0,5. Рассчитаем среднее линейное отклонение взвешенное: Л = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.
Линейный коэффициент вариации
Линейный коэффициент вариации — это отношение среднего линейного отклонение к средней арифметической:
С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.
В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, линейный коэффициент вариации составит 0,5/4 = 0,125 или 12,5%.
Дисперсия — это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой — получим дисперсию простую:
В уже знакомом нам примере про студента, который сдал 4 экзамена и получил оценки: 3, 4, 4 и 5, ранее уже была рассчитана средняя арифметическая = 4. Тогда дисперсия простая Д = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2 )/4 = 0,5.
Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной — получим дисперсию взвешенную:
В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию взвешенную: Д = ((3-4) 2 *1+(4-4) 2 *2+(5-4) 2 *1)/4 = 0,5.
Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:
В уже знакомом нам примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию методом разности средней квадратов и квадрата средней:
Д = (3 2 *1+4 2 *2+5 2 *1)/4-4 2 = 16,5-16 = 0,5.
Если значения X — это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли:
.
Cреднее квадратическое отклонение
Выше уже было рассказано о формуле средней квадратической, которая применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма:
Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:
В примере про студента, в котором выше рассчитали дисперсию, найдем среднее квадратическое отклонение как корень квадратный из нее: .
Квадратический коэффициент вариации
Квадратический коэффициент вариации — это самый популярный относительный показатель вариации:
Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 — вариация считает слабой, а если больше 0,333 — сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина — нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.
В примере про студента, в котором выше рассчитали среднее квадратическое отклонение, найдем квадратический коэффициент вариации V = 0,707/4 = 0,177, что меньше критериального значения 0,333, значит вариация слабая и равна 17,7%.
- Разработка интернет-магазина
- Редизайн сайта эвакуации
- Редизайн сайта доставки суши


