Как построить график огиву гальтона в. Использование Excel для расчета статистических характеристик случайной величины

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации

Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.

Определение . Полигоном частот называют ломаную, отрезки которой соединяют точки (x 1 , n 1), (x 2 , n 2), …, (x k , n k).

Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат – соответствующие им частоты n i . Точки (x i , n i) соединяют отрезками прямых и получают полигон частот.

Определение. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1), (x 2 , w 2), …, (x k , w k).

Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат w i . Точки (x i , w i) соединяют отрезками прямых и получают полигон относительных частот.

На рисунке изображен полигон относительных частот следующего распределения:

Рис. 6. Полигон относительных частот.

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длинной h и находят для каждого частичного интервала n i – сумму частот вариант, попавших в i-ый интервал.

Определение . Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению (плотность частоты).

Рис. 7. Гистограмма частот.

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс, на расстоянии .

Площадь i-го частичного прямоугольника равна =─ сумме частот вариантi-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, то есть объему выборки n.

На рисунке 2 изображена гистограмма частот распределения объема n=100, приведенного в таблице 1.

Частичный интервал,

длиною h=5

Плотность частоты

Определение . Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны отношению (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии . Площадьi-го частичного прямоугольника равна =─ относительной частоте вариант, попавших вi-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице.

    В результате выборки получена следующая таблица распределения частот.

Построить полигоны частот и относительных частот распределения.

Для начала построим полигон частот.

Рис. 8. Полигон частот.

Чтобы построить полигон относительных частот найдем относительные частоты, для чего разделим частоты на объем выборки n.

n = 3 + 10 + 7 = 20.

Получаем

Построим полигон относительных частот.

Рис. 9. Полигон относительных частот.

2. Построить гистограммы частот и относительных частот распределения.

Найдем плотность частоты :

Частичный интервал,

длиною h = 3

Сумма частот вариант частичного интервала

Плотность частоты

Разделы: Математика

Цель:

  • Совершенствование умений и навыков нахождения статистических характеристик случайной величины, работа с расчетами в Excel;
  • применение информационно коммутативных технологий для анализа данных; работа с различными информационными носителями.

Ход урока

  1. Сегодня на уроке мы научимся рассчитывать статистические характеристики для больших по объему выборок, используя возможности современных компьютерных технологий.
  2. Для начала вспомним:

– что называется случайной величиной? (Случайной величиной называют переменную величину, которая в зависимости от исхода испытания принимает одно значение из множества возможных значений.)

– Какие виды случайных величин мы знаем? (Дискретные, непрерывные.)

– Приведите примеры непрерывных случайных величин (рост дерева), дискретных случайных величин (количество учеников в классе).

– Какие статистические характеристики случайных величин мы знаем (мода, медиана, среднее выборочное значение, размах ряда).

– Какие приемы используются для наглядного представления статистических характеристик случайной величины (полигон частот, круговые и столбчатые диаграммы, гистограммы).

  1. Рассмотрим, применение инструментов Excel для решения статистических задач на конкретном примере.

Пример. Проведена проверка в 100 компаниях. Даны значения количества работающих в компании (чел.):

Ход работы.

1. Занести данные в EXCEL, каждое число в отдельную ячейку.

23 25 24 25 30 24 30 26 28 26
32 33 31 31 25 33 25 29 30 28
23 30 29 24 33 30 30 28 26 25
26 29 27 29 26 28 27 26 29 28
29 30 27 30 28 32 28 26 30 26
31 27 30 27 33 28 26 30 31 29
27 30 30 29 27 26 28 31 29 28
33 27 30 33 26 31 34 28 32 22
29 30 27 29 34 29 32 29 29 30
29 29 36 29 29 34 23 28 24 28

2. Для расчета числовых характеристик используем опцию Вставка – Функция. И в появившемся окне в строке категория выберем - статистические, в списке: МОДА

Нажимаем клавишу ОК. Получили М о = 29 (чел) – Фирм у которых в штате 29 человек больше всего.

Используя тот же путь вычисляем медиану.

Вставка – Функция – Статистические – Медиана.

В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:

Нажимаем клавишу ОК. Получили М е = 29 (чел) – среднее значение сотрудников в фирме.

Размах ряда чисел – разница между наименьшим и наибольшим возможным значением случайной величины. Для вычисления размаха ряда нужно найти наибольшее и наименьшее значения нашей выборки и вычислить их разность.

Вставка – Функция – Статистические – МАКС.

В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:

Нажимаем клавишу ОК. Получили наибольшее значение = 36.

Вставка – Функция – Статистические – МИН.

В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:

Нажимаем клавишу ОК. Получили наименьшее значение = 22.

36 – 22 = 14 (чел) – разница между фирмой с наибольшим штатом сотрудников и фирмой с наименьшим штатом сотрудников.

Для построения диаграммы и полигона частот необходимо задать закон распределения, т.е. составить таблицу значений случайной величины и соответствующих им частот. Мы ухе знаем, что наименьшее число сотрудников в фирме = 22, а наибольшее = 36. Составим таблицу, в которой значения x i случайной величины меняются от 22 до 36 включительно шагом 1.

x i 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
n i

Вставка – Функция – Статистические – СЧЕТЕСЛИ.

В окне Диапазон ставим курсор и выделяем нашу выборку, а в окне Критерий ставим число 22

Нажимаем клавишу ОК, получаем значение 1, т.е. число 22 в нашей выборке встречается 1 раз и его частота =1. Аналогичным образом заполняем всю таблицу.

x i 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
n i 1 3 4 5 11 9 13 18 16 6 4 6 3 0 1

Для проверки вычисляем объем выборки, сумму частот (Вставка – Функция – Математические - СУММА). Должно получиться 100 (количество всех фирм).

Чтобы построить полигон частот выделяем таблицу – Вставка – Диаграмма – Стандартные – Точечная (точечная диаграмма на которой значения соединены отрезками)

Получаем:

Для построения столбчатой и круговой диаграмм используем тот же путь (выбирая нужный нам тип диаграммы).

Диаграмма – Стандартные – Круговая.

Диаграмма – Стандартные – Гистограмма.

4. Сегодня на уроке мы научились применять компьютерные технологии для анализа и обработки статистической информации.

В результате обработки и систематизации первичных статистических материалов получаются ряды цифровых статистических показателей, которые характеризуют отдельные стороны изучаемых явлений. Эти ряды называются статистическими.

Статистические ряды бывают двух видов: ряды распределения и ряды динамики (рис. 1).

Статистические ряды

Ряды распределения Ряды динамики

Атрибутивные Вариационные

Дискретные Непрерывные

(Интервальные)

Рисунок 1 – Виды рядов распределения

Ряды распределения – это ряды, которые характеризуют распределение единиц совокупности по какому-либо признаку (например, распределение производственного оборудования по видам и срокам службы). Ряд распределения состоит из двух элементов: вариант – значений группировочного признака и частот – число повторений отдельных вариантов значений признака.

Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака, применяется только один показатель - численность групп.

Частоты, представленные в относительном выражении, называют частостями и обозначают .

Например, вместо абсолютного числа рабочих, имеющих определённый разряд, можно установить долю рабочих этого разряда. Частости могут быть выражены в долях единицы или в процентах. Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.

По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, то есть даны в виде прерывных чисел. Например, тарифный разряд рабочих, количество детей в семье, число рабочих на предприятии. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определённых границах принимать любые значения. Например, заработная плата рабочих, стоимость основных фондов предприятия.



Атрибутивный ряд распределения образуется по качественному признаку (распределение рабочих по профессиям, машин – по маркам). Вариационный ряд распределения образуется по количественному признаку. Он состоит из вариант и частот. В дискретном ряде распределения отдельные варианты имеют определённые значения (распределение рабочих по разрядам). В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения этого признака у отдельных единиц могут вообще не повторяться, строятся интервальные ряды распределения. Интервал указывает определённые пределы значений варьирующего признака и обозначается верхней и нижней границей интервала.

Различают ряды распределения с абсолютными, относительными и накопленными частотами. Накопленные частоты называют кумулятивными.

Если приведён вариационный ряд с неравными интервалами, то для правильного представления о характере распределения необходимо рассчитать плотность распределения. Плотность распределения – это количество единиц совокупности, приходящихся на единицу величины интервала группировочного признака. Различают абсолютную () и относительную () плотность:

где – частота;

– удельный вес;

– размер интервала.

По форме ряды распределения бывают одно- двух- и многовершинными. Среди одновершинных распределений есть симметричные и асимметричные (скошенные), остро- и плосковершинные.

Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения.

Для графического изображения дискретного ряда применяют полигон распределения. Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (xi,mi) , где xi – варианты выборки и mi – соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов.

Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абс­цисс откладывают значения аргумента (вари­анты), а на оси ординат – значения час­тот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами (xi,mi) и последовательно соединяют их отрезками прямой.

Рисунок 2 – Полигон распределения

Для графического изображения интервальных вариационных рядов применяются гистограммы. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частностям) интервала.

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс на середины интервалов, в которых частоты (частности) равны нулю. При построении гистограммы для вариационного ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения.

Рисунок 3 – Гистограмма

При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что приводит к уменьшению величины интервала. При этом ломанная линия имеет тенденцию превращения в плавную кривую, которую называют кривой распределения. Кривая распределения характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри однокачественной совокупности.

Кумулята или кривая накопленных частот в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат – накопленные частоты или частости (рисунок 4).

Накопленной частоты, т. е. число значений, которые попали в этот интервал и все предшествующие.

Рисунок 4 – Кумулята (кривая накопленных частот)

Следует отметить, что кривая накопленных частот не убывает ни на одном участке.

Пример построения группировки рассмотрим в примерах 1 и 2.


Пример 1

Оборот и издержки обращения тридцати торговых предприятий за отчетный период составили (тыс. руб.):

Магазины, № п/п Оборот Издержки обращения

Для выявления зависимости между размером оборота и издержками обращения произведите группировку магазинов по размеру оборота, образовав пять групп магазинов с равными интервалами. В каждой группе и в целом подсчитайте:

1) число магазинов;

2) размер оборота – всего и в среднем на один магазин;

3) издержки обращения – всего и в среднем на один магазин;

4) структуру товарооборота по группам и структуру издержек обращения;

5) уровень издержек обращения

У ИО = Издержки обращения ×100%.
Товарооборот

6) Решение оформите в разработочной и групповой таблицах. Сделайте выводы, укажите вид группировки. Постройте гистограмму и преобразуйте её в полигон. Постройте кумуляту (кривую накопленных частот).

Решение:

Составим вариационный ряд распределения, упорядочив магазины по товарообороту от большего к меньшему.

Магазины, № п/п Оборот Издержки обращения Магазины, № п/п Оборот Издержки обращения
7 341 160
11 456 242 19 1199 635
5 1326 623

Определим величину интервала:

, где

i – величина интервала;

Xmax, Xmin – максимальное и минимальное значение признака (1700 и 341 соответственно).

Величина интервала составит:

Определим границы интервалов:

Разнесем по выделенным интервалам предприятия (разработочная таблица):

Определим в каждой группе и в целом объем оборота – всего и в среднем на один магазин и издержки – всего и в среднем на один магазин, для чего составим группировочную таблицу:

Группы предприятий по величине оборота Число предприятий в группе Суммарный товарооборот в группе Средний товарооборот по группе Суммарные издержки обращения по группе Средние издержки обращения по группе Уровень издержек обращения по группе, %
А (1) (2) (3)=(2)/(1) (4) (5)=(4)/(1) (6)=(4)/(2)*100
341-612,8 398,5 50,44
612,8-884,6 744,5 345,5 46,41
884,6-1156,4 998,75 482,625 48,32
1156,4-1428,2 1262,5 49,82
1428,2-1700 687,417 43,65
Итого 34679/30= 1155,97 15843/30= 528,1 528,1/1155,97*100 = 45,68

На основании проведенных расчетов построим гистограмму и полигон.

При построении гистограммы по оси Х откладывают значения признака (границы интервалов), а по оси Y – частоты. Для соответствующего интервала строиться прямоугольник, высота которого соответствует частоте признака (рисунок 5).

Рисунок 5 – Гистограмма

Гистограмма может быть преобразована в полигон, если середины верхних граней прямоугольника соединить прямой линией (рисунок 6).

Рисунок 6 – Полигон распределения

Также построим кумуляту или кривую накопленных частот. В этом случае по оси Х откладываем интервалы признака, а по оси Y – накопленные частоты (это количество единиц совокупности, имеющие значения признака меньше указанного) . Накопленные частоты рассчитаны в таблице.

Кривая накопленных частот представлена на рисунке 7.

Рисунок 7 – Кривая накопленных частот

Вывод: Суммарный товарооборот в первой группе 797 тыс. руб., во второй – 4467 тыс. руб., в третьей – 7990 тыс. руб., в четвертой – 2525 тыс. руб., в пятой – 18900 тыс. руб. Средний товарооборот на один магазин в первой группе 398,5 тыс. руб., во второй – 744,5 тыс. руб., в третьей – 998,75 тыс. руб., в четвертой – 1262,5 тыс. руб., в пятой – 1575 тыс. руб.

Суммарные издержки обращения в первой группе 402 тыс. руб., во второй – 2073 тыс. руб., в третьей – 3861 тыс. руб., в четвертой – 1258 тыс. руб., в пятой – 8249 тыс. руб. Средний издержки обращения в первой группе 201 тыс. руб., во второй – 345,5 тыс. руб., в третьей – 482,625 тыс. руб., в четвертой – 629 тыс. руб., в пятой – 687,417 тыс. руб.

На основании полученных значений можно сделать вывод о прямой зависимости между размером оборота и средними издержек обращения: при росте размера оборота средние издержки обращения увеличиваются. На основании анализа уровня издержек обращения можно сделать вывод, что наиболее конкурентны предприятия пятой группы, поскольку у них уровень издержек ниже среднего.

Пример 2

По данным таблицы постройте ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:

а) по числу совместно проживающих человек (1,2,3,4 и более)

б) по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами)

в) по статусу занятости главы семьи.

№ п/п Число членов в семье Статус главы семьи по месту в занятости
1. Самозанятость
2. По найму
3. По найму
4. По найму
5. По найму
6. Нет работы
7. Нет работы
8. Самозанятость
9. Нет работы
10. По найму
11. По найму
12. По найму
13. Самозанятость
14. По найму
15. По найму
16. По найму
17. По найму
18. Нет работы
19. Нет работы
20. Самозанятость
21. Нет работы
22. По найму
23. По найму
24. По найму
25. По найму
26. По найму
27. Самозанятость
28. Нет работы
29. По найму
30. По найму
Итого - -

Решение:

Построим ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:

Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.

Общее число глав семей, имеющих разный статус по месту в занятости (са Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.

Группировка по числу совместно проживающих человек (1,2,3,4 и более), представлено в таблице. В этом случае группировка строиться по количественному дискретному признаку.

Таким образом, 33% всех обследованных семей состоят из трех человек. 13% семей состоят из 4 и более человек. Доли семей, состоящих из 1 человека – 17%, из 2 человек – 37%.

Построим группировку по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами);

На начальном этапе проранжируем ряд от меньшего к большему:

Номер домохозяйства Среднемесячный доход на душу, руб. Номер домохозяйства Среднемесячный доход на душу, руб.

Определим величину интервала по формуле:

, где

i – величина интервала;

n – число групп (в данной задаче 5 группы);

Xmax, Xmin – максимальное и минимальное значение признака.

Величина интервала составит:

Разнесем по выделенным интервалам домашние хозяйства:

Это и будет интервальный ряд распределения.

Рисунок 8 – Гистограмма распределения

Таким образом, в 50% всех обследуемых домашних хозяйствах среднедушевой доход составляет от 4800 рублей до 7460 рублей на человека. Доход от 2140 до 4800 рублей на человека наблюдается в 16% всех семей. Доход от 7460 до 10120 рублей на человека наблюдается в 20% всех обследованных семей. Доля семей, где среднедушевой доход составляет от 10120 до 12780, а также от 12780 до 15440 рублей, равна 7%.


Вопросы для самопроверки

Графическое изображение вариационных рядов

Графическое изображение зависимости между величинами дает возможность представить эту зависимость наглядно. Графики могут служить основой для открытия новых свойств, соотношений и закономерностей.

Наиболее употребительными графиками для изображения вариационных рядов, т. е. соотношений между значениями признака и соответствующими частотами или относительными частотами, являются полигон, гистограмма и кумулята.

Полигон чаще всего используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс в произвольно выбранном масштабе откладывают значения аргумента, т. е. варианты, а на оси ординат также в произвольно выбранном масштабе - значения частот или относительных частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность, и чтобы рисунок имел желательный размер. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю "левую" точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю "правую" точку также соединяют с точкой оси абсцисс.

Кумулята служит для графического изображения кумулятивного вариационного ряда. Для ее построения на оси абсцисс откладывают значения аргумента, а на оси ординат - накопленные частоты или накопленные относительные частоты. Масштаб на каждой оси выбирают произвольно. Далее строят точки, абсциссы которых равны вариантам (в случае дискретных рядов) или верхним границам интервалов (в случае интервальных рядов), а ординаты - соответствующим частотам (накопленным частотам). Эти точки соединяют отрезками прямой. Полученная ломаная и является кумулятой.