Как построить полигон частот в excel

Построение полигона, гистограммы, кумуляты, огивы

Для наглядности строят различные графики статистического распределения, и, в частности, полигон и гистограмму.

Полигон

Полигоном частот называют ломаную, отрезки которой соединяют точки , а на оси ординат – соответствующие им частоты , а на оси ординат – соответствующие им относительные частоты (частости) Пример 1

Построить полигон частот и полигон относительных частот (частостей):

2	7	8	15	16	17
Решение

Вычислим относительные частоты (частости):

Полигон относительных частот

В случае интервального ряда для построения полигона в качестве берутся середины интервалов.

Гистограмма

В случае интервального статистического распределения целесообразно построить гистограмму.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты (в случае равных интервалов) должны быть пропорциональны частотам. При построении гистограммы с неравными интервалами по оси ординат наносят не частоты, а плотность частоты . Это необходимо сделать для устранения влияния величины интервала на распределение и иметь возможность сравнивать частоты.

В случае построения гистограммы относительных частот (гистограммы частостей) высоты в случае равных интегралов должны быть пропорциональны относительной частоте Пример 2

Построить гистограмму частот и относительных частот (частостей)

2-5	5-8	8-11	11-14	14-17	17-20
Решение

Вычислим относительные частоты:

Гистограмма относительных частот

Построить гистограмму частот (случай неравных интервалов).

2-4	4-8	8-13	13-15	15-17	17-20
Решение

Вычислим плотности частоты:

Интервалы,	Плотность частоты,
2 – 4	15	2	7.500
4 – 8	35	4	8.750
8 – 13	64	5	12.800
13 – 15	55	2	27.500
15 – 17	21	2	10.500
17 – 20	10	3	3.333
Итого	200	—	—

Кумулята и огива

При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательного суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты, которые наносят на поле в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т.е. кумуляту.

Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получим огиву. То есть огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Построить кумулятивную кривую:

2	5	8	11	14	17
Решение

Вычислим накопленные частоты:

2	15	15
7	35	50
8	64	114
15	55	169
16	21	190
17	10	200
Итого	200	—

Если по каким-либо причинам не справляетесь с решением задач, на портале можно заказать выполнение расчетной домашней работы, ИДЗ, РГР, контрольной и даже отдельных задач в разумные сроки. Чтобы вы смогли сделать заказ, я доступен по следующим каналам связи::

Контакты будут для вас
видны на территории
России и Беларуси

Общение без посредников. Удобная оплата переводом на банковскую карту. Опыт работы более 25 лет.

Подробное решение в формате электронного документа получите точно в срок или раньше.

Помощь во время экзамена/зачета/самостоятельной в онлайн-режиме строго по предварительной записи. Если вы уже знаете расписание зачетов/экзаменов и вам требуется онлайн-помощь — обращайтесь.

Инструменты Excel для построения гистограмм, полигонов

Процедура «Гистограмма» пакета «Анализ данных. Вычисление частот и накопленных частот. Построение гистограмм.

В процедуре автоматически выполняются следующие вычисления:

выбирается число m интервалов группировки (7 £ m £ 20);

вычисляются середины интервалов группировки , , ;

для каждого интервала вычисляются частоты n_j — количество выборочных значений, которые попали в j -й интервал;

для каждого интервала вычисляются накопленные частоты — количество выборочных значений, не превышающих верхней границы j -го интервала;

Строится гистограмма – график ступенчатой функции , , , D _j = ( a_j , b_j ) , .

Для того чтобы вычислять накопленные частоты и отобразить гистограмму в листе в листе Excel , в окне процедуры следует пометить соответствующие поля.

Результаты вычислений процедуры представлены в виде таблицы (ниже приведены две таблицы, первая – когда поле «Интегральный процент» не помечено, вторая – когда помечено)

2.2.1. Гистограмма частот

– это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов (данные задачи), а высота – соответствующим плотностям частот:

при этом вполне допустимо использовать нестандартную шкалу по оси абсцисс, в данном случае я начал нумерацию с четырёх. Площадь гистограммы частот в точности равна объёму совокупности: . В нашем случае и плотности совпали с самими частотами , таким образом:

2.2.2. Гистограмма относительных частот

– это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов, а высота – соответствующим плотностям относительных частот:

Площадь такой гистограммы равна единице: , и это статистический аналог функции плотности распределения непрерывной случайной величины.

Построенный чертёж даёт наглядное и весьма точное представление о распределении цен на ботинки по всей генеральной совокупности. При условии, что выборка представительна.

И для ИВР чаще всего требуется построить гистограмму именно относительных частот. А вместе с ней нередко и полигон таковых частот. Без проблем, полигон относительных частот – это ломаная, соединяющая соседние точки , где – середины интервалов:

По сути, здесь мы приблизили интервальный ряд дискретным, выбрав в качестве вариант середины интервалов. Это важнейший принцип и метод, который неоднократно встретится нам в будущем.

Большим достоинством приведённого решения является тот факт, что многие вычисления здесь устные, а если вы помните, как делить «столбиком», то можно обойтись даже без калькулятора. Вот она где притаилась, смерть Терминатора 🙂 😉

модел_3

СТАТИСТИЧЕСКАЯ ОБРАБОТКА ОДНОМЕРНОЙ ВЫБОРКИ Цель работы – получение основных навыков обработки одномерной выборки в пакетах MS Excel и MATLAB. Пакет MS Excel отлично подходит для простых задач вычисления числовых характеристик выборки. Для вычисления выборочных числовых характеристик средствами MS Excel можно использовать встроенные функции

категории «Статистические».
Функция СРЗНАЧ возвращает значение выборочного					среднего		x ,
функция ДИСП позволяет получить значение оценки дисперсии S 2						, а при
x
~ 2
помощи функции ДИСПР можно получить значение дисперсии S x .
Функция	СТАНДОТКЛОН			вычисляет	выборочное
среднеквадратическое отклонение			S x ,	а функция СТАНДОТКЛОНП дает
~
возможность получить		значение	среднеквадратического отклонения				S x .
Значение выборочного		момента	корреляции (ковариацию)		ˆ	можно
					V XY

рассчитать, используя функцию КОВАР, а выборочный коэффициент корреляции r xy можно вычислить, обратившись к функции КОРРЕЛ. В то же время, при вычислении выборочных числовых характеристик в MS Excel можно воспользоваться возможностями пакета анализа. Процедура действий в этом случае, следующая: 1. Открыть меню Сервис и выбрать Анализ данных. 2. Указать необходимую строку в списке Инструменты анализа. 3. Ввести входной и выходной диапазоны ячеек и установить необходимые параметры. Так, например, для одновременного вычисления выборочного среднего и дисперсии, а также других характеристик выборки, может быть использована процедура «Описательная статистика». Эта процедура позволяет получить очень полный статистический отчет. Для выполнения процедуры необходимо: 1

1. Выполнить команду Сервис – Анализ данных, в появившемся списке «Инструменты анализа» выбрать строку «Описательная статистика» и нажать «Ок». 2. В появившемся диалоговом окне указать входной диапазон анализируемых данных. 3. Указать входной диапазон, т.е. указать адрес ячейки на листе. 4. В разделе Группировка установить переключатель в положение «по столбцам». 5. Установить флажок в поле «Итоговая статистика», нажать ОК. В результате проведенного анализа в указанном выходном диапазоне для каждого столбца данных выводятся следующие статистические характеристики: 1. среднее (выборочное среднее x ), 2. стандартная ошибка (величина S n x ), 3. медиана (выборочная квантиль второго порядка), 4. мода (наиболее часто повторяющееся выборочное значение), 5. стандартное отклонение (величина S x ), 6. дисперсия выборки (выборочная дисперсия S x 2 ), 7. эксцесс (оценка коэффициентов эксцесса), 8. асимметричность (оценка коэффициента асимметрии), 9. интервал (размах выборки x max x min ), 10. минимум (наименьшее выборочное значение x min ), 11. максимум (наибольшее выборочное значение x max ), 12. сумма (сумма всех выборочных значений), 13. счет (объем выборки). Этапы выполнения работы 2

1. Получение допуска к работе. Необходимо переписать данные своего варианта N (см. приведенные ниже варианты заданий к работе №1, выборка объемом 50) 2. Выполнить аналитически от руки или в электронном виде: 2.1. Построение вариационного и статистического рядов, найти размах выборки; 2.2. Построение таблицы абсолютных и относительных частот группированной выборки, расчет интервалов провести по формуле Стерджеса; 2.3. Построить эмпирическую функцию распределения, гистограмму, полигон частот. 3. Средствами MS Excel и MATLAB найти оценки математического ожидания, дисперсии (смещенной и несмещенной), медианы и моды. Построить графики эмпирической функции распределения, гистограмму и полигон частот. Решение задачи в пакете MATLAB Для начала нам необходима выборка, с которой можно работать. В данном примере мы ее сгенерируем сами. Обратите внимание, что у каждого студента выборка уже задана вариантом задания, и ее не нужно будет генерировать. clear all close all clc % Генерация выборки, для дальнейшей работы % мат. ожидание генерируемой выборки mu = 0; % Среднеквадратическое отклонение sigma = 1; % Объем выборки n = 50; % Генерация нормально распределенных случайных чисел 3

X = normrnd(mu,sigma,n,1); % Генерация лог-нормально распределенных % случайных чисел % Данная выборка является в нашем случае % входной x = exp(X); Далее построим вариационный ряд, определим количество интервалов и найдем абсолютную частоту попадания элемента выборки в каждый из интервалов. % Построение вариационного ряда x = sort(x); % Поиск минимального и максимального % элементов выборки xmax = max(x); xmin = min(x); % Определим количество интервалов % по формуле Стерджесса b = 3.332; r = ceil(1+b*log10(n)); % Длина интервала stp = (xmax-xmin)/r; % Определяем середины интервалов centr = []; centr(1) = xmin+(stp/2); for i=2:1:r centr(i) = centr(i-1)+stp; end % Определяем абсолютную частоту k1 = xmin; i = 1; while i<=r k2 = 0; for j=1:n if (x(j)>=k1) & (x(j)<=k1+stp) k2 = k2+1; end end freqn(i) = k2; 4

k1 = xmin+stp*i; i = i+1; end Рассчитаем числовые характеристики выборки и выведем их на экран, при помощи следующего программного кода: % Числовые характеристики выборки: % Выборочное среднее m = mean(x); % Дисперсия D = var(x); % Ср. кв. отклонение SKO = std(x); % Мода moda = mode(x); % Медиана med = median(x); % Коэффициент эксцесса kurt = kurtosis(x); % Коэффициент асимметрии skew = skewness(x); % Вывод значений fprintf( ‘Максимальное значение = %f\n’ ,xmax); fprintf( ‘Минимальное значение = %f\n’ ,xmin); fprintf( ‘Количество интервалов = %f\n’ ,r); fprintf( ‘Длина одного интервала = %f\n’ ,r); fprintf( ‘Выборочное среднее = %f\n’ ,m); fprintf( ‘Выборочная дисперсия = %f\n’ ,D); fprintf( ‘Ср. кв. отклонение = %f\n’ ,SKO); fprintf( ‘Мода = %f\n’ ,moda); fprintf( ‘Медиана = %f\n’ ,med); fprintf( ‘Коэффициент эксцесса = %f\n’ ,kurt); fprintf( ‘Коэффициент асимметрии = %f\n’ ,skew); Далее построим полигон частот, гистограмму и эмпирическую функцию распределения, которые показаны на рис. 1-3 соответственно. % Построение полигона частот figure() plot(centr,freqn/n, ‘r-o’ ) xlabel( ‘Интервалы’ ); ylabel( ‘Относительная частота’ ) 5

grid on % Построение гистограммы figure() histogram(x,r) xlabel( ‘Интервалы’ ); ylabel( ‘Частота’ ) grid on % Построение эмпирической % функции распределения figure() ecdf(x) % Подпись оси 0X xlabel( ‘x’ ) % Подпись оси 0Y ylabel( ‘F(x)’ ) % Добавление сетки на график grid on

Рис. 1. Полигон частот

Рис. 2. Гистограмма Рис. 3. Эмпирическая функция распределения Выполнение работы в Excel в данной лабораторной работе мы пропустим, Excel по умолчанию не предоставляет возможности 7