Предположим,
что варианты выборки расположены
в возрастающем порядке, т. е. в виде
вариационного ряда.
Равноотстоящими
называют
варианты, которые образуют
арифметическую прогрессию с разностью
h.
Условными
называют
варианты, определяемые равенством
ui=(xi—C)/h,
где
С—ложный
нуль (новое начало отсчета); h
—
шаг, т.
е. разность между любыми двумя соседними
первоначальными
вариантами (новая единица масштаба).
Упрощенные
методы расчета сводных характеристик
выборки
основаны на замене первоначальных
вариант условными.
Покажем,
что если вариационный ряд состоит из
равноотстоящих
вариант с шагом h,
то условные варианты есть
целые числа. Действительно, выберем в
качестве ложного
нуля произвольную варианту, например
хт,
Тогда
.
Так как
i
и
m—целые
числа, то их разность i—m
=
иi-также
целое число.
Замечание
1. В качестве ложного нуля можно принять
любую
варианту. Максимальная простота
вычислений достигается, если выбрать
в качестве ложного нуля варианту, которая
расположена примерно
в середине вариационного ряда (часто
такая варианта имеет
наибольшую частоту).
Замечание
2. Варианте, которая принята в качестве
ложного
нуля, соответствует условная варианта,
равная нулю.
Пример.
Найти
условные варианты статистического
распределения:
варианты
. . . 23,6 28,6 33,6 38,6 43,6
частоты
…
5 20
50 15 10
Решение.
Выберем в качестве ложного нуля
варианту 33,6 (эта
варианта
расположена в середине вариационного
ряда). Найдем
шаг:
h
= 28,6 —23,6 = 5.
Найдем условную
варианту:
u1=(xi—C)/h=
(23,6 —33,6)/5 = -2.
Аналогично
получим: u2=
— 1, u3
= 0, u4
=1, u5
= 2. Мы видим, что
условные варианты — небольшие целые
числа. Разумеется, оперировать
с ними проще, чем с первоначальными
вариантами.
§ 2. Обычные, начальные и центральные эмпирические моменты
Для
вычисления сводных характеристик
выборки удобно
пользоваться эмпирическими моментами,
определения которых
аналогичны определениям соответствующих
теоретических моментов (см. гл. VIII,
§ 10). В отличие от
теоретических эмпирические моменты
вычисляют по
данным наблюдений.
Обычным
эмпирическим моментом порядка k
называют
среднее
значение k-x
степеней разностей xi
—
С:
где xi—
наблюдаемая варианта, ni—
частота варианты,
—
объем выборки,С
— произвольное постоянное число
(ложный нуль).
Начальным
эмпирическим моментом порядка k
называют
обычный момент порядка k
при
С
= 0
.
В частности,
,
т, е.
начальный эмпирический момент первого
порядка равен
выборочной средней.
Центральным
эмпирическим моментом порядка k
называют
обычный момент порядка k
при
С
=
.
В частности,
,
(*)
т. е.
центральный эмпирический момент второго
порядка равен
выборочной дисперсии.
Легко выразить центральные моменты
через обычные (рекомендуем читателю
сделать это самостоятельно):
,(**)
(***)
§ 3. Условные эмпирические моменты. Отыскание центральных моментов по условным
Вычисление центральных
моментов требует довольно
громоздких вычислений. Чтобы упростить
расчеты,
заменяют первоначальные варианты
условными.
Условным
эмпирическим моментом порядка k
называют
начальный момент порядка k,
вычисленный
для условных вариант:
.
В частности,
.
Отсюда
.
(*)
Таким
образом, для того чтобы найти выборочную
среднюю,
достаточно вычислить условный момент
первого порядка,
умножить его на h
и
к результату прибавить ложный
нуль С.
Выразим обычные моменты через условные:
.
Отсюда
.
Таким
образом, для того чтобы найти обычный
момент порядка k,
достаточно условный
момент того же порядка умножить
на hk.
Найдя
же обычные моменты, легко найти центральные
моменты по равенствам (**) и (***) предыдущего
параграфа.
В итоге получим удобные для вычислений
формулы,
выражающие центральные моменты через
условные:
,(**)
(***)
В
частности, в силу (**) и соотношения (*)
предыдущего параграфа
получим формулу для вычисления выборочной
дисперсии по условным моментам первого
и второго
порядков
.
(****)
Техника
вычислений центральных моментов по
условным
описана далее.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Варианты для выполнения работы
I. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.
Почти все встречающиеся в жизни величины (урожайность сельскохозяйственных растений, продуктивности скота, производительность труда и заработная плата рабочих, объем производства продукции и т.д.) принимают неодинаковые значения у различных членов совокупности. Поэтому возникает необходимость в изучении их изменяемости. Это изучение начинается с проведения соответствующих наблюдений, обследований.
В результате наблюдений получают сведения о численной величине изучаемого признака у каждого члена данной совокупности.
Пример. Имеются данные о размере прибыли 100 коммерческих банков. Прибыль, млн. рублей.
30,2 | 51,9 | 43,1 | 58,9 | 34,1 | 55,2 | 47,9 | 43,7 | 53,2 | 34,9 |
47,8 | 65,7 | 37,8 | 68,6 | 48,4 | 67,5 | 27,3 | 66,1 | 52,0 | 55,6 |
54,1 | 26,9 | 53,6 | 42,5 | 59,3 | 44,8 | 52,8 | 42,3 | 55,9 | 48,1 |
44,5 | 69,8 | 47,3 | 35,6 | 70,1 | 39,5 | 70,3 | 33,7 | 51,8 | 56,1 |
28,4 | 48,7 | 41,9 | 58,1 | 20,4 | 56,3 | 46,5 | 41,8 | 59,5 | 38,1 |
41,4 | 70,4 | 31,4 | 52,5 | 45,2 | 52,3 | 40,2 | 60,4 | 27,6 | 57,4 |
29,3 | 53,8 | 46,3 | 40,1 | 50,3 | 48,9 | 35,8 | 61,7 | 49,2 | 45,8 |
45,3 | 71,5 | 35,1 | 57,8 | 28,1 | 57,6 | 49,6 | 45,5 | 36,2 | 63,2 |
61,9 | 25,1 | 65,1 | 49,7 | 62,1 | 46,1 | 39,9 | 62,4 | 50,1 | 33,1 |
33,3 | 49,8 | 39,8 | 45,9 | 37,3 | 78,0 | 64,9 | 28,8 | 62,5 | 58,7 |
Из данной таблицы видно, что интересующий нас признак (прибыль банков) меняется от одного члена совокупности к другому, варьирует. Варьирование есть изменяемость признака у отдельных членов совокупности.
Вариационным рядом называется последовательность вариант, записанных в возрастающем порядке и соответствующих им частот.
Число, показывающее, сколько раз повторяется в данной совокупности каждое значение признака, называется частотой.
Составим ранжированный вариационный ряд (выпишем варианты в порядке возрастания):
20,4 | 25,1 | 26,9 | 27,3 | 27,6 | 28,1 | 28,4 | 28,8 | 29,3 | 30,2 |
31,4 | 33,1 | 33,3 | 33,7 | 34,1 | 34,9 | 35,1 | 35,6 | 35,8 | 36,2 |
37,3 | 37,8 | 38,1 | 39,5 | 39,8 | 39,9 | 40,1 | 40,2 | 41,4 | 41,8 |
41,9 | 42,3 | 42,5 | 43,1 | 43,7 | 44,5 | 44,8 | 45,2 | 45,3 | 45,5 |
45,8 | 45,9 | 46,1 | 46,3 | 46,5 | 47,3 | 47,8 | 47,9 | 48,1 | 48,4 |
48,7 | 48,9 | 49,2 | 49,6 | 49,7 | 49,8 | 50,1 | 50,3 | 51,8 | 51,9 |
52,0 | 52,3 | 52,5 | 52,8 | 53,2 | 53,6 | 53,8 | 54,1 | 55,2 | 55,6 |
55,9 | 56,1 | 56,3 | 57,4 | 57,6 | 57,8 | 58,1 | 58,7 | 58,9 | 59,3 |
59,5 | 60,4 | 61,7 | 61,9 | 62,1 | 62,4 | 62,5 | 63,2 | 64,9 | 65,1 |
65,7 | 66,1 | 67,5 | 68,6 | 69,8 | 70,1 | 70,3 | 70,4 | 71,5 | 78,0 |
В нашем случае каждое значение признака (варианта вариационного ряда) повторилось только один раз, т.е. значение частоты для всех вариант равно единице. Перейдем к интервальному вариационному ряду, так как интересующий нас признак принимает дробные, практически не повторяющиеся значения.
Для этого необходимо определить число интервалов (классов) и длину интервала (классного промежутка), после чего произвести разноску, т.е. подсчитать для каждого интервала число вариант, попавших в него.
Количество классов устанавливают в зависимости от степени точности, с которой ведется обработка, и количества объектов в выборке. Считается удобным при объеме выборки (n) в пределах от 30 до 60 вариант распределять их на 6-7 классов, при n от 60 до 100 вариант — на 7-8 классов, при n от 100 и более вариант — на 9-17 классов.
Нужное количество групп также может быть ориентировочно вычислено по формуле Стерджесса:
где — число групп (классов, интервалов) ряда распределения; n — объем выборки.
Можно также использовать выражение:
При они дают примерно одинаковые результаты.
В рассматриваемом примере о размере прибыли коммерческих банков, n=100. Применяя формулу Стерджесса, получим:
Однако Таким образом, число интервалов может быть равно 8, 9, 10 и т.д.
Нахождение нужного количества групп и их размеров часто бывает взаимообусловлено. Для того, чтобы как-то определиться с числом интервалов, найдем размах вариации — разность между наибольшей и наименьшей вариантой:
где — размах вариации,
— наибольшее значение варьирующего признака,
— наименьшее значение варьирующего признака.
Найдем размах вариации для рассматриваемой задачи:
Для того, чтобы найти длину интервала (величину классового промежутка) необходимо разделить размах вариации на число классов и полученную величину округлить таким образом, чтобы было удобно производить сначала разноску, а затем и различные вычисления. Рекомендую округлять до единиц, до которых округлены варианты в исходной таблице, в нашем случае до десятых.
Согласно формуле получаем
Теперь необходимо определиться с началом первого интервала. Для этого можно использовать формулу:
Замечание. За начало первого интервала можно принять некоторое значение, несколько меньшее или само значение
. Далее в табличном виде я покажу оба варианта.
Прибавив к началу первого интервала (нижней границе) шаг, получим верхнюю границу первого интервала и одновременно нижнюю границу второго интервала. Выполняя последовательно указанные действия, будем находить границы последующих интервалов до тех пор, пока не будет получено или перекрыто .
Таким образом, верхняя граница одного интервала одновременно является нижней границей другого интервала. Чтобы не возникало сомнений, в какой интервал отнести варианту, попавшую на границу, условимся относить ее к верхнему интервалу.
Составим теперь рабочую таблицу для построения интервального вариационного ряда и произведем подсчет частот вариант, попавших в тот или иной интервал.
Как и обещал покажу две таблицы построения ряда:
1. Отсчет ведем от , т.е. нижняя граница первого интервала совпадает с
.
Группы банков по размеру прибыли (границы интервалов) |
Количество банков, принадлежащих данной группе (частоты, |
Накопленные частоты, |
20,4 — 27,6 | 4 | 4 |
27,6 — 34,8 | 11 | 15 |
34,8 — 42 | 16 | 31 |
42 — 49,2 | 21 | 52 |
49,2 — 56,4 | 21 | 73 |
56,4 — 63,6 | 15 | 88 |
63,6 — 70,8 | 10 | 98 |
70,8 — 78 | 2 | 100 |
2. Начало первого интервала определяем с помощью формулы: .
Группы банков по размеру прибыли (границы интервалов) |
Количество банков, принадлежащих данной группе (частоты, |
Накопленные частоты, |
16,8 — 24 | 1 | 1 |
24 — 31,2 | 9 | 10 |
31,2 — 38,4 | 13 | 23 |
38,4 — 45,6 | 17 | 40 |
45,6 — 52,8 | 23 | 63 |
52,8 — 60 | 18 | 81 |
60 — 67,2 | 11 | 92 |
67,2 — 74,4 | 7 | 99 |
74,4 — 81,6 | 1 | 100 |
Как мы видим в 1-м случае у нас получилось восемь интервалов, что полностью совпадает с результатом, который нам дала формула Стерджесса. Во втором случае у нас получилось девять интервалов, так как при поиске начала первого интервала пользовались специальной формулой.
Для дальнейшего исследования я буду пользоваться результатами второй таблицы, так как там ярко выражен модальный интервал (одна мода) и медиана практически точно попадает на середину вариационного ряда.
Мы получили интервальный вариационный ряд — упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами попаданий в каждый из них значений величины.
II. Графическая интерпретация вариационных рядов.
№ п/п |
Границы интервалов, |
Середины интервалов, |
Частоты интервалов, |
Относительные частоты |
Плотность относит. частоты |
Плотность частоты |
1 | 16,8 — 24 | 20,4 | 1 | 0,01 | 0,001 | 0,139 |
2 | 24 — 31,2 | 27,6 | 9 | 0,09 | 0,013 | 1,250 |
3 | 31,2 — 38,4 | 34,8 | 13 | 0,13 | 0,018 | 1,806 |
4 | 38,4 — 45,6 | 42 | 17 | 0,17 | 0,024 | 2,361 |
5 | 45,6 — 52,8 | 49,2 | 23 | 0,23 | 0,032 | 3,194 |
6 | 52,8 — 60 | 56,4 | 18 | 0,18 | 0,025 | 2,500 |
7 | 60 — 67,2 | 63,6 | 11 | 0,11 | 0,015 | 1,528 |
8 | 67,2 — 74,4 | 70,8 | 7 | 0,07 | 0,010 | 0,972 |
9 | 74,4 — 81,6 | 78 | 1 | 0,01 | 0,001 | 0,139 |
Строим графики:
Далее найдем моду вариационного ряда:
где
— начало модального интервала;
— длина частичного интервала (шаг);
— частота предмодального интервала;
— частота модального интервала;
— частота послемодального интервала.
Определим модальный интервал — интервал, имеющий наибольшую частоту. Из таблицы видно, что модальным является интервал (45,6 — 52,8).
Медиана
Для интервального ряда медиана находится по формуле:
где
— начало медианного интервала;
— длина частичного интервала (шаг);
— объем совокупности;
— накопленная частота интервала, предшествующая медианному;
— частота медианного интервала.
Определим медианный интервал — интервал, в котором впервые накопленная частота превышает половину объема выборки.Так как объем выборки n=100, то n/2=50. По таблице найдем интервал, где впервые накопленные частоты превысят это значение. Таким является интервал (45,6 — 52,8).
Получаем,
III. Расчет сводных характеристик выборки.
Для определения составим расчетную таблицу. Для начала определимся с ложным нулем С. В качестве ложного нуля можно принять любую варианту. Максимальная простота вычислений достигается, если выбрать в качестве ложного нуля варианту, которая расположена примерно в середине вариационного ряда (часто такая варианта имеет наибольшую частоту).
Варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю. В нашем случае С=49,2.
Равноотстоящими называют варианты, которые образуют арифметическую прогрессию с разностью h.
Условными называют варианты, определяемые равенством:
Произведем расчет условных вариант согласно формуле:
N п/п |
Середины интервалов, |
Частоты интервалов, |
Условные варианты, |
Произведения частот и условных вариант, |
Произведения частот и условных вариант, |
Произведения частот и условных вариант, |
Произведения частот и условных вариант, |
Произведения частот и условных вариант, |
Произведения частот и условных вариант, |
1 | 20,4 | 1 | -4 | -4 | 16 | -64 | 256 | 9 | 81 |
2 | 27,6 | 9 | -3 | -27 | 81 | -243 | 729 | 36 | 144 |
3 | 34,8 | 13 | -2 | -26 | 52 | -104 | 208 | 13 | 13 |
4 | 42 | 17 | -1 | -17 | 17 | -17 | 17 | 0 | 0 |
5 | 49,2 | 23 | 0 | 0 | 0 | 0 | 0 | 23 | 23 |
6 | 56,4 | 18 | 1 | 18 | 18 | 18 | 18 | 72 | 288 |
7 | 63,6 | 11 | 2 | 22 | 44 | 88 | 176 | 99 | 891 |
8 | 70,8 | 7 | 3 | 21 | 63 | 189 | 567 | 112 | 1792 |
9 | 78 | 1 | 4 | 4 | 16 | 64 | 256 | 25 | 625 |
Контроль:
Контроль:
Равенство выполнено, следовательно вычисления произведены верно.
Вычислим условные моменты 1-го, 2-го, 3-го и 4-го порядков:
Найдем выборочные среднюю, дисперсию и среднее квадратическое отклонение :
Также для оценки отклонения эмпирического распределения от нормального используют такие характеристики, как асимметрия и эксцесс.
Асимметрией теоретического распределения называют отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:
Асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания; асимметрия отрицательна, если «длинная часть» кривой расположена слева от математического ожидания. Практически определяют знак асимметрии по расположению кривой распределения относительно моды (точки максимума дифференциальной функции): если «длинная часть» кривой расположена правее моды, то асимметрия положительна, если слева — отрицательна.
Эксцесс эмпирического распределения определяется равенством:
где — центральный эмпирический момент четвертого порядка.
Для нормального распределения эксцесс равен нулю. Поэтому если эксцесс некоторого распределения отличен от нуля, то кривая этого распределения отличается от нормальной кривой: если эксцесс положительный, то кривая имеет более высокую и «острую» вершину, чем нормальная кривая; если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая. При этом предполагается, что нормальное и теоретическое распределения имеют одинаковые математические ожидания и дисперсии.
Вычисляем центральные эмпирические моменты третьего и четвертого порядков:
Найдем асимметрию и эксцесс:
IV. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.
Проверим генеральную совокупность значений размера прибыли банков по критерию Пирсона
Правило. Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу : генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия:
и по таблице критических точек распределения , по заданному уровню значимости
и числу степеней свободы
найти критическую точку
, где s — количество интервалов.
Если — нет оснований отвергнуть нулевую гипотезу.
Если — нулевую гипотезу отвергают.
Найдем теоретические частоты , для этого составим следующую таблицу.
Середины интервалов, |
Частоты интервалов, |
Произведем расчет, |
Произведем расчет, |
Значения функции Гаусса, |
Произведем расчет, |
Теоретические частоты, |
20,4 | 1 | -28,152 | -2,23 | 0,0332 | 57 | 2 |
27,6 | 9 | -20,952 | -1,66 | 0,1006 | 57 | 6 |
34,8 | 13 | -13,752 | -1,09 | 0,2203 | 57 | 13 |
42 | 17 | -6,552 | -0,52 | 0,3485 | 57 | 20 |
49,2 | 23 | 0,648 | 0,05 | 0,3984 | 57 | 23 |
56,4 | 18 | 7,848 | 0,62 | 0,3292 | 57 | 19 |
63,6 | 11 | 15,048 | 1,19 | 0,1965 | 57 | 11 |
70,8 | 7 | 22,248 | 1,77 | 0,0833 | 57 | 5 |
78 | 1 | 29,448 | 2,34 | 0,0258 | 57 | 1 |
Вычислим , для чего составим расчетную таблицу.
1 | 1 | 2 | -1 | 1 | 0,5 | 1 | 0,5 |
2 | 9 | 6 | 3 | 9 | 1,5 | 81 | 13,5 |
3 | 13 | 13 | 0 | 0 | 0 | 169 | 13 |
4 | 17 | 20 | -3 | 9 | 0,45 | 289 | 14,45 |
5 | 23 | 23 | 0 | 0 | 0 | 529 | 23 |
6 | 18 | 19 | -1 | 1 | 0,05 | 324 | 17,05 |
7 | 11 | 11 | 0 | 0 | 0 | 121 | 11 |
8 | 7 | 5 | 2 | 4 | 0,8 | 49 | 9,8 |
9 | 1 | 1 | 0 | 0 | 0 | 1 | 1 |
100 | 100 |
Наблюдаемое значение критерия, |
103,30 |
Контроль:
Вычисления произведены правильно.
Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) s=9;
По таблице критических точек распределения по уровню значимости
и числу степеней свободы k=6 находим
Так как — нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначительное. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.
На рисунке построены нормальная (теоретическая) кривая по теоретическим частотам (зеленый график) и полигон наблюдаемых частот (коричневый график). Сравнение графиков наглядно показывает, что построенная теоретическая кривая удовлетворительно отражает данные наблюдений.
V. Интервальные оценки.
Интервальной называют оценку, которая определяется двумя числами — концами интервала, покрывающего оцениваемый параметр.
Доверительным называют интервал, который с заданной надежностью покрывает заданный параметр.
Интервальной оценкой (с надежностью ) математического ожидания (а) нормально распределенного количественного признака Х по выборочной средней
при известном среднем квадратическом отклонении
генеральной совокупности служит доверительный интервал
где — точность оценки, n — объем выборки, t — значение аргумента функции Лапласа
(см. приложение 2), при котором
;
при неизвестном среднем квадратическом отклонении (и объеме выборки n<30)
где S — исправленное выборочное среднее квадратическое отклонение, находят по таблице приложения по заданным n и
.
В нашем примере среднее квадратическое отклонение известно, . А также
,
,
. Поэтому для поиска доверительного интервала используем первую формулу:
Все величины, кроме t, известны. Найдем t из соотношения По таблице приложения находим t=1,96. Подставив t=1,96,
,
,
в формулу, окончательно получим искомый доверительный интервал:
Интервальной оценкой (с надежностью ) среднего квадратического отклонения
нормально распределенного количественного признака Х по «исправленному» выборочному среднему квадратическому отклонению S служит доверительный интервал
(при q<1), (*)
(при q>1),
где q — находят по таблице приложения по заданным n и .
По данным и n=100 по таблице приложения 4 найдем q=0,143. Так как q<1, то, подставив
в соотношение (*), получим доверительный интервал:
Рассмотрим рациональные методы определения характеристик выборки Xb и dB.
6.5.1. Условные варианты.
Метод произведений
Пусть выборка из генеральной совокупности X является вариационным рядом с равноотстоящими вариантами, т. е.
Условными называют варианты Ui, определяемые равенством
где С — ложный нуль. Обычно полагают С равным варианте с наибольшей частотой.
Нетрудно видеть, что условные варианты принимают только целые значения, и, если xi0 = C, то Ui0 = 0.
Условные варианты U1, U2, …, Un образуют условную выборку
Тогда можно определить условные эмпирические моменты порядка ;:
т
2 П’^
м; = -.
п
Определив условные выборочные моменты первого и второго порядка
тт
2 П • мг’ 2 П ¦ м* = -; м2* = -,
пп можно определить выборочные среднюю и дисперсию: хв = М* • к + С; 4 = [м2* -(м*)2]• А2.
Пример 6.36. Даны выборочные варианты х. и соответствующие частоты пг — количественного признака X:
Найти методом произведений выборочные среднюю, дисперсию и среднее квадратическое отклонение.
Решение. Составим расчетную таблицу, для чего:
1) запишем варианты х. в первый столбец;
2) запишем частоты пг — во второй столбец;
3) в качестве ложного нуля С выберем варианту 20 (эта варианта имеет наибольшую частоту); в клетке третьего столбца, которая принадлежит строке, содержащей варианту 20, пишем 0; над нулем последовательно записываем условные варианты -1, -2, а под нулем — последовательно 1, 2;
4) произведения частот на условные варианты мг — записываем в четвертый столбец; находим сумму этих произведений и помещаем ее в нижнюю клетку столбца;
5) произведения частот на квадраты условных вариант запишем в пятый столбец; сумму чисел столбца (80) помещаем в нижнюю клетку столбца;
6) произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой (контрольный) столбец; сумму чисел столбца (188) помещаем в нижнюю клетку столбца. В итоге получим следующую расчетную таблицу:
x. | n. | u. | n. ¦ u. | ni •u.2 | n. (u. + 1)2 |
10 | 6 | -2 | -12 | 24 | 6 |
15 | 16 | -1 | -16 | 16 | 0 |
20 | 50 | 0 | 0 | 0 | 50 |
25 | 24 | 1 | 24 | 24 | 96 |
30 | 4 | 2 | 8 | 16 | 36 |
n = 100 | £ n u. = 4 | £ n. u2 = 80 | £ n. (u. +1)2 = 188 |
Контроль
£ ni • u2 +2 £ n. • u. + n = 80 + 2 • 4 +100 = 188;
£ n. (и. +1)2 = 188.
Совпадение найденных сумм свидетельствует о том, что вычисления произведены правильно.
Вычислим условные моменты первого и второго порядков:
< Предыдущая | Следующая > |
---|
1
Первый слайд презентации: Математическая статистика. МЕТОДЫ РАСЧЕТА СВОДНЫХ ХАРАКТЕРИСТИК ВЫБОРКИ
Автор:
доцент кафедры
информатики и математики Грязнов Сергей Александрович
ВЫСШАЯ ШКОЛА ПРИВАТИЗАЦИИ И ПРЕДПРИНИМАТЕЛЬСТВА
Изображение слайда
2
Слайд 2: Условные варианты
Предположим, что варианты выборки
расположены в возрастающем порядке,
т.е. в виде вариационного ряда.
Изображение слайда
3
Слайд 3: Условные варианты
Равноотстоящими называют варианты, которые образуют арифметическую прогрессию с разностью h.
Изображение слайда
4
Слайд 4: Условные варианты
Условными называют варианты, определяемые равенством :
где С —ложный нуль (новое начало отсчета);
h —шаг, т.е. разность между любыми двумя соседними первоначальными вариантами (новая единица масштаба).
Изображение слайда
5
Слайд 5: Условные варианты
Упрощенные методы расчета сводных
характеристик выборки основаны на
замене первоначальных вариант
условными.
Изображение слайда
6
Слайд 6: Условные варианты. Замечание 1
В качестве ложного нуля можно принять
любую варианту. Максимальная простота
вычислений достигается, если выбрать в
качестве ложного нуля варианту, которая
расположена примерно в середине
вариационного ряда (часто такая варианта
имеет наибольшую частоту).
Изображение слайда
7
Слайд 7: Условные варианты. Замечание 2
Варианте, которая принята в качестве
ложного нуля, соответствует условная
варианта, равная нулю.
Изображение слайда
8
Слайд 8: Условные варианты. Пример
Найти условные варианты статистического распределения:
Изображение слайда
9
Слайд 9: Условные варианты. Решение
Выберем в качестве ложного нуля варианту
33,6 (эта варианта расположена в середине
вариационного ряда).
Найдем шаг:
Изображение слайда
10
Слайд 10: Условные варианты. Решение
Найдем условную варианту:
Аналогично получим: и 2 = — 1, и 3 = 0, и 4 =1,
и 5 =2. Мы видим, что условные варианты –
небольшие целые числа. Разумеется,
оперировать с ними проще, чем с
первоначальными вариантами.
Изображение слайда
11
Слайд 11: Обычные, начальные и центральные эмпирические моменты
Для вычисления сводных характеристик
выборки удобно пользоваться
эмпирическими моментами.
В отличии от теоретических эмпирические
вычисляют по данным наблюдений.
Изображение слайда
12
Слайд 12: Обычные, начальные и центральные эмпирические моменты
Обычным эмпирическим моментом
порядка k называют среднее значение k — x
степеней разностей x i — С:
Изображение слайда
13
Слайд 13: Обычные, начальные и центральные эмпирические моменты
Начальным эмпирическим моментом
порядка k называют обычный момент
порядка k при С = 0
Изображение слайда
14
Слайд 14: Обычные, начальные и центральные эмпирические моменты
В частности,
т.е. начальный эмпирический момент первого порядка равен выборочной средней.
Изображение слайда
15
Слайд 15: Обычные, начальные и центральные эмпирические моменты
Центральным эмпирическим моментом порядка k называют обычный момент порядка k при
Изображение слайда
16
Слайд 16: Обычные, начальные и центральные эмпирические моменты
В частности,
т.е. центральный эмпирический момент
второго порядка равен выборочной
дисперсии.
Изображение слайда
17
Слайд 17: Обычные, начальные и центральные эмпирические моменты
Легко выразить центральные моменты
через обычные :
Изображение слайда
18
Слайд 18: Условные эмпирические моменты. Отыскание центральных моментов по условным
Вычисление центральных моментов
требует довольно громоздких вычислений.
Чтобы упростить расчеты, заменяют
первоначальные варианты условными.
Изображение слайда
19
Слайд 19: Условные эмпирические моменты. Отыскание центральных моментов по условным
Условным эмпирическим моментом
порядка k называют начальный момент
порядка k, вычисленный для условных
вариант:
Изображение слайда
20
Слайд 20: Условные эмпирические моменты. Отыскание центральных моментов по условным
В частности,
Изображение слайда
21
Слайд 21: Условные эмпирические моменты. Отыскание центральных моментов по условным
Отсюда,
Таким образом, для того чтобы найти
выборочную среднюю, достаточно
вычислить условный момент первого
порядка, умножить его на h и к результату
прибавить ложный нуль С.
Изображение слайда
22
Слайд 22: Условные эмпирические моменты. Отыскание центральных моментов по условным
Выразим обычные моменты через условные:
Изображение слайда
23
Слайд 23: Условные эмпирические моменты. Отыскание центральных моментов по условным
Отсюда,
Таким образом, для того чтобы найти
обычный момент порядка k, достаточно
условный момент того же порядка
умножить на h k.
Изображение слайда
24
Слайд 24: Условные эмпирические моменты. Отыскание центральных моментов по условным
Найдя же обычные моменты, легко найти цент-
ральные моменты. В итоге получим удобные для
вычислений формулы, выражающие цент-
ральные моменты через условные:
Изображение слайда
25
Слайд 25: Условные эмпирические моменты. Отыскание центральных моментов по условным
В частности, получим формулу для
вычисления выборочной дисперсии по
условным моментам первого и второго
порядков
Изображение слайда
26
Слайд 26: Метод произведений для вычисления выборочных средней и дисперсии
Метод произведений дает удобный способ вычисления условных моментов различных порядков вариационного ряда с равноотстоящими вариантами. Зная же условные моменты, нетрудно найти интересующие нас начальные и центральные эмпирические моменты.
Изображение слайда
27
Слайд 27: Метод произведений для вычисления выборочных средней и дисперсии
В частности, методом произведений удобно вычислять выборочную среднюю и выборочную дисперсию.
Целесообразно пользоваться расчетной таблицей, которая составляется по следующим правилам:
Изображение слайда
28
Слайд 28: Метод произведений для вычисления выборочных средней и дисперсии
1) в первый столбец таблицы записывают выборочные (первоначальные) варианты, располагая их в возрастающем порядке;
Изображение слайда
29
Слайд 29: Метод произведений для вычисления выборочных средней и дисперсии
2) во второй столбец записывают частоты вариант; складывают все частоты и их сумму (объем выборки n ) помещают в нижнюю клетку столбца;
Изображение слайда
30
Слайд 30: Метод произведений для вычисления выборочных средней и дисперсии
3) в третий столбец записывают условные варианты u i = ( x i — C )/ h, причем в качестве ложного
нуля С выбирают варианту, которая расположена
примерно в середине вариационного ряда, и
полагают h равным разности между любыми двумя
соседними вариантами; практически же третий
столбец заполняется так: в клетке строки,
содержащей выбранный ложный нуль, пишут 0; в
клетках над нулем пишут последовательно —1, —2,
—3 и т.д., а под нулем — 1, 2, 3 и т.д.;
Изображение слайда
31
Слайд 31: Метод произведений для вычисления выборочных средней и дисперсии
4) умножают частоты на условные варианты и записывают их произведения n i u i в четвертый столбец; сложив все полученные числа, их сумму
помещают в нижнюю клетку столбца;
Изображение слайда
32
Слайд 32: Метод произведений для вычисления выборочных средней и дисперсии
5) умножают частоты на квадраты условных вариант и записывают их произведения n i u i 2 в пятый столбец; сложив все полученные числа, их сумму помещают в нижнюю клетку столбца;
Изображение слайда
33
Слайд 33: Метод произведений для вычисления выборочных средней и дисперсии
6) умножают частоты на квадраты условных вариант, увеличенных каждая на единицу, и записывают произведения
в шестой контрольный столбец; сложив все
полученные числа, их сумму
помещают в нижнюю клетку столбца.
Изображение слайда
34
Слайд 34: Метод произведений для вычисления выборочных средней и дисперсии. Замечание 1
Целесообразно отдельно складывать отрицательные числа четвертого столбца (их сумму А 1 записывают в клетку строки, содержащей ложный нуль) и отдельно положительные числа (их сумму А 2 записывают в предпоследнюю клетку столбца); тогда
Изображение слайда
35
Слайд 35: Метод произведений для вычисления выборочных средней и дисперсии. Замечание 2
При вычислении произведений n i u i 2 пятого столбца целесообразно числа n i u i четвертого столбца умножать на u i.
Изображение слайда
36
Слайд 36: Метод произведений для вычисления выборочных средней и дисперсии. Замечание 3
Изображение слайда
37
Слайд 37: Метод произведений для вычисления выборочных средней и дисперсии
После того как расчетная таблица заполнена и проверена правильность вычислений, вычисляют условные моменты:
Изображение слайда
38
Слайд 38: Метод произведений для вычисления выборочных средней и дисперсии
Наконец, вычисляют выборочные среднюю и дисперсию:
Изображение слайда
39
Слайд 39: Метод произведений для вычисления выборочных средней и дисперсии. Пример
Найти методом произведений выборочные среднюю и дисперсию следующего статистического распределения:
Изображение слайда
40
Слайд 40: Метод произведений для вычисления выборочных средней и дисперсии. Решение
Составим расчетную таблицу, для чего:
1) запишем варианты в первый столбец;
2) запишем частоты во второй столбец; сумму частот (100) поместим в нижнюю клетку столбца;
Изображение слайда
41
Слайд 41: Метод произведений для вычисления выборочных средней и дисперсии. Решение
3) в качестве ложного нуля выберем
варианту 11,0 (эта варианта расположена
примерно в середине вариационного ряда);
в клетке третьего столбца, которая
принадлежит строке, содержащей
выбранный ложный нуль, пишем 0; над
нулем записываем последовательно —1,
—2, —3, —4, а под нулем — 1, 2, 3, 4, 5;
Изображение слайда
42
Слайд 42: Метод произведений для вычисления выборочных средней и дисперсии. Решение
4) произведения частот на условные
варианты записываем в четвертый
столбец; отдельно находим сумму (—46)
отрицательных и отдельно сумму (103)
положительных чисел; сложив эти числа,
их сумму (57) помещаем в нижнюю клетку
столбца;
Изображение слайда
43
Слайд 43: Метод произведений для вычисления выборочных средней и дисперсии. Решение
5) произведения частот на квадраты условных вариант запишем в пятый столбец; сумму чисел столбца (383) помещаем в нижнюю клетку столбца;
Изображение слайда
44
Слайд 44: Метод произведений для вычисления выборочных средней и дисперсии. Решение
6) произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой контрольный столбец; сумму (597) чисел столбца помещаем в нижнюю клетку столбца.
Изображение слайда
45
Слайд 45: Метод произведений для вычисления выборочных средней и дисперсии. Решение
Изображение слайда
46
Слайд 46: Метод произведений для вычисления выборочных средней и дисперсии. Решение
Вычислим условные моменты первого и второго порядков:
Изображение слайда
47
Слайд 47: Метод произведений для вычисления выборочных средней и дисперсии. Решение
Найдем шаг:
Вычислим искомые выборочные среднюю и дисперсию:
Изображение слайда
48
Последний слайд презентации: Математическая статистика. МЕТОДЫ РАСЧЕТА СВОДНЫХ ХАРАКТЕРИСТИК ВЫБОРКИ: Математическая статистика. МЕТОДЫ РАСЧЕТА СВОДНЫХ ХАРАКТЕРИСТИК ВЫБОРКИ
Автор:
доцент кафедры
информатики и математики Грязнов Сергей Александрович
ВЫСШАЯ ШКОЛА ПРИВАТИЗАЦИИ И ПРЕДПРИНИМАТЕЛЬСТВА
Изображение слайда
Методы расчета сводных характеристик выборки
Условные варианты
Предположим, что варианты выборки расположены в возрастающем порядке, то есть в виде вариационного ряда.
Равноотстоящими называются варианты, которые образуют арифметическую прогрессию с разностью . Условными вариантами называют варианты, определяемые равенством:
где
ложный нуль (новое начало отсчета);
шаг, то есть разность между любыми двумя соседними первоначальными вариантами (новая единица масштаба).
Упрощенные методы расчета сводных характеристик выборки основаны на замене первоначальных вариант условными. Если вариационный ряд состоит из равноотстоящих вариант с шагом , то условные варианты суть целые числа. В самом деле, выбирая в качестве ложного нуля произвольную варианту
будем иметь:
Так как (множеству целых чисел, то и их разность есть целое число.
Условные варианты – это небольшие целые числа. Разумеется оперировать с ними проще, чем с первоначальными вариантами.
Обычные, начальные и центральные эмпирические моменты
Для вычисления сводных характеристик выборки удобно пользоваться эмпирическими моментами, определения которых аналогичны определениям соответствующих теоретических моментов. Эмпирические моменты вычисляются по данным наблюдений.
Определение 1. Обычным эмпирическим моментом порядка называют среднее значение
-х степеней разностей
где наблюдаемая варианта,
частота варианты,
объем выборки,
произвольное постоянное число (ложный нуль).
Определение 2. Начальным эмпирическим моментом порядка называется обычный эмпирический момент порядка
при
В частности
Определение 3. Центральным эмпирическим моментом порядка называется обычный момент порядка
при
В частности
(IV.1)
Легко выразить центральные моменты через обычные:
(IV.2)
(IV.3)
Условные эмпирические моменты. Отыскание центральных моментов по условным
Определение 4. Условным эмпирическим моментом порядка называется начальный момент порядка
, вычисленный для условных вариант
В частности
Откуда:
Выразим обычные моменты через условные:
Отсюда:
Найдя обычные моменты, легко найти центральные моменты по соотношениям (IV.2) и (IV.3), тогда будем иметь удобные формулы для вычислений
(IV.4)
(IV.5)