Функция распределения случайной величины
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Пусть
– действительное число. Вероятность события,
состоящего в том, что
примет значение, меньшее
, то есть вероятность
события
обозначим через
. Разумеется, если
изменяется, то, вообще говоря, изменяется и
, то есть
– функция от
.
Функцией распределения называют функцию
, определяющую вероятность
того, что случайная величина
в результате испытания примет значение,
меньшее
, то есть:
Геометрически
это равенство можно истолковать так:
есть вероятность того, что случайная величина примет
значение, которое изображается на числовой оси точкой, лежащей левее точки
.
Иногда
вместо термина «функция распределения» используют термин «интегральная
функция».
Функцию
распределения дискретной случайной величины
можно представить следующим соотношением:
Это
соотношение можно переписать в развернутом виде:
Функция
распределения дискретной случайной величины есть разрывная ступенчатая функция,
скачки которой происходят в точках, соответствующих возможным значениям
случайной величины и равны вероятностям этих значений. Сумма всех скачков
функции
равна 1.
Свойства функции распределения
Свойство 1.
Значения
функции распределения принадлежат отрезку
:
Свойство 2.
– неубывающая функция, то есть:
,
если
Свойство 3.
Если возможные значения случайной величины
принадлежат интервалу
,
то:
1)
при
;
2)
при
Свойство 4.
Справедливо равенство:
Свойство 5.
Вероятность того, что непрерывная случайная
величина
примет одно определенное значение, равна нулю.
Таким образом, не представляет интереса говорить о
вероятности того, что непрерывная случайная величина примет одно определенное
значение, но имеет смысл рассматривать вероятность попадания ее в интервал,
пусть даже сколь угодно малый.
Заметим, что было бы неправильным думать, что
равенство нулю вероятности
означает, что событие
невозможно (если, конечно, не ограничиваться
классическим определением вероятности). Действительно, в результате испытания
случайная величина обязательно примет одно из возможных значений; в частности,
это значение может оказаться равным
.
Свойство 6.
Если возможные значения непрерывной случайной величины
расположены на всей оси
,
то справедливы следующие предельные соотношения:
Свойство 7.
Функция распределения непрерывная слева, то есть:
Смежные темы решебника:
- Дискретная случайная величина
- Непрерывная случайная величина
- Математическое ожидание
- Дисперсия и среднее квадратическое отклонение
Примеры решения задач
Пример 1
Дан ряд
распределения случайной величины
:
|
1 | 2 | 6 | 8 |
|
0,2 | 0,3 | 0,1 | 0,4 |
Найти и изобразить ее функцию распределения.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Будем задавать различные значения
и находить для них
1. Если
,
то, очевидно,
в том числе и при
2. Пусть
(например
)
Очевидно, что и
3. Пусть
(например
);
Очевидно, что и
4. Пусть
Очевидно, что и
5. Пусть
Итак:
График функции распределения
Пример 2
Случайная
величина
задана функцией распределения:
Найти
вероятность того, что в результате испытания
примет значение:
а) меньше
0,2;
б) меньше
трех;
в) не
меньше трех;
г) не
меньше пяти.
Решение
а) Так
как при
функция
, то
то есть
при
б)
в)
События
и
противоположны, поэтому
Отсюда:
г) сумма
вероятностей противоположных событий равна единице, поэтому
Отсюда, в
силу того что при
функция
, получим:
Пример 3
Задана
непрерывная случайная величина X своей плотностью
распределения вероятностей f(x). Требуется:
1)
определить коэффициент A;
2) найти
функцию распределения F(x);
3)
схематично построить графики функций f(x) и F(x);
4)
вычислить математическое ожидание и дисперсию X;
5)
определить вероятность того, что X примет значение из
интервала (a,b).
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
1)
Постоянный параметр
найдем из
свойства плотности вероятности:
В
нашем случае эта формула имеет вид:
Получаем:
2)
Функцию распределения
найдем из
формулы:
Учитывая
свойства
, сразу можем отметить,
что:
и
Остается
найти выражение для
, когда х принадлежит интервалу
:
Получаем:
3) Построим графики функций:
График плотности распределения
График функции распределения
4) Вычислим
математическое ожидание:
В нашем случае:
Вычислим дисперсию:
Искомая дисперсия:
5) Вероятность того, что
примет значение из интервала
:
Задачи контрольных и самостоятельных работ
Задача 1
Закон
распределения случайной величины X задан таблицей.
Найти ее
математическое ожидание, дисперсию и значение функции распределения в заданной
точке.
F(1)=
M[X]=
D[X]=
Задача 2
Случайная
величины X задана функцией распределения
Найти
плотность распределения вероятностей, математическое ожидание и дисперсию
случайной величины. Построить графики дифференциальной и интегральной функций.
Найти вероятность попадания случайной величины X в интервалы (1,2; 1,8),
(1,8; 2,3)
Задача 3
Дискретная
случайная величина X задана рядом распределения. Найти:
1)
функцию распределения F(x) и ее график;
2)
математическое ожидание M(X);
3)
дисперсию D(X).
|
-5 | 5 | 25 | 45 | 65 |
|
0.2 | 0.15 | 0.3 | 0.25 | 0.1 |
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 4
В задаче
дискретная случайная величина задана рядом распределения.
Найти
; M(X), D(X), P(0≤X≤2); F(x).
Начертить график F(x)
Задача 5
В задаче
непрерывная случайная величина X задана функцией
распределения F(x).
Найти a; f(x); M(X); D(X); P(X<0.2)
Начертить
графики функций f(x);F(x).
Задача 6
Функция
распределения непрерывной случайной величины X (времени безотказной работы
некоторого устройства) равна
(
). Найти вероятность безотказной
работы устройства за время x больше либо равно T.
Задача 7
Функция
распределения непрерывной случайной величины задана выражением:
Найдите:
1)
параметр a;
2)
плотность вероятностей;
4) P(0<x<1)
Постройте
графики интегральной и дифференциальной функции распределения.
Задача 8
Дана
интегральная функция распределения. Найти: дифференциальную функцию f(x),M(X),σ(X),D(X).
Задача 9
Дана
функция распределения F(х) случайной величины Х.
Найти плотность
распределения вероятностей f(x), математическое ожидание M(X),
дисперсию D(X) и вероятность попадания X на
отрезок [a,b]. Построить графики
функций F(x) и f(x).
Задача 10
НСВ X имеет
плотность вероятности (закон Коши)
Найти:
а)
постоянную C=const;
б)
функцию распределения F(x);
в)
вероятность попадания в интервал -1<x<1
г)
построить графики f(x), F(x).
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Непрерывная случайная величина
Ранее мы представили примеры решений задач о дискретной случайной величине, теперь переходим к непрерывной. Формально в задачах требуется найти тоже самое: вычислить числовые характеристики, начертить графики, определить неизвестные параметры, найти вероятности событий.
Но формулы-то совсем другие (в силу непрерывности СВ), поэтому стоит разобраться в них хорошенько. Надеемся, наши примеры вам помогут (а если нет времени, закажите решение).
Ниже вы найдете примеры решений на самые разные законы распределений непрерывных случайных величин: законы $arcsin$ и $arctan$, тригонометрические и логарифмические функции, показательный, равномерный закон распределения, законы Коши, Симпсона, Лапласа и т.д.
Примеры для других НСВ: Нормальный закон, Равномерный закон, Показательный закон.
Спасибо за ваши закладки и рекомендации
Примеры решений
Задача 1. Случайная величина X задана дифференциальной функцией распределения
1) Определить вероятность попадания случайной величины X в интервал $[pi, 5/4 pi]$.
2) Найти математическое ожидание и дисперсию случайной величины X.
Задача 2. Случайная величина X задана плотностью вероятности:
Требуется:
а) найти коэффициент C;
б) найти функцию распределения F(x);
в) найти M(X), D(X), σ(X)
г) найти вероятность P(α < X < β);
д) построить графики f(x) и F(x).
Задача 3. Случайная величина Х задана функцией распределения F(x).
А) является ли случайная величина Х непрерывной?
Б) имеет ли случайная величина Х плотность вероятности f(X)? Если имеет, найти ее.
В) постройте схематично графики f(X) и F(X).
Задача 4. Дана функция распределения F(x) непрерывной случайной величины X.
1. Найти значения параметров a,b
2. Построить график функции распределения F(x)
3. Найти вероятность P(α < X < β)
4. Найти плотность распределения p(x) и построить ее график.
Задача 5. Время в годах безотказной работы прибора подчинено показательному закону, т.е. плотность распределения этой случайной величины такова: f(t)=2e-2t при t ≥ 0 и f(t)=0 при t<0.
1) Найти формулу функции распределения этой случайной величины.
2) Определить вероятность того, что прибор проработает не более года.
3) Определить вероятность того, что прибор безотказно проработает 3 года.
4) Определить среднее ожидаемое время безотказной работы прибора.
Задача 6. Функция распределения вероятностей случайной величины $X$ имеет вид:
А) найти $a$ и $b$;
Б) найти плотность $f(x)$;
В) нарисовать график $F(x)$;
Г) нарисовать график $f(x)$;
Д) найти $M[X]$;
Е) найти $D[X]$.
Задача 7. Функция распределения вероятностей случайной величины $X$ имеет вид:
$$F(x)=A+B arctan (x/2), -infty lt x lt infty $$ (закон Коши).
А) определить постоянные $A$ и $B$;
Б) найти плотность распределения вероятностей
В) найти $P(-1 lt X lt 1)$;
Г) нарисовать график $F(x)$;
Д) нарисовать график $f(x)$.
Задача 8. Случайная величина $X$ имеет распределение Парето с плотностью вероятности $f(x)=4/23(23/x)^5$
при $23 le x$ и $f(x)=0$ при $x lt 23$.
Найдите $M(X)$ и $P(23lt X lt 27)$.
Задача 9. Непрерывная случайная величина задана интегральной функцией (функцией распределения) $F(x)$. Найти:
А) вероятность попадания случайной величины $X$ в интервал $(a;b)$.
Б) дифференциальную функцию (функцию плотности вероятностей) $f(x)$.
В) математическое ожидание, дисперсию и среднее квадратическое отклонение величины $X$.
Г) построить графики функций $F(x)$ и $f(x)$.
Задача 10. Случайная величина $X$ подчинена закону Лапласа $p(x)=acdot e^{-lambda |x|}$, $lambda gt 0.$ Найти $a$, $M(x)$, $D(x)$ и $F(x)$. Построить графики $p(x)$ и $F(x)$.
Задача 11. Случайная величина $X$ задана функцией распределения $F(x)$. Найти:
5) дифференциальную функцию $f(x)$ (плотность распределения),
6) математическое ожидание $M(X)$, дисперсию $D(X)$, среднее квадратическое отклонение $sigma(X)$.
7) Моду $Mo$ и медиану $Me$,
$P(1/2 lt X lt 2).$
Построить графики функции и плотности распределения.
Задача 12. Случайная величина $Х$ подчинена закону Симпсона (закону равнобедренного треугольника) на участке от $-a$ до $+a$.
а) Написать выражение для плотности распределения.
б) Построить график функции распределения.
в) Определить числовые характеристики случайной величины Х.
Мы отлично умеем решать задачи по теории вероятностей
Решебник по теории вероятности онлайн
Больше 11000 решенных и оформленных задач по теории вероятности:
Здравствуйте, на этой странице я собрала краткий курс лекций по предмету «Теория вероятностей и математическая статистика» — ТВИМС.
Лекции подготовлены для студентов любых специальностей и охватывает курс предмета «Теория вероятностей и математическая статистика».
В лекциях вы найдёте основные законы, теоремы, формулы и примеры с решением.
Если что-то непонятно — вы всегда можете написать мне в WhatsApp и я вам помогу!
Тео́рия вероя́тностей — раздел математики, изучающий случайные события, случайные величины, их свойства и операции над ними. wikipedia.org/wiki/Теория_вероятностей
Математи́ческая стати́стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов. wikipedia.org/wiki/Математическая_статистика
Предмет теория вероятностей
Задачи любой науки состоят в выявлении и исследовании закономерностей, которым подчиняются реальные процессы.
Теория вероятностей — математическая наука, изучающая закономерности случайных явлений. Знание закономерностей, которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.
Методы теории вероятностей широко применяются в различных отраслях науки и техники: в теории надёжности, теории массового обслуживания, теоретической физике, геодезии, астрономии, теории ошибок, теории управления, теории связи и во многих других теоретических и прикладных науках. Теория вероятностей служит для обоснования математической статистики.
Математическая статистика — раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей. Методы математической статистики используются при планировании организации производства, анализе технологических процессов, для контроля качества продукции и многих других целей.
Первые работы, в которых зарождались основные понятия теории вероятностей, появились в XVI-XVII веках. Они принадлежали Д.Кардано, Б.Паскалю, П.Ферма, Х.Гюйгенс и др. и представляли попытки создания теории азартных игр с целью дать рекомендации игрокам. Следующий этап развития теории вероятностей связан с именем Я.Бернулли, который доказал теорему, теоретически обосновавшую накопленные ранее факты и названную в дальнейшем «законом больших чисел».
Дальнейшее развитие теории вероятностей приходится на XVII-XIX века благодаря работам А.Муавра, П.Лапласа, К.Гаусса, С.Пуассона и др. Весьма плодотворный период развития «математики случайного» связан с именами русских математиков П.Л.Чебышсва, А.М.Ляпунова и А.А.Маркова.
Большой вклад в последующее развитие теории вероятностей и математической статистики внесли российские математики С.Н.Бсрнштейн, В.И.Романовский, А.Н.Колмогоров, А.Я.Хинчин, Б.В.Гнеденко и др., а также учёные англо-американской школы Стьюдент (псевдоним В.Госсета), Р.Фишер, Э.Пирсон, Е.Нейман и др. Особо следует отметить неоценимый вклад академика А.Н.Колмогорова в становление теории вероятностей как математической науки.
Широкому внедрению статистических методов исследования способствовало появление во второй половине XX века электронных вычислительных машин и, в частности, персональных компьютеров. Статистические программные пакеты сделали эти методы более доступными и наглядными, так как трудоёмкую работу по расчёту статистик, параметров, характеристик, построению таблиц и графиков в основном стал выполнять компьютер, а исследователю осталась главным образом творческая работа: постановка задачи, выбор методов решения и интерпретация результатов.
Основные понятия теории вероятностей
Наблюдаемые события можно разделить на три вида: достоверные, невозможные и случайные.
Событие называется достоверным, если оно обязательно произойдет при выполнении данного ряда условий.
Событие называется невозможным, если оно заведомо не произойдет при выполнении данного ряда условий.
Событие называется случайным, если при осуществлении ряда условий оно может либо произойти, либо не произойти. Испытанием называется осуществление ряда условий. События называются несовместными, если появление одного из них исключает появление других событий в одном и том же испытании. События называются единственно возможными, если появление в результате испытания одного и только одного из них является достоверным событием.
Очевидно, единственно возможные события являются попарно несовместимыми.
События называются равновозможными. если можно считать, что ни одно из них не является более возможным, чем другие.
Элементарным исходом называется каждый из возможных результатов испытания.
Полной группой называется совокупность единственно возможных событий испытания.
Противоположными называются два единственно возможных события, образующих полную группу. Если одно из двух противоположных событий обозначено через , то другое обозначают
.
Суммой двух событий
и
называется событие, состоящее в появлении события
или события
, или обоих этих событий. Суммой нескольких событий называется событие, которое состоит в появлении хотя бы одного из этих событий.
Произведением двух событий и
называется событие
, состоящее в совместном появлении этих событий.
Произведением нескольких событий называется событие, состоящее в совместном появлении всех этих событий.
Вероятностью события называется отношение числа благоприятных исходов к общему числу всех элементарных исходов испытания, если все исходы равновозможны (классическое определение вероятности). Формулой это определяется так:
где — число элементарных исходов, благоприятных событию
— число всех возможных элементарных исходов.
Из определения вероятности вытекают следующие свойства:
а) вероятность достоверного события равна единице;
б) вероятность невозможного события равна нулю;
в) вероятность случайного события есть положительное число, заключенное между нулем и единицей;
г) вероятность суммы двух несовместных событий равна сумме вероятностей этих событий:
Пример № 1
В ящике 10 пронумерованных шаров с номерами от 1 до 10. Вынули один шар. Какова вероятность того, что номер вынутого шара не превышает 10?
Решение:
Так как номер любого шара, находящегося в ящике, не превышает 10, то число случаев, благоприятствующих событию , равно числу всех возможных случаев, т.е.
В этом случае событие достоверно.
Пример № 2
В урне 15 шаров: 5 белых и 10 чёрных. Какова вероятность вынуть из урны синий шар?
Решение:
Синих шаров в урне нет, т.е.
Следовательно,
В данном случае событие — невозможное.
Пример № 3
В урне 12 шаров: 3 белых, 4 чёрных и 5 красных. Какова вероятность вынуть из урны чёрный шар?
Решение:
Здесь
Пример № 4
В урне 10 шаров: 6 белых и 4 чёрных. Вынули 2 шара. Какова вероятность того, что оба шара — белые?
Решение:
Здесь число всех случаев
Число же случаев, благоприятствующих событию , определяется равенством
Итак,
Пример № 5
В корзине 100 фруктов: 10 груш и 90 яблок. Наугад взяты четыре фрукта. Найти вероятность того, что
а) взято четыре яблока;
б) взято четыре груши.
Решение:
Общее число элементарных исходов испытания равно числу сочетаний из 100 элементов по четыре, т.е. .
а) Число исходов, благоприятствующих рассматриваемому событию (все взятые наугад четыре фрукта являются яблоками), равно числу сочетаний из 90 элементов по четыре, т.е. .
Искомая вероятность равна отношению числа исходов, благоприятствующих рассматриваемому событию, к общему числу возможных элементарных исходов:
б) Число исходов, благоприятствующих рассматриваемому событию (все взятые наугад четыре фрукта — груши), равно числу способов, которыми можно извлечь четыре груши из десяти имеющихся, т.е. . Искомая вероятность
Пример № 6
Из 10 ответов к задачам, помещённым на данной странице, 2 имеют опечатки. Студент решает 5 задач. Какова вероятность того, что в одной из них ответ дан с опечаткой.
Решение:
Примечание. Такие задачи описываются общей схемой. Имеется совокупность из элементов первого вида и
элементов второго вида. Какова вероятность того, что при выборе совокупности из
элементов она состоит из
элементов первого вида и
элементов второго вида, где
Относительная частота события
Относительной частотой события называется отношение числа испытаний, в которых событие появилось, к общему числу фактически произведенных испытаний. Таким образом,
где — число появлений события;
— общее число испытаний,
— относительная частота события.
В тех случаях, когда классическое определение вероятности неприменимо (например, когда число исходов бесконечно), используется статистическое определение. В этом случае за вероятность события принимается относительная частота события.
Геометрическое определение вероятности
При классическом определении вероятности не всегда можно определить числа и
для вычисления вероятностей событий, и поэтому непосредственно пользоваться формулой
не удаётся. В таких случаях вводят понятие геометрической вероятности, т. е. вероятности попадания точки в область (отрезок, часть плоскости, часть тела и т. д.).
Пусть, например, на плоскости имеется некоторая область и в ней содержится другая область
. Требуется найти вероятность того, что точка, взятая наудачу в области
, попадет в область
. При этом выражению «точка, взятая наудачу в области
» придается следующий смысл: эта точка может попасть в любую точку области
. Вероятность попадания точки в какую-либо часть области
пропорциональна мере
этой части (длине, площади, объему и т.д.) и не зависит от ее расположения и формы:
(геометрическое определение вероятности).
Пример № 7
На отрезке длины
числовой оси
наудачу нанесена точка
. Найти вероятность того, что отрезки
и
имеют длину больше, чем
.
Решение:
Разобьём отрезок на четыре равные части точками
(рис. 1). Требование задачи будет выполнено, если точка
попадёт на отрезок
, длина которого равна
.
Следовательно,
Пример № 8
Внутри эллипса расположен круг
. Найти вероятность попадания точки в кольцо, ограниченное эллипсом и кругом.
Решение:
Пусть событие — попадание точки в кольцо. Тогда
где
Так как
то
Примечание. В случае классического определения вероятность невозможного события равна нулю. Справедливо и обратное утверждение, т.е. если вероятность события равна нулю, то событие невозможно. При геометрическом же определении вероятности обратное утверждение не имеет места. Вероятность попадания брошенной точки в одну определённую точку области равна нулю, однако это событие может произойти и, следовательно, не является невозможным.
Пример № 9 (Задача о встрече)
Два студента и
условились встретиться в определённом месте во время перерыва между 13 ч и 13 ч 50 мин. Пришедший первым ждёт другого в течение 10 мин, после чего уходит. Чему равна вероятность их встречи, если приход каждого из них в течение указанных 50 мин может произойти наудачу, и моменты прихода независимы?
Решение:
Обозначим момент прихода студента через
, а студента
— через
. Для того чтобы встреча произошла, необходимо и достаточно, чтобы
. Изобразим
и
как декартовы координаты на плоскости, а в качестве единицы масштаба выберем одну минуту (рис. 2). Всевозможные исходы изобразятся точками квадрата со стороной 50, а исходы, благоприятствующие встрече, — точками заштрихованной области. Искомая вероятность равна отношению площади заштрихованной фигуры к площади всего квадрата:
Аксиоматическое построение теории вероятностей
Пусть — множество всех возможных исходов некоторого испытания (опыта, эксперимента). Каждый элемент
множества
, т.е.
, называют элементарным событием или элементарным исходом, а само множество
— пространством элементарных событий. Любое событие
рассматривается как некоторое подмножество (часть) множества
, т.е.
.
Само пространство элементарных событий представляет собой событие, происходящее всегда (при любом элементарном исходе со), и называется достоверным событием. Таким образом,
выступает в двух качествах: множества всех элементарных исходов и достоверного события. Ко всему пространству
элементарных событий добавляется ещё пустое множество
, рассматриваемое как событие и называемое невозможным событием.
Суммой нескольких событий называется объединение множеств
.
Произведением нескольких событий называется пересечение множеств
Событием , противоположным событию
, называется дополнение множества
до
, т.е.
.
Несколько событий образуют полную группу (полную систему), если их сумма представляет всё пространство элементарных событий, а сами события несовместные, т.е.
Таким образом, под операциями над событиями понимаются операции над соответствующими множествами.
В начале 30-х годов XX века академик А.Н.Колмогоров разработал подход, связывающий теорию вероятностей с современной метрической теорией функций и теорией множеств, который в настоящее время является общепринятым.
Сформулируем аксиомы теории вероятностей. Каждому событию поставим в соответствие некоторое число, называемое вероятностью события
, т.е.
. Так как любое событие есть множество, то вероятность события есть функция множества.
Вероятность события должна удовлетворять следующим аксиомам: Р.1. Вероятность любого события неотрицательна: .
Р.2. Вероятность достоверного события равна 1: .
Р.З. Вероятность суммы несовместных событий равна сумме вероятностей этих событий, т.е. если то
Из аксиом P.1, Р.2, Р.З можно вывести основные свойства вероятностей:
Произведение событий
Условной вероятностью называется вероятность события
, вычисленная в предположении, что событие
уже произошло. Теорема. Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную в предположении, что первое событие уже наступило:
Следствие. Вероятность совместного появления нескольких событий равна произведению вероятности одного из них на условные вероятности всех остальных, причем вероятность каждого последующего события вычисляется в предположении, что все предыдущие события уже появились:
Два события и
называются независимыми, если
Пример № 10
В первом ящике 2 белых и 10 чёрных шаров; во втором ящике 8 белых и 4 чёрных шара. Из каждого ящика вынули по шару. Какова вероятность, что оба шара белые?
Решение:
В данном случае речь идёт о совмещении событий и
, где событие
— появление белого шара из первого ящика, событие
— появление белого шара из второго ящика. При этом
и
— независимые события. Имеем
Применив теорему умножения вероятностей, находим
Пример № 11
В ящике 6 белых и 8 чёрных шаров. Из ящика вынули два шара (не возвращая вынутый шар в ящик). Найти вероятность того, что оба шара белые.
Решение:
Пусть событие — появление белого шара при первом вынимании; событие
— появление белого шара при втором вынимании. По теореме умножения вероятностей для случая зависимых событий имеем
Но
(вероятность появления первого белого шара);
(вероятность появления второго белого шара в предположении, что первый белый шар уже вынут). Поэтому
Пример № 12
Три стрелка независимо друг от друга стреляют по цели. Вероятность попадания в цель для первого стрелка равна 0,75, для второго — 0,8, для третьего — 0,9. Определить вероятность того, что все три стрелка одновременно попадут в цель.
Решение:
Пример № 13
Из колоды в 52 листа наугад вытягиваются три карты. Какова вероятность, что все три карты — тузы?
Решение:
Интересующее нас событие (все три карты — тузы) является произведением трех событий: — первая карта туз,
— вторая карта туз,
— третья карта туз. По теореме умножения
(число благоприятствующих исходов — число тузов в колоде, общее число элементарных исходов равно числу карт).
(число благоприятствующих исходов — число тузов, оставшихся после совершения события , т.е. после того, как один туз был вынут из колоды; общее число исходов равно числу карт, оставшихся в колоде после того, как одну карту уже вынули). Аналогично,
Следовательно,
Пример № 14
Вероятность выхода станка из строя в течении одного рабочего дня равна (
— малое положительное число, второй степенью которого можно пренебречь). Какова вероятность того, что за 5 дней станок ни разу не выйдет из строя? Решить задачу при
= 0,01.
Решение:
Так как (1 — ) — вероятность того, что станок не выйдет из строя в течение дня, то по теореме умножения вероятностей
— вероятность того, что станок не выйдет из строя в течение 5 дней.
Воспользовавшись биномиальным разложением и пренебрегая членами, содержащими получим приближённое равенство
. Приняв
, получаем
.
Сумма событий
Теорема. Вероятность суммы нескольких попарно несовместных событий равна сумме вероятностей этих событий:
Теорема. Сумма вероятностей событий образующих полную группу, равна единице:
Теорема. Сумма вероятностей противоположных событий равна единице:
Теорема. Вероятность суммы совместных событий равна сумме вероятностей этих событий без вероятности их совместного появления:
Пример № 15
В урне 10 белых, 15 чёрных, 20 синих и 25 красных шаров. Вынули один шар. Найти вероятность того, что вынутый шар: белый; чёрный; синий; красный; белый или чёрный; синий или красный; белый, чёрный или синий.
Решение:
Имеем
Применив теорему сложения вероятностей, получим
Пример № 16
Два стрелка стреляют по мишени. Вероятность попадания в цель первым стрелком равна 0,6, вторым — 0,8. Найти вероятность того, что при одном залпе:
а) попадут в цель оба стрелка;
б) попадет хотя бы один.
Решение:
Обозначим события: — попадет в цель первый стрелок,
— попадет в цель второй стрелок.
а) Интересующее нас событие (попадут в цель оба стрелка) является произведением событий и
. Так как
и
— независимые события (стрелок попадает или не попадает в цель независимо от меткости другого), то
Следовательно,
б) 1-й способ. Интересующее нас событие является суммой событий и
, поэтому по теореме сложения
2-й способ. Событие (попадет хотя бы один стрелок) и
(ни один из стрелков не попадет) — противоположные, поэтому
. Следовательно,
.
Событие является произведением событий
и
. Таким образом
Пример № 17
В первом ящике 2 белых и 10 чёрных шаров; во втором ящике 8 белых и 4 чёрных шара. Из каждого ящика вынули по шару. Какова вероятность того, что один из вынутых шаров белый, а другой — чёрный.
Решение:
Пусть: событие — появление белого шара из первого ящика; событие
— появление белого шара из второго ящика; событие
— появление чёрного шара из первого ящика
, событие
— появление белого шара из второго ящика
.
Определим вероятность того, что шар, вынутый из первого ящика, белый, а из второго ящика — чёрный:
Определим вероятность того, что шар, вынутый из первого ящика, чёрный, а из второго ящика — белый:
Определим теперь вероятность того, что шар, вынутый из одного ящика (безразлично — из первого или второго), окажется белым, а шар, вынутый из другого ящика, — чёрным. Применяем теорему сложения вероятностей:
Пример № 18
Три стрелка независимо друг от друга стреляют по цели. Вероятность попадания в цель для первого стрелка равна 0,75, для второго — 0,8, для третьего — 0,9. Определить вероятность того, что в цель попадёт хотя бы один стрелок.
Решение:
Здесь (вероятность промаха первого стрелка);
(вероятность промаха второго стрелка);
(вероятность промаха третьего стрелка); тогда
— вероятность одновременного промаха всех трёх стрелков — определится следующим образом:
Но событие, противоположное событию , заключается в поражении цели хотя бы одним стрелком. Следовательно, искомая вероятность
Формула полной вероятности
Теорема. Вероятность события , которое может наступить при условии появления одного из несовместных событий
образующих полную группу и называемых гипотезами, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события
:
Пример № 19
Студент знает только 10 из 25 экзаменационных билетов. В каком случае вероятность сдать экзамен больше: когда студент подходит тянуть билет первым или вторым по счету?
Решение:
Обозначим события: — вытягивает выученный билет, подходя первым;
— вытягивает выученный билет, подходя вторым.
(число благоприятствующих исходов равно числу выученных билетов; число всех элементарных исходов равно числу билетов). Событие может наступить при появлении одного из двух несовместных событий
(первый взятый билет был известен нашему студенту) и
(первый взятый билет был невыученный билет). По формуле полной вероятности
Так как
то вероятность одинакова.
Пример № 20
Имеются 4 урны. В первой урне 1 белый и 1 чёрный шар, во второй -2 белых и 3 чёрных шара, в третьей — 3 белых и 5 чёрных шаров, в четвёртой -4 белых и 7 чёрных шаров. Событие — выбор
-той урны
. Известно, что вероятность выбора
-той урны равна
, т.е.
,
Выбирают наугад одну из урн и вынимают из неё шар. Найти вероятность того, что этот шар белый.
Решение:
Из условия следует, что (условная вероятность извлечения белого шара из первой урны); аналогично
. Вероятность извлечения белого шара находим по формуле полной вероятности:
Пример № 21
В первой урне 5 белых и 10 чёрных шаров, во второй — 3 белых и 7 чёрных шаров. Из второй урны в первую переложили один шар, а затем из первой урны вынули наугад один шар. Определить вероятность того, что вынутый шар — белый.
Решение:
Обозначим события: — вынули белый шар из первой урны после того, как в неё переложили шар из второй урны;
— из второй урны в первую переложили белый шар;
— из второй урны в первую переложили чёрный шар.
Если из второй урны в первую переложили белый шар, то в первой урне стало 16 шаров, из них 6 белых, поэтому
Если переложили чёрный шар, то в первой урне стало 16 шаров, из них 5 белых, поэтому
По формуле полной вероятности
Формула Байеса
Пусть событие может наступить при условии появления одного из несовместных событий
образующих полную группу. Тогда условная вероятность любого события
при условии, что событие
уже произошло, вычисляется по формуле Байеса:
Пример № 22
В первой урне 4 белых и 6 чёрных шаров, во второй — 5 белых и 4 чёрных. Из первой урны во вторую перекладывают, не глядя, один шар, после чего из второй урны извлекают один шар. Найти вероятность, что этот шар белый. Какова вероятность, что из первой во вторую урну был переложен чёрный шар, если извлечённый из второй урны шар оказался белым?
Решение:
Пусть — событие, состоящее в том, что извлечённый шар из второй урны оказался белым,
— из первой урны во вторую переложили белый шар,
— чёрный.
и
— гипотезы.
Найдем
Если переложили белый шар, то во второй урне стало 10 шаров, из них 6 белых 6
если чёрный, то шаров так же 10, но белых 5, тогда
По формуле полной вероятности
По формуле Байеса:
Схема Бернулли
Испытания называются независимыми относительно события , если при нескольких испытаниях вероятность события
не зависит от исходов других испытаний.
Говорят, что испытания проводятся по схеме Бернулли, если для них выполняются следующие условия:
1) испытания независимы;
2) количество испытаний известно заранее;
3) в результате испытания может произойти только два исхода: «успех» или «неуспех»;
4) вероятность «успеха» в каждом испытании одна и та же. Вероятность того, что при испытаниях «успех» осуществится ровно
раз и, следовательно, «неуспех»
раз, вычисляется по следующей формуле:
где — число сочетаний из
элементов по
;
— вероятность «успеха»;
— вероятность «неуспеха»
Данная формула называется формулой Бернулли.
Пример № 23
В урне 20 белых и 10 чёрных шаров. Вынули подряд 4 шара, причём каждый вынутый шар возвращают в урну перед извлечением следующего, и шары в урне перемешивают. Какова вероятность того, что из четырёх вынутых шаров окажется два белых?
Решение:
Вероятность извлечения белого шара можно считать одной и той же во всех четырёх испытаниях;
. Используя формулу Бернулли, получаем
Пример № 24
Вероятность появления события равна 0,4. Какова вероятность того, что при 10 испытаниях событие А появится не более трёх раз?
Решение:
Здесь
Имеем:
Вероятность того, что событие появится не больше трёх раз, составляет
Полагая
получим
Пример № 25
В семье пять детей. Найти вероятность того, что среди этих детей два мальчика. Вероятность рождения мальчика принять равной 0,51.
Решение:
Вероятность рождения мальчика равна . Следовательно, вероятность рождения девочки равна
. Искомая вероятность по формуле Бернулли равна
Локальная и интегральная теоремы Лапласа
В тех случаях, когда использование формулы Бернулли затруднено из-за большого значения п, можно использовать асимптотическую формулу из следующей теоремы.
Локальная теорема Лапласа. Вероятность того, что в независимых испытаниях, в каждом из которых вероятность появления события равна
, событие наступит ровно
раз (безразлично, в какой последовательности), приближенно равна (тем точнее, чем больше
)
Здесь
Имеются таблицы, в которых помещены значения функции
соответствующие положительным значениям аргумента (приложение, табл. 1). Для отрицательных значений аргумента пользуются теми же таблицами, т.к. функция
четна, т.е.
. При
.
Интегральная теорема Лапласа. Вероятность того, что в п независимых испытаниях, в каждом из которых вероятность появления события равна , событие наступит не менее
раз и не более
раз, приближенно равна
Здесь
функция Лапласа,
Имеются таблицы функции Лапласа (приложение, табл. 2) для положительных значений ; для значений
полагают
. Для отрицательных значений используют эту же таблицу, учитывая, что функция Лапласа нечетна, т.е.
Пример № 26
Вероятность рождения мальчика равна 0,51. Найти вероятность того, что среди 100 новорожденных окажется 50 мальчиков.
Решение:
По условию задачи
Так как — достаточно большое число, воспользуемся локальной теоремой Лапласа:
Найдем значение :
По справочным таблицам (см. приложение, табл.1) найдем
(т.к. функция — четная).
Искомая вероятность
Пример № 27
Вероятность поражения мишени стрелком при одном выстреле равна 0,8. Найти вероятность того, что при 100 выстрелах мишень будет поражена не менее 75 раз и не более 90 раз.
Решение:
По условию задачи
Воспользуемся интегральной теоремой Лапласа:
где — функция Лапласа,
Вычислим и
:
Так как функция Лапласа нечетна, т.е.
получим
По справочным таблицам (см. приложение, табл.2) найдём:
Искомая вероятность
Наивероятнейшее число появлений события в независимых испытаниях
Число (наступление события в независимых испытаниях, в каждом из которых вероятность появления события равна
) называют наивероятнейшим, если вероятность того, что событие наступит в этих испытаниях
раз, превышает (или, по крайней мере, не меньше) вероятности остальных возможных исходов испытаний .
Наивероятнейшее число определяют из двойного неравенства
причем:
а) если число — дробное, то существует одно наивероятнейшее число
;
б) если число — целое, то существует два наивероятнейших числа, а именно
и
;
в) если число — целое, то наивероятнейшее число
.
Пример № 28
В урне 10 белых и 40 чёрных шаров. Вынимают подряд 14 шаров, причём цвет вынутого шара регистрируют, а затем шар возвращают в урну. Определить наивероятнейшее число появлений белого шара.
Решение:
Используя двойное неравенство
при указанных значениях и
получим
Таким образом, задача имеет два решения:
Пример № 29
Вероятность попадания стрелком в цель равна 0,7. Сделано 25 выстрелов. Определить наивероятнейшее число попаданий в цель.
Решение:
Здесь
Следовательно,
Так как — целое число, то
= 18.
Пример № 30
В результате многолетних наблюдений установлено, что вероятность выпадения дождя 1 октября в данном городе равна 1/7. Определить наивероятнейшее число дождливых дней 1 октября в данном городе за 40 лет.
Решение:
Имеем
Таким образом,
Пример № 31
В урне 100 белых и 80 чёрных шаров. Из урны извлекают шаров (с возвратом каждого вынутого шара). Наивероятнейшее число появлений белого шара равно 11. Найти
.
Решение:
Из двойного неравенства
следует, что
Здесь
следовательно,
Итак, задача имеет два решения:
Пример № 32
Найти наиболее вероятное число правильно набранных секретарём страниц среди 19 страниц текста, если вероятность того, что страница набрана с ошибками, равна 0,1.
Решение:
По условию задачи
Найдем наиболее вероятное число правильно набранных страниц из двойного неравенства
Подставляя данные задачи, получим
или
Так как — целое число, то наиболее вероятных чисел два:
и
Формула Пуассона
При достаточно больших , если вероятность события мала
, формула Лапласа непригодна.
В этих случаях ( велико, р <0,1) пользуются формулой Пуассона: вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно
раз, приближенно равна
Здесь Имеются таблицы для вычисления
, для различных
и
(приложение, табл. 3).
Пример № 33
Прядильщица обслуживает 1000 веретен. Вероятность обрыва нити на одном веретене в течение 1 минуты равна 0,004. Найти вероятность того, что в течение 1 минуты обрыв произойдет на пяти веретенах.
Решение:
Так как вероятность очень мала, применение локальной теоремы Лапласа приведет к значительному отклонению от точного значения
. Поэтому при
применяют формулу Пуассона:
где
По условию задачи
Тогда
Подставляя данные задачи, получим
Замечание. Формулы Бернулли, Пуассона и формула, следующая из локальной теоремы Лапласа, служат для нахождения вероятности, что в испытаниях, проводимых по схеме Бернулли, «успех» наступит ровно
раз. Для удобства сведём их в одну таблицу.
Случайная величина
Случайной величиной называется переменная величина, значения которой зависят от случая. Примеры случайных величин: число попаданий в мишень при данном числе выстрелов; число очков, выпадающее при бросании игральной кости.
Случайная величина, возможные значения которой можно перенумеровать, называется дискретной. При этом число значений может быть конечным или бесконечным.
Непрерывной называется случайная величина, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Очевидно, число возможных значений непрерывной случайной величины — бесконечно.
Закон распределения дискретной случайной величины
Для характеристики случайной величины нужно знать совокупность возможных значений этой величины, а также вероятности, с которыми эти значения могут появиться. Эти данные образуют закон распределения случайной величины. Закон распределения дискретной случайной величины может быть задан в виде таблицы, первая строка которой содержит возможные значения
а вторая — вероятности
:
где
Если множество возможных значений бесконечно, то ряд
сходится и его сумма равна единице.
Закон распределения дискретной случайной величины может быть задан аналитически (в виде формулы)
или с помощью функции распределения (см. §20).
Закон распределения дискретной случайной величины можно изобразить графически, для чего в прямоугольной системе координат строят точки — возможные значения
— соответствующие вероятности) и соединяют их отрезками прямых. Полученную фигуру называют многоугольником или полигоном распределения вероятностей.
Числовые характеристики дискретных случайных величин
Математическим ожиданием дискретной случайной величины называется сумма произведений всех ее возможных значений на их вероятности:
Если дискретная случайная величина принимает бесконечное множество возможных значений, то
причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно.
Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
Дисперсию удобно вычислять по формуле
Средним квадратическим отклонением случайной величины называется квадратный корень из дисперсии:
Свойства математического ожидания
Свойство 1. Математическое ожидание постоянной величины равно самой постоянной:
Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:
Свойство 3. Математическое ожидание произведения взаимно независимых случайных величин равно произведению математических ожиданий сомножителей:
Свойство 4. Математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых:
Свойства дисперсии
Свойство 1. Дисперсия постоянной равна нулю:
Свойство 2. Постоянный множитель можно выносить за знак дисперсии, предварительно возведя в квадрат:
Свойство 3. Дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых:
Примеры дискретных распределений
Биномиальным называют закон распределения дискретной случайной величины — числа появлений «успеха» в
независимых испытаниях (возможные значения случайной величины
), в каждом из которых вероятность появления «успеха» равна
, вероятность возможного значения
(числа
появлений «успеха») вычисляют по формуле Бернулли:
Математическое ожидание биномиального распределения равно произведению числа испытаний на вероятность появления события в одном испытании:
Дисперсия биномиального распределения равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании:
Если число испытаний велико, а вероятность появления события в каждом испытании очень мала, то используют приближенную формулу
где — число появлений события в
независимых испытаниях,
, и говорят, что случайная величина распределена по закону Пуассона.
Пример № 34
Производится независимых испытаний, в каждом из которых некоторое событие
наступает с вероятностью
— число наступлений события
в
испытаниях. Для случая 1) малого
построить ряд распределения, функцию распределения случайной величины
, найти
и
; 2) большого
и малого
найти
приближённо с помощью распределения Пуассона; 3) большого
найти вероятность
.
Решение:
1)
Возможные значения случайной величины : 0,1,2,3,4. Пусть им соответствуют вероятности
Найдём их, используя формулу Бернулли:
Таким образом, ряд распределения имеет следующий вид:
По определению функция распределения находится по формуле
Найдем
2)
По формуле Пуассона
Таким образом, имеем:
(значения найдены по табл. 3 приложения).
3)
По условию задачи
Воспользуемся интегральной теоремой Лапласа:
где — функция Лапласа,
Вычислим и
:
Так как функция Лапласа нечетна, т.е. , получим
По табл.2 приложения найдем:
Искомая вероятность
Функция распределения вероятностей случайной величины
Функцией распределения называется функция , определяющая для каждого значения
вероятность того, что случайная величина
примет значение, меньшее
, т.е.
Свойства функции распределения:
Свойство 1. Значения функции распределения принадлежат отрезку .
Свойство 2. Функция распределения есть неубывающая функция:
Следствие 1. Вероятность того, что случайная величина примет значение, заключенное в промежутке
, равна приращению функции распределения на этом интервале:
Следствие 2. Вероятность того, что непрерывная случайная величина примет одно определенное значение
, равна нулю:
Свойство 3. Если все возможные значения случайной величины принадлежат интервалу
, то
при
при
. Следствие. Справедливы следующие предельные соотношения:
Свойство 4. Функция распределения непрерывна слева:
Пример № 35
В тёмной комнате 7 красных кубиков и 8 синих, не отличаемых друг от друга на ощупь. Мальчик вынес три кубика. — случайная величина числа красных кубиков среди вынесенных. Найти закон распределения, математическое ожидание и дисперсию случайной величины
. Построить график функции распределения
и найти вероятность
.
Решение:
Возможные значения случайной величины : 0,1,2,3. Пусть им соответствуют вероятности
. Найдём их, используя непосредственный подсчёт:
Проверка
Таким образом, закон распределения имеет вид:
Найдем
Дисперсию будем искать по формуле
Составим закон распределения для .
По определению функция распределения находится по формуле
Построим график функции распределения:
IIo функции распределения
Плотность распределения вероятностей непрерывной случайной величины
Плотностью распределения вероятностей непрерывной случайной величины называется первая производная от функции распределения:
Вероятность того, что непрерывная случайная величина примет значение, принадлежащее интервалу
, определяется равенством
Зная плотность распределения, можно найти функцию распределения
Свойства плотности распределения:
Свойство 1. Плотность распределения неотрицательна, т.е. .
Свойство 2. Несобственный интеграл от плотности распределения по всей числовой оси равен единице:
Числовые характеристики непрерывных случайных величин
Математическое ожидание непрерывной случайной величины , возможные значения которой принадлежат всей оси
, определяется равенством
, где
— плотность распределения случайной величины
.
Предполагается, что интеграл сходится абсолютно.
Дисперсия непрерывной случайной величины , возможные значения которой принадлежат всей оси
, определяется равенством
или равносильным равенством
Среднее квадратическое отклонение непрерывной случайной величины определяется так же, как и для дискретной величины:
Все свойства числовых характеристик, указанные для дискретных случайных величин, сохраняются и для непрерывных величин.
Пример № 36
Дана функция плотности распределения
Найти: 1) параметр ; 2) построить графики плотности и функции распределения; 3)
; 4)
5) вероятность
, что отклонение случайной величины от
не более 1.
Решение:
Так как
получаем
так как
тогда
Итак,
Найдём , функцию распределения по формуле
Итак,
Построим оба графика
Найдем
Так как
Найдём по формуле
Дисперсия вычисляется по формуле
Среднее квадратическое отклонение
Найдем
Так как
следует
в нашей задаче
или
то необходимо найти
Примеры непрерывных распределений
Равномерным называется распределение вероятностей непрерывной случайной величины , если на интервале
, которому принадлежат все возможные значения
, плотность сохраняет постоянное значение, а именно
; вне этого интервала
Математическое ожидание случайной величины, равномерно распределенной в интервале , равно полусумме концов этого интервала:
Дисперсия случайной величины, равномерно распределенной в интервале , определяется равенством
Нормальным называется распределение вероятностей непрерывной случайной величины , плотность которого имеет вид
где — математическое ожидание,
— среднее квадратическое отклонение
. Для случайной величины
, распределенной по нормальному закону, вероятность того, что
примет значение, принадлежащее интервалу
, вычисляется по формуле
— функция Лапласа.
Функция распределения случайной величины находится по формуле
а вероятность отклонения нормально распределённой случайной величины от её математического ожидания менее чем на 8 равна:
Правило трёх сигм. Если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения с вероятностью 0,9973.
Пример № 37
Масса вагона — случайная величина, распределённая по нормальному закону с математическим ожиданием 65 т и средним квадратичным отклонением 0,9 т. Найти вероятность того, что вагон имеет массу не более 67 т и не менее 64 т. По правилу трёх сигм найти наибольшую и наименьшую границы предполагаемой массы.
Решение:
Для нормального распределённой случайной величины
По правилу трёх сигм наименьшая граница , наибольшая граница
. Таким образом,
.
Наименьшая граница 62,3 т, наибольшая 67,7 т.
Закон больших чисел
Неравенство Чебышева. Вероятность того, что отклонение случайной величины от ее математического ожидания по абсолютной величине меньше положительного числа
, не меньше чем
:
Теорема Чебышева. Если последовательность попарно независимых случайных величин имеет конечные математические ожидания и дисперсии этих величин равномерно ограничены (не превышают постоянного числа
), то среднее арифметическое случайных величин сходится по вероятности к среднему арифметическому их математических ожиданий, т.е. если
— любое положительное число, то
Теорема Бернулли (Закон больших чисел). Если в каждом из независимых испытаний вероятность
появления события
постоянна, то как угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности
по абсолютной величине будет сколь угодно малым, если число испытаний достаточно велико, т.е.
где — любое сколь угодно малое положительное число.
Центральная предельная теорема
Теорема Ляпунова. Если случайные величины в последовательности … независимы, одинаково распределены и имеют конечное математическое ожидание
, и дисперсию
, то для любого действительного
где
функция распределения случайной величины
Системы случайных величин
Часто результат опыта описывается не одной случайной величиной , а несколькими случайными величинами:
. В этом случае принято говорить, что указанные случайные величины образуют систему
Систему двух случайных величин можно изобразить случайной точкой на плоскости.
Событие, состоящее в попадании случайной точки в область
, принято обозначать в виде
.
Закон распределения системы двух дискретных случайных величин может быть задан с помощью таблицы
где — вероятность события, заключающегося в одновременном выполнении равенств
При этом
Таблица может содержать бесконечное множество строк и столбцов.
Функцией распределения -мерной случайной величины
называется функция
, выражающая вероятность совместного выполнения
неравенств
т.е.
Примечание. Функцию называют также совместной функцией распределения случайных величин
.
В двумерном случае для случайной величины функция распределения
определяется равенством
. Геометрически функция распределения
означает вероятность попадания случайной точки
в бесконечный квадрант, лежащий левее и ниже точки
. Правая и верхняя границы области в квадрант не включаются — это означает, что функция распределения непрерывна слева по каждому из аргументов.
В случае дискретной двумерной случайной величины её функция распределения определяется по формуле:
где суммирование вероятностей распространяется на все , для которых
, и все
, для которых
.
Отметим свойства функции распределения двумерной случайной величины, аналогичные свойствам функции распределения одномерной случайной величины.
где и
— функции распределения случайных величин
и
, т.е.
.
Закон распределения системы непрерывных случайных величин будем задавать с помощью функции плотности вероятности
. Плотностью вероятности (плотностью распределения или совместной плотностью) непрерывной двумерной случайной величины
называется вторая смешанная частная производная её функции распределения, т.е.
Вероятность попадания случайной точки в область
определяется равенством
Функция плотности вероятности обладает следующими свойствами:
Если все случайные точки принадлежат конечной области
, то последнее условие принимает вид
Математические ожидания дискретных случайных величии и
, входящих в систему, определяются по формулам
а математические ожидания непрерывных случайных величин — по формулам
Точка называется центром рассеивания системы случайных величин
.
Математические ожидания и
. можно найти и проще, если случайные величины
и
независимы. В этом случае из законов распределения этих случайных величин можно определить математические ожидания
и
по формуле, приведенной в §16 для дискретных случайных величин и в §22 для непрерывных случайных величин.
Дисперсии дискретных случайных величин и
определяются по формулам
Дисперсии же непрерывных случайных величии и
, входящих в систему, находятся по формулам
Средние квадратические отклонения случайных величин и
определяются по формулам
Для вычисления дисперсий могут быть применены формулы
Важную роль в теории систем случайных величин играет так называемый корреляционный момент (коваркация)
Для дискретных случайных величин корреляционный момент находится по формуле
а для непрерывных — по формуле
Случайные величины и
называются независимыми, если вероятность одной из них принять значение, лежащее в любом промежутке области её значений, не зависит от того, какое значение приняла другая величина. В этом случае
Ковариация двух случайных величин характеризует как степень зависимости случайных величин, так и их рассеяние вокруг точки .
Свойства ковариации случайных величин:
Здесь
для дискретных случайных величин и
и
для непрерывных величин.
- Ковариация двух независимых случайных величин равна нулю, т.е.
- Ковариация двух случайных величин по абсолютной величине не превосходит произведения их средних квадратических отклонений, т.е.
Для характеристики связи между величинами и
рассматривается так называемый коэффициент корреляции
являющийся безразмерной величиной. Свойства коэффициента корреляции:
Пример № 38
В двух ящиках находятся по шесть шаров; в первом ящике: 1 шар с №1,2 шара с №2, 3 шара с №3; во втором ящике: 2 шара с №1, 3 шара с №2, 1 шар с №3. Пусть — номер шара, вынутого из первого ящика.
— номер шара, вынутого из второго ящика. Из каждого ящика вынули по шару. Составить таблицу закона распределения системы случайных величин
. Найти математические ожидания и дисперсии случайных величин
и
. Определить коэффициент корреляции.
Решение:
Случайная точка (1,1) имеет кратность 1 х 2 = 2;
Всего случайных точек 6×6 = 36 (-кратную точку принимаем за
точек). Так как отношение кратности точки ко всему количеству точек равно вероятности появления этой точки, то таблица закона распределения системы случайных величин имеет вид
Сумма всех вероятностей, указанных в таблице, равна единице. Найдём математические ожидания случайных величин и
Точка (7/3; 11/6) является центром рассеивания для заданной системы .
Так как случайные величины и
независимы, то математические ожидания
и
можно подсчитать проще, используя ряды распределения:
Отсюда находим
От системы величин перейдём к системе центрированных величин
, где
Составим таблицу
Имеем
Отсюда
Заметим, что и
можно найти по формулам
Для нахождения коэффициента корреляции воспользуемся таблицей распределения системы центрированных случайных величин. Определим ковариацию:
Так как , то и коэффициент корреляции
.
Этот же результат мы могли получить и не определяя ковариации . Действительно, полагая
, получаем, что значение
повторяется 2 раза, значение
= 2 — 4 раза, а значение
= 3 — 6 раз. Значит при
получаем ряд распределения случайной величины
:
Если , то значение
повторяется 3 раза, значение
= 2-6 раз, а значение
= 3-9 раз. Следовательно, при
получается ряд распределения случайной величины
:
Наконец, если = 3, то значение
= 1 повторяется 1 раз, значение
= 2 -2 раза, а значение
= 3 — 3 раза. Ряд распределения случайной величины
при
= 3 имеет вид
Итак, при различных значениях получаем один и тот же ряд распределения случайной величины
. Так как ряд распределения случайной величины
не зависит от значений случайной величины
, то случайные величины
и
независимы. Отсюда следует, что коэффициент корреляции равен нулю.
Пример № 40
Система случайных величин подчинена закону распределения с плотностью
Область — квадрат, ограниченный прямыми
. Требуется: 1) определить коэффициент
; 2) вычислить вероятность попадания случайной точки
в квадрат
, ограниченный прямыми
3) найти математические ожидания
и
; 4) найти средние квадратические отклонения
и
.
Решение:
1. Коэффициент находим из уравнения
Находим математические ожидания и
; имеем
Следовательно, и
Находим средние квадратические отклонения и
:
Итак,
Предмет математическая статистика
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных — результатах наблюдений.
Первая задача математической статистики — указать способы сбора и группировки (если данных очень много) статистических сведений.
Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от целей исследования.
Основные понятия математической статистики
Генеральная совокупность — совокупность всех изучаемых объектов, — её объём (количество всех объектов).
Выборочная совокупность — совокупность объектов, отобранных для изучения, — объём выборки.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.
Таким образом, вместо большой совокупности объектов изучается совокупность объёма, значительно меньшего по количеству объектов . Результаты, полученные при изучении выборки, распространяются на объекты всей генеральной совокупности. Для этого выборка должна быть репрезентативной (представительной), то есть правильно представлять генеральную совокупность. Это обеспечивается случайностью отбора.
Виды отбора:
- простой случайный: повторный; бесповторный;
- сложный случайный: типический; механический; серийный.
Простой случайный отбор — производится без деления генеральной совокупности на части.
Повторный отбор — отобранный объект возвращается в генеральную совокупность.
Бссповторный отбор — отобранный объект не возвращается в генеральную
Сложный случайный отбор — производится после предварительного деления генеральной совокупности на части.
Типический отбор — генеральная совокупность делится на типы, из каждого типа случайно отбираются объекты пропорционально объёму типов. Механический отбор — генеральная совокупность делится на части механически, из каждой части случайно отбираются объекты.
Серийный отбор — генеральная совокупность делится на серии, и случайным образом отбираются целые серии объектов.
Статистическое распределение выборки и его характеристики
Пусть из генеральной совокупности извлечена выборка, причем наблюдалось
раз,
раз,
раз
— объем выборки. Наблюдаемые значениях, называют вариантами, а последовательность вариант, записанных в возрастающем порядке, — вариационным рядом. Числа наблюдений называются частотами, а их отношения к объему выоорки —
относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.
Результаты выборки представляются в виде статистического распределения:
где
— варианты;
— соответствующие им частоты;
— объём выборки;
— относительные частоты.
Распределение относительных частот:
Основные характеристики выборки:
— выборочная средняя;
— выборочная дисперсия;
— выборочное среднее квадратичное отклонение;
— исправленная дисперсия.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения
относительную частоту события
:
где — число вариант, меньших
— объем выборки.
Полигон и гистограмма
Полигон абсолютных частот — это ломаная, отрезки которой соединяют точки
Пример:
Полигон относительных частот — это ломаная, отрезки которой соединяют точки
Пример:
Статистическое распределение может носить интервальный (непрерывный) характер.
Пример:
— длина частичного интервала.
Гистограмма частот — ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты равны отношению
(плотность частоты).
Пример № 41
В результате испытания случайная величина приняла следующие значения
Требуется: 1) составить таблицу, устанавливающую зависимость между значениями случайной величины и её частотами; 2) построить статистическое распределение; 3) изобразить полигон распределения.
Решение:
1. Найдём объём выборки: . Составим таблицу
Статистическое распределение имеет вид
Контроль
Последнюю таблицу можно переписать в виде
Возьмём на плоскости точки (1; 0,04), (2; 0,08), (3; 0,12) и т.д. Последовательно соединив эти точки прямолинейными отрезками, получим полигон распределения случайной величины
.
Пример № 42
В результате испытания случайная величина приняла следующие значения
Требуется: составить таблицу статистического распределения, разбив промежуток (0, 25) на пять участков, имеющих одинаковые длины; построить гистограмму одинаковых частот.
Решение:
Предварительно составим таблицу
Статистическое распределение имеет вид
Гистограмма относительных частот изображена на рисунке
Точечные оценки параметров генеральной совокупности
Точечной называют оценку, которая определяется одним числом. Оценка параметра
называется несмещённой, если её математическое ожидание равно оцениваемому параметру, т.е.
. В противном случае оценка называется смещённой.
Оценка параметра
называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:
В случае использования состоятельных оценок оправдывается увеличение объёма выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельна, то практически достоверно, что при достаточно большом
Несмещённая оценка параметра
называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещённых оценок параметра
, вычисленных по выборкам одного и того же объёма
. Параметры генеральной совокупности
— генеральная средняя и
— генеральная дисперсия оцениваются по соответствующим параметрам выборки:
Пример № 43
Объем выборки:
или
Таким образом, точечные оценки характеристик генеральной совокупности
Для интервального распределения сначала находят середины интервалов .
Пример № 44
Переходим к дискретному распределению
Дальнейшие вычисления проводим, как в предыдущем примере. Получаем:
Таким образом:
Интервальная оценка (доверительный интервал) для генеральной средней
Интервальной называют оценку, которая определяется двумя числами -концами интервала.
Доверительным интервалом для параметра называется интервал
, содержащий истинное значение 9 с заданной вероятностью
, т.е.
Число называется доверительной вероятностью (надежностью), а значение
— уровнем значимости.
Интервальной оценкой (с надежностью ) математического ожидания а нормально распределенного количественного признака
по выборочной средней
при известном среднем квадратическом отклонении
служит доверительный интервал
где — объем выборки;
— значение аргумента функции Лапласа
(см. приложение, табл. 2), при котором
.
— генеральная средняя (оцениваемый параметр);
— средняя выборочная, точечная оценка генеральной средней;
— точность оценки,
— надёжность оценки.
— доверительный интервал для
.
с вероятностью (надёжностью)
.
Для нормального распределения признака
где — объём выборки;
— находят из соотношения
с помощью табл. 2 (см. приложение). Таким образом, для нормально распределённой величины
:
Чем больше , тем меньше
, то есть точность оценки увеличивается при увеличении объёма выборки.
Чем выше — надёжность оценки, тем меньше её точность (
увеличивается).
Если неизвестно, то
где
— исправленная выборочная дисперсия,
находится из табл. 4 (приложение) по заданным значениям
и
.
Интервальной оценкой (с надежностью ) среднего квадратического отклонения
нормально распределенного качественного признака
по «исправленному» выборочному среднему квадратическому отклонению
служит доверительный интервал
где — «исправленное» выборочное среднее квадратическое отклонение;
находят по табл. 5 приложения по заданным
и
.
Пример № 45
Найти доверительный интервал для оценки неизвестного математического ожидания «а» нормально распределённого признака, если известны:
Решение:
Из таблицы
Доверительный интервал
Пример № 46
Найти минимальный объём выборки, при котором с надёжностью 0,95 точность оценки математического ожидания нормально распределённого признака по выборочной средней будет равна 0,2, если среднее квадратическое отклонение равно 2.
Решение:
Дано:
найти .
Из формулы
находим
Из условия
находим
Тогда
Пример № 47
По заданным значениям характеристик нормально распределённого признака найти доверительный интервал для оценки неизвестного математического ожидания:
Решение:
. Из табл. 4 по данным
и
находим
. Тогда
Доверительный интервал (16,8 — 0,95; 16,8 + 0,95) = (15,85; 17,75).
Понятие о критериях согласия
Статистической называется гипотеза о неизвестном законе распределения случайной величины или о параметрах закона распределения, вид которого известен.
Нулевой (основной) гипотезой называется выдвинутая гипотеза .
Конкурирующей (альтернативной) гипотезой называется гипотеза , которая противоречит нулевой гипотезе
.
Пусть имеется статистическое распределение выборки для случайной величины :
По виду полигона или гистограммы, сравнивая их с графиками дифференциальных функций распределения, делаем предположение о виде закона распределения случайной величины.
Сделанное предположение (гипотеза) подтверждается расчётами критерия согласия.
Имеются различные критерии согласия: Хинчина, Колмогорова, Пирсона. Например, критерий Пирсона (хи-квадрат)
позволяет сравнивать близость частот — данного статистического распределения с теоретическими частотами
, найденными с помощью функции распределения предполагаемого закона:
где — дифференциальная,
— интегральная функции предполагаемого распределения.
Если вычисленное значение критерия не превосходит некоторого критического значения
взятого по таблице, то выдвинутая гипотеза принимается с заданным уровнем надёжности (вероятности)
. В противном случае гипотеза отвергается. В табл. 6 приложения:
— уровень значимости, это вероятность отвергнуть гипотезу;
— число степеней свободы,
, где
— число параметров предполагаемого распределения:
для нормального распределения (
и
),
для показательного распределения (
).
При проверке гипотезы возможны следующие ошибки: ошибка первого рода — отвергнуть гипотезу
при её правильности; ошибка второго рода — принятие гипотезы
при правильности альтернативной гипотезы
.
Виды зависимостей между случайными величинами X и Y
— количественные признаки, связанные между собой.
— их возможные значения.
Функциональная зависимость — каждому значению признака соответствует единственное значение признака
. Статистическая зависимость — каждому значению признака
соответствует статистическое распределение признака
:
Корреляционная зависимость — каждому значению признака соответствует среднее значение признака
(условная средняя
):
Аналогично:
— уравнение регрессии
по
.
— уравнение регрессии
по
.
Примеры: площадь квадрата есть функция от длины стороны квадрата
:
, зависимость функциональная.
Товарооборот магазина зависит от числа торговых работников
. Эта зависимость корреляционная. Две основные задачи теории корреляции:
- Определить форму корреляционной связи, то есть определить вид уравнения регрессии.
- Оценить тесноту (силу) корреляционной связи.
Корреляционная таблица
Все наблюдения числовых признаков и
с соответствующими частотами записываются в корреляционную таблицу.
Пример № 48
Числа 1; 3; 5 (левый столбец таблицы) показывают наблюдаемые значения признака . Числа 2; 4; 6 (первая строка) показывают наблюдаемые значения признака
.
Числа внутри таблицы показывают частоту появления соответствующей пары значений . Например, пара (1; 2) наблюдалась 2 раза, пара (3; 4) — 5 раз, пара (1; 4) не наблюдалась ни разу (соответствующая частота равна 0).
По данным наблюдений вычислены частоты :
— частота появления данного значения
,
— частота появления данного значения
,
— объём выборки, количество всех наблюдаемых пар
.
Так, значение = 1 наблюдалось 2 + 4 = 6 раз; значение
= 5 наблюдалось 3 + 9 + 3 = 15 раз и т.д. Объём выборки
= 6 + 11 + 15 + 32 или
= 5 + 14 + 13 + 32.
В общем виде корреляционная таблица выглядит так:
Условные средние по :
Условные средние по :
Виды уравнений регрессии
В случаях 1-5 параметры линейной зависимости находятся по формулам, указанным в следующем параграфе. Для случая 6 применяется непосредственно метод наименьших квадратов.
Пример № 49
Дана таблица
Определить коэффициент корреляции и уравнения линий регресии.
Решение:
Составим расчётную таблицу:
Из таблицы получаем:
Теперь находим
Вычисляем значение произведения
так как
то связь достаточно обоснована. Уравнения линий регрессии:
Построив точки, определяемые таблицей, и линии регрессии, видим, что обе линии регрессии проходят через точку (0,7029; 1,5782). Первая линия отсекает на оси ординат отрезок 3,0329, а вторая — на оси абсцисс отрезок 1,4566. Точки
расположены близко к линиям регрессии.
Метод наименьших квадратов
Служит для нахождения параметров уравнения регрессии. Пусть даны соответствующие значения рассматриваемых признаков и
:
Подберём функцию , наилучшим образом отражающую зависимость между признаками
и
.
Подставляя в функцию, получим теоретическое значение
(обозначим
):
— отклонения теоретических значений
от эмпирических значений
.
Суть метода наименьших квадратов: параметры выбранной функции находят так, чтобы сумма квадратов отклонений теоретических значений от эмпирических была наименьшей, т.е.
Нахождение параметров уравнения линейной регрессии:
Из системы нормальных уравнений:
Показатели тесноты корреляционной связи
— корреляционное отношение (для линейной и нелинейной связи).
— коэффициент корреляции (только для линейной связи). Свойства:
Формулы для вычислении:
— корреляционное отношение
к
, где
межгрупповая дисперсия, характеризует разброс условных средних
от общей средней
— общая дисперсия, характеризует разброс фактических данных от их общей средней
.
— корреляционное отношение
к
, где
— межгрупповая дисперсия, характеризует разброс условных средних
от общей средней
— общая дисперсия, характеризует разброс фактических данных
от их общей средней
Кстати дополнительная теория из учебников по теории вероятности тут.
Пример составления уравнения линейной регрессии и оценки тесноты корреляционной связи
Пусть — оценка студента по математике в школе,
— оценка по математике в первом семестре.
В результате опроса составлена следующая корреляционная таблица:
Оценить тесноту корреляционной связи между и
, вычислив коэффициент корреляции
. Составить уравнение линейной регрессии
по
.
Решение:
Для вычисления найдём
Общие средние:
- Это уравнение выражает зависимость средней оценки по математике в первом семестре от оценки в школе.
Аналогично, — уравнение регрессии
по
.
Тогда,
Построим прямые регрессии по
и
по
. Они всегда проходят через точку
.
Чем теснее связь между признаками и
, тем ближе друг к другу расположены прямые регрессии (угол между ними мал). Прямые совпадают, если связь между
и
функциональная.
Основы комбинаторики
Факториалом целого положительного числа (обозначается
!) называется произведение
Основное свойство факториала: .
Размещениями из элементов по
называются такие соединения по
элементов, которые отличаются друг от друга самими элементами или их порядком. Число всех размещений из и различных элементов по к (обозначается
):
Перестановками из элементов называются их соединения, отличающиеся друг от друга только порядком входящих в них элементов. Число всех перестановок из
различных элементов (обозначается
):
Если среди элементов
имеются одинаковые (
повторяется
раз,
—
раз,
раз и т.д.), то
Сочетаниями из элементов по
называются их соединения, отличающиеся друг от друга только самими элементами. Число всех сочетаний из
различных элементов по
(обозначается
):
Основное свойство сочетаний:
Основной закон комбинаторики. Пусть нужно провести к действий, причём первое действие можно провести способами, второе —
способами,…,
-е-
способами. Тогда все действия можно провести
способами.
Возможно эти страницы вам будут полезны:
- Решение задач по теории вероятностей
- Помощь по теории вероятности
- Заказать работу по теории вероятности
- Контрольная работа по теории вероятности
- Курсовая работа по теории вероятности
- Решение задач по математической статистике
- Помощь по математической статистике
- Заказать работу по математической статистике
- Контрольная работа по математической статистике
- Курсовая работа по математической статистике
- Теория вероятностей краткий курс для школьников и студентов (заочников)
Содержание:
В статистике наиболее часто применяются такие распределения:
- Нормальное (Гауссовское) распределение.
- Распределение Пирсона, распределение
- Распределение Стьюдента (t — распределение).
- Распределение Фишера (F — распределение).
Нормальный закон распределения мы подробно рассмотрели при изучении раздела 6.5 теории вероятностей и здесь рассматриваться не будет.
Отметим, что в законы распределений математической статистики входит гамма-функция, поэтому необходимо познакомиться с этой функцией и рассмотреть ее свойства.
Гамма-функция и ее свойства
Гамма-функцией или интегралом Эйлера второго рода называется функция следующего вида:
где — параметр, от которого зависит значение интеграла.
Свойства гамма-функции:
1. Г(1) = Г(2) = 1.
Доказательство:
Подставим
2.
Доказательство:
Вычислим интеграл в (9.1), используя интегрирование по частям:
Доказательство:
Значит, если значение кратно
то
легко вычисляется с использованием свойства 2:
Для целых — гамма-функция это факториал:
Например,
Г(3) = 2! = 2, Г(4) = 3! = 6, Г(5) = 4! = 24.
Отметим, что смысл гамма-функции — распространение понятия факториал на нецелые значения. На рис. 9.1 приведен график гамма-функции.
Распределение (хи-квадрат )
Распределение (хи-квадрат )
Случайная величина имеет закон распределения , если она определяется так:
(9.2)
где — независимые нормированные нормальные случайные величины, т. е.
с плотностью распределения
Распределение случайной величины, определенной по формуле (9.2), называется распределением Пирсона.
Покажем, что плотность распределения случайной величины формула (9.2), определяется следующим равенством:
(9.3)
Здесь для краткости записи
— гамма-функция,
Для доказательства используем аппарат характеристических функций. Найдем характеристическую функцию случайной величины которая входит в формулу (9.2), учитывая, что имеет нормированное нормальное распределение:
Используем подстановку тогда
Согласно 5-му свойству характеристической функции (для суммы независимых случайных величин) найдем характеристическую функцию случайной величины
Найдем характеристическую функцию случайной величины
плотность распределения которой определяется по формуле (9.3):
При сравнении правых частей характеристических функций и
мы увидим, что они совпадают. Значит случайная величина, определяемая по формуле (9.2), действительно имеет плотность распределения вероятностей, определяемую формулой (9.3).
Найдем математическое ожидание и дисперсию случайной величины
Продифференцируем 2 раза
Значения производных при t = 0:
Таким образом, математическое ожидание равно числу степеней свободы
а дисперсия — удвоенному числу степеней свободы. Числом степеней свободы называется параметр
равный числу независимых случайных величин в (9.2) и который записывают
С ростом распределение становится симметричным относительно
т. к. с увеличением
по центральной теореме закон распределения должен стремиться к нормальному закону (рис. 9.2).
При закон распределения
практически совпадает с нормальным законом.
Квантилем (где
— заданный уровень вероятности,
число степеней свободы) называется такое значение
при котором
(9.4)
т. е. это то значение , при котором площадь заштрихованной фигуры на рис. 9.2 равна
. Для определения квантилей
составлены таблицы хи-квадрат распределения. Чтобы воспользоваться ими, необходимо задать уровень вероятности
и число степеней свободы
Распределение Стьюдента
Распределение Стьюдента — распределение)
Случайная величина t имеет распределение Стьюдента, если она определяется так.
(9.5)
где X — нормированная нормальная случайная величина,
Y — величина степенями свободы,
X и Y — независимые случайные величины.
Случайная величина t является функцией нормально распределенных нормированных случайных величин и называется безразмерной дробью Стьюдента. Плотность распределения случайной величины t определяется равенством
(9.6)
где
Числовые характеристики случайной величины t :
На рис. 9.3 приведены кривые распределения Стьюдента. Кривые на рис. 9.3 качественно напоминают кривые нормального закона распределения с математическим ожиданием, равным нулю, и при они стремятся к нормальному закону.
Квантили распределения Стьюдента в зависимости от числа степеней
свободы и заданного уровня вероятности
находятся из уравнения:
Рис. 9.4 иллюстрирует процесе определения квантилей, т. е. необходимо так выбрать , чтобы суммарная площадь заштрихованных фигур была равна
Распределение Фишера (F-распределение)
Случайная величина F имеет распределение Фишера, если она определяется так:
(9.7)
где — независимые случайные величины, имеющие распределение
с
степенями свободы, т. е.
можно записать в следующем виде:
(9.8)
Безразмерная случайная величина F (9.8) имеет плотность распределения, определяемую следующей формулой:
(9.9)
Распределение случайной величины F зависит от двух параметров степеней свободы. График плотности распределения случайной величины F для разного числа степеней свободы приведен на рис. 9.5
Квантили распределения Фишера для заданного уровня вероятности
и числа степеней свободы
определяются из условия
На рис. 9.6 показано, что надо так выбрать , чтобы площадь заштрихованной фигуры была равна заданной вероятности
Как правило, квантили находят по таблицам распределения Фишера и для их определения необходимо задать три параметра: уровень вероятности
и число степеней свободы
Биноминальный закон распределения
Определение: Дискретная случайная величина Х имеет биноминальный закон распределения, если она принимает значения 0, 1, 2, …, m, …, n с вероятностями где 0 < р < 1, q = 1 – p, m = 0, 1, …, n.
Как видим, вероятности Р(Х = m) находятся по формуле Бернулли.
Следовательно, биноминальный закон распределения представляет собой закон распределения числа X = m наступлений события А в n независимых испытаниях, в каждом из которых оно может произойти с одной и той же вероятностью р.
Ряд распределения биноминального закона имеет вид:
Теорема. Математическое ожидание случайной величины, распределенной по биноминальному закону а ее дисперсия
Следствие. Математическое ожидание частости события в n независимых испытаниях, в каждом из которых оно может наступить с одной и той же вероятностью, равно а ее дисперсия
Биноминальный закон распределения широко используется в теории и практике статистического контроля качества продукции, при описании функционирования систем массового обслуживания, в теории стрельбы и в других областях.
Закон распределения Пуассона
Определение: Дискретная случайная величина Х имеет закон распределения Пуассона, если она принимает значения 0, 1, 2, …, m с вероятностями Ряд распределения закона Пуассона имеет вид:
Теорема. Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона, совпадают и равны параметру λ этого закона, т.е.
При достаточно больших n (вообще при n → ∞) и малых значениях р (р → 0) при условии, что произведение np – постоянная величина (nр → λ = const), закон распределения Пуассона является хорошим приближением биноминального закона. Т.е. при n → ∞, р → 0, nр → λ = const закон распределения Пуассона является предельным случаем биноминального закона. Так как при этом вероятность р события А в каждом испытании мала, то закон распределения Пуассона часто называют законом редких явлений.
По закону Пуассона распределены, например, число сбоев на автоматической линии, число отказов сложной системы в нормальном режиме, число требований на обслуживание в единицу времени в системах массового обслуживания, и т.п.
Отметим еще, что если случайная величина представляет собой сумму двух независимых случайных величин, каждая из которых распределена по закону Пуассона, то она также распределена по закону Пуассона с параметром
Равномерный закон распределения
Определение: Непрерывная случайная величина Х имеет равномерный закон распределения на отрезке [a; b], если ее плотность вероятности f(x) постоянна на этом отрезке и равна нулю вне его, т.е.
Кривая распределения f(x) и график функции распределения F(x) случайной величины Х приведены соответственно на рис. 7.1 и рис. 7.2.
Теорема. Функция распределения случайной величины Х, распределенной по равномерному закону, есть
Равномерный закон распределения используется при анализе ошибок округления при проведении числовых расчетов, в ряде задач теории массового обслуживания, при статистическом моделировании наблюдений, подчиненных заданному распределению, и т.д.
Показательный (экспоненциальный) закон распределения
Определение: Непрерывная случайная величина Х имеет показательный (экспоненциальный) закон распределения с параметром λ, если ее плотность вероятности f(x) имеет вид:
Кривая распределения f(x) и график функции распределения F(x) случайной величины Х приведены соответственно на рис. 7.3 и рис. 7.4.
Теорема. Функция распределения случайной величины Х, распределенной по показательному (экспоненциальному) закону, есть ее математическое ожидание
а дисперсия
Отсюда следует, что для случайной величины, распределенной по показательному закону, математическое ожидание равно среднему квадратическому отклонению, т.е.
Вероятность попадания в интервал [a; b] непрерывной случайной величины Х, распределенной по показательному закону, находится как
Пример:
Установлено, что время ремонта железнодорожных вагонов есть случайная величина Х, распределенная по показательному закону. Определить вероятность того, что на ремонт вагона потребуется менее 7 дней, если среднее время ремонта вагонов составляет 10 дней.
Решение:
По условию математическое ожидание М(Х) = 1/λ = 10, откуда параметр λ = 0,1. По формуле (6.17) находим вероятность попадания случайной величины Х в интервал [0, 7]:
Показательный закон распределения играет большую роль в теории массового обслуживания. Так например, интервал времени между двумя соседними событиями в простейшем потоке имеет показательное распределение с параметром λ – интенсивностью потока. Кроме того, показательное распределение широко применяется в теории надежности, одним из основных понятий которой является функция надежности.
Функция надежности
Будем называть элементом некоторое устройство. Пусть элемент начинает работать в момент времени , а по истечении времени τ происходит отказ. Обозначим через Т непрерывную случайную величину – длительность времени безотказной работы элемента. Если элемент проработал безотказно (т.е. до наступления отказа) время, меньшее чем τ, то, следовательно, за время длительностью τ наступил отказ.
Таким образом, интегральная функция определяет вероятность отказа за время длительностью τ. Следовательно, вероятность безотказной работы за это же время, длительностью τ, т.е. вероятность противоположного события Т > τ, равна
Функцией надежности R(τ), называют функцию, определяющую вероятность безотказной работы элемента за время длительностью τ: где λ – интенсивность отказов.
Широкое использование показательного закона распределения обусловлено тем, что только он обладает следующим важным свойством: Если промежуток времени Т, распределенный по показательному закону, уже длился некоторое время τ, то это никак не влияет на закон распределения оставшейся части – τ промежутка, т.е. закон распределения
остается таким же, как и всего промежутка Т.
Пример:
Время безотказной работы устройства распределено по показательному законуКакова вероятность того, что устройство проработает безотказно 50 часов?
Решение:
По условию постоянная интенсивность отказов λ = 0,02. Используя формулу (6.18), получаем:
Нормальный закон распределения
Нормальный закон распределения наиболее часто встречается на практике. Главная особенность, выделяющая его среди других законов, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях.
Определение: Непрерывная случайная величина Х имеет нормальный закон распределения (закон Гаусса) с параметрами а и , если ее плотность вероятности f(x) имеет вид:
Кривую нормального закона распределения называют нормальной или гауссовой кривой. На рис. 6.5 а), б) показана нормальная кривая с параметрами а и и график функции распределения.
Обратим внимание на то, что нормальная кривая симметрична относительно прямой х = а, имеет максимум в точке х = а, равный и две точки перегиба х =
с ординатами
Можно заметить, что в выражении плотности нормального закона параметры распределения обозначены буквами а и , которыми мы обозначали математическое ожидание и дисперсию. Такое совпадение не случайно. Рассмотрим теорему, которая устанавливает теоретико-вероятностный смысл параметров нормального закона.
Теорема. Математическое ожидание случайной величины Х, распределенной по нормальному закону, равно параметру a этого распределения, т.е. а ее дисперсия – параметру
, т.е.
Выясним, как будет меняться нормальная кривая при изменении параметров а и σ. Если σ = const, и меняется параметр a (а1 < а2 < а3), т.е. центр симметрии распределения, то нормальная кривая будет смещаться вдоль оси абсцисс, не меняя формы (рис. 6.6).
Если а = const и меняется параметр σ, то меняется ордината максимума кривой При увеличении σ ордината максимума уменьшается, но так как площадь под любой кривой распределения должна оставаться равной единице, то кривая становится более плоской, растягиваясь вдоль оси абсцисс. При уменьшении σ, напротив, нормальная кривая вытягивается вверх, одновременно сжимаясь с боков (рис. 6.7).
Таким образом, параметр a характеризует положение , а параметр σ – форму нормальной кривой.
Нормальный закон распределения случайной величины с параметрами a = 0 и σ = 1 называется стандартным или нормированным, а соответствующая нормальная кривая – стандартной или нормированной. Сложность непосредственного нахождения функции распределения случайной величины, распределенной по нормальному закону, связана с тем, что интеграл от функции нормального распределения не выражается через элементарные функции. Однако его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения
Такую функцию называют функцией Лапласа, для нее составлены таблицы. Существует много разновидностей такой функции, например:
Мы будем использовать функцию:
Для такой функции табличные значения приведены в Приложении 2.
Теорема. Функция распределения случайной величины Х, распределенной по нормальному закону, выражается через функцию Лапласа Ф(х) по формуле
Рассмотрим свойства случайной величины, распределенной по нормальному закону.
1. Вероятность попадания случайной величины Х, распределенной по нормальному закону, в интервал [α, β] равна
2. Вероятность того, что отклонение случайной величины Х, распределенной по нормальному закону, от математического ожидания a не превысит величину δ > 0 (по абсолютной величине), равна
Вычислим по этой формуле вероятности при различных значениях δ (используя таблицу значений функции Лапласа):
Отсюда вытекает так называемое «правило трех сигм»: Если случайная величина Х имеет нормальный закон распределения с параметрами a и σ, то практически достоверно, что ее значения заключены в интервале (a – 3σ; a + 3σ).
Пример:
Полагая, что рост мужчин определенной возрастной группы есть нормально распределенная случайная величина Х с параметрами а = 173 и найти: 1. Выражение плотности вероятности и функции распределения случайной величины Х; 2. Долю костюмов 4-го роста (176 – 183 см) и долю костюмов 3-го роста (170 – 176 см), которые нужно предусмотреть в общем объеме производства для данной возрастной группы; 3. Сформулировать «правило трех сигм» для случайной величины Х.
Решение:
1. Находим плотность вероятности и функцию распределения случайной величины Х
2. Долю костюмов 4-го роста (176 – 182 см) находим как вероятность
По таблице значений функции Лапласа (Приложение 2) находим:
Окончательно получаем
Долю костюмов 3-го роста (170 – 176 см) можно найти аналогично. Однако проще это сделать, если учесть, что данный интервал симметричен относительно математического ожидания а = 173, т.е. неравенство 170 ≤ Х ≤ 176 равносильно неравенству │Х – 173│≤ 3. Тогда
3. Сформулируем «правило трех сигм» для случайной величины Х: Практически достоверно, что рост мужчин данной возрастной группы заключен в границах от
- Асимптотика схемы независимых испытаний
- Функции случайных величин
- Центральная предельная теорема
- Ковариация в теории вероятности
- Простейший (пуассоновский) поток событий
- Случайные величины
- Числовые характеристики случайных величин
- Нормальный закон распределения
В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями —
обновите страницу .
Параметры дискретного закона распределения
В статье описано как найти среднее значение и стандартное отклонение. Вы узнаете, что такое квантиль и каких он бывает видов, а также,
как построить доверительный интервал.
Математическое описание
Смотря на закон распределения, мы можем понять, какова вероятность того или иного события,
можем сказать, какова вероятность, что произойдёт группа событий, а в этой статье мы рассмотрим, как наши выводы «на глаз» перевести
в математически обоснованное утверждение.
Крайне важное определение: математическое ожидание — это площадь под графиком распределения. Если мы говорим о дискретном распределении —
это сумма событий умноженных на соответсвующие вероятности, также известно как момент:
(2) E(X) = Σ(pi•Xi) E — от английского слова Expected (ожидание)
Для математического ожидания справедливы равенства:(3) E(X + Y) = E(X) + E(Y)
(4) E(X•Y) = E(X) • E(Y)
Момент степени k:
(5) νk = E(Xk)
Центральный момент степени k:
(6) μk = E[X — E(X)]k
Среднее значение
Среднее значение (μ) закона распределения — это математическое ожидание случайной величины
(случайная величина — это событие), например, сколько в среднем посетителей заходит в магазин в час:
Кол-во посетителей | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
Количество наблюдений | 50 | 24 | 78 | 85 | 36 | 46 | 81 |
Таблица 1. Количество посетителей в час |
График 1. Количество посетителей в час
Чтобы найти среднее значение всех результатов необходимо сложить всё вместе и разделить на количество результатов:
μ = (50 • 0 + 24 • 1 + 78 • 2 + 85 • 3 + 36 • 4 + 46 • 5 + 81 • 6) / 400 = 1295/400 = 3.24
То же самое мы можем проделать используя формулу 2:
μ = M(X) = Σ(Xi•pi) = 0 • 0.13 + 1 • 0.06 + 2 • 0.2 + 3 • 0.21 + 4 • 0.09 + 5 • 0.12 + 6 • 0.2 = 3.24 Момент первой степени, формула (5)
Собственно, формула 2 представляет собой среднее арифметическое всех значений
Итог: в среднем, 3.24 посетителя в час
Количество посетителей | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
Вероятность (%) | 12.5 | 6 | 19.5 | 21.3 | 9 | 11.5 | 20.3 |
Таблица 2. Закон распределения количества посетителей |
Отклонение от среднего
Посмотрите на это распределение, можно предположить, что в среднем случайная величина равна 100±5, поскольку
кажется, что таких значений несравнимо больше чем тех, что меньше 95 или больше 105:
График 2. График функции вероятности. Распределение ≈ 100±5
Среднее значение по формуле (2): μ = 99.95, но как посчитать, насколько далеко все значения находятся от среднего? Вам должна быть
знакома запись 100±5. Что бы получить это значение ±, нам необходимо определить диапазон значений вокруг среднего. И мы могли бы
использовать в качестве меры удалённости «разность» между средним и случайными величинами:
(7) xi — μ
но сумма таких расстояний, а следовательно и любое производное от этого числа, будет равно нулю, поэтому в качестве меры выбрали квадрат разниц
между величинами и средним значением:
(8) (xi — μ)2
Соответственно, среднее значение удалённости — это математическое ожидание квадратов удалённости:
(9) σ2 = E[(X — E(X))2]
Поскольку вероятности любой удалённости равносильны — вероятность каждого из них — 1/n, откуда:
(10) σ2 = E[(X — E(X))2] = ∑[(Xi — μ)2]/n
Она же формула центрального момента (6) второй степени
σ возведена в квадрат, поскольку вместо расстояний мы взяли квадрат расстояний. σ2 называется дисперсией. Корень из дисперсии
называется средним квадратическим отклонением, или среднеквадратическим отклоненим, и его используют в качестве меры разброса:
(11) μ±σ
(12) σ = √(σ2) = √[∑[(Xi — μ)2]/n]
Возвращаясь к примеру, посчитаем среднеквадратическое отклонение для графика 2:
σ = √(∑(x-μ)2/n) = √{[(90 — 99.95)2 + (91 — 99.95)2 + (92 — 99.95)2 + (93 — 99.95)2 + (94 — 99.95)2 + (95 — 99.95)2 + (96 — 99.95)2 + (97 — 99.95)2 + (98 — 99.95)2 + (99 — 99.95)2 + (100 — 99.95)2 + (101 — 99.95)2 + (102 — 99.95)2 + (103 — 99.95)2 + (104 — 99.95)2 + (105 — 99.95)2 + (106 — 99.95)2 + (107 — 99.95)2 + (108 — 99.95)2 + (109 — 99.95)2 + (110 — 99.95)2]/21} = 6.06
Итак, для графика 2 мы получили:
X = 99.95±6.06 ≈ 100±6 , что немного отличается от полученного «на глаз»
Квантиль
График 3. Функция распределения. Медиана
График 4. Функция распределения. 4-квантиль или квартиль
График 5. Функция распределения. 0.34-квантиль
Для анализа функции распределения ввели понятие квантиль. Квантиль — это случайная величина при заданном уровне вероятности, т.е.:
квантиль для уровня вероятности 50% — это случайная величина на графике плотности вероятности, которая имеет вероятность 50%.
На примере с графиком 3, квантиль уровня 0.5 = 99 (ближайшее значение, поскольку распределение дискретно и события со значением 99.3 просто не существует)
- 2-квантиль — медиана
- 4-квантиль — квартиль
- 10-квантиль — дециль
- 100-квантиль — перцентиль
То есть, если мы говорим о дециле (10-квантиле), то это означает, что мы разбили график на 10 частей, что соответствует девяти линяям,
и для каждого дециля нашли значение случайной величины.
Также, используется обозначение x-квантиль, где х — дробное число, например, 0.34-квантиль, такая запись означает значение случайной величины при
p = 0.34.
Для дискретного распределения квантиль необходимо выбирать следующим образом: квантиль гарантирует вероятность, поэтому, если рассчитанный
квантиль не совпадает с одним и значений, необходимо выбирать меньшее значение.
Построение интервалов
Квантили используют для построения доверительных интервалов, которые необходимы для исследования статистики не одного конкретного события (например,
интерес — случайное число = 98), а для группы событий (например, интерес — случайное число между 96 и 99). Доверительный интервал бывает двух видов:
односторонний и двусторонний. Параметр доверительного интервала — уровень доверия. Уровень доверия означает процент событий, которые можно считать успешными.
Двусторонний доверительный интервал
Двусторонний доверительный интервал строится следующим образом: мы задаёмся уровнем значимости, например, 10%, и выделяем область на графике так, что 90% всех
событий попадут в эту область. Поскольку интервал двусторонний, то мы отсекаем по 5% с каждой стороны, т.е. мы ищем 5й перцентиль, 95й перцентиль и значения
случайной величины между ними будут являться доверительной областью, значения за пределами доверительной области называются «критическая область»
График 6. Плотность вероятности
График 7. Функция распределения с 5 и 95 перцентилями. Цветом выделен доверительный интервал с уровнем доверия 0.9
График 8. Функция вероятности и двусторонний доверительный интервал с уровнем доверия 90%
Доверительный интервал
Левосторонний и правосторонний доверительные интервалы строятся аналогично двустороннему: для левостороннего интервала мы находим перцентиль уровня
[‘один’ минус ‘уровень значимости’]. Таким образом, для построения доверительного левостороннего интервала уровня значимости 4% нам необходимо найти четвёртый перцентиль
и всё, что справа — доверительный интервал, всё что слева — критическая область.
График 9. Левосторонний доверительный интервал с уровнем значимости 4%. Заливкой выделен доверительный интервал
График 10. Правосторонний доверительный интервал с уровнем значимости 4%. Заливкой выделен доверительный интервал
Итого
Среднее значение — математическое ожидание случайной величины, находится по формуле:
μ = E(X) = Σ(pi•Xi)
Среднеквадратичное отклонение — математическое ожидание удалённости значений от среднего, находится по формуле:
σ = √(σ2) = √[∑[(Xi — μ)2]/n]
n-квантиль — разделение функции распределения на n равных отрезков, основные типы квантилей:
- 2-квантиль — медиана
- 4-квантиль — квартили
- 10-квантиль — децили
- 100-квантиль — перцентили
Доверительный интервал уровня α — участок функции вероятности, содержащий α всех возможных значений. Двусторонний доверительный
интервал строится отсечением (1-α)/2 справа и слева. Левосторонний и правосторонний доверительные интервалы строятся отсечением
области (1-α) слева и справа соответственно.
Построить ряд распределения
Предположим, мы имеем 100 значений и все разные, например: масса тела Сомалийских пиратов.
Такой набор данных обрабатывать неудобно, мы даже не можем представить их на обычном графике.
Поэтому нам необходимо категоризировать имеющиеся данные и для этого мы делаем следующее:
Запишем наши данные в таблицу:
67 | 95 | 59 | 108 | 105 | 128 | 86 | 108 | 128 | 77 |
125 | 139 | 114 | 55 | 58 | 55 | 84 | 125 | 79 | 103 |
131 | 98 | 84 | 91 | 94 | 113 | 91 | 54 | 53 | 62 |
53 | 115 | 88 | 86 | 95 | 66 | 136 | 59 | 126 | 125 |
79 | 56 | 87 | 120 | 60 | 137 | 66 | 106 | 123 | 120 |
108 | 57 | 62 | 76 | 97 | 101 | 119 | 116 | 64 | 120 |
71 | 59 | 87 | 88 | 121 | 85 | 115 | 63 | 87 | 61 |
116 | 123 | 82 | 141 | 114 | 65 | 117 | 56 | 84 | 53 |
95 | 106 | 137 | 71 | 73 | 106 | 98 | 80 | 107 | 57 |
79 | 65 | 108 | 141 | 95 | 127 | 125 | 91 | 137 | 60 |
Таблица 3. Вес сомалийских пиратов |
Данные разобьём на группы, для начала предлагаю разбить на девять интервалов:
Узнаём максимальное и минимальное значения, вычитаем их друг из друга и делим на количество
интервалов — получили отрезки:
Максимальное значение: 141
Минимальное значение: 53
Разница: 141 — 53 = 88
Длина интервала: 88 / 9 = 9.78
Теперь посчитаем количество пиратов (весов, я имею ввиду) в каждом интервале:
# | Интервал | Количество элементов |
---|---|---|
1. | 53 — 62.78 | 19 |
2. | 62.78 — 72.56 | 9 |
3. | 72.56 — 82.34 | 8 |
4. | 82.34 — 92.12 | 14 |
5. | 92.12 — 101.9 | 9 |
6. | 101.9 — 111.68 | 10 |
7. | 111.68 — 121.46 | 13 |
8. | 121.46 — 131.24 | 11 |
9. | 131.24 — 141.02 | 7 |
Таблица 4. Количество элементов в интервалах |
Вуа-ля, наше распределение на графике:
График 11. Ряд распределения массы тела сомалийских пиратов
Бонус
Интервалы лучше брать целыми числами, поэтому, если с выбранным количеством интервалов
размер выходит нецелым, то можно раздвинуть диапазон значений, пример:
Значение интервала равно 9.78, число не является целым, поэтому
отодвигаем верхнюю границу:
Остаток от деления: [(141 — 53) / 9] = 7
Подвинуть на: 2
Новый диапазон: [53;143]
Диапазон можно двигать как вверх, так и вниз, но лучше в обе стороны.
Совет
Принято делить распределение на 7-8 интервалов, но в каждой конкретной ситуации
Вы можете выбрать отличное количество интервалов, впрочем, как и сделать их
различной длины.
Список параметров
Итак, вот список основных параметров дискретного закона распределения:
Название | Символ | Формула |
---|---|---|
Математическое ожидание (среднее) | E(X) | Σ(pi•Xi) |
Центральный момент (среднеквадратичное отклонение) |
σx | σ = √(σ2) = √[∑[(Xi — μ)2]/n] |
Длина интервала | R | max(x) — min(x) |
Мода | mo | max P(x = mo) |
1й квантиль | — | F(x) = 0.25 |
Медиана | me | F(x) = 0.5 |
Дециль | — | F(x) = 0.1 |
Таблица 5. Основные параметры дискретного закона распределения |
Шаблон гистограммы в OpenOffice Calc
Файл histogram_mock.ods содержит шаблон
построения гистограммы.
Вам понравилась статья?
/
Просмотров: 16 126