Свойства плотности распределения. Математическое ожидание непрерывной случайной величины Функция непрерывного распределения вероятности плотности
Непрерывные случайные величины характеризуются тем, что их значения могут сколь угодно мало отличаться друг от друга.
Вероятность события X < х (где X – значение , а х – произвольно задаваемое значение), рассматриваемая как функция от х , называется функцией распределения вероятностей :
F (x ) = Р (Х <х ).
Производная от функции распределения вероятностей называется функцией плотности распределения вероятностей или плотностью вероятности :
f (x ) = F" (x ).
Функция распределения вероятностей выражается через плотность вероятности в виде интеграла:
х 1 , х 2) равна приращению функции распределения вероятностей на этом интервале:
P (x 1 <X <x 2) = F (x 2) – F (x 1). (4)
3.1. Случайная величина X задана функцией распределения вероятностей:
Найти плотность вероятности f (x ) и вероятность попадания случайной величины X в интервалы (1; 2,5), (2,5; 3,5).
Решение . Плотность вероятности находим по формуле f (x ) = F" (x ):
Вероятности попадания случайной величины X в интервалы вычисляем по формуле (3.1):
Р (1 < X < 2,5) = F (2,5) – F (1) = 0,5 2 – 0 = 0,25;
Р (2,5 < X < 3,5) = F (3,5) – F (2,5) = 1 – 0,25= 0,75.
3.2. Плотность вероятности непрерывной случайной величины X:
Найти функцию распределения F (х ) и построить ее график.
Решение.
если ,
Если х > 2.
График функции представлен на рис. 3.1.
Рис. 3.1
3.3. Плотность вероятности непрерывной случайной величины X задана в виде
Найти параметр С.
Решение . На основании равенства
Математическое ожидание и дисперсия. Мода и медиана
Средним значением или математическим ожиданием непрерывной случайной величины X
М (Х ) = М х = ,
где f (x ) – плотность вероятности.
Дисперсией непрерывной случайной величины X называется значение интеграла
D (X ) = D x = .
Для определения дисперсии может быть также использована формула
D x = .
Модой М 0 (Х X называется такое значение этой величины, плотность вероятности которого максимальна.
Медианой Мe (Х ) непрерывной случайной величины X называется такое ее значение, при котором выполняется равенство
Р (Х < Me ) = Р (Х > Me ).
3.4. Случайная величина X f (x ) = х /2 в интервале (0; 2), вне этого интервала f (x ) = 0. Найти математическое ожидание величины X .
Решение . На основании формулы
3.5. Случайная величина X задана плотностью вероятности f (x ) = x /8 в интервале (0; 4). Вне этого интервала f (x ) = 0. Найти математическое ожидание.
3.6. Случайная величина X задана плотностью вероятности f (x ) = при . Найти математическое ожидание.
3.7. Случайная величина X задана плотностью вероятности f (x ) = С (х 2 + 2х ) в интервале (0; 1). Вне этого интервала f (x ) = 0. Найти параметр С .
Решение . Так как
Откуда С = .
Равномерное распределение
Непрерывная случайная величина называется равномерно распределенной на отрезке [а , b ], если ее плотность вероятности имеет вид:
Математическое ожидание и дисперсия равномерно распределенной случайной величины определяются выражениями
3.8. Случайная величина X распределена равномерно на отрезке . Найти функцию распределения F (x ), математическое ожидание, дисперсию и среднее квадратичное отклонение величины.
Решение . Плотность вероятности для величины X имеет вид:
Следовательно, функция распределения, вычисляемая по формуле:
,
запишется следующим образом:
Математическое ожидание будет равно М х = (1 + 6)/2 = 3,5. Находим дисперсию и среднее квадратичное отклонение:
D x = (6 – 1) 2 /12 = 25/12, .
Нормальное распределение
Случайная величина X распределена по нормальному закону, если ее функция плотности распределения вероятностей имеет вид:
где М х – математическое ожидание;
– среднее квадратичное отклонение.
Вероятность попадания случайной величины в интервал (а , b ) находится по формуле
Р (а < X < b ) = Ф – Ф = Ф(z 2) – Ф(z 1), (5)
где Ф(z ) = – функция Лапласа.
Значения функции Лапласа для различных значений z приведены в Приложении 2.
3.9. Математическое ожидание нормально распределенной случайной величины X равно М х = 5, дисперсия равна D x = 9. Написать выражение для плотности вероятности.
3.10. Математическое ожидание и среднее квадратичное отклонение нормально распределенной случайной величины X соответственно равны 12 и 2. Найти вероятность того, что случайная величина примет значение, заключенное в интервале (14; 16).
Решение . Используем формулу (21.2), учитывая, что М х = 12, = 2:
Р (14 < X < 16) = Ф((16 – 12)/2) – Ф(14 – 12)/2) = Ф(2) – Ф(1).
По таблице значений функции Лапласа находим Ф(1) = 0,3413, Ф(2) = 0,4772. После подстановки получаем значение искомой вероятности:
Р (14 <Х < 16) = 0,1359.
3.11. Имеется случайная величина X , распределенная по нормальному закону, математическое ожидание которой равно 20, среднее квадратичное отклонение равно 3. Найти симметричный относительно математического ожидания интервал, в который с вероятностью р = 0,9972 попадет случайная величина.
Решение . Так как Р (х 1 < Х < х 2) = р = 2Ф((х 2 – М х )/ ), то Ф(z ) = р /2 = 0,4986. По таблице функции Лапласа находим значение z , соответствующее полученному значению функции Ф(z ) = 0,4986: z = 2,98. Учитывая то, что z = (х 2 – М х )/ , определяем = х 2 – М х = z = 3 · 2,98 = 8,94. Искомый интервал будет иметь вид (11,06; 28,94).
Учтем, что f (x ) = F" (x ). Тогда получим:
Подставим в выражение для математического ожидания
.
Интегрируя по частям, получаем М х = 1/ , или М х = 1/0,1.
Для определения дисперсии проинтегрируем по частям первое слагаемое. В результате получим:
.
Учтем найденное выражение для М х . Откуда
.
В данном случае М х = 10, D x = 100.
СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН
Непрерывную с. в. можно задать, используя функцию, которую называют плотностью распределения или плотностью вероятности, или дифференциальной функцией распределения.
Плотностью распределения вероятностей непрерывной с. в. Х называют функцию f(x) – первую производную от функции распределения F(x):
Из этого определения следует, что функция распределения является первообразной для плотности распределения.
Для описания распределения вероятностей дискретной с. в. плотность распределения не применима.
Вероятностный смысл плотности распределения.
Таким образом, предел отношения вероятности того, что непрерывная с. в. примет значение, принадлежащее интервалу (x, x +∆x), к длине этого интервала (при ∆x → 0) равен значению плотности распределения в точке х.
Функция плотности характеризует каждое значение непрерывной случайной величины в отдельности, а не целый диапазон как это имеет место для функции распределения.
Вероятность попадания непрерывной с. в. в заданный интервал.
По формуле Ньютона – Лейбница:
P{a < X b}= F(b) – F(a),
таким образом
Нахождение функции распределения по известной функции плотности.
Полагая в предыдущей формуле а = -∞, b = х, и заменив переменную интегрирования х на t имеем:
F(х) = P{X х}=P{-∞< X х},
следовательно
Свойства плотности распределения
Свойство 1. Плотность распределения – неотрицательная функция: f(x)0 (т.к. интегральная функция распределения – неубывающая функция, а плотность распределения ее первая производная).
Свойство 2:
Доказательство.
Несобственный интеграл
выражает вероятность события, состоящего
в том, что случайная величина примет
значение, принадлежащая интервалу (-∞,
∞). Очевидно, такое событие достоверно,
следовательно, вероятность его равна
единице.
Геометрически это означает, что вся площадь криволинейной трапеции, ограниченной осью 0х и кривой распределения, равна единице.
Вчастности, если все возможные значения
случайной величины принадлежат интервалу
(а,b),
то
.
Возможный график плотности распределения (пример)
f 1 (x) – плотность распределения размера выигрыша в 1-й игре
f 2 (x) – плотность распределения размера выигрыша во 2-ой игре
Какая игра предпочтительней?
Числовые характеристики случайных величин. .
Данные характеристики позволяют решать многие задачи, не зная закона распределения случайных величин.
Характеристики положения случайной величины на числовой оси.
Математическое ожидание это есть среднее взвешенное значений случайной величины Х, в которое абсцисса каждой точки х i входит с «весом», равным соответствующей вероятности.
Математическое ожидание иногда называют просто средним значением с.в.
Обозначение: m x или M [X].
Для дискретной случайной величины
M
[X]
=
Для непрерывной случайной величины
Мода – это наиболее вероятное значение случайной величины (то для которого вероятность p i , или плотность распределения f(x) достигает максимума).
Обозначение:
Различают унимодальные распределения (имеют одну моду), полимодальные распределения (имеют несколько мод) и анимодальные (не имеют моды)
унимодальное
Медиана – это такое значение случайной величины х m , для которого выполняется следующее равенство:
P{X < х m }= P{X > х m }
Медиана делит площадь,ограниченную f(x), пополам
Если плотность распределения случайной величины симметрична и унимодальна, то М[X], и х m совпадают
М[X], , х m – неслучайные величины
Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .
Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.
Генеральная совокупность и случайная величина
Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.
Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.
Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.
В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.
Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).
Функция распределения
Функцией распределения
вероятностей случайной величины
Х называют функцию F(x), значение которой в точке х равно вероятности события X F(x) = P(X Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.
Типичный график Функции распределения
для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера
): В справке MS EXCEL Функцию распределения
называют Интегральной
функцией распределения
(Cumulative
Distribution
Function
,
CDF
). Приведем некоторые свойства Функции распределения:
Напомним, что плотность распределения
является производной от функции распределения
, т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения
>1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ). Примечание
: Площадь, целиком заключенная под всей кривой, изображающей плотность распределения
, равна 1. Примечание
: Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения
. Этот термин присутствует в параметрах функций, например в НОРМ.РАСП
(x; среднее; стандартное_откл; интегральная
). Если функция MS EXCEL должна вернуть Функцию распределения,
то параметр интегральная
, д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности
, то параметр интегральная
, д.б. ЛОЖЬ. Примечание
: Для дискретного распределения
вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности
может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП()
). Понятно, что чтобы вычислить плотность вероятности
для определенного значения случайной величины, нужно знать ее распределение. Найдем плотность вероятности
для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ)
=0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ)
. Напомним, что вероятность
того, что непрерывная случайная величина
примет конкретное значение x равна 0. Для непрерывной случайной величины
Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b). 1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения
вероятность равна F(+∞)-F(0)=1-0,5=0,5. НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА)
=1-0,5. 2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения,
вероятность равна F(0)=0,5. В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА)
=0,5. 3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению
, примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА)
. Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону
N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье функции распределения
найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5. В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5)
=0. Однозначно вычислить значение случайной величины
позволяет свойство монотонности функции распределения.
Обратная функция распределения
вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения
. В файле примера
можно вычислить и другой квантиль
этого распределения. Например, 0,8-квантиль равен 0,84. В англоязычной литературе обратная функция распределения
часто называется как Percent Point Function (PPF). Примечание
: При вычислении квантилей
в MS EXCEL используются функции: НОРМ.СТ.ОБР()
, ЛОГНОРМ.ОБР()
, ХИ2.ОБР(),
ГАММА.ОБР()
и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье . Выше непрерывная случайная величина задавалась с помощью функции распределения. Этот способ задания не является единственным. Непрерывную случайную величину можно также задать, используя функцию, которую называют плотностью распределения
или плотностью вероятности
(часто ее называют дифференциальной функцией
). Плотностью распределения вероятностей непрерывной случайной величины Х
называют функцию f (x) -
первую производную от функции распределения F (x)
:
f (x)= F" (x).
Из этого определения следует, что функция распределения является первообразной
для плотности распределения. Зная плотность распределения, можно вычислить вероятность того, что непрерывная случайная величина примет значение, принадлежащее заданному интервалу. Теорема
. Вероятность того, что непрерывная случайная величина Х
примет значение, принадлежащее интервалу (а, b
), равна определенному интегралу от плотности распределения, взятому в пределах от а
до b
: Зная плотность распределения f(x)
, можно найти функцию распределения F (х)
по формуле . Свойства плотности распределения: Свойство 1.
Плотность распределения - неотрицательная функция: Геометрически это свойство означает, что точки, принадлежащие графику плотности распределения, расположены либо над осью Ох
, либо на этой оси. График плотности распределения называют кривой распределения
. Свойство 2
. Несобственный интеграл от плотности распределения в пределах от . Геометрически это означает, что вся площадь криволинейной трапеции, ограниченной осью Ох и кривой распределения, равна единице. В частности, если все значения случайной величины принадлежат интервалу (а, b
), то . Математическое ожидание дискретной случайной величины
Закон распределения полностью характеризует случайную величину. Однако он зачастую неизвестен заранее и приходится пользоваться косвенными сведениями. Во многих случаях этих косвенных характеристик вполне достаточно для решения практических задач и определять закон распределения не нужно. Такие характеристики называют числовыми характерис
тиками случайной величины. И первой из них является математическое ожидание. Математическим ожиданиемдискретной случайной величины X
называется сумма произведений всех ее возможных значений (x
1 , x
2 , …, x n
) на их вероятности (p
1 , p
2 , …, p n
):
Следует заметить, что M
(x
) есть неслучайная
(постоянная) величина. Можно доказать, что M
(x
) приближенно равно (и тем точнее, чем больше число испытаний n
) среднему арифметическому наблюдаемых значений случайной величины. Математическое ожидание имеет следующие свойства
:
· Математическое ожидание постоянной
равно самой постоянной: . · Постоянный множитель
можно выносить за знак математического ожидания: . · Математическое ожидание произведения
двух независимых случайных величин X
и Y
(т.е. закон распределения одной из них не зависит от возможных значений другой) равно произведению их математических ожиданий: · Математическое ожидание суммы
двух случайных величин равно сумме математических ожиданий слагаемых: Здесь под суммой
X + Y
случайных величин понимается новая случайная величина, значения которой равны суммам каждого значения X
с каждым возможным значением Y
; вероятности возможных значений X + Y
для независимых случайных величин X
и Y
равны произведениям вероятностей слагаемых, а для зависимых – произведениям вероятностей одного слагаемого на условную вероятность другого. Так, если X
и Y
– независимы и их законы распределения · Если производится n
независимых испытаний, в каждом из которых вероятность события A
постоянна и равна p
, то математическое ожидание числа появлений
события A
в серии: . Отметим, что свойства третье и четвертое легко обобщаются для любого количества случайных величин. Дисперсия дискретной случайной величины
Математическое ожидание – удобная характеристика, но часто ее недостаточно для суждения о возможных значениях случайной величины или о том, как они рассеяны
вокруг среднего значения. Поэтому вводятся и другие числовые характеристики. Пусть X
– случайная величина с математическим ожиданием M
(X
). Отклонением
X
0 назовем разность между случайной величиной и ее математическим ожиданием: . Математическое ожидание отклонения M
(X
0) = 0. Пример. Пусть задан закон распределения величины X
: Отклонение является промежуточной характеристикой, на основе которой введем более удобную характеристику. Дисперсией
(рассеиванием
) дискретной случайной величиныназывается математическое ожидание квадрата отклонения случайной величины:
Для примера найдем дисперсию величины X
со следующим законом распределения: Здесь . Искомая дисперсия: Величина дисперсии определяется не только значениями случайной величины, но и их вероятностями. Поэтому в случае если две случайные величины имеют одинаковые или близкие математические ожидания (это достаточно часто встречается), то дисперсии, как правило, различны. Это позволяет дополнительно характеризовать изучаемую случайную величину. Перечислим свойства дисперсии:
· Дисперсия постоянной
величины равна нулю: . · Постоянный множитель
можно выносить за знак дисперсии, возводя его в квадрат: . · Дисперсия суммы
и разности
двух независимых случайных величин равна сумме дисперсий этих величин: · Дисперсия числа появлений
события A
в n
независимых испытаниях, в каждом из которых вероятность P
появления события постоянна
, определяется по формуле: , где Удобной вспомогательной характеристикой, используемой в расчетах даже чаще, чем D
(X
), является среднеквадратическое отклонение
(или стандарт
) случайной величины: . Дело в том, что D
(X
) имеет размерность квадрата размерности случайной величины, а размерность стандарта X
) та же, что и у случайной величины X
. Это очень удобно для оценки разброса случайной величины. Пример. Пусть случайная величина задается распределением: Рассчитываем: м, а стандарт: м. Поэтому про случайную величину X
можно сказать либо – ее математическое ожидание 6,4 м с дисперсией 13,04 м 2 , либо – ее математическое ожидание 6,4 м с разбросом Отметим, что для суммы
n
независимых случайных величин: Начальные и центральные теоретические моменты
Для большинства практических расчетов введенных выше числовых характеристик M
X
),D
X
)и X
) достаточно. Однако для исследования поведения случайных величин можно использовать и некоторые дополнительные числовые характеристики, позволяющие отследить нюансы поведения случайной величины и обобщить вышеизложенную теорию. Начальным моментомk-го порядка случайной величины X
называется математическое ожидание величины X
k
:
Определение
. Непрерывной
называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Для непрерывной случайной величины вводится понятие функции распределения. Определение.
Функцией распределения
вероятностей случайной величины Х называют функцию F(х), определяющую для каждого значения x вероятность того, что случайная величина Х примет значение меньшее x, то есть: F(х) = P(X < x) Часто вместо термина «функция распределения» используют термин «интегральная функция распределения». Свойства функции распределения:
1. Значения функции распределения принадлежат отрезку: 0 ≤ F(х) ≤ 1. 2. Функция распределения есть неубывающая функция, то есть: если x > x , то F(x ) ≥ F(x ). 3. Вероятность того, что случайная величина примет значение, заключенное в интервале }
Вычисление плотности вероятности с использованием функций MS EXCEL
Вычисление вероятностей с использованием функций MS EXCEL
Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).
.
до
равен единице:
– вероятность непоявления события. X
2м
3м
10м
P
0,1
0,4
0,5
м. Вторая формулировка, очевидно, нагляднее.