СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

Распределения случайных величин

Случайная величина - это величина, которая в результате испытаний может принимать определенные значения (из совокупности своих значений) с определенной вероятностью. Случайной можно назвать любую (не обязательно численное) переменную x, значение которой х создают множество случайных элементарных событий {х }.

Различают дискретную и непрерывную случайные величины.

Дискретной случайной величиной называется случайная величина, принимающая конечное число значений из множества, элементы которой можно пронумеровать. Непрерывной случайной величиной называется случайная величина, возможные значения которой непрерывно заполняют некоторый интервал.

Строка распределения дискретной случайной величины x может быть представлен как в табличной форме - в виде таблицы, где перечислены значения случайной величины х 1, х 2, х п с соответствующими них ймовирностямир 1, р 2, р п (см. Табл. 3.2) , так и в виде графического изображения (рис. 3.7).

Таблица 3.2

Строка распределения дискретной случайной величины X

Рис. 3.7. График распределения дискретной случайной величины X

Строка распределения может иметь аналитическую форма представления, например:

В общем виде это можно записать якД (Х) = Р (Х = х) - значение функции / (X) равна вероятности Р (Х = х) того, что переменная X принимает значение х.

По аналогии со случайными событиями, можно считать, что пространством элементарных случайных значений х 1, х 2, х п переменной X является конечное множество этих значений С1 = {х}. Каждому элементарному значению х 1, х 2, х п, которое принадлежит множеству СИ, поставлены в соответствие неотрицательное число - ймовирностир 1, р 2, р п, то есть р! = Р (Х = х {)> 0, причем сумма вероятностей появления всех элементарных значений переменной x равна единице:

Р, = 1. (3.14)

Итак, пару {СИ, Р} можно считать вероятностным пространством, которое состоит из конечного множества значений В переменного x и неотъемлемой функции Р, которая определена на множестве значений В и удовлетворяет условию (3.14).

Если эмпирические данные результат статистических испытаний, то эмпирическое распределение частот можно трактовать как распределение случайной величины - соотношение возможных значений с соответствующими вероятностями их появления. Поскольку классические вероятности совпадают с относительными частотами (см. Понятие классической вероятности), то распределения частот можно представлять как соответствующие распределения случайных величин, однако, только по определенным условиям и ограничениями (речь о них пойдет ниже).

Рассмотрим на примере построение распределения дискретной случайной величины.

Пример 3.11. Рассчитать распределение количества выполненных задач по результатам тестирования наугад отобранной по академической потока выборки студентов объемом 20 человек (табл. 3.3).

Таблица 3.3

Количество выполненных заданий

Последовательность решения:

o представить эмпирические данные табл. 3.3 значениями хи и соответствующими абсолютными частотами выполнения задач. Частоты рассчитать по любым известным методом и внести в ячейки Л3: С9. Сумма абсолютных частот по-

7

должна составить объем выборки, то есть ^ т и = 20 (см. ячейку С10 рис. 3.8);

i = 1

o для расчета ймовирностейр = Р (Х = хи) внести в ячейку выражение

= С3 / $ С $ 10 аналогичные выражения внести в ячейки 4:09;

o рассчитать в ячейках Е3: Е9 вероятности р, - = Р (Х <хи)

o построить графики распределения вероятностей (рис. 3.9).

Итак, в таблице рис. 3.8 рассчитан распределения вероятностей дискретной переменной X (количества выполненных заданий) р '(х) = Р (Х = х) и р (х) = Р (Х <х), на рис. 3.9 изображено соответствующие графики.

Совокупность вероятностей рьи = Р (Х = хи) называется плотности распределения переменной X (см. Колонку Б рис. 3.8 и гистограмму рис. 3.9). Каждое отдельное значение плотности распределения определяет вероятность г. ", - каждого отдельного значения X! переменной X, то есть Р (Х = хи). Сумма вероятностей г. ", - всех элементарных значений X! переменной X (при условии полной системы случайных значений) равна

п

единицы, то есть ^ р] = 1 Как видно из рис. 3.8 (см. Ячейку 010), это требование

i = 1

выполняется: 0,00 + 0,05 + 0,10 + 0,20 + 0,25 + 0,30 + 0,10 = 1,00.

Совокупность вероятностей р! = Р (Х <X!) Называется распределения переменной X (см. Колонку Е рис. 3.6 и дискретной график рис. 3.7 в виде ступенек с насыщением до 1,00). Распределение случайной величины показывает вероятность для переменной X, значение которой не превышает х ^, то есть Р (Х <х ^. Каждое значение распределения суммой вероятностей рьи всех предыдущих элементарных значений х, и

переменной X, то есть: г. и = ^ р 'И. Например, для i = 4 значения вероятность р 4

i = 1

4

Аналогично может быть представлено и плотность распределения Дх). Для дискретной переменной распределение и плотность распределения связаны соотношением:

Р (хи) = ± / (х,) (3.17)

i = 1

Для непрерывной переменной можно записать следующие соотношения:

- Плотность распределения Дх) = Р '(х). Это значит, что плотность Дх) является первой производной от функции распределения Р (х)

- Плотность распределения для любой случайной величины неотъемлемая, то есть Лх)> 0, и имеет такое свойство:

составлять г. 4 г. ". = 0,00 + 0,05 + 0,10 + 0,20 = 0,35 (см. Ячейку Е6 рис. 3.6).

¡= 1

Вероятность получения в испытании любого значения с полной системы случайных значений (фактически, это вероятность достоверного события) равна

п

единицы. И действительно, для i = п вероятность р п = ^ г] = 1 (см. Ячейку Е9 рис. 3.6

i = 1

или последнее значение вероятности распределения на графике рис. 3.7).

Законом распределения случайной величины является соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Закон распределения могут быть заданы функциями:

o функцией распределения Р (х)

Р (х) = Р (Х <х) (3.15)

o функцией плотности розподилуДх)

Дх) = Р (Х = х). (3.16)

Для дискретной переменной функция распределения Р (х) может быть представлена в аналитической форме. Так, по данным рис. 3.8 функция Р (х) будет иметь вид:

Математический анализ предоставляет геометрическую интерпретацию определенный интеграл (3.18) как площади (см. Окрашенную площадь на рис. 3.10), которая сверху ограничена графиком функции / (х), а снизу - осью абсцисс в пределах ю <x <+ со. Размер площади по интегралом (3.18) равен единице.

Значение функции распределения ¥ (х) для определенного значения х (например, х = а) определяется через плотность распределения / (х) по формуле:

Интеграл (3.19) и функция ¥ (а) распределения также имеют смысл площади (см. Окрашенную площадь на рис. 3.11), которая ограничена с трех сторон: сверху - графиком функции Дх), снизу - осью абсцисс в пределах - "<x < а с правой стороны -ординатою, которая проходит через точку х = а.

Для х = + со функция распределения ¥ (со) = 1, то есть

и (со) = / (х) ^ х = 1 (3.20)

-ОС

Итак, сравнивая алгебру случайных событий с математическим аппаратом случайной величины, можно прийти к выводу о том, что распределения случайных величин изоморфно воспроизводятся на распределениях случайных событий.

Рассмотрим пример распределения непрерывной случайной величины.

Пример 3.12. Как известно из психодиагностики, коэффициент интеллекта В (показатель интеллектуального развития совокупности одинаковых по возрасту лиц) распределяется по закону, близкому к нормальному 12, плотность распределения которого определяется формулой:

гґ 1 0,5 ((х-1 в) / <7) 2 гг,. 1 | (х - И 0 2 и

где / (х) - вероятность Р (и <2 = х) того, что й <2 примет значение х; И <2 и а -среднее арифметическое и стандартное отклонение генеральной совокупности; % ~ 3,14; е ~ 2,71. Для определенного контингента индивидуумов среднее значение 1 <2 = 100 и а = 15.

Задача: Построить распределение коэффициента интеллекта И £) в диапазоне значений от И <2 МИН = 50 до I (2макс = 150. Определить вероятность того, что и (2 принимать значения: а) И £) <80; б) Щ> 110; в) в пределах 70 <И £) <90; г) принимать значения вне интервала 80 <Щ <120.

Решение:

Рассчитаем плотности / (х) нормального распределения и распределение и (х) в табличной форме в указанном диапазоне с интервалом 10 (рис. 3.10). Детали расчета рассмотрим позже в соответствующем разделе. Важным моментом является достижение так называемой нормализации, при которой площадь под кривой плотности распределения / (х) должна быть равна единице. Как видно из ячейки С14 рис. 3.10, это требование выполняется.

Построим соответствующие графики распределения И £) (рис. 3.13). Форма графика плотности / (ИО) имеет вид "колокола". Она является симметричной относительно среднего значения ИО = 100. График распределение достигает насыщения на уровне 1,00.

12 Подробнее о нормального закона распределения см. раздел 3.4.

Следует обратить внимание на то, что вероятность Р (/ £> <100) = 0,50. Иначе говоря, вероятность получить значение 12 на уровне не больше среднего значения й <2 = 100 составляет 50%. На рис. 3.13 это соответствует окрашенной площади, которая составляет 50% от общей. Аналитически это можно записать так:

100

Р <100) = | / (х) Сх = 0,50.

-сс

Рассмотрим пункты задачи по определению вероятности получения конкретных значений коэффициента интеллекта

а) Определить вероятность того, что 12 принимать значения не более 80, то есть Р (и <2 <80). Этой ситуации соответствует закрашена площадь рис. 3.14, для которой Р (80) ~ 0,091 (значение 0,091 можно получить из табл. Рис. 3.12). Аналитический запись имеет вид:

80

Р <80) = | Л (х) Сох ~ 0,091.

-сс

Следовательно, вероятность Р (и <2 <80) = 0,091 = 9,1%.

б) Определить вероятность того, что значение 12 не менее 110, то есть, Р (/ 0> 110). Закрашена площадь рис. 3.15 соответствует ситуации, когда надо получить событие ^ 4 {/ 2> 110}, которая является дополнением противоположного события А {й <2 <110}. Сумма вероятностей противоположных событий равна единице. Отсюда вероятность желаемой события Р (I 2> 110) = 1 - Р (и (2 <110) и аналитический запись для определения соответствующей вероятности с помощью функций распределения такой:

110

Р (х> 110) = 1 - Р (х <110) = 1 - | Л (х) Сх = 1 - 0,748 = 0,252.

-сс

Значение Р (110) = 0,748 можно получить из табл. рис. 3.12. Следовательно, вероятность Р (/ ((> 110) ~ 25,2%.

в) Определить вероятность того, что ¡2 принимать значения не менее 70, но не более 90, то есть Р (70 <¡2 <90). Закрашена площадь рис. 3.16 соответствует ситуации, когда с события ^ {¡2 <90} надо изъять элементы события А 2 {12 <70}. Тогда вероятность Р (А) желаемой события А равна разности вероятностей Р (40 и Р (А,) событий А х и ^ 2, то есть Р (70 <1 (2 <90) = Р (/ (<90) - Р ( Р2 <70). Определение вероятности с помощью функций распределения будет иметь вид:

90 90 70

| Л (х) Сх = | Л (х) Сх - | Л (х) Сх = Р (90) - Р (70), или

Р (90) - Р (70) = 0,253 - 0,023 = 0,23. Следовательно, вероятность Р (70 <¡2 <90) = 23%.

г) Определить вероятность того, что и <О принимать значения вне интервала 80 <120, то есть, Р (80> В> 120). Этому событию соответствует сумма двух окрашенных частей площади рис. 3.17. Решение можно получить в 2-х вариантах:

1-й вариант. Событие А состоит из двух несовместимых событий А 1 {и <2 <80} и ^ 2 {и <2> 120} с вероятностями Р (АА и Р (А 2) соответственно. Вероятность Р (АА события А 1 определится как

80

| / (Х) ах = и (80), или из табл. рис. 3.12 имеем и (80) = 0,091.

Вероятность Р (А 2) события ^ 4 2 определится как дополнение к противоположному события I 2 {ИО <120} или Р (А 2) = 1 - ~ Аи {ИО <120}, а именно

120

и (х> 120) = 1 - | / (х) йх = первый (120) или

-ос

120

и (х> 120) = первый (х <120) = 1 - | / (х) х = 1 - 0,909 ~ 0,091.

-ос

Вероятность Р (А) события А состоит из суммы вероятностей Р (АА и Р (А 2) событий А 1 и А 2, то есть Р (А) = Р (А 1) + Р (А 2) = 0,091 + 0,091 ~ 0,182 = 18,2%.

2-й вариант. Событие ^ 4 {80> и <> 120} можно построить и рассматривать как дополнение к противоположному событию А, которую обозначим _8 {80 <I (2 <120} (см. Неокрашенные площадь рис. 3.17). Тогда Р (А) = 1- Р (В).

Событие _8 {80 <¡2 <120} соответствует предыдущей ситуации (см. Выше п. "В"), когда с события В 1 {¡2 <120} надо изымать элементы события В 2 {2 <80}. Вероятность Р (В) события В разница вероятностей Р (В {) и Р (В 2)

Р (В) = Р (12 <120) - Р (12 <80). Вероятность Р (А) желаемой события А равна

Р (А) = 1- Р (В) = 1 - [Р (Щ <120) - Р (12 <80)]. Определение вероятности с помощью функций распределения будет иметь вид:

120 Г120 80 ~ |

1 - | Л (х) Сх = 1 - | Л (х) Сх - | Л (х) Сх = 1 - [Р (120) - Р (80)], или 1- [Р (120) - Р ( 80)] = 1 - [0,909 - 0,091] = 1- 0,818 = 0,182 = 18,2%.

Следовательно, вероятность того, что ¡2 принимать не значение в диапазоне от 80 до 120, то есть Р (80> ¡2> 120), составляет 18,2%.

Примечание: если график распределения симметричный и закрашенные площади одинаковые по размеру, вероятность Р (А) рассчитывается как удвоенная площадь одной из частей, например, Р (А) = 2-Д80 <¡2) = 2-0,091 ~ 0,182 = 18,2 %.

Распределения дают возможность решения и обратной задачи: нахождение значений переменной x, вероятность которой заданы.

Так, по данным примера 3.12 можно утверждать, что на уровне вероятности 0,05 (5%) коэффициент интеллекта ¡2 не будет превышать значение 75,3. Из графика функции распределения Р (2) рис. 3.18 видно, что вероятности 0,05 соответствует закрашена площадь, ограниченная графиком щильностиЛ (Ш) и ординатой ¡2 = 75,3. Иначе говоря, Р (! 2) = ^ (¡2 <75,3) = 0,05.

Аналогично можно получить значение переменной ¡2, вероятность которой составляет 20% или 0,20. Из рис. 3.19 видно, что вероятности 0,20 соответствует закрашена площадь, ограниченная графиком плотности Л (Ш) и ординатой ¡2 = 87,4.

Иначе говоря, Р (! 2) = ^ (¡2 <87,4) = 0,20.

На данном этапе изучения свойств распределений уместно вспомнить понятие "процентиль" и предоставить ему дополнительного содержательного смысла. Как определялось выше, процентили делят объем упорядоченной совокупности на ста частей, то есть отделяют от совокупности по 0,01 доли (по 1%). Pj - это z'-й процентиль - предел, ниже которой лежат / 'процентов значений. Например, если пятый процентиль равен 30 (записывают Р 5 = 30), это значит, что 5% всех значений x не превышают 30.

Значение функции распределения F (X), которые находятся в пределах от 0 для F (- ") до 1 для F (+ co), также удобно разделить на ста частей и представлять функцию распределения в виде Процентиль. Если цена шкалы функции распределения F ( x) составляет 0,01 (1%), полученные выше результаты можно прокомментировать таким способом:

o для F (IQ) = P (IQ <75,3) = 0,05 = 5% можно записать Р 5 = 75,3 - пятом процентили соответствует коэффициент интеллекта, который не превышает значения в 75,3;

o для F (IQ) = P (IQ <87,4) = 0,20 = 20% можно записать Р 20 = 87,4 - двадцатом процентили соответствует коэффициент интеллекта, который не превышает 87,4.

Значение процентиля для нормального распределения можно получить с помощью функции MS Excel = НОРМОБР (вероятность; среднее; ст.видхилення). Так, ^ 5 = НОРМОБР (0,05; 100; 15) = 75,3; а Р 20 = НОРМОБР (0,20; 100; 15) = 87,4.

При цитировании материалов в рефератах, курсовых, дипломных работах правильно указывайте источник цитирования, для удобства можете скопировать из поля ниже:

Поделиться материалом

Содержание