Нормальное распределение

Работы Я. Бернулли, а также частные исследования других математиков XVII-XVIII вв. из Европы впоследствии оформились в теорию вероятности. В начальный период развития основной проблемой данной теории было определение вероятности сложного события при случае определенного количества независимых появлений вроде рассмотренных выше испытаний с подбрасыванием монет. Формула для таких задач была определена, однако для больших объемов (например, вычислить вероятность того, что при 20000 подбрасываний монеты выпадут 5000 или больше "гербов") такие вычисления выглядели очень громоздкими.

В начале XVIII в. где Муавру (1667-1754) удалось аппроксимировать биномиальное распределение с помощью формулы

f (x) = -) = ехри- (3.57)

где fx) - вероятность; fi и а - среднее и стандартное отклонение. Функция fx) получила название плотности нормального распределения.

Функция нормального распределения определяется через плотность

ф (x) = | f (t) dt. (3.58)

-сс

MS Excel содержит функцию = НОРМРАСП (х; / г, а, И), которая возвращает значение или функции Ф (х), или функции плотности fx) для заданных fi и а. Параметр И определяет форму функции: если 1 = 0, = НОРМРАСП () возвращает значение Ф (х), иначе fx). На рис. 3.42 приведены формулы расчета распределений с использованием функций MS Excel = БИНОМРАСП () и = НОРМРАСП ().

Рис. 3.42. Формулы расчета распределений (п = 6, р = 0,5; ¡1 = 3, а = 1,22)

На рис. 3.43 и 3.44 представлены результаты расчета плотности биномиального и нормального распределений и соответствующие графики для двух наборов параметров: первый (п = 6; р = 0,5; / г = 3; а = 1,22) и второй (п = 10, р = 0,5; / г = 5 и а = 1,58). Значение / г и а получено из биномиального распределения.

Рис. 3.43. Биномиальное и нормальное распределения (п = 6, р = 0,5; ¡1 = 3, а = 1,22)

Сравнивая графики кривых биномиального и нормального распределений, можно констатировать, что функция нормального распределения вполне удовлетворительно аппроксимирует функцию биномиального распределения. Более того, с увеличением объема выборки п отклонения значений нормального и биномиального распределений хь (х) -Дх) | / п уменьшается (для п = 6 составляет 0,54%, для n = 10 - 0,24%).

Рис. 3.44. Биномиальное и нормальное распределения (п = 10, р = 0,5; / г = 5, а = 1,58)

Универсальность функции плотности нормального распределения заключается в том, что она использует в качестве своих аргументов одни из основных характеристик совокупностей - среднее г. и стандартное отклонение а, а также "работает" и для дискретных, и для непрерывных величин.

Формула плотности нормального распределения (3.56) задает только некоторую типичную форму графика в виде симметричного "колокола", известного под названием нормальной кривой. Меняя значение / г и а, можно сдвигать конкретную нормальную кривую вдоль числовой оси ординат и менять ее размах.

На рис. 3.45 графики нормальных распределений построено для совокупностей, которые имеют различные средние / г и различные стандартные отклонения а. Предлагаем проанализировать сходство и различие этих распределений плотности.

Рис. 3.45. Семья графиков плотности нормального распределения Популярность нормального распределения обоснованно выводами центральной предельной теоремы, поскольку в природе, социальной, педагогической сферах и ситуациях много случайных величин суммами нескольких случайных факторов. Среди семейства нормальных распределений особое место занимает распределение, которое имеет нулевое среднее fi = 0 и единичное стандартное отклонение а = 1

f (z) = ^ Lexp {- I (3.59)

График соответствующего распределения называется стандартным нормальным распределением. Значение и функции щильностиf z), распределения Ф (г) можно получить с помощью или специальных таблиц 18, или компьютерных программ, в частности, функций MS Excel = НОРМРАСП () и = НОРМСТРАСП () (см. Рис. 3.46).

Стандартном нормальном распределению присущи следующие свойства:

o площадь, имеет смысл вероятности под графиком плотности, равен 1;

o кривая графика не пересекает ось z хотя и приближается к ней по мере того, как z становится более трех, но никогда ее не касается;

o высшая точка кривой плотности распределения 0,3989 расположена над нулевым значением z;

18 Болыпев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М .: Наука, 1965 (первое изд.), 1968 (второе изд.), 1983 (3-е изд.).

Рис. 3.46. Значение и графики стандартного нормального распределения

o стандартная нормальная кривая всегда будет симметричной относительно вертикали, проведенной через i = 0, ее асимметрия и эксцесс равны нулю;

o любую другую нормальную кривую можно совместить со стандартной с помощью операции нормализации (переход от переменной х к и см. 2.2)

и, = ^ ~ ^; (3.60)

o если случайные величины X 1 и Х 2 имеют функции нормального распределения И (р 1; d) и N (^ 2, (+7 2) соответственно, то случайная величина (X 1 + Х 2) имеет нормальное распределение N (/ ^ + ^ 2 д / ег 2 + <т2)

o если случайные величины Х 1, Х 2, Х п независимы и имеют один тот

_ Х + Х + + Х

же распределение N (м; в), то их среднее арифметическое Х = - 1 - 2 ----

п

имеет нормальное распределение N (¿1, <в И4П).

Как известно, площадь под кривой функции плотности имеет смысл вероятности. Общая площадь под нормальной кривой, где абсцисса х меняется от -оо до + оо, равен 1. А это значит, что вероятность р того, что х будут принимать любые значения (от -оо до + оо), равно 1 (или 100 %).

Вероятность того, что х будет принимать значения от х 1 до х 2, равно значению соответствующей площади под нормальной кривой, ограниченную по бокам этими значениями. Для нормированной нормальной кривой (где а = 1) значение х можно записывать в единицах стандартного отклонения а например "х меняется от-1А до + 1о", или "х меняется от -1 до + 1".

Для значений х от-1А до +1 (7 площадь (и соответствующая вероятность принимать значения / и ± а) равна 0,683 (или вероятность 68,3%).

Для значений х от 2А до 2 (7 площадь (и соответствующая вероятность принимать значения / и ± 2а) равна 0,954 (или 95,4%).

Для значений х от 3А до + 3а площадь (и соответствующая вероятность) равна 0,997 (или 99,7%). Следует обратить внимание на то, что 99,7% значений совокупности (то есть практически все ее значения) находятся в пределах среднего / г ± 3а. Этот факт получил своеобразное название "закон трех сигм".

Как получить значения вероятностей с использованием нормального распределения? Наряду с классическими формулами, которые выглядят слишком громоздкими и очень неудобными, существуют специально рассчитаны статистические таблицы. Однако самым мощным способом считаются компьютерные средства.

Чтобы подсчитать вероятность (площадь), например, для значений х от-1А до +1 (7, необходимо выполнить 3 действия:

o определить вероятность р 1 для х от -оо до-1А с помощью функции = НОРМРАСП (-1, 0, 1, 1), которая вернет значение 15,866%;

o определить вероятность р 2 для х от -оо до +1 (7 с помощью функции = НОРМРАСП (1; 0; 1; 1), которая вернет значение 84,134%;

o визначитир = р 2 - Ри = 84,134% - 15,866% = 68,269% ~ 68,3% ..

В математической статистике часто возникает необходимость решать обратные задачи типа: "определить х, которому соответствует определенная вероятность р". Например, для которого значение х, начиная от вероятность составит 5%?

С математической точки зрения необходимо определить такое 2, которое ограничивает ординатой слева 5% площади под нормальной кривой (см. Рис. 3.47).

Рис. 3.47. Распределение N (0,1) имеет параметр z 0; о5 ~ -1,64

Традиционно эта задача также решался с помощью специальных статистических таблиц. Однако, можно предложить использовать функцию MS Excel = НОРМОБР (г; fi; о), которая возвращает значение z для заданных вероятности р, среднего fi, стандартного отклонения а. Так, для /> <0,05, fi = 0 и а = 1 функция = НОРМОБР (0,05; 0; 1) вернет значение z ~ -1,64485. Аналогично для / 7 <0,01 = НОРМОБР (0,01; 0; 1) вернет значение z ~ -2,32635 и т.д.

Для множества нормальных кривых, отличаются друг от друга значениями fi и а важной общим свойством является то, что любая часть площади (которая ассоциирует вероятность) под нормальной кривой может быть выражена в средних fi и стандартных отклонениях а. Например, в любом нормальном распределении примерно 95% площади под кривой лежит в пределах двух а среднего fi (если точно определять, то 95% площади лежит в пределах среднего fi от -1,96с до + 1,96ег (см. Рис . 3.48);

Рис. 3.48. Распределение N (0,1) имеет параметр г +0 025 | ~ 1,96

Важность использования в различных педагогических и психологических исследованиях нормального распределения объясняется выводами центральной предельной теоремы, которая является фундаментальным проявлением закона больших чисел. Между тем в конкретных прикладных задачах нормальность результатов испытаний установить из общих соображений, как правило, невозможно. Нормальность следует проверять с помощью статистических критериев, или же использовать непараметрические методы (см. 5.3).

При цитировании материалов в рефератах, курсовых, дипломных работах правильно указывайте источник цитирования, для удобства можете скопировать из поля ниже:

Поделиться материалом

Содержание