Характеристики биномиального распределения. Биномиальное распределение. Дискретные распределения в MS EXCEL. Расчет вероятностей биномиального распределения в Excel

В настоящей и нескольких следующих заметках мы рассмотрим математические модели случайных событий. Математическая модель - это математическое выражение, представляющее случайную величину. Для дискретных случайных величин это математическое выражение известно под названием функция распределения.

Если задача позволяет явно записать математическое выражение, представляющее случайную величину, можно вычислить точную вероятность любого ее значения. В этом случае можно вычислить и перечислить все значения функции распределения. В деловых, социологических и медицинских приложениях встречаются разнообразные распределения случайных величин. Одним из наиболее полезных распределений является биномиальное.

Биномиальное распределение используется для моделирования ситуаций, характеризующихся следующими особенностями.

  • Выборка состоит из фиксированного числа элементов n , представляющих собой исходы некоего испытания.
  • Каждый элемент выборки принадлежит одной из двух взаимоисключающих категорий, исчерпывающих все выборочное пространство. Как правило, эти две категории называют успех и неудача.
  • Вероятность успеха р является постоянной. Следовательно, вероятность неудачи равна 1 – р .
  • Исход (т.е. удача или неудача) любого испытания не зависит от результата другого испытания. Чтобы гарантировать независимость исходов, элементы выборки, как правило, получают с помощью двух разных методов. Каждый элемент выборки случайным образом извлекается из бесконечной генеральной совокупности без возвращения или из конечной генеральной совокупности с возвращением.

Скачать заметку в формате или , примеры в формате

Биномиальное распределение используется для оценки количества успехов в выборке, состоящей из n наблюдений. Рассмотрим в качестве примера оформление заказов. Чтобы сделать заказ клиенты компании Saxon Company могут воспользоваться интерактивной электронной формой и послать ее в компанию. Затем информационная система проверяет, нет ли в заказах ошибок, а также неполной или недостоверной информации. Любой заказ, вызывающий сомнения, помечается и включается в ежедневный отчет об исключительных ситуациях. Данные, собранные компанией, свидетельствуют, что вероятность ошибок в заказах равна 0,1. Компания хотела бы знать, какова вероятность обнаружить определенное количество ошибочных заказов в заданной выборке. Например, предположим, что клиенты заполнили четыре электронных формы. Какова вероятность, что все заказы окажутся безошибочными? Как вычислить эту вероятность? Под успехом будем понимать ошибку при заполнении формы, а все остальные исходы будем считать неудачей. Напомним, что нас интересует количество ошибочных заказов в заданной выборке.

Какие исходы мы можем наблюдать? Если выборка состоит из четырех заказов, ошибочными могут оказаться один, два, три или все четыре, кроме того, все они могут оказаться правильно заполненными. Может ли случайная величина, описывающая количество неправильно заполненных форм, принимать какое-либо иное значение? Это невозможно, поскольку количество неправильно заполненных форм не может превышать объем выборки n или быть отрицательным. Таким образом, случайная величина, подчиняющаяся биномиальному закону распределения, принимает значения от 0 до n .

Допустим, что в выборке из четырех заказов наблюдаются следующие исходы:

Какова вероятность обнаружить три ошибочных заказа в выборке, состоящей из четырех заказов, причем в указанной последовательности? Поскольку предварительные исследования показали, что вероятность ошибки при заполнении формы равна 0,10, вероятности указанных выше исходов вычисляются следующим образом:

Поскольку исходы не зависят друг от друга, вероятность указанной последовательности исходов равна: р*р*(1–р)*р = 0,1*0,1*0,9*0,1 = 0,0009. Если же необходимо вычислить количество вариантов выбора X n элементов, следует воспользоваться формулой сочетаний (1):

где n! = n * (n –1) * (n – 2) * … * 2 * 1 - факториал числа n , причем 0! = 1 и 1! = 1 по определению.

Это выражение часто обозначают как . Таким образом, если n = 4 и X = 3, количество последовательностей, состоящих из трех элементов, извлеченных из выборки, объем которой равен 4, определяется по следующей формуле:

Следовательно, вероятность обнаружить три ошибочных заказа вычисляется следующим образом:

(Количество возможных последовательностей) *
(вероятность конкретной последовательности) = 4 * 0,0009 = 0,0036

Аналогично можно вычислить вероятность того, что среди четырех заказов окажутся один или два ошибочных, а также вероятность того, что все заказы ошибочны или все верны. Однако при увеличении объема выборки n определить вероятность конкретной последовательности исходов становится труднее. В этом случае следует применить соответствующую математическую модель, описывающую биномиальное распределение количества вариантов выбора X объектов из выборки, содержащей n элементов.

Биноминальное распределение

где Р(Х) - вероятность X успехов при заданных объеме выборки n и вероятности успеха р , X = 0, 1, … n .

Обратите внимание на то, что формула (2) представляет собой формализацию интуитивных выводов. Случайная величина X , подчиняющаяся биномиальному распределению, может принимать любое целое значение в диапазоне от 0 до n . Произведение р X (1 – р) n X представляет собой вероятность конкретной последовательности, состоящей из X успехов в выборке, объем которой равен n . Величина определяет количество возможных комбинаций, состоящих из X успехов в n испытаниях. Следовательно, при заданном количестве испытаний n и вероятности успеха р вероятность последовательности, состоящей из X успехов, равна

Р(Х) = (количество возможных последовательностей) * (вероятность конкретной последовательности) =

Рассмотрим примеры, иллюстрирующие применение формулы (2).

1. Допустим, что вероятность неверно заполнить форму равна 0,1. Какова вероятность того, что среди четырех заполненных форм три окажутся ошибочными? Используя формулу (2), получаем, что вероятность обнаружить три ошибочных заказа в выборке, состоящей из четырех заказов, равна

2. Допустим, что вероятность неверно заполнить форму равна 0,1. Какова вероятность того, что среди четырех заполненных форм не менее трех окажутся ошибочными? Как показано в предыдущем примере, вероятность того, что среди четырех заполненных форм три окажутся ошибочными, равна 0,0036. Чтобы вычислить вероятность того, что среди четырех заполненных форм не менее трех будут неправильно заполнены, необходимо сложить вероятность того, что среди четырех заполненных форм три окажутся ошибочными, и вероятность того, что среди четырех заполненных форм все окажутся ошибочными. Вероятность второго события равна

Таким образом, вероятность того, что среди четырех заполненных форм не менее трех окажутся ошибочными, равна

Р(Х > 3) = Р(Х = 3) + Р(Х = 4) = 0,0036 + 0,0001 = 0,0037

3. Допустим, что вероятность неверно заполнить форму равна 0,1. Какова вероятность того, что среди четырех заполненных форм менее трех окажутся ошибочными? Вероятность этого события

Р(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)

Используя формулу (2), вычислим каждую из этих вероятностей:

Следовательно, Р(Х < 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Вероятность Р(Х < 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х> 3. Тогда Р(Х< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

По мере увеличения объема выборки n вычисления, аналогичные проведенным в примере 3, становятся затруднительными. Чтобы избегать этих сложностей, многие биномиальные вероятности табулируют заранее. Некоторые из этих вероятностей приведены рис. 1. Например, чтобы получить вероятность, что Х = 2 при n = 4 и p = 0,1, следует извлечь из таблицы число, стоящее на пересечении строки Х = 2 и столбца р = 0,1.

Рис. 1. Биномиальная вероятность при n = 4, Х = 2 и р = 0,1

Биномиальное распределение можно вычислить с помощью функции Excel =БИНОМ.РАСП() (рис. 2), имеющей 4 параметра: число успехов – Х , число испытаний (или объем выборки) – n , вероятность успеха – р , параметр интегральная , принимающий значения ИСТИНА (в этом случае вычисляется вероятность не менее Х событий) или ЛОЖЬ (в этом случае вычисляется вероятность точно Х событий).

Рис. 2. Параметры функции =БИНОМ.РАСП()

Для вышеприведенных трех примеров расчеты приведены на рис. 3 (см. также Excel-файл). В каждом столбце приведено по одной формуле. Цифрами показаны ответы на примеры соответствующего номера).

Рис. 3. Расчет биноминального распределения в Excel для n = 4 и p = 0,1

Свойства биномиального распределения

Биномиальное распределение зависит от параметров n и р . Биномиальное распределение может быть, как симметричным, так и асимметричным. Если р = 0,05, биномиальное распределение является симметричным независимо от величины параметра n . Однако, если р ≠ 0,05, распределение становится асимметричным. Чем ближе значение параметра р к 0,05 и чем больше объем выборки n , тем слабее выражена асимметрия распределения. Таким образом, распределение количества неправильно заполненных форм смещено вправо, поскольку p = 0,1 (рис. 4).

Рис. 4. Гистограмма биномиального распределения при n = 4 и p = 0,1

Математическое ожидание биномиального распределения равно произведению объема выборки n на вероятность успеха р :

(3) Μ = Е(Х) = np

В среднем, при достаточно долгой серии испытаний в выборке, состоящей из четырех заказов, может оказаться р = Е(Х) = 4 х 0,1 = 0,4 неправильно заполненных форм.

Стандартное отклонение биномиального распределения

Например, стандартное отклонение количества неверно заполненных форм в бухгалтерской информационной системе равно:

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 307–313

Здравствуйте! Мы уже знаем, что такое распределение вероятностей. Оно может быть дискретным или непрерывным, и мы узнали, что его называют плотностью распределения вероятностей. Теперь давайте изучим парочку более распространенных распределений. Предположим, у меня есть монета, причем правильная монета, и я собираюсь ее подбросить 5 раз. Также я определю случайную величину Х, обозначу ее заглавной буквой X, она будет равна количеству «орлов» при 5 подбрасываниях. Может, у меня есть 5 монет, я подброшу их все сразу и посчитаю, сколько у меня выпало «орлов». Или у меня могла бы быть одна монета, я могла бы ее подбросить 5 раз и посчитать, сколько раз у меня выпал «орел». Это, собственно, не имеет значения. Но давайте предположим, что у меня одна монета, и я подброшу ее 5 раз. Тогда у нас не будет неопределенности. Итак, вот определение моей случайной величины. Как мы знаем, случайная величина немного отличается от обычной переменной, она больше похожа на функцию. Она присваивает какое-то значение эксперименту. И эта случайная величина довольно проста. Мы просто считаем, сколько раз выпал «орел» после 5 подбрасываний, – это и есть наша случайная величина X. Давайте подумаем, какие могут быть вероятности разных значений в нашем случае? Так, какова вероятность того, что Х (заглавная Х) равна 0? Т.е. какова вероятность того, что после 5 подбрасываний ни разу не выпадет «орел»? Ну, это, по сути, то же самое, что вероятность выпадения одних «решек» (это так, небольшой обзор теории вероятностей). У вас должны выпасть одни «решки». Какова вероятность каждой из этих «решек»? Это 1/2. Т.е. здесь должно быть 1/2 умножить на 1/2, на 1/2, на 1/2 и снова на 1/2. Т.е. (1/2)⁵. 1⁵=1, разделить на 2⁵, т.е. на 32. Вполне логично. Так… Я немного повторю то, что мы проходили по теории вероятностей. Это важно для того, чтобы понимать, куда мы сейчас движемся и как, собственно, формируется дискретное распределение вероятностей. Итак, а какова вероятность того, что у нас ровно 1 раз выпадет «орел»? Ну, «орел» мог бы выпасть при первом подбрасывании. Т.е. могло бы быть так: «орел», «решка», «решка», «решка», «решка». Или «орел» мог бы выпасть при втором подбрасывании. Т.е. могла бы быть такая комбинация: «решка», «орел», «решка», «решка», «решка» и так далее. Один «орел» мог бы выпасть после любого из 5 подбрасываний. Какова вероятность каждой из этих ситуаций? Вероятность выпадения «орла» равна 1/2. Затем вероятность выпадения «решки», равная 1/2, умножить на 1/2, на 1/2, на 1/2. Т.е. вероятность каждой из этих ситуаций равна 1/32. Так же, как и вероятность ситуации, где Х=0. По сути, вероятность любого особого порядка выпадений «орла» и «решки» будет равна 1/32. Итак, вероятность этого равна 1/32. И вероятность этого равна 1/32. И вот такие ситуации имеют место потому, что «орел» мог бы выпасть при любом из 5 подбрасываний. Следовательно, вероятность того, что точно выпадет один «орел», равна 5*1/32, т.е. 5/32. Вполне логично. Теперь начинается интересное. Какова вероятность… (буду писать каждый из примеров другим цветом)… какова вероятность того, что моя случайная величина равна 2? Т.е. я подброшу монету 5 раз, и какова вероятность того, что 2 раза точно выпадет «орел»? Это уже интереснее, правда? Какие возможны комбинации? Могла бы быть «орел», «орел», «решка», «решка», «решка». Также могла бы быть «орел», «решка», «орел», «решка», «решка». И если подумать, что эти два «орла» могут стоять в разных местах комбинации, то можно немного запутаться. Уже нельзя размышлять о размещениях так, как мы это делали здесь, вверху. Хотя… можно, только рискуете запутаться. Вы должны понять одно. Для каждой из этих комбинаций вероятность равна 1/32. ½*½*½*½*½. Т.е. вероятность каждой из этих комбинаций равна 1/32. И мы должны подумать над тем, сколько существует таких комбинаций, удовлетворяющих нашему условию (2 «орла»)? Т.е. по сути, нужно представить, что есть 5 подбрасываний монеты, и нужно из них выбрать 2, при которых выпадает «орел». Давайте представим, что наши 5 подбрасываний собрались в кружочек, также представим, что у нас есть только два стула. И мы говорим: «Хорошо, кто из вас сядет на эти стулья для «орлов»? Т.е. кто из вас будет «орлом»? И нас не интересует то, в каком порядке они сядут. Я привожу такой пример, надеясь, что так вам будет понятнее. И может, вам захочется посмотреть некоторые уроки по теории вероятностей на эту тему, когда я буду говорить о биноме Ньютона. Потому что там я более детально углублюсь во все это. Но если вы будете рассуждать таким путем, то поймете, что такое биномиальный коэффициент. Потому что если будете думать так: хорошо, у меня 5 подбрасываний, при каком подбрасывании выпадет первый «орел»? Ну, здесь 5 возможностей того, при каком по счету подбрасывании выпадет первый «орел». А сколько возможностей для второго «орла»? Ну, первое подбрасывание, которое мы уже использовали, забрало одну возможность выпадения «орла». Т.е. одна позиция «орла» в комбинации уже занята одним из подбрасываний. Теперь осталось 4 подбрасывания, значит, второй «орел» может выпасть при одном из 4 подбрасываний. И вы это видели, вот здесь. Я выбрала так, что «орел» выпал при 1-м подбрасывании, и предположила, что при 1 из 4 оставшихся бросков также должен выпасть «орел». Итак, здесь только 4 возможности. Все, что я говорю, означает, что для первого «орла» у вас есть 5 различных позиций, на которые он может выпасть. А для второго уже остается только 4 позиции. Подумайте над этим. Когда мы вычисляем вот так, то порядок учитывается. Но для нас сейчас неважно, в какой последовательности выпадают «орлы» и «решки». Мы не говорим, что это «орел 1» или что это «орел 2». В обоих случаях это просто «орел». Мы могли бы предположить, что это «орел 1», а это – «орел 2». Или могло бы быть наоборот: это мог бы быть второй «орел», а это – «первый». И я говорю это потому, что важно понять, где использовать размещения, а где – сочетания. Нас не интересует последовательность. Так что, собственно, есть только 2 способа происхождения нашего события. Значит, делим это на 2. И как вы позже увидите, здесь 2! способов происхождения нашего события. Если было бы 3 «орла», тогда здесь было бы 3!, и я покажу вам, почему. Итак, это будет равно… 5*4=20 и разделить на 2 – получится 10. Поэтому здесь 10 различных комбинаций из 32, в которых у вас точно будет 2 «орла». Итак, 10*(1/32) равно 10/32, а чему это равно? 5/16. Запишу через биномиальный коэффициент. Это значение, вот здесь, вверху. Если подумать, то это – то же самое, что и 5!, деленный на… Что означает вот это 5*4? 5! – это 5*4*3*2*1. Т.е. если мне здесь нужно только 5*4, то для этого я могу разделить 5! на 3! Это равно 5*4*3*2*1, деленное на 3*2*1. И остается только 5*4. Значит, это – то же самое, что и этот числитель. И затем, т.к. нас не интересует последовательность, нам нужно здесь 2. Собственно, 2!. Умножить на 1/32. Такой была бы вероятность того, что у нас выпало бы точно 2 «орла». Какова вероятность того, что у нас точно 3 раза выпадет «орел»? Т.е. вероятность того, что Х=3. Итак, по той же логике, первый случай выпадения «орла» может иметь место при 1 из 5 подбрасываний. Второй случай выпадения «орла» может иметь место при 1 из 4 оставшихся подбрасываний. А третий случай выпадения «орла» может иметь место при 1 из 3 оставшихся подбрасываний. А сколько существует различных способов расставить 3 подбрасывания? В общем, сколько есть способов, чтобы расставить 3 предмета по местам? Это 3! И вы можете это вычислить или, возможно, захотите пересмотреть те уроки, в которых я подробнее это объясняла. Но если вы, например, возьмете буквы A, B и C, то всего есть 6 способов, с помощью которых вы их можете расставить. Можете рассматривать это как случаи выпадения «орлов». Здесь могли бы быть ACB, CAB. Могло бы быть BAC, BCA, и… Какой последний вариант, который я не назвала? CBA. Есть 6 способов расставить 3 разных предмета. Мы делим на 6, потому что не хотим повторно засчитывать эти 6 разных способов, потому что рассматриваем их как равнозначные. Здесь нас не интересует, при каком по счету подбрасывании выпадет «орел». 5*4*3… Это можно переписать, как 5!/2!. И разделить это еще на 3!. Это он и есть. 3! равен 3*2*1. Тройки сокращаются. Это становится равным 2. Это – равным 1. Еще раз, 5*2, т.е. равно 10. Каждая ситуация имеет вероятность 1/32, потому это опять равно 5/16. И это интересно. Вероятность того, что у вас выпадет 3 «орла» равна вероятности того, что у вас есть 2 орла. И причина этому… Ну, есть много причин тому, что так получилось. Но если подумать, что вероятность того, что выпадет 3 «орла» – то же самое, что вероятность выпадения 2 «решек». И вероятность выпадения 3 «решек» должна быть такой же, как и вероятность выпадения 2-х «орлов». И хорошо, что значения вот так срабатывают. Хорошо. Какова вероятность того, что Х=4? Мы можем использовать ту же формулу, что использовали прежде. Это могло бы быть 5*4*3*2. Итак, здесь запишем 5*4*3*2… Сколько есть различных способов расставить 4 предмета? Это 4!. 4! – это, по сути, вот эта часть, вот здесь. Это 4*3*2*1. Так, это сокращается, остается 5. Затем, каждая комбинация имеет вероятность 1/32. Т.е. это равно 5/32. И еще раз заметьте, что вероятность того, что 4 раза выпадет «орел» равна вероятности того, что 1 раз выпадет «орел». И в этом есть смысл, т.к. 4 «орла» – это то же самое, что случай выпадения 1 «решки». Вы скажете: ну, и при каком же подбрасывании выпадет эта одна «решка»? Ага, для этого здесь есть 5 различных комбинаций. И каждая из них имеет вероятность 1/32. И наконец, какова вероятность того, что Х=5? Т.е. выпадает «орел» 5 раз подряд. Должно быть так: «орел», «орел», «орел», «орел», «орел». Каждый из «орлов» имеет вероятность 1/2. Вы их перемножаете и получаете 1/32. Можно пойти другим путем. Если всего есть 32 способа, с помощью которых вы можете получить «орлы» и «решки» в этих экспериментах, то это – только один из этих способов. Здесь таких способов было 5 из 32. Здесь - 10 из 32. Тем не менее, вычисления мы провели, а теперь готовы нарисовать распределение вероятностей. Но мое время истекло. Позвольте продолжить на следующем уроке. А если вы в настроении, то, может, нарисуете перед тем, как смотреть следующий урок? До скорой встречи!

Биномиальное распределение

распределение вероятностей числа появлений некоторого события при повторных независимых испытаниях. Если при каждом испытании вероятность появления события равна р, причём 0 ≤ p ≤ 1, то число μ появлений этого события при n независимых испытаниях есть случайная величина, принимающая значения m = 1, 2,.., n с вероятностями

где q = 1 - p, a - биномиальные коэффициенты (отсюда название Б. р.). Приведённая формула иногда называется формулой Бернулли. Математическое ожидание и Дисперсия величины μ, имеющей Б. р., равны М (μ) = np и D (μ) = npq , соответственно. При больших n, в силу Лапласа теоремы (См. Лапласа теорема), Б. р. близко к нормальному распределению (См. Нормальное распределение), чем и пользуются на практике. При небольших n приходится пользоваться таблицами Б. р.

Лит.: Большев Л. Н., Смирнов Н. В., Таблицы математической статистики, М., 1965.


Большая советская энциклопедия. - М.: Советская энциклопедия . 1969-1978 .

Смотреть что такое "Биномиальное распределение" в других словарях:

    Функция вероятности … Википедия

    - (binomial distribution) Распределение, позволяющее рассчитать вероятность наступления какого либо случайного события, полученного в результате наблюдений ряда независимых событий, если вероятность наступления, составляющих его элементарных… … Экономический словарь

    - (распределение Бернулли) распределение вероятностей числа появлений некоторого события при повторных независимых испытаниях, если вероятность появления этого события в каждом испытании равна p(0 p 1). Именно, число? появлений этого события есть… … Большой Энциклопедический словарь

    биномиальное распределение - — Тематики электросвязь, основные понятия EN binomial distribution …

    - (распределение Бернулли), распределение вероятностей числа появлений некоторого события при повторных независимых испытаниях, если вероятность появления этого события в каждом испытании равна р (0≤р≤1). Именно, число μ появлений этого события… … Энциклопедический словарь

    биномиальное распределение - 1.49. биномиальное распределение Распределение вероятностей дискретной случайной величины X, принимающей любые целые значения от 0 до n, такое что при х = 0, 1, 2, ..., n и параметрах n = 1, 2, ... и 0 < p < 1, где Источник … Словарь-справочник терминов нормативно-технической документации

    Распределение Бернулли, распределение вероятностей случайной величины X, принимающей целочисленные значения с вероятностями соответственно (биномиальный коэффициент; р параметр Б. р., наз. вероятностью положительного исхода, принимающей значения … Математическая энциклопедия

    - (распределение Бернулли), распределение вероятностей числа появлений нек рого события при повторных независимых испытаниях, если вероятность появления этого события в каждом испытании равна р (0<или = p < или = 1). Именно, число м появлений … Естествознание. Энциклопедический словарь

    Биномиальное распределение вероятностей - (binomial distribution) Распределение, которое наблюдается в случаях, когда исход каждого независимого эксперимента (статистического наблюдения) принимает одно из двух возможных значений: победа или поражение, включение или исключение, плюс или … Экономико-математический словарь

    биномиальное распределение вероятностей - Распределение, которое наблюдается в случаях, когда исход каждого независимого эксперимента (статистического наблюдения) принимает одно из двух возможных значений: победа или поражение, включение или исключение, плюс или минус, 0 или 1. То есть… … Справочник технического переводчика

Книги

  • Теория вероятностей и математическая статистика в задачах. Более 360 задач и упражнений , Д. А. Борзых. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…
  • Теория вероятностей и математическая статистика в задачах: Более 360 задач и упражнений , Борзых Д.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…