malobukov: (nerf gun)
[personal profile] malobukov
Попытался я намедни найти в сети объяснение теоремы Байеса человеческим языком и не нашёл. Даже великолепный betterexplaied рисует вот такое безобразие:



и потом пишет ещё много текста. Запоминать таким образом невозможно, да и не нужно.

Достаточно всего лишь понять, что теорема Байеса переводит одну условную вероятность в другую, в данном случае Pr(X|A) в Pr(A|X). Это полезно, например, для решения задач такого вида:


В США за период с 2010 года 22 из 46 террористов были мусульманами. Какова вероятность того, что мусульманин в США является террористом?


Cначала определим, что есть что.


  • Pr(A) безусловная вероятность события A
  • Pr(X) безусловная вероятность события X
  • Pr(A|X) вероятность события A при условии события X
  • Pr(X|A) вероятность события X при условии события A


Назовём страшное выражение в знаменателе Pr(X). Это действительно так, можно проверить, аккуратно нарисовав табличку со всеми возможными вариантами.

Потом перепишем теорему в таком виде:

Pr(A|X) = Pr(X|A) · k

где k — это некий коэффициент, позволяющий перевести одну условную вероятность в другую.

В формуле для k должны фигурировать безусловные вероятности Pr(A) и Pr(X), и больше ничего.

Слегка подумав, можно догадаться, Pr(A) должна быть в числителе. Потому что Pr(A|X) должна расти, если увеличивается Pr(A). Методом исключения Pr(X) должна быть в знаменателе, так что k = Pr(A) / Pr(X). Получаем правильную формулу

Pr(A|X) = Pr(X|A) Pr(A) / Pr(X)

Ладно, про метод исключения я погорячился, но мнемоника всё равно работает.

Применим полученное знание к вышеприведённой задаче. Для выбранного наугад американца


  • Pr(A) вероятность того, что он террорист
  • Pr(X) вероятность того, что он мусульманин
  • Pr(A|X) вероятность того, что он террорист при условии того, что он мусульманин
  • Pr(X|A) вероятность того, что он мусульманин при условии того, что он террорист


Из условия задачи мы уже знаем, что Pr(X|A) ≈ 0.5.

Население Штатов примерно 325 миллионов человек, поэтому Pr(A) = 46/325 · 10-6 ≈ 1.4 · 10-7.

В США примерно 3.3 миллиона мусульман, то есть Pr(X) ≈ 10-2.

Pr(A|X) = Pr(X|A) Pr(A) / Pr(X) ≈ 0.5 · 1.4 · 10-7 / 10-2 ≈ 7 · 10-6

Пример игрушечный. Можно было бы напрямую поделить 22 на 3.3 миллиона и получить тот же результат (население и общее количество террористов сокращаются). Он выбран специально для того, чтобы можно было легко проверить, как именно 0.5 превращается в 7 · 10-6.

Profile

malobukov: (Default)
Лжедмитрий Малобуков

September 2017

S M T W T F S
     12
3456789
10111213 141516
171819 20212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 21st, 2017 10:38 am
Powered by Dreamwidth Studios