malobukov: (nerf gun)
[personal profile] malobukov
Попытался я намедни найти в сети объяснение теоремы Байеса человеческим языком и не нашёл. Даже великолепный betterexplaied рисует вот такое безобразие:



и потом пишет ещё много текста. Запоминать таким образом невозможно, да и не нужно.

Достаточно всего лишь понять, что теорема Байеса переводит одну условную вероятность в другую, в данном случае Pr(X|A) в Pr(A|X). Это полезно, например, для решения задач такого вида:


В США за период с 2010 года 22 из 46 террористов были мусульманами. Какова вероятность того, что мусульманин в США является террористом?


Cначала определим, что есть что.


  • Pr(A) безусловная вероятность события A
  • Pr(X) безусловная вероятность события X
  • Pr(A|X) вероятность события A при условии события X
  • Pr(X|A) вероятность события X при условии события A


Назовём страшное выражение в знаменателе Pr(X). Это действительно так, можно проверить, аккуратно нарисовав табличку со всеми возможными вариантами.

Потом перепишем теорему в таком виде:

Pr(A|X) = Pr(X|A) · k

где k — это некий коэффициент, позволяющий перевести одну условную вероятность в другую.

В формуле для k должны фигурировать безусловные вероятности Pr(A) и Pr(X), и больше ничего.

Слегка подумав, можно догадаться, Pr(A) должна быть в числителе. Потому что Pr(A|X) должна расти, если увеличивается Pr(A). Методом исключения Pr(X) должна быть в знаменателе, так что k = Pr(A) / Pr(X). Получаем правильную формулу

Pr(A|X) = Pr(X|A) Pr(A) / Pr(X)

Ладно, про метод исключения я погорячился, но мнемоника всё равно работает.

Применим полученное знание к вышеприведённой задаче. Для выбранного наугад американца


  • Pr(A) вероятность того, что он террорист
  • Pr(X) вероятность того, что он мусульманин
  • Pr(A|X) вероятность того, что он террорист при условии того, что он мусульманин
  • Pr(X|A) вероятность того, что он мусульманин при условии того, что он террорист


Из условия задачи мы уже знаем, что Pr(X|A) ≈ 0.5.

Население Штатов примерно 325 миллионов человек, поэтому Pr(A) = 46/325 · 10-6 ≈ 1.4 · 10-7.

В США примерно 3.3 миллиона мусульман, то есть Pr(X) ≈ 10-2.

Pr(A|X) = Pr(X|A) Pr(A) / Pr(X) ≈ 0.5 · 1.4 · 10-7 / 10-2 ≈ 7 · 10-6

Пример игрушечный. Можно было бы напрямую поделить 22 на 3.3 миллиона и получить тот же результат (население и общее количество террористов сокращаются). Он выбран специально для того, чтобы можно было легко проверить, как именно 0.5 превращается в 7 · 10-6.
From:
Anonymous( )Anonymous This account has disabled anonymous posting.
OpenID( )OpenID You can comment on this post while signed in with an account from many other sites, once you have confirmed your email address. Sign in using OpenID.
User
Account name:
Password:
If you don't have an account you can create one now.
Subject:
HTML doesn't work in the subject.

Message:

 
Notice: This account is set to log the IP addresses of everyone who comments.
Links will be displayed as unclickable URLs to help prevent spam.

Profile

malobukov: (Default)
Лжедмитрий Малобуков

September 2017

S M T W T F S
     12
3456789
10111213 141516
171819 20212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 21st, 2017 10:20 am
Powered by Dreamwidth Studios