베이즈 정리

From CS Wiki
Bayes' theorem
사건 A와 B가 있을 때 사전(prior) 확률 P(A)과 사후(posterior) 확률 P(A|B) 사이의 관계를 조건부 확률 P(A|B)를 이용해서 계산하는 확률 이론

공식[edit | edit source]

P(A|B) = P(A)P(B|A)/P(B) = P(A∩B)/P(B)
  • P(A): 사전확률, A일 확률
  • P(B|A): 조건부 확률, 사건 A로 인하여 B가 일어날 확률
  • P(A|B): 사후확률, 사건 B로 인하여 A가 일어날 확률
  • P(B): B가 일어날 확률
    • = P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3) + ... + P(An)P(B|An)

예시

  • P(채무불이행): 채무불이행 확률
  • P(채무불이행|직업='선생님'): 선생님이 채무를 불이행할 확률
  • P(직업='선생님'|채무불이행): 채무를 불이행한 사람이 선생님일 확률
  • P(직업=선생님): 직업이 선생님일 확률

활용[edit | edit source]

베이즈 정리는 불확실한 상황에서 정보를 업데이트하는 강력한 도구이다. 새로운 증거가 나타날 때마다 확률을 재계산할 수 있게 해주며, 이를 통해 보다 정확한 예측이 가능하다.

  • 실제생활에서는 사후 확률만 알고 있는 경우가 많음
  • 사전 확률과 사휴 확률 사이의 관계를 조건부 확률을 이용해서 계산하는 확률 이론

예제[edit | edit source]

예제 문제1[edit | edit source]

  • 누군가가 유방조영술을 받았는데 결과가 양성이었다.
  • 유방암 환자가 유방조영술이 양성일 확률은 90%이다.
  • 유방암이 아니더라도 유방조영술이 양성일 확률은 7%이다.
  • 40~50대에 유방암일 확률이 0.8%이다.
  • 유방조영술 양성자가 유방암일 경우는?

예제 풀이1[edit | edit source]

  • 유방암에 걸릴 확률(사전 확률) P(A) = 0.8%
  • 검사 결과가 양성일 확률 P(B) = 0.8%의 90% + 99.2%의 7%
    • = 0.008 * 0.9 + 0.992 * 0.07 = 0.0766 = 7.7%
  • 유방암일 때 검사결과가 양성일 확률(조건부 확률) P(B|A) = 90%
  • 검사 결과가 양성일 때 유방암에 걸렸을 확률(사후 확률) P(A|B) = 0.8% * 90% / 7.7%
    • = 0.008 * 0.9 / 0.077 = 0.0935 = 9.4%

예제 문제2[edit | edit source]

  • 공정1, 공정2, 공정3에서 생산량의 50%, 30%, 20%를 각각 생산
  • 공정1, 공정2, 공정3에서 불량품은 3%, 2%, 1%
  • 불량품이 하나 나왔을 때 이 제품이 공정1에서 생산된 제품일 확률

예제 풀이2[edit | edit source]

  • 불량품임을 감안하지 않고, 제품이 각 공정에서 생산되었을 확률
    • 공정1: P(A1) = 0.5
    • 공정2: P(A2) = 0.3
    • 공정2: P(A2) = 0.2
  • 각 공정에서 생산된 제품의 불량 확률
    • 공정1: P(B|A1) = 0.03
    • 공정2: P(B|A2) = 0.02
    • 공정2: P(B|A2) = 0.01
  • 불량품이 나올 전체 확률
    • P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3)
    • = 0.5 * 0.03 + 0.3 * 0.02 + 0.2 * 0.01 = 0.023
  • 불량품이 A1에서 나왔을 확률
    • P(A1|B)
    • = P(A1)P(B|A1)/P(B)
    • = 0.5 * 0.03 / 0.023 = 0.65