베이즈 정리: Difference between revisions
From CS Wiki
No edit summary |
No edit summary |
||
(4 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
[[분류:인공지능]] | [[분류:인공지능]] | ||
;Bayes' theorem | ;Bayes' theorem | ||
;사건 A와 B가 있을 때 | ;사건 A와 B가 있을 때 사전(prior) 확률 P(A)과 사후(posterior) 확률 P(A|B) 사이의 관계를 조건부 확률 P(A|B)를 이용해서 계산하는 확률 이론 | ||
P(A|B) = P(A)P(B|A)/P(B) = P(A∩B)/P(B) | == 공식 == | ||
;P(A|B) = P(A)P(B|A)/P(B) = P(A∩B)/P(B) | |||
* P(A): '''사전확률''', A일 확률 | * P(A): '''사전확률''', A일 확률 | ||
* P(B|A): '''조건부 확률''', 사건 A로 | * P(B|A): '''조건부 확률''', 사건 A로 인하여 B가 일어날 확률 | ||
* P(A|B): '''사후확률''', 사건 B로 인하여 A가 일어날 확률 | * P(A|B): '''사후확률''', 사건 B로 인하여 A가 일어날 확률 | ||
* P(B): B가 일어날 확률 | * P(B): B가 일어날 확률 | ||
** = P(A<sub>1</sub>)P(B|A<sub>1</sub>)+P(A<sub>2</sub>)P(B|A<sub>2</sub>)+P(A<sub>3</sub>)P(B|A<sub>3</sub>) + ... + P(A<sub>n</sub>)P(B|A<sub>n</sub>) | ** = P(A<sub>1</sub>)P(B|A<sub>1</sub>)+P(A<sub>2</sub>)P(B|A<sub>2</sub>)+P(A<sub>3</sub>)P(B|A<sub>3</sub>) + ... + P(A<sub>n</sub>)P(B|A<sub>n</sub>) | ||
'''예시''' | |||
* P(채무불이행): 채무불이행 확률 | |||
* P(채무불이행|직업='선생님'): 선생님이 채무를 불이행할 확률 | |||
* P(직업='선생님'|채무불이행): 채무를 불이행한 사람이 선생님일 확률 | |||
* P(직업=선생님): 직업이 선생님일 확률 | |||
== 활용 == | == 활용 == | ||
베이즈 정리는 불확실한 상황에서 정보를 업데이트하는 강력한 도구이다. 새로운 증거가 나타날 때마다 확률을 재계산할 수 있게 해주며, 이를 통해 보다 정확한 예측이 가능하다. | |||
* 실제생활에서는 사후 확률만 알고 있는 경우가 많음 | * 실제생활에서는 사후 확률만 알고 있는 경우가 많음 | ||
* 사전 확률과 사휴 확률 사이의 관계를 '''조건부 확률'''을 이용해서 계산하는 확률 이론 | * 사전 확률과 사휴 확률 사이의 관계를 '''조건부 확률'''을 이용해서 계산하는 확률 이론 | ||
Line 22: | Line 29: | ||
* 40~50대에 유방암일 확률이 0.8%이다. | * 40~50대에 유방암일 확률이 0.8%이다. | ||
* 유방조영술 양성자가 유방암일 경우는? | * 유방조영술 양성자가 유방암일 경우는? | ||
=== 예제 | === 예제 풀이1 === | ||
* 유방암에 걸릴 확률('''사전 확률''') '''P(A)''' = '''0.8%''' | * 유방암에 걸릴 확률('''사전 확률''') '''P(A)''' = '''0.8%''' | ||
* 검사 결과가 양성일 확률 '''P(B)''' = 0.8%의 90% + 99.2%의 7% | * 검사 결과가 양성일 확률 '''P(B)''' = 0.8%의 90% + 99.2%의 7% | ||
Line 29: | Line 36: | ||
* 검사 결과가 양성일 때 유방암에 걸렸을 확률(사후 확률) '''P(A|B)''' = 0.8% * 90% / 7.7% | * 검사 결과가 양성일 때 유방암에 걸렸을 확률(사후 확률) '''P(A|B)''' = 0.8% * 90% / 7.7% | ||
** = 0.008 * 0.9 / 0.077 = 0.0935 = '''9.4%''' | ** = 0.008 * 0.9 / 0.077 = 0.0935 = '''9.4%''' | ||
=== 예제 문제2 === | |||
* 공정1, 공정2, 공정3에서 생산량의 50%, 30%, 20%를 각각 생산 | |||
* 공정1, 공정2, 공정3에서 불량품은 3%, 2%, 1% | |||
* 불량품이 하나 나왔을 때 이 제품이 공정1에서 생산된 제품일 확률 | |||
=== 예제 풀이2 === | |||
* 불량품임을 감안하지 않고, 제품이 각 공정에서 생산되었을 확률 | |||
** 공정1: P(A1) = 0.5 | |||
** 공정2: P(A2) = 0.3 | |||
** 공정2: P(A2) = 0.2 | |||
* 각 공정에서 생산된 제품의 불량 확률 | |||
** 공정1: P(B|A1) = 0.03 | |||
** 공정2: P(B|A2) = 0.02 | |||
** 공정2: P(B|A2) = 0.01 | |||
* 불량품이 나올 전체 확률 | |||
** P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3) | |||
** = '''0.5 * 0.03''' + 0.3 * 0.02 + 0.2 * 0.01 = '''0.023''' | |||
* 불량품이 A1에서 나왔을 확률 | |||
** P(A1|B) | |||
** = P(A1)P(B|A1)/P(B) | |||
** = 0.5 * 0.03 / 0.023 = '''0.65''' |
Latest revision as of 17:34, 21 October 2024
- Bayes' theorem
- 사건 A와 B가 있을 때 사전(prior) 확률 P(A)과 사후(posterior) 확률 P(A|B) 사이의 관계를 조건부 확률 P(A|B)를 이용해서 계산하는 확률 이론
공식[edit | edit source]
- P(A|B) = P(A)P(B|A)/P(B) = P(A∩B)/P(B)
- P(A): 사전확률, A일 확률
- P(B|A): 조건부 확률, 사건 A로 인하여 B가 일어날 확률
- P(A|B): 사후확률, 사건 B로 인하여 A가 일어날 확률
- P(B): B가 일어날 확률
- = P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3) + ... + P(An)P(B|An)
예시
- P(채무불이행): 채무불이행 확률
- P(채무불이행|직업='선생님'): 선생님이 채무를 불이행할 확률
- P(직업='선생님'|채무불이행): 채무를 불이행한 사람이 선생님일 확률
- P(직업=선생님): 직업이 선생님일 확률
활용[edit | edit source]
베이즈 정리는 불확실한 상황에서 정보를 업데이트하는 강력한 도구이다. 새로운 증거가 나타날 때마다 확률을 재계산할 수 있게 해주며, 이를 통해 보다 정확한 예측이 가능하다.
- 실제생활에서는 사후 확률만 알고 있는 경우가 많음
- 사전 확률과 사휴 확률 사이의 관계를 조건부 확률을 이용해서 계산하는 확률 이론
예제[edit | edit source]
예제 문제1[edit | edit source]
- 누군가가 유방조영술을 받았는데 결과가 양성이었다.
- 유방암 환자가 유방조영술이 양성일 확률은 90%이다.
- 유방암이 아니더라도 유방조영술이 양성일 확률은 7%이다.
- 40~50대에 유방암일 확률이 0.8%이다.
- 유방조영술 양성자가 유방암일 경우는?
예제 풀이1[edit | edit source]
- 유방암에 걸릴 확률(사전 확률) P(A) = 0.8%
- 검사 결과가 양성일 확률 P(B) = 0.8%의 90% + 99.2%의 7%
- = 0.008 * 0.9 + 0.992 * 0.07 = 0.0766 = 7.7%
- 유방암일 때 검사결과가 양성일 확률(조건부 확률) P(B|A) = 90%
- 검사 결과가 양성일 때 유방암에 걸렸을 확률(사후 확률) P(A|B) = 0.8% * 90% / 7.7%
- = 0.008 * 0.9 / 0.077 = 0.0935 = 9.4%
예제 문제2[edit | edit source]
- 공정1, 공정2, 공정3에서 생산량의 50%, 30%, 20%를 각각 생산
- 공정1, 공정2, 공정3에서 불량품은 3%, 2%, 1%
- 불량품이 하나 나왔을 때 이 제품이 공정1에서 생산된 제품일 확률
예제 풀이2[edit | edit source]
- 불량품임을 감안하지 않고, 제품이 각 공정에서 생산되었을 확률
- 공정1: P(A1) = 0.5
- 공정2: P(A2) = 0.3
- 공정2: P(A2) = 0.2
- 각 공정에서 생산된 제품의 불량 확률
- 공정1: P(B|A1) = 0.03
- 공정2: P(B|A2) = 0.02
- 공정2: P(B|A2) = 0.01
- 불량품이 나올 전체 확률
- P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3)
- = 0.5 * 0.03 + 0.3 * 0.02 + 0.2 * 0.01 = 0.023
- 불량품이 A1에서 나왔을 확률
- P(A1|B)
- = P(A1)P(B|A1)/P(B)
- = 0.5 * 0.03 / 0.023 = 0.65