기저율
From CS Wiki
Base Rate
기저율은 특정 사건이나 상태가 발생할 확률을 나타내는 기본적인 통계값이다. 이는 별다른 추가 정보 없이 주어진 집단 내에서 해당 사건이 발생할 확률을 나타낸다.
특징[edit | edit source]
기저율은 종종 의사결정 과정에서 무시되거나 간과되기 쉬운 값이다. 특히 개인적이거나 특수한 정보에 더 큰 비중을 두는 경향이 있을 때 기저율은 잘못 해석되거나 왜곡될 수 있다. 이를 "기저율 무시"라고 부르며, 이는 대표적인 인지 편향 중 하나다.
기저율의 활용[edit | edit source]
통계 분석이나 확률 기반의 예측 모델에서 기저율은 매우 중요한 역할을 한다. 예를 들어, 의학 진단에서 특정 질병의 기저율을 알면 진단 검사의 결과를 더 정확하게 해석할 수 있다. 기저율이 낮은 질병일수록 양성 판정이 실제로 질병을 의미할 확률은 낮아지게 된다.
예시[edit | edit source]
가령, 특정 질병의 기저율이 2%라고 가정하자. 즉, 100명 중 2명이 이 질병에 걸려 있다는 뜻이다. 이제 질병 진단을 위한 검사에서 90%의 정확도로 양성 판정을 내린다고 가정할 경우, 100명 중 2명이 실제로 질병에 걸려 있고, 98명은 건강하다고 하자.
- 실제 환자: 2명 (검사에서 양성)
- 건강한 사람들: 98명 중 90%가 잘못된 양성 판정을 받는다. 따라서, 98명 중 약 88명이 잘못 양성으로 판별된다.
결과적으로 검사에서 양성으로 판별된 총 인원은 2명 (진짜 환자) + 88명 (잘못된 양성) = 90명이다.
이때, 실제 질병에 걸린 사람의 비율은 2명 / 90명 = 약 2.22%로 계산된다. 이는 양성 판정을 받은 사람들 중 실제로 질병에 걸린 사람의 비율이 낮다는 것을 보여준다.