상세 컨텐츠

본문 제목

[탐구주제찾기] 검사 결과를 그대로 믿어도 될까? 베이즈 정리로 보는 진단 확률

읽기 자료

by better루시아 2025. 11. 11. 22:55

본문

 

베이즈 정리는 새로운 정보가 주어졌을 때,

그 정보를 반영해 확률을 다시 계산하는 방법이다.

검사 결과는 확정이 아니라,

확률을 업데이트하는 근거가 된다.

베이즈 정리


 

베이즈 정리에 대한 기본

우리는 어떤 일이 실제로 일어났는지 직접 확인할 수 없고, 그와 관련된 표현이나 결과를 통해 추정해야 하는 상황이 자주 발생한다. 예를 들어, 사람이 어떤 병에 걸렸는지 바로 알 수는 없지만, 검사 결과가 양성인지 음성인지로 판단하려 한다.

이때 검사가 양성이라고 해서 무조건 병이라고 단정할 수는 없다. 검사에는 맞는 경우도 있지만 틀리는 경우도 있기 때문이다. 그래서 중요한 것은 “양성이라고 나왔을 때 실제로 병일 확률”이다.

 

베이즈 정리는 바로 이 문제를 해결하는 원리이다.
즉, 어떤 결과를 관찰했을 때, 그 결과가 어디에서 왔는지를 다시 따져서 확률을 갱신하는 방법이라고 말할 수 있다.

여기서 먼저 고려해야 하는 것은 그 병이 처음부터 얼마나 흔한지이다.

이를 ‘사전확률’이라고 부른다. 예를 들어 매우 드문 병이라면, 검사에서 양성이 나왔다고 하더라도 실제로 병일 가능성은 생각보다 낮을 수 있다.

 

다음으로 고려해야 하는 것은 검사의 특성, 즉 병이 있을 때 양성이 잘 나오는지(민감도), 병이 없을 때 음성이 잘 나오는지(특이도)이다. 

베이즈 정리는 이 두 가지 정보를 같이 반영한다.
검사 결과(새로운 정보)가 들어오면, 처음 알고 있던 확률(사전확률)을 검사 정확도에 따라 조정하여, “지금 조건에서의 확률(사후확률)”을 다시 계산한다.

 

즉, 베이즈 정리는 처음에 알고 있던 확률 + 검사 또는 관측으로 얻은 새로운 정보 = 상황에 맞게 다시 계산된 현실적인 확률을 구하는 원리이다.

 

 

베이즈 정리 예시

어떤 학교에서 건강 검사를 한다고 하자.
이 학교 학생 중 1%만 실제로 어떤 병을 가지고 있다고 알려져 있다.
즉, 병은 매우 드문 상황이다.

 

검사 키트는

  • 병이 있으면 99% 확률로 양성을 잘 찾아낸다. (민감도 높음)
  • 하지만 병이 없어도 5% 정도는 잘못 양성이 나온다. (가짜 양성 존재)

이제 어떤 학생이 검사를 했는데 양성이 나왔다고 하자.
그러면 이 학생은 실제로 병일까?

 

우리의 직감은 이렇게 말한다:
“검사 정확도 99%면 양성이면 거의 병 아니야?”

 

하지만 실제로는 다르다.
왜냐하면 처음부터 병을 가진 사람 자체가 매우 적기 때문이다.

 

실제로 따져보면

  • 병이 있는 학생은 처음부터 1%밖에 없다.
  • 그런데 병이 있는 학생은 대부분 양성이 나오므로 양성 학생 중에 일부는 진짜이다.
  • 하지만 병이 없는 학생(99%) 중에서도 5%가 양성이 나오므로,
    가짜 양성이 꽤 많이 생긴다.

즉, 양성이 나온 학생 중에는
진짜 병인 학생보다 ‘병은 없는데 잘못 양성 나온 학생’이 더 많아질 수 있다.

 

그래서 검사 결과가 양성이라고 해도
“진짜로 병일 확률”은 생각보다 낮아진다.

 

 

여기서 베이즈 정리의 역할

베이즈 정리는 바로 이 상황에서

  • 병의 원래 발생 확률 (드문 병인지 흔한 병인지)
  • 검사의 맞고 틀리는 비율
  • 실제로 관찰된 검사 결과

이 세 가지를 모두 반영해서 “양성이라고 나왔을 때 정말 병일 확률”을 다시 계산한다.

베이즈 정리는 검사 결과를 그대로 믿지 않고, ‘병의 희귀성 + 검사 정확도’를 함께 고려해 현실적인 확률을 다시 계산하는 방법이다.

 

 

베이즈 정리 관련 탐구주제

고등학교 수준에서 가능한 베이즈 정리 관련 탐구주제로는 다음과 같은 것들이 가능합니다. 

 

희귀 질환 진단에서의 베이즈 정리

  • 핵심 질문: 검사가 양성이라고 해서 모두 환자인가?
  • 내용: 질환의 사전 확률과 검사 정확도를 이용해 양성 결과 후 실제 환자일 확률 계산.
  • 확장: 민감도 / 특이도 / 양성예측도(PPV) 비교.

코로나 PCR 검사 정확도와 실제 감염 확률

  • 핵심 질문: 99% 정확한 검사라도, 감염 확률이 낮으면 오진이 높을 수 있을까?
  • 내용: 유병률(사전확률)에 따라 양성 결과의 해석이 달라지는 이유 설명.
  • 확장: 집단 검사 전략(POOL TESTING)과의 연결.

스포츠 도핑 검사에서의 오판 문제

  • 핵심 질문: 도핑 양성 = 무조건 도핑 선수일까?
  • 내용: 도핑 유병률이 매우 낮기 때문에 검사가 정확해도 가짜 양성이 꽤 나올 수 있음을 계산.
  • 확장: 임계값 변경 → 경기 공정성과 선수 권리의 균형 논의.
반응형

관련글 더보기