공중보건학 반사실적 모형 공중보건학은 단순히 건강 상태를 설명하는 학문이 아니다. 예방접종을 확대했을 때 사망률이 줄어드는가, 환경 규제를 강화했을 때 호흡기 질환이 줄어드는가와 같은 ‘만약’의 질문에 과학적으로 대답할 수 있어야 한다. 그리고 바로 이러한 질문에 해답을 주는 이론적 틀과 분석 도구가 반사실적 모형(counterfactual model)이다.
반사실적 모형은 ‘그 일이 일어나지 않았더라면 무슨 일이 벌어졌을까’라는 상상에서 출발하지만 이는 단순한 추측이 아니다.
엄격한 통계학적 틀 위에서 실제 정책 효과를 측정하고 건강 결정 요인을 밝혀내는 데 활용된다.
우리는 일상에서 수많은 ‘만약’을 떠올린다. “그때 병원에 일찍 갔더라면?”, “담배를 끊었더라면?”, “백신을 맞지 않았다면?”. 반사실적 사고란 바로 이런 상상을 수학과 통계의 언어로 표현한 개념이다.
공중보건학에서는 이를 통해 실제 정책이나 개입의 효과를 추론하고, 과학적 의사결정을 돕는다.
특히 인과추론 분야에서는 Rubin의 인과모형(Rubin Causal Model)이 반사실적 사고의 대표적인 틀로 자리 잡았다.
이 모형에 따르면 한 개인은 개입을 받았을 때의 결과와 받지 않았을 때의 결과, 즉 두 개의 잠재적 결과(potential outcomes)를 가질 수 있다. 그러나 우리는 현실에서 이 중 하나만 볼 수 있기 때문에, 나머지를 통계적으로 추정해야 한다.
| 근거 | 개인적 감정, 기억 | 데이터 기반, 통계 모델 |
| 목적 | 자기 성찰 | 정책 효과 추정 |
| 기준 | 주관적 판단 | 과학적 검정 |
| 결과 활용 | 개인 결정 | 집단 건강 전략 |
| 타당성 검토 | 없음 | 민감도 분석, 모델 검증 필요 |
공중보건학 반사실적 모형 Rubin의 반사실적 인과모형은 인과 추론을 ‘잠재적 결과’의 비교로 정의한다.
어떤 개입 A를 받을 때의 건강 결과와 받지 않을 때의 결과를 각각 Y(1), Y(0)이라 할 때, 진정한 인과효과는 Y(1) – Y(0)이다.
문제는 하나의 개인에게 두 상황을 동시에 적용할 수 없다는 데 있다. 이 문제를 해결하기 위해서는 다른 사람을 비교 대상으로 삼거나 혹은 통계적 기법을 통해 가상의 비교군을 생성해야 한다. 이것이 바로 성향점수 매칭, 도구변수 분석, 회귀 불연속 설계 등 반사실적 기반 인과추론 기법들의 출발점이다
| 개입 처리(T) | 개입 여부 (1 = 개입, 0 = 없음) |
| 잠재 결과(Y(1), Y(0)) | 개입 여부에 따른 건강 상태 |
| 실제 관측치 | T=1이면 Y(1), T=0이면 Y(0)만 관측 |
| 인과효과 | Y(1) – Y(0) |
| 평균 인과효과 (ATE) | 전체 인구에서 평균적 인과효과 추정 |
공중보건학 반사실적 모형 인과관계를 추론하는 대부분의 공중보건 연구는 결국 반사실적 비교를 전제로 한다. 예방접종을 받은 집단과 받지 않은 집단의 질병 발생률 차이를 비교할 때 우리는 “접종을 받지 않았더라면 어떻게 됐을까?”라는 가정 하에 추론을 한다.
이러한 추론이 타당하려면 처리군과 비교군이 개입 이외에는 유사해야 한다.
즉, 같은 시간, 같은 조건, 같은 사회경제적 배경에서 하나의 차이만 있어야 한다.
반사실적 모형은 이 원리를 기반으로 실제 데이터를 바탕으로 가상의 비교군을 구성하는 다양한 방법을 제공한다.
| 개입 후 변화 측정 | 백신, 건강 캠페인 등 정책 효과 측정 |
| 윤리적 문제로 무작위화 불가 | 흡연, 환경오염 등 자의적 노출 요인 |
| 비슷한 대상을 비교해야 할 때 | 소득 수준, 지역 조건이 유사한 두 집단 |
| 시계열 간섭 발생 | 전후 비교만으로는 혼란 변수 통제 불가 |
| 관찰연구 설계 | 무작위 대조군이 불가능한 경우 대부분 해당 |
공중보건학 반사실적 모형 반사실적 모형을 기반으로 하는 분석 기법은 다양하다.
이들 방법은 상황에 따라 적절한 도구를 선택해야 하며 각 기법은 특정한 가정과 한계를 갖는다. 대표적으로 성향점수 방법은 관찰연구에서 반사실적 비교를 수행하는 가장 널리 쓰이는 기법이다. 또한 차이의 차이 기법은 개입 전후의 변화량을 비교함으로써 시간의 흐름에 따른 영향을 통제할 수 있다. 회귀불연속 설계(Regression Discontinuity Design)는 정책이나 개입의 기준값 경계에서 나타나는 집단 간 차이를 이용해 인과관계를 추론한다.
| 성향점수 매칭 | 유사한 조건 간 비교 | 광범위한 변수 통제 가능 | 측정되지 않은 변수 반영 어려움 |
| 차이의 차이(DiD) | 정책 시행 전후 비교 | 시간 변화 효과 배제 가능 | 병렬 추세 가정 필수 |
| 회귀 불연속 설계 | 점수 기반 정책 경계 활용 | 준무작위 환경 유사 | 경계 주변에만 적용 가능 |
| 도구변수 분석 | 외생 변수 통한 효과 추정 | 측정오류 보정 가능 | 적절한 도구 찾기 어려움 |
| inverse probability weighting | 관측치 보정 기반 전체 평균 추정 | 전체 인과효과 추정 가능 | 가중치의 불안정성 |
반사실적 모형은 실제 다양한 공중보건 분야에서 활용되어 왔다. 예를 들어 백신 정책의 효과 평가, 흡연 규제의 건강 영향 분석, 의료 접근성 변화에 따른 사망률 변화 등이 있다. 이들 연구는 단순히 비교만 하는 것이 아니라, 대안적 현실을 가정하고, 그 현실에서는 어떤 결과가 나왔을지를 추정한다. 예를 들어 A지역에서 공공병원이 추가로 설립된 후 심혈관 사망률이 감소했다고 하자.
이것이 병원 설치 때문인지, 동시에 진행된 건강 캠페인 때문인지 구분하기 위해서는 성향점수와 차이의 차이 방법을 결합한 반사실적 분석이 필요하다.
| 코로나19 백신 접종 정책 효과 | 성향점수 매칭 | 사망률 60% 감소 효과 확인 |
| 대기오염 규제 정책 평가 | 회귀 불연속 설계 | 기준 초과 지역에서 천식 발병률 감소 |
| 금연구역 확대 효과 분석 | 차이의 차이 | 급성 호흡기 질환 응급실 내원율 감소 |
| 유급 병가 제도 도입 효과 | 도구변수 분석 | 병가 도입 후 감염 확산 20% 억제 |
| 저소득층 의료비 지원정책 | IPW | 전체 사망률 감소 효과 정량화 |
모든 통계 모델에는 가정이 존재하고, 반사실적 추론 역시 예외는 아니다.
특히 각 기법이 성립하기 위해 필요한 통계적 가정(statistical assumptions)이 충족되지 않으면 결과 해석에 오류가 발생한다.
예를 들어 성향점수 매칭은 ‘모든 교란변수를 측정했다’는 강한 가정을 전제로 한다.
또한 회귀 불연속 설계는 경계값 주변에 집단들이 무작위로 분포해 있다는 전제가 필요하다.
이를 검증하지 않은 채 해석을 한다면, 정책이나 개입의 효과를 과대 또는 과소 평가할 위험이 있다.
따라서 각 기법 사용 시에는 민감도 분석, 외적 타당성 점검, 대안적 모형 비교 등이 함께 이루어져야 한다.
| 성향점수 | 교란변수 완전 측정 | 인과효과 왜곡 |
| 차이의 차이 | 병렬 추세 존재 | 외부 요인 간섭 우려 |
| 회귀 불연속 | 임의 배정과 유사한 분포 | 경계 근처 왜곡 발생 |
| 도구변수 | 외생성, 독립성 | 인과 추론 불가능 |
| IPW | 안정적인 확률 분포 | 가중치 폭주로 인한 오차 증가 |
오늘날 공중보건학은 전자의무기록, 모바일 헬스, 생체 센서 등 다양한 빅데이터를 수집할 수 있는 환경에 놓여 있다.
이러한 환경은 반사실적 추론을 더욱 정교하게 만들 수 있는 기회를 제공한다. 특히 머신러닝 기법과 결합하면 복잡한 변수들 간의 상호작용까지 고려한 정교한 잠재 결과 예측이 가능해진다. 예를 들어 머신러닝을 활용한 성향점수 예측은 전통적 회귀모형보다 더 나은 적합도를 제공하며 시계열 데이터에서 딥러닝 기반 반사실적 예측이 적용되는 사례도 늘고 있다.
궁극적으로는 정책 결정 전 시뮬레이션 기반 반사실적 분석이 공중보건 의사결정의 표준이 될 가능성이 크다.
| 정밀 공중보건 | 개인 맞춤형 개입 효과 추정 |
| 유전자-환경 상호작용 | 복합 요인 기반 인과효과 분석 |
| 디지털 치료제 평가 | 반사실적 기반 치료 효과 측정 |
| 사회정책 시뮬레이션 | 다양한 개입 시나리오 평가 |
| 실시간 건강정책 조정 | 반사실적 추론 기반 실시간 대안 제시 |
공중보건학 반사실적 모형 공중보건학의 핵심은 단순히 현재를 설명하는 데 그치지 않고 바꾸려는 의지와 능력을 갖추는 것이다. 반사실적 모형은 바로 그러한 변화 가능성을 과학적으로 추정하는 도구다. 실제로 일어나지 않은 상황을 통계적으로 구현하고, 그 결과를 통해 보다 나은 미래를 설계할 수 있는 힘을 제공한다. 이제 공중보건 연구자와 정책입안자들은 단지 상관관계가 아닌 인과적 통찰을 바탕으로 건강 개입을 설계해야 할 시대에 살고 있다. 반사실적 모형은 그 길을 안내하는 나침반이며 앞으로 데이터와 기술의 발전과 함께 그 중요성은 더욱 커질 것이다. 과거에 대한 상상력이 미래를 바꾸는 힘이 될 수 있다.
그 출발점이 바로 반사실적 사고다.