프로그래밍 기술/IT 이야기

[4차 산업, 빅데이터] 임의화 비교실험을 못할 때 비교대조 분석(case control)

언제나휴일 2018. 5. 9. 16:54
반응형

[4차 산업, 빅데이터] 임의화 비교실험을 못할 때 비교대조 분석(case control)



안녕하세요. 언제나 휴일, 언휴예요.


이전 글에서 얘기했듯이 임의화 비교실험은 현실, 윤리, 감정의 벽에 부딪혀 실험할 수 없거나 혹은 하지 말아야 할 때가 있습니다.

 

이처럼 임의화 비교실험을 할 수 없는 상황일 때 비슷한 방법으로 '비교대조 분석(case control)'이 있습니다.

 

비교대조 분석은 임의화 비교실험처럼 랜덤한 조사를 하는 것은 아니지만 특정 인자가 영향을 미치는 정도를 분석하기 위해 같은 부류에 속하는 어떤 사물들 사이의 유사점이나 차이점을 밝혀내는 방법을 말합니다.

 

이러한 비교대조 분석이 보다 실험적 가치를 지니기 위해서는 층별 해석을 가미하세요. 층별 해석은 조건을 같게 만든 후에 조사하는 것을 말합니다.

 

따라서 가치 있는 비교대조 분석을 원한다면 가능한 범위에서 다른 인자들을 같게 만들어 같은 조건에서 조사한 후에 비교하시길 바랍니다. 결국 층별 해석을 통해 공정한 비교를 하라는 것이죠.

 

대표적인 '비교 대조분석연구'에는 1948~1952년에 1500여명의 폐암 환자들을 성별과 연령, 거주 지역 등으로 나누어 같은 조건을 갖는 폐암 이외의 질병으로 입원한 환자들에게 조사하였습니다. 조사한 내용은 흡연자와 비흡연자의 비율을 분석한 것인데 카이제곱검정을 하면 p-value가 남자는 0.1 미만, 여자는 1%미만이어서 유의미한 결과라고 할 수 있습니다.


 

흡연자

비흡연자

인원 수

비율

인원 수

비율

남성

폐암환자

1350

99.50%

7

0.50%

비폐암환자

1296

95.50%

61

4.50%

여성

폐암환자

68

63.00%

40

37.00%

비폐암환자

49

45.40%

59

54.60%


*참고: 빅데이터를 지배하는 통계의 힘 


반응형