반응형

통계의 힘 3

[4차 산업, 빅데이터] 임의화 비교실험의 한계

[4차 산업, 빅데이터] 임의화 비교실험의 한계 안녕하세요. 언제나 휴일, 언휴예요. 이번에는 임의화 비교실험의 한계를 알아볼게요. 이전 게시글에서 주어진 문제를 해결할 방법이 없을 때 임의화 비교실험은 적은 비용의 최소 위험부담을 통해 실수를 줄일 수 있다고 하였습니다. 하지만 임의화 비교실험은 언제나 가능한 것도 아니며 가능하더라도 해서는 알 될 때도 있습니다. 먼저 실험 자체를 하는 것이 현실적으로 가능하지 않을 때가 있습니다. 예를 들어 "누구와 결혼을 할 것인가?"와 같은 문제에서 임의화 비교실험을 위해 실험적으로 결혼을 하는 것은 현실적으로 가능하지 않습니다. 이처럼 실험 자체를 여러 번 하기 힘든 상황에서는 임의화 비교실험은 무기력합니다. 그리고 데이터가 몇 개 없을 때에도 임의화 비교실험은..

[4차 산업, 빅데이터] 쓸모 없는 통계, 쓸모 있는 통계 - 2

[4차 산업, 빅데이터] 쓸모 없는 통계, 쓸모 있는 통계 - 2 안녕하세요. 언제나 휴일, 언휴예요. 이전 글에서 언급했듯이 의미가 있는 통계해석이라면 다음 질문에 "Yes"를 대답할 수 있어야 합니다. * 어떤 요인을 변화시켜야 이익이 향상될까?* 그런 변화를 일으키는 행동이 실제로 가능한가?* 그에 따르는 비용이 이익을 상회할까? [그림] 의미 없는 통계 위 그래프는 특정 광고를 보았는지 여부를 조사한 통계 그래프이다. 통계 그래프를 보면 "보았다."와 "본 것 같다."의 합이 75%정도이다. 이러한 값을 보고 많은 이들이 광고를 보거나 본 것으로 기억하고 있다고 볼 수 있다. 하지만 광고를 본 것이 실제 구매로 얼마나 이어졌는지 알 수 없다. [그림] 광고를 본 것과 실제 구매와의 관계를 알 수 ..

[4차 산업, 빅데이터] 질병의 역학조사, 통계가 답이다.

[4차 산업, 빅데이터] 질병의 역학조사, 통계가 답이다. 안녕하세요. 언제나 휴일, 언휴예요. 역학은 통계학의 한 분야로 원인을 모르는 전염병의 원인을 파악하여 전염병이 번지는 것을 막기 위해 연구하는 학문입니다. 이러한 역학은 19세기 런던의 콜레라에 관한 역학 연구가 시초라고 볼 수 있어요. '역학의 아버지' 라고 불리는 존 스노(John Snow,1813~1858)는 런던의 원인 모를 전염병이 번지는 것을 막기 위해 다음과 같은 조사를 하였다고 합니다. * 콜레라로 목숨을 잃은 희생자 집을 방문해 이것저것 묻고 주변환경을 관찰* 콜레라에 걸린 사람과 걸리지 않은 사람의 차이점 비교 * 가설을 세워 대규모의 데이터를 분석하여 관련이 있다고 보여지면 어느 정도의 확실성이 있는지 검증 그리고 다음은 존..

반응형