반응형
[4차 산업, 빅데이터] A/B 테스트에 카이제곱검정과 p value를 더하다.
안녕하세요. 언제나 휴일, 언휴예요.
마켓팅과 웹 분석에서 A/B 테스트는 두 가지 형태의 테스트 중에 어느 것이 나은지 검토하는 것입니다. (세 가지 이상의 형태 중에 나은 것을 찾는 것 또한 A/B 테스트라고 부릅니다.)
예를 들어 한 회사의 배너 광고를 왼쪽에 다는 것과 오른쪽에 다는 것 중에 어느 쪽이 방문자의 머무는 시간이 길게 유도하는지를 파악하는 것을 들 수 있다. 그런데 이와 같은 형태의 A/B 테스트의 결과를 보다 신뢰성있게 사용하고자 한다면 오차를 고려하여야 할 것입니다. 그리고 이를 통해 테스트 결과가 유의미한 것인지 무의미한 것인지를 판별하는 것이죠.
이처럼 A/B 테스트의 결과(교차 분할표)를 보고 의미있는 결과인지를 판별하기 위한 방법으로 카이제곱검정과 p value를 사용할 수 있습니다.
카이제곱검정은 카이제곱분포에 기초한 통계적 방법으로 관찰빈도가 의미있는 빈도인지 오차인지를 확인하는 해석기법입니다.
크리고 p - value (probability value)는 오차나 우연에 의해 실제가 아닌데 나오는 차이가 발생할 확률을 말하며 이러한 확률을 유의확률이라 부릅니다.
p - value = 오차나 우연에 의해 실제가 아닌데 나오는 차이가 생길 확률
이처럼 A/B 테스트를 하고 난 결과가 우연한 것인지 아닌지를 검증하여 신뢰성을 높이는 것은 단순 통계의 함정에 빠지지 않는 방법입니다.
반응형
'프로그래밍 기술 > IT 이야기' 카테고리의 다른 글
[4차 산업, 빅데이터] 회귀분석, 일반화 선형모델 도구 (0) | 2018.05.10 |
---|---|
[4차 산업, 빅데이터] 임의화 비교실험을 못할 때 비교대조 분석(case control) (0) | 2018.05.09 |
[4차 산업, 빅데이터] 임의화 비교실험의 한계 (0) | 2018.05.09 |
[4차 산업, 빅데이터] 문제 해결 방법을 모르면 임의로 정해 놓고 실험하라. (0) | 2018.05.09 |
[4차 산업, 빅데이터] 어떠한 기준으로 데이터를 수집해야 하는가? (0) | 2018.05.09 |
[4차 산업, 빅데이터] 쓸모 없는 통계, 쓸모 있는 통계 - 2 (0) | 2018.05.08 |
[4차 산업, 빅데이터] 쓸모있는 통계, 쓸모없는 통계 (0) | 2018.05.08 |
[4차 산업, 빅데이터] 표본 조사 결과와 표준오차 (0) | 2018.05.08 |
[4차 산업] 빅데이터 관련 전문용어 7가지 (0) | 2018.05.08 |
[4차 산업, 빅데이터] 질병의 역학조사, 통계가 답이다. (0) | 2018.05.08 |