반응형

2018/05/16 2

[4차 산업, 빅데이터 - 통계 실무활용] 평균으로 생기는 오해 줄이기

[4차 산업, 빅데이터 - 통계 실무활용] 평균으로 생기는 오해 줄이기 안녕하세요. 언제나 휴일, 언휴예요. 대푯값은 데이터 전체를 파악하기 위한 값으로 가장 많이 사용하는 것이 평균이다. 하지만 평균은 많은 오해를 가져오고 있습니다. 예를 들어 ㄱ 회사의 평균 연봉이 6000만원이라고 하였을 때 보통 6000만원은 받는 것으로 생각할 수 있습니다. 하지만 2000만원을 받는 직원이 5명 2500만원을 받는 직원이 7명, 3000만원을 받는 직원이 19명, 3500만원을 받는 직원이 11명, 4500만원을 받는 직원이 6명, 1억 6000만원을 받는 임원이 9명, 2억 2000만원을 받는 임원이 3명이라고 한다면 6000만원보다 적게 받는 인원이 48명이고 6000만원보다 많게 받는 인원이 12명입니다.

[4차 산업, 빅데이터 - 통계 실무활용] 인과관계 분석하기

[4차 산업, 빅데이터 - 통계 실무활용] 인과관계 분석하기 안녕하세요. 언제나 휴일, 언휴예요. 이번 글부터는 4차 산업의 기반 기술인 빅데이터를 지배하기 위한 통계를 실무에서 활용하는 것에 관하여 하나 하나 살펴볼 거예요. 제일 먼저 데이터를 단순 집계하는 것을 넘어서기 위한 지혜에 관해서 다룰 것입니다. 주요 참고 서적: "빅데이터를 지배하는 통계의 힘 - 실무활용 편" 데이터를 단순 집계하는 수준의 통계만 사용하던 수준에서 한 단계 끌어올려 인과관계를 분석할 수 있고자 한다면 다음 세 가지 지혜를 갖추어야 할 것입니다. ① 평균과 비율 등 통계 지표이 본질적인 의미를 이해하기② 데이터를 점이 아닌 구간으로 이해하기③ '무슨 값을 어떻게 정리해야 하는지' 알기 참고 문헌: 빅데이터를 지배하는 통계의..

반응형