반응형

통계 14

[4차 산업, 빅데이터] 어떠한 기준으로 데이터를 수집해야 하는가?

[4차 산업, 빅데이터] 어떠한 기준으로 데이터를 수집해야 하는가? 안녕하세요. 언제나 휴일, 언휴예요. 이번에는 어떠한 기준으로 데이터를 수집해야 하는지에 관하여 알아볼게요. 통계 데이터를 바탕으로 실질적인 이득을 얻을 수 있는 해결방법을 구하고자 한다면 단순한 집계에 머물지 말고 오차를 고려하고 p-value을 확인해야 한다고 앞에서 다루었어요. 그런데 단순한 집계도 "어떤 데이터를 수집하고 해석해야 하는가?"라는 근원적인 문제가 더 중요할 수 있습니다. "어떤 데이터를 수집하고 해석해야 하는가?" 수집할 데이터를 선정하는 가장 기본적인 원칙은 지향하는 목적을 달성한 것과 그렇지 않은 것의 차이에서 출발하는 것입니다. 예를 들어 교육 서비스를 하는 곳이라면 성적이 좋은 학생들과 그렇지 않은 학생들, ..

[4차 산업, 빅데이터] 표본 조사 결과와 표준오차

[4차 산업, 빅데이터] 표본 조사 결과와 표준오차 안녕하세요. 언제나 휴일, 언휴예요. 이번에는 표준 조사의 결과와 표준오차에 관한 얘기입니다. 현실 세계에서 표본을 조사하여 실제 값이 얼마일지 예측하는 것은 비일비재합니다. 선거 예측이나 지지율 조사 등을 들 수가 있습니다. 하지만 표본 조사가 얼마나 가치 있는 정보인지를 판별하려면 오차가 생길 수 있는 범위를 인지할 수 있어야 합니다. 이를 위해 통계학에서 사용하는 것이 표준오차입니다. 다음은 표준오차 산출식입니다. ▶표준오차 산출식 그리고 95% 신뢰성에서 참 값과 표본 값의 차이는 표준오차의 두 배를 벗어나지 않습니다. 표본 값-(표준오차 X 2)

통계와 IT 만남, 빅데이터를 빛내다.

통계와 IT 만남, 빅데이터를 빛내다. 안녕하세요. 언제나 휴일, 언휴예요. 최근 들어 4차산업에 관한 얘기는 굉장히 많이 나오네요. 그리고 2010년 이후부터 4차산업의 기반인 빅데이터와 인공지능이 여러 분야에 접목하고 있죠. 하지만 빅데이터와 인공지능을 비롯한 4차산업은 통계가 없다면 아무 쓸모가 없는 것일 수도 있어요. 물론 이런 가정은 할 필요는 없어요. 이미 통계학은 1960년대부터 확고하기 때문이죠. 정 반대로 IT가 없었다면 통계가 다양한 분야에 활용하지 못했을 거예요. 예전에는 리터러시(literacy, 읽고 쓰는 능력)가 없다면 중요한 계약이나 교육, 법률 등을 알 수가 없어 중요한 사회 생활을 할 수 없었을 거예요. 그런데 어떤 이들은 가까운 미래에는 통계학적 리터러시가 없다면 중요한 ..

erf, erff, erfl

erf, erff, erfl헤더 파일[언어 자료구조 알고리즘/C11 표준 라이브러리 함수] - math.h double erf(double x); 오차 함수float erff(float x); 오차 함수long double erfl(long double x); 오차 함수 입력 매개 변수 리스트x 실수반환 값오차함수(x) 오차 함수는 확률, 통계, 편미분 등에서 사용하는 함수로 가우스 오차함수라고도 부릅니다. 사용 예 //C언어 표준 라이브러리 함수 가이드 //double erf(double x); 오차 함수 //float erff(float x); 오차 함수 //long double erfl(long double x); 오차 함수 #include #include int main(void) { double..

반응형