[4차 산업] 빅데이터 관련 전문용어 7가지
데이터마이닝 Data mining |
대량의 데이터 안에서 통계적 규칙이나 패턴을 체계적이고 자동적으로 찾아내는 것을 말한다. 다른 말로는 데이터베이스 속에서 지식 발견(KDD, Knowledge discovery in database)라고도 부릅니다. 분류, 군집화, 연관성, 연속성, 예측을 적용하여 결과를 도출해 낼 수 있습니다. |
텍스트마이닝 Text mining |
텍스트를 분석하여 가치 있는 정보를 추출하는 과정을 말합니다. 텍스트 내의 단어의 빈도를 파악하고 이를 통해 예측 분석 및 연관 분석 등을 할 수 있습니다. |
분산처리 Distributed processing |
네트워크로 이루어진 여러 컴퓨터들의 처리 능력을 이용하여 거대한 계산 문제를 해결하는 방법입니다. |
인메모리 데이터베이스 In memory database |
파일 기반의 데이터베이스 시스템에서 자료를 검색하기 위해 디스크 검색에 들어가는 응답 속도가 떨어지는 단점을 해결하기 위한 대안으로 메모리 상에 데이터베이스 혹은 색인을 두어 빠르게 검색할 수 있습니다. 단점으로는 메모리가 휘발성이라 데이터베이스 서버가 갑자기 전원이 나가면 자료들도 날라가 버린다는 것입니다. |
비구조화 데이터 Unstructed data |
미리 정의한 방식이 없는 데이터입니다. 일반적으로 텍스트 중심의 데이터이긴 하지만 날짜나 숫자, 사건 등의 데이터를 포함합니다. 비구조화 데이터는 불규칙하고 모호한 특징을 갖고 있습니다. |
NoSQL |
"Not only SQL"입니다. SQL만을 사용하지 않는 데이터베이스 관리시스템이라는 말입니다. |
KVS Key Value Store |
키와 값을 쌍으로 보관하는 저장소를 말합니다. |
'프로그래밍 기술 > IT 이야기' 카테고리의 다른 글
[4차 산업, 빅데이터] 어떠한 기준으로 데이터를 수집해야 하는가? (0) | 2018.05.09 |
---|---|
[4차 산업, 빅데이터] A/B 테스트에 카이제곱검정과 p value를 더하다. (0) | 2018.05.08 |
[4차 산업, 빅데이터] 쓸모 없는 통계, 쓸모 있는 통계 - 2 (0) | 2018.05.08 |
[4차 산업, 빅데이터] 쓸모있는 통계, 쓸모없는 통계 (0) | 2018.05.08 |
[4차 산업, 빅데이터] 표본 조사 결과와 표준오차 (0) | 2018.05.08 |
[4차 산업, 빅데이터] 질병의 역학조사, 통계가 답이다. (0) | 2018.05.08 |
통계와 IT 만남, 빅데이터를 빛내다. (0) | 2018.05.04 |
[가트너] 2018년에는 어떠한 기술이 주도할까? 10대 전략 기술 트렌드 (0) | 2018.03.19 |
SNS 전문가, 4차 산업 시대에는 이런 직업이 뜬다. - 직무 개요 (2) | 2018.03.13 |
지능형 에이전트(Intelligent agent) (0) | 2016.05.01 |