프로그래밍 기술/IT 이야기

[4차 산업] 빅데이터 관련 전문용어 7가지

언제나휴일 2018. 5. 8. 10:11
반응형

[4차 산업] 빅데이터 관련 전문용어 7가지


데이터마이닝

Data mining

대량의 데이터 안에서 통계적 규칙이나 패턴을 체계적이고 자동적으로 찾아내는 것을 말한다. 다른 말로는 데이터베이스 속에서 지식 발견(KDD, Knowledge discovery in database)라고도 부릅니다.

분류, 군집화, 연관성, 연속성, 예측을 적용하여 결과를 도출해 낼 수 있습니다.

텍스트마이닝

Text mining

텍스트를 분석하여 가치 있는 정보를 추출하는 과정을 말합니다. 텍스트 내의 단어의 빈도를 파악하고 이를 통해 예측 분석 및 연관 분석 등을 할 수 있습니다.

분산처리

Distributed

processing

네트워크로 이루어진 여러 컴퓨터들의 처리 능력을 이용하여 거대한 계산 문제를 해결하는 방법입니다.

인메모리

데이터베이스

In memory

database

파일 기반의 데이터베이스 시스템에서 자료를 검색하기 위해 디스크 검색에 들어가는 응답 속도가 떨어지는 단점을 해결하기 위한 대안으로 메모리 상에 데이터베이스 혹은 색인을 두어 빠르게 검색할 수 있습니다.

단점으로는 메모리가 휘발성이라 데이터베이스 서버가 갑자기 전원이 나가면 자료들도 날라가 버린다는 것입니다.

비구조화 데이터

Unstructed data

미리 정의한 방식이 없는 데이터입니다. 일반적으로 텍스트 중심의 데이터이긴 하지만 날짜나 숫자, 사건 등의 데이터를 포함합니다. 비구조화 데이터는 불규칙하고 모호한 특징을 갖고 있습니다.

NoSQL

"Not only SQL"입니다. SQL만을 사용하지 않는 데이터베이스 관리시스템이라는 말입니다.

KVS

Key Value Store

키와 값을 쌍으로 보관하는 저장소를 말합니다.


반응형