빅데이터: Difference between revisions

From CS Wiki
(새 문서: 분류:데이터 분석분류:데이터베이스 ;Big Data ;기존 데이터베이스 관리도구의 능력을 넘어서는 대량 데이터 또는 비정형의 데이터를...)
 
No edit summary
Line 26: Line 26:
| 시각화(Visualization) || 비정형 데이터까지 다루면서 처리하는 데이터량 대폭 증가
| 시각화(Visualization) || 비정형 데이터까지 다루면서 처리하는 데이터량 대폭 증가
|}
|}
== 빅데이터 처리 기술 ==
=== 분석 기술 ===
* 병렬 데이터베이스
** Divide and Conquer 방식을 이용하여 대량 데이터를 분산 및 병렬 처리
** 기법/도구: [[하둡]], [[스파크]], [[하이브]]
* [[데이터 마이닝]]
** [[텍스트 마이닝]], [[군집분석]], [[연관분석]] 등 대량의 데이터에서 가치를 찾는 정보 도출
** 기법/도구: [[머신러닝]], [[의사결정나무]]
=== 표현 기술 ===
* [[NoSQL]]
** 대량의 반정형 데이터에 대한 유연한 조회, 갱신 처리 지원
** 기법/도구: [[몽고DB]], [[카우치베이스]]
* [[R]]
** 분석된 빅데이터를 대상으로 데이터의 의미를 시각화해주는 프로그래밍 언어


== 같이 보기 ==
== 같이 보기 ==
* [[데이터베이스]]
* [[데이터베이스]]

Revision as of 10:06, 6 October 2019

Big Data
기존 데이터베이스 관리도구의 능력을 넘어서는 대량 데이터 또는 비정형의 데이터를 분석하고 가치를 창출하는 기술

빅데이터의 특징(3V+α)

  • 가트너에서 제시한 3가지 특징
특징 설명
양(Volume) 처리하는 데이터의 양이 기존의 데이터베이스에 비해 거대
속도(Velocity) 데이터 입출력 속도가 기존 데이터베이스에 비해 초고속
다양성(Variety) 비정형 데이터까지 다루면서 처리하는 데이터량 대폭 증가
  • IBM 등에서 제시한 개념이 추가됨
특징 설명
정확성(Veracity) 처리하는 데이터의 양이 기존의 데이터베이스에 비해 거대
가변성(Variability) 데이터 입출력 속도가 기존 데이터베이스에 비해 초고속
시각화(Visualization) 비정형 데이터까지 다루면서 처리하는 데이터량 대폭 증가

빅데이터 처리 기술

분석 기술

표현 기술

  • NoSQL
  • R
    • 분석된 빅데이터를 대상으로 데이터의 의미를 시각화해주는 프로그래밍 언어

같이 보기