데이터 상품

From CS Wiki
Revision as of 07:55, 26 November 2020 by 빅터기사 (talk | contribs) (새 문서: 데이터 수요자가 비즈니스 목표 달성을 용이하게 할 수 있도록 지원하는 '''구매할 수 있는 디지털 자산''' 파일:데이터 상품 라이프사이...)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

데이터 수요자가 비즈니스 목표 달성을 용이하게 할 수 있도록 지원하는 구매할 수 있는 디지털 자산

데이터 상품 라이프사이클.png

분류[edit | edit source]

가공 형태에 따른 분류[edit | edit source]

  • 원천 데이터: 거래내역, 로그, 센싱 정보, 설문조사 결과, 연구관찰 데이터 등 수집·기록된 원시 데이터 자체
  • 가공 데이터: 원천 데이터를 가공한 데이터로, 대부분의 데이터 거래는 가공 데이터 형태로 이루어짐
    • 가공 데이터는 원천 데이터의 변화에 따라 변경되는 종속적인 데이터로서 원천 데이터를 가공 처리함으로써 가치 상승
  • 보고서: 원천 데이터, 가공 데이터, 시장 조사 분석, 연구 결과 등 기업 내외부의 데이터를 활용하여 정리된 보고서
    • 데이터 항목과 값 자체를 제공하는 것이 아닌, 해당 데이터를 활용하여 정리된 문서를 판매
    • 주로 비정형 데이터 형태로 판매되며, 정형화된 형태로 표현하기 어려운 정보 전달이 필요한 경우 활용됨
  • 데이터 분석 모델: 데이터에 머신러닝 등 다양한 형태의 분석을 적용하여 가치 도출 후, 데이터 자체가 아닌 분석 모델을 상품화
    • ex) 신용평가 모델, 부도예측 모델, 고객 세분화 모델, 이미지 인식 모델 등
    • 분석 모델의 기반 데이터와 알고리즘을 판매하는 형태와 분석 모델을 서비스화(Analytics as a Service)하여 판매하는 형태 존재

데이터 제공 방식에 따른 분류[edit | edit source]

  • 파일 상품: 텍스트, 엑셀, 이미지 등의 파일 형태로 데이터를 제공
    • 지속적으로 업데이트가 필요한 시계열 데이터 상품보다는 특정 시점·기간의 일회성 데이터 상품에 적합
구분 형태 설명
판독성 정형 데이터

(Structured Data)

필드가 고정되어 있으며 기계 판독 및 자동화된 연산이 가능한 형태

ex) CSV, XLS, SQL 등

반정형 데이터

(Semi-Structured Data)

필드가 지정되어 있으나 고정되어 있지 않고 연산을 위한 가공이 필요한 형태

ex) JSON, XML, HTML 등

비정형 데이터

(Unstructured Data)

형태가 고정되어 있지 않고 기계 판독이 어려운 형태

ex) PPT, HWP, PDF, 음성, 이미지, 영상 등

독점성 독점 포맷

(Proprietary Format)

특정 상용 소프트웨어를 통해 열람할 수 있는 소프트웨어 종속적인 파일 포맷

ex) XLS, PPT, HWP, PDF

비독점 포맷

(Non-proprietary Format)

텍스트 형태로 제공되며, 표준화된 체계를 통해 소프트웨어 종속적이지 않은 형태

ex) CSV, JSON, XML, HTML, SQL

  • API 상품: 데이터를 호출할 수 있는 애플리케이션 인터페이스를 통해 데이터 상품을 제공하는 방식
    • 데이터가 주기적으로 업데이트 또는 갱신되는 경우 적합
  • 서비스 상품: 데이터를 시각화하여 그래프, 대시보드 등의 분석화면이나 BI 도구와 같은 서비스 형태로 제공하는 방식
    • 데이터 상품과 데이터 기반 서비스를 결합한 방식으로, 수요자가 분석을 통해 얻을 수 있는 결과를 사전에 정리된 형태로 제공
    • 기업 내부에서 열람하기 위한 대시보드, BI 도구 형태와 대고객 서비스에 직접 출력하기 위한 웹페이지 형태 등으로 제공될 수 있음

참고 문헌[edit | edit source]

  • 금융권 데이터 유통 가이드(2020.10, 금융보안원)