데이터 웨어하우스: Difference between revisions

From CS Wiki
No edit summary
No edit summary
Line 4: Line 4:


== DW의 특징 ==
== DW의 특징 ==
* 주제 중심: 분석하고자 하는 주제를 중심으로 데이터를 구성
{| class="wikitable"
* 시계열성: 시간에 따른 변경 사항을 지속 기록
|-
* 비휘발성: 한번 적재된 데이터는 변경/삭제되지 않고 읽기전용으로 사용됨
! 특징 !! 설명
|-
| 주제 중심적
(Subject Oriented)
||
* 분석하고자 하는 주제를 중심으로 데이터를 구성
* 특정 업무 기능이나 응용 프로그램에 종속되지 않는 데이터 구조를 지원
|-
| 통합 구조
(Integrated)
||
* 업무 기능별로 관리되는 다수의 운영 데이터를 전사적 관점에서 중복을 최소화하고, 모든 업무에 공유할 수 있도록 통합
* 데이터의 정합성과 물리적 통일성을 갖는 통합된 데이터 구조를 지원
* 전사적인 데이터 표준화를 통해 데이터 통일성(즉, 속성 이름, 데이터 표현, 계산 단위 등) 확보
* 데이터 획득 시 데이터 통합을 위한 일련의 변환 작업을 수행
|-
| 시계열 데이터
(Time Variant)
||
* 데이터는 오랜 기간 동안 보유되며, 과거와 현재의 경향에 대한 분석이 가능하도록 시간에 따라 모든 순간의 값을 유지하고 있음(즉, 일련의 스냅삿(Snapshot)처럼 저장됨)
* 일정 기간 동안의 업무 변화 내지는 발전의 추세 분석에 필요
** 이력 데이터를 통해 시간 경과에 따른 데이터의 변화 과정 파악이 가능
* 스냅샷 생성
** 키 구조에 시간 요소를 추가하여 레코드 생성
** 이벤트 발생 시점의 일자 또는 시간 저장
|-
| 비휘발성
(Non Volatile)
||
* 초기 데이터 적재 이후에는 데이터의 갱신은 발생하지 않고 검색만 있음(즉, 데이터 적재와 데이터 검색만 존재)
* 데이터 변경이 발생하더라도 변경을 직접 반영하지 않고 스냅샷 형태로 반영
* 장애 발생에 대한 데이터의 복구, 트랜잭션과 데이터의 무결성 유지, 교착상태의 탐지와 처리가 매우 단순함
* 데이터 갱신 이상에 대한 고려가 불필요하고, 정규화 및 반정규화에 대한 융통성의 증가
|}

Revision as of 07:33, 10 October 2019

DW; Data Warehouse
기업의 정보분석 요구를 충족시키기 위해 분석, 가공된 데이터를 저장 및 관리하는 기술

DW의 특징

특징 설명
주제 중심적

(Subject Oriented)

  • 분석하고자 하는 주제를 중심으로 데이터를 구성
  • 특정 업무 기능이나 응용 프로그램에 종속되지 않는 데이터 구조를 지원
통합 구조

(Integrated)

  • 업무 기능별로 관리되는 다수의 운영 데이터를 전사적 관점에서 중복을 최소화하고, 모든 업무에 공유할 수 있도록 통합
  • 데이터의 정합성과 물리적 통일성을 갖는 통합된 데이터 구조를 지원
  • 전사적인 데이터 표준화를 통해 데이터 통일성(즉, 속성 이름, 데이터 표현, 계산 단위 등) 확보
  • 데이터 획득 시 데이터 통합을 위한 일련의 변환 작업을 수행
시계열 데이터

(Time Variant)

  • 데이터는 오랜 기간 동안 보유되며, 과거와 현재의 경향에 대한 분석이 가능하도록 시간에 따라 모든 순간의 값을 유지하고 있음(즉, 일련의 스냅삿(Snapshot)처럼 저장됨)
  • 일정 기간 동안의 업무 변화 내지는 발전의 추세 분석에 필요
    • 이력 데이터를 통해 시간 경과에 따른 데이터의 변화 과정 파악이 가능
  • 스냅샷 생성
    • 키 구조에 시간 요소를 추가하여 레코드 생성
    • 이벤트 발생 시점의 일자 또는 시간 저장
비휘발성

(Non Volatile)

  • 초기 데이터 적재 이후에는 데이터의 갱신은 발생하지 않고 검색만 있음(즉, 데이터 적재와 데이터 검색만 존재)
  • 데이터 변경이 발생하더라도 변경을 직접 반영하지 않고 스냅샷 형태로 반영
  • 장애 발생에 대한 데이터의 복구, 트랜잭션과 데이터의 무결성 유지, 교착상태의 탐지와 처리가 매우 단순함
  • 데이터 갱신 이상에 대한 고려가 불필요하고, 정규화 및 반정규화에 대한 융통성의 증가