ETT: Difference between revisions
From CS Wiki
(새 문서: ;Extraction, Transformation, Transportation * Extraction: 추출 * Transformation: 가공 * Transportation: 전송 == ETT의 단계 === * 추출 ** 원본 파일과 트랜잭션 데...) |
No edit summary |
||
Line 5: | Line 5: | ||
* Transportation: 전송 | * Transportation: 전송 | ||
== ETT의 단계 === | == ETT의 단계 == | ||
{| class="wikitable" | |||
|- | |||
! 단계 !! 내용 | |||
|- | |||
| 추출 | |||
|| | |||
* 원본 파일과 트랜잭션 데이터베이스로부터 데이터 웨어하우스에 저장될 데이터를 추출하는 과정 | |||
* 추출의 기준이 명확해야 함 | |||
* 초기 추출(Migration) : 데이터 웨어하우스에 최초로 데이터를 구축할 때 이용 | |||
* 주기적 추출(Batch) : 데이터 웨어하우스 초기 추출 이후에 일/월 단위의 주기적인 보완 | |||
|- | |||
| 가공 | |||
|| | |||
* 질적으로 문제가 있는 데이터에 대해 데이터 정제(Cleansing) 기법을 이용 | |||
* 열(Column) 수준 : 각 도메인의 값들에 대한 정제 | |||
* 레코드 수준 : 셀렉션(Selection), 조인(Join), 집단화 기능을 이용 | |||
|- | |||
| 전송 | |||
|| | |||
* 선택된 데이터를 데이터 웨어하우스에 전송해서 저장하고, 필요한 색인을 작성 | |||
|} |
Revision as of 08:06, 10 October 2019
- Extraction, Transformation, Transportation
- Extraction: 추출
- Transformation: 가공
- Transportation: 전송
ETT의 단계
단계 | 내용 |
---|---|
추출 |
|
가공 |
|
전송 |
|