데이터 표준화: Difference between revisions

From CS Wiki
No edit summary
No edit summary
 
Line 1: Line 1:
[[분류:데이터베이스]]
[[분류:데이터베이스]]
;Data Standardization
;Data Standardization
시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 작업
시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 작업
* 적용 범위에 따라서 업계, 또는 국가가 대상이 될 수도 있음


== 필요성 ==
*적용 범위에 따라서 업계, 또는 국가가 대상이 될 수도 있음
 
==필요성==
{| class="wikitable"
{| class="wikitable"
|-
|-
! 문제점 !! 원인
!문제점!!원인
|-
|-
|  
|
* 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
*데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
* 데이터에 파악 지연으로 정보 제공의 적시성 결여
*데이터에 파악 지연으로 정보 제공의 적시성 결여
* 데이터 통합의 어려움
*데이터 통합의 어려움
* 정보시스템 변경 및 유지보수 곤란
*정보시스템 변경 및 유지보수 곤란
||
||
* 동시 다발적인 정보시스템 개발
*동시 다발적인 정보시스템 개발
* 전사 데이터 관리 마인드 미형성
*전사 데이터 관리 마인드 미형성
* 전사 데이터 관리 인력 부재
*전사 데이터 관리 인력 부재
* 전사 데이터 표준 관리 도구 부재
*전사 데이터 표준 관리 도구 부재
|-
|-
! colspan="2" | 개선 방안
! colspan="2" |개선 방안
|-
|-
| colspan="2" |
| colspan="2" |
* 데이터 표준화, 규격화를 위한 기본 방침 설정
*데이터 표준화, 규격화를 위한 기본 방침 설정
* 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
*전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
* 전사적인 데이터 요소 등록 및 관리 체계 구축
*전사적인 데이터 요소 등록 및 관리 체계 구축
|}
|}


== 기대 효과 ==
==기대 효과==
* 명칭의 통일로 인한 명확한 의사소통의 증대
 
* 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
*명칭의 통일로 인한 명확한 의사소통의 증대
* 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
*필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
* 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소
*일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
*정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소
 
==표준화 요소==
===[[데이터 명칭]]===
표준화 요구사항
{| class="wikitable"
!특성
!요구사항
|-
|'''고유성'''
|
* 특정 데이터 개념을 표현하는 데이터의 명칭은 다른 개념을 표현하는 명칭과 동일하지 않은 값이어야 함
|-
|'''규칙성'''
|
* 데이터 명칭을 구성하는 용어·단어들은 통일된 규칙을 가져야 함
* 용어의 축약, 나열 순서 등이 통일되지 않을 경우 같은 의미를 가진 중복된 데이터 명칭이 혼용될 수 있음
|-
|'''보편성'''
|
* 데이터 명칭은 데이터를 취급하는 관점에서 보편타당하게 인지되어야 함
* 데이터 명칭 구성 시 업무에서 보편적으로 사용되는 표현을 차용해야 함
|-
|'''충분성'''
|
* 데이터의 명칭은 데이터 개념을 충분히 표현할 수 있도록 구체적이어야 함
* 처음부터 충분성을 고려하지 않고 명칭을 표준화할 경우 향후 데이터가 다양해질수록 유일성이 위배 될 가능성 증가
|}
 
===데이터 정의===
 
*데이터가 의미하는 범위 및 자격 요건
 
===데이터 형식===
 
*Numeric
*Text
*Date
*Char
*Timestamp
 
===데이터 규칙===
 
*기본 값
*허용 값
*허용 범위


== 표준화 요소 ==
==표준화 구성==
=== 데이터 명칭 ===
===데이터 표준===
* 유일성
* 업무적 관점의 보편
* 의미 전달의 충분성


=== 데이터 정의 ===
*'''단어''': 금지 단어, 표준 단어
* 데이터가 의미하는 범위 및 자격 요건
**금지 단어: 손님, 휴대폰, 스마트폰
**표준 단어: 고객, 핸드폰
**단어 사전: 고유코드, 한글명: 고객, 영문명: Customer, 영문 약어명: CUST
*'''용어''': 단어의 조합, 조합 규칙
**고객 휴대폰 번호 → 고객_핸드폰_번호 → CUST_CPHONE_NO, custCphoneNo
*'''도메인''': 용어, 단어의 분류
**주소: 고객 주소, 직장 주소, 수령지 주소
**연락처: 집전화번호, 핸드폰번호, 팩스번호
*'''코드''': 코드 분류, 코드 값
**코드 분류: 담보 구분코드
**코드 값: 11-주택, 12-토지, 21-자동차, 22-기타기계


=== 데이터 형식 ===
===데이터 표준 조직===
* Numeric
* Text
* Date
* Char
* Timestamp


=== 데이터 규칙 ===
*전사 데이터 관리자
* 기본 값
*업무 데이터 관리자
* 허용 값
*업무 시스템 데이터 관리자
* 허용 범위


== 표준화 구성 ==
===데이터 표준 절차===
=== 데이터 표준 ===
* '''단어''': 금지 단어, 표준 단어
** 금지 단어: 손님, 휴대폰, 스마트폰
** 표준 단어: 고객, 핸드폰
** 단어 사전: 고유코드, 한글명: 고객, 영문명: Customer, 영문 약어명: CUST
* '''용어''': 단어의 조합, 조합 규칙
** 고객 휴대폰 번호 → 고객_핸드폰_번호 → CUST_CPHONE_NO, custCphoneNo
* '''도메인''': 용어, 단어의 분류
** 주소: 고객 주소, 직장 주소, 수령지 주소
** 연락처: 집전화번호, 핸드폰번호, 팩스번호
* '''코드''': 코드 분류, 코드 값
** 코드 분류: 담보 구분코드
** 코드 값: 11-주택, 12-토지, 21-자동차, 22-기타기계


=== 데이터 표준 조직 ===
*데이터 표준화 요구 사항수집
* 전사 데이터 관리자
*데이터 표준 정의
* 업무 데이터 관리자
*데이터 표준 확정
* 업무 시스템 데이터 관리자
*데이터 표준 관리


=== 데이터 표준 절차 ===
==참고 문헌==
* 데이터 표준화 요구 사항수집
* 데이터 표준 정의
* 데이터 표준 확정
* 데이터 표준 관리


== 참고 문헌 ==
*[http://www.dbguide.net/db.db?cmd=view&boardUid=12803&boardConfigUid=9&categoryUid=216&boardIdx=30&boardStep=1 디비가이드넷]
* [http://www.dbguide.net/db.db?cmd=view&boardUid=12803&boardConfigUid=9&categoryUid=216&boardIdx=30&boardStep=1 디비가이드넷]

Latest revision as of 23:20, 29 March 2021


Data Standardization

시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 작업

  • 적용 범위에 따라서 업계, 또는 국가가 대상이 될 수도 있음

필요성[edit | edit source]

문제점 원인
  • 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
  • 데이터에 파악 지연으로 정보 제공의 적시성 결여
  • 데이터 통합의 어려움
  • 정보시스템 변경 및 유지보수 곤란
  • 동시 다발적인 정보시스템 개발
  • 전사 데이터 관리 마인드 미형성
  • 전사 데이터 관리 인력 부재
  • 전사 데이터 표준 관리 도구 부재
개선 방안
  • 데이터 표준화, 규격화를 위한 기본 방침 설정
  • 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
  • 전사적인 데이터 요소 등록 및 관리 체계 구축

기대 효과[edit | edit source]

  • 명칭의 통일로 인한 명확한 의사소통의 증대
  • 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
  • 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
  • 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소

표준화 요소[edit | edit source]

데이터 명칭[edit | edit source]

표준화 요구사항

특성 요구사항
고유성
  • 특정 데이터 개념을 표현하는 데이터의 명칭은 다른 개념을 표현하는 명칭과 동일하지 않은 값이어야 함
규칙성
  • 데이터 명칭을 구성하는 용어·단어들은 통일된 규칙을 가져야 함
  • 용어의 축약, 나열 순서 등이 통일되지 않을 경우 같은 의미를 가진 중복된 데이터 명칭이 혼용될 수 있음
보편성
  • 데이터 명칭은 데이터를 취급하는 관점에서 보편타당하게 인지되어야 함
  • 데이터 명칭 구성 시 업무에서 보편적으로 사용되는 표현을 차용해야 함
충분성
  • 데이터의 명칭은 데이터 개념을 충분히 표현할 수 있도록 구체적이어야 함
  • 처음부터 충분성을 고려하지 않고 명칭을 표준화할 경우 향후 데이터가 다양해질수록 유일성이 위배 될 가능성 증가

데이터 정의[edit | edit source]

  • 데이터가 의미하는 범위 및 자격 요건

데이터 형식[edit | edit source]

  • Numeric
  • Text
  • Date
  • Char
  • Timestamp

데이터 규칙[edit | edit source]

  • 기본 값
  • 허용 값
  • 허용 범위

표준화 구성[edit | edit source]

데이터 표준[edit | edit source]

  • 단어: 금지 단어, 표준 단어
    • 금지 단어: 손님, 휴대폰, 스마트폰
    • 표준 단어: 고객, 핸드폰
    • 단어 사전: 고유코드, 한글명: 고객, 영문명: Customer, 영문 약어명: CUST
  • 용어: 단어의 조합, 조합 규칙
    • 고객 휴대폰 번호 → 고객_핸드폰_번호 → CUST_CPHONE_NO, custCphoneNo
  • 도메인: 용어, 단어의 분류
    • 주소: 고객 주소, 직장 주소, 수령지 주소
    • 연락처: 집전화번호, 핸드폰번호, 팩스번호
  • 코드: 코드 분류, 코드 값
    • 코드 분류: 담보 구분코드
    • 코드 값: 11-주택, 12-토지, 21-자동차, 22-기타기계

데이터 표준 조직[edit | edit source]

  • 전사 데이터 관리자
  • 업무 데이터 관리자
  • 업무 시스템 데이터 관리자

데이터 표준 절차[edit | edit source]

  • 데이터 표준화 요구 사항수집
  • 데이터 표준 정의
  • 데이터 표준 확정
  • 데이터 표준 관리

참고 문헌[edit | edit source]