분산 데이터베이스

From CS Wiki
Revision as of 23:46, 13 July 2022 by Dmlee89 (talk | contribs) (→‎장단점)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Distribute Database
물리적으로 분산되어 있는 데이터를 네트워크를 통해 논리적으로 동일한 시스템에서 하나의 데이터베이스처럼 이용하는 기술, 그 기술로 구현된 데이터베이스

장단점[edit | edit source]

장점 단점
  • 지역 자치성, 점증적 시스템 확장
  • 신뢰성과 가용성
  • 효용성과 융통성
  • 빠른 응답속도와 통신비용 절감
  • 데이터의 가용성과 신뢰성 증가
  • 시스템 규모의 적절한 조절
  • 각 지역 사용자의 요구 수용
  • 소프트웨어 개발 비용 증가
  • 오류의 잠재성 증대
  • 처리 비용의 증대
  • 설계, 관리의 복잡성과 비용 증대
  • 불규칙한 응답 속도
  • 통제의 어려움
  • 데이터 무결성에 대한 위협

투명성 조건[edit | edit source]

분산데이터베이스는 6가지 투명성(Transparency)을 만족해야 한다.[1]
  1. 분할 투명성 : 하나의 논리적 Relation이 여러 단편으로 분할되어 각 단편의 사본이 여러 site에 저장
  2. 위치 투명성 : 사용하려는 데이터의 저장 장소 명시 불필요. 위치정보가 시스템 카탈로그에 유지되어야 함
  3. 지역사상 투명성 : 지역DBMS와 물리적 DB사이의 Mapping 보장. 각 지역시스템 이름과 무관한 이름 사용 가능
  4. 중복 투명성 : DB 객체가 여러 site에 중복 되어 있는지 알 필요가 없는 성질
  5. 장애 투명성 : 구성요소(DBMS 등)의 장애에 무관한 트랜잭션의 원자성 유지
  6. 병행 투명성 : 다수 트랜잭션 동시 수행시 결과의 일관성 유지, Time Stamp, 2PL 구현

분산 유형[edit | edit source]

테이블 위치 분산[edit | edit source]

  • 본사 IDC: 자재 DB, 파트너 DB, 부서 DB
  • 지사 IDC: 생산 DB, 판매 DB, 직원 DB

테이블 수평 분할[edit | edit source]

  • 본사 IDC: 최근 7일을 제외한 전체 이력 데이터베이스
  • 지사 IDC: 최근 7일 데이터베이스

테이블 수직 분할[edit | edit source]

  • 본사 IDC: 제품 번호, 생산 원가
  • 지사 IDC: 제품 번호, 재고량, 판매가

테이블 복제[edit | edit source]

  • 부분 복제: 본사의 제품 DB중 지사에서 판매하는 제품만 복제하여 지사 DB로 활용
  • 광역 복제: 지사에 본사의 제품 DB를 그대로 복사하여두고 사용

테이블 요약[edit | edit source]

  • 분석 요약: 지사1, 지사2의 실적 DB를 분석한 결과를 본사 DB에 저장
  • 통합 요약: 지사1, 지사2의 실적 DB를 통합한 DB를 본사에 저장

관련 개념[edit | edit source]

  • 2단계 커밋: 분산 데이터베이스 환경에서 안전한 커밋을 위한 단계 분할 커밋 기법
  • CAP 이론: 분산 데이터베이스의 속성

참고 문헌[edit | edit source]