테이블 인덱스

From CS Wiki

데이터베이스에 저장된 자료를 더욱 빠르게 조회하기 위해 사용

  • 일반적으로 인덱스는 테이블 전체 데이터 중 10~15%의 데이터를 처리하는 경우 효율적
  • 그 이상의 데이터를 처리할 땐 성능상 오히려 불이익이 있을 수 있음

인덱스 적용[edit | edit source]

인덱스를 사용하는 경우[edit | edit source]

  • 고유(Unique) 인덱스 일치(Equal) 스캔
  • 고유(Unique) 인덱스 범위(Range) 스캔
  • 중복(Non-Unique) 인덱스 범위(Range) 스캔
  • OR / IN
  • NOT BETWEEN

인덱스가 사용되지 않는 경우[edit | edit source]

  • NOT 연산자 사용
  • IS NULL, IS NOT NULL
  • 옵티마이저 취사 선택
  • 인덱스 칼럼의 변형(Suppressing)
    • 외부 변형(External Suppressing): 코딩상 적용된 서프레싱
      • WHERE SUBSTR(col, 1, 1) = 'C' -- SUBSTR 대신 LIKE를 사용하면 인덱스 사용 가능
      • WHERE col1||col2 = 'COL1COL2'
      • WHERE TO_CHAR(date, 'YYYYMMDD') -- DATE 타입 칼럼인 경우 TO_DATE 등으로 통일
      • WHERE num * 12 > 100000 -- num > 100000/12 로 사용하면 인덱스 사용 가능
    • 내부 변형(Internal Suppressing): 데이터베이스 내부에서 이루어지는 서프레싱
      • WHERE num1 > num2 + '100' -- 타입 혼합
      • WHERE regdate = '20210809'

인덱스 머지와 결합인덱스[edit | edit source]

  • 인덱스 머지: A칼럼 인덱스와, B칼럼 인덱스가 각각 존재
    • A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 두 인덱스를 모두 활용하여 검색
  • 결합 인덱스: A칼럼+B칼럼 인덱스
    • A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 더 높은 성능을 발휘
    • 결합 인덱스를 구성하는 모든 칼럼이 사용되지 않고 첫번째 칼럼만 사용되어도 사용 가능

옵티마이저에 의한 인덱스 선택[edit | edit source]

  • (1단계) 매칭률 = WHERE절 첫번째 칼럼부터 연속하여 값을 '='로 비교하는 칼럼 수 / 인덱스를 구성하는 칼럼 총 개수
  • (2단계) 1단계의 매칭률이 같은 경우 인덱스를 구성하는 칼럼의 개수가 많은 경우 선택
  • (3단계) 1~2단계가 모두 같은 경우 가장 최근에 선택된 것을 우선 선택

인덱스 선정 고려사항[edit | edit source]

  • 기존 프로그램의 영향도
  • 모든 테이블에 대한 Access Path
  • 인덱스 칼럼 분포도
  • Critical Access Path 및 우선순위
  • 인덱스 칼럼의 조합 및 순서
  • 인덱스 추가에 대한 DML 속도 저하
  • 개별 칼럼의 분포가 좋지 않은 경우에도 결합 인덱스 검토

변경 절차[edit | edit source]

규모가 있는 기업에서 DBA가 인덱스 변경을 맡아서 수행하는 경우를 상정

  1. 수요 발생
    • 데이터 증가, 조인 조건 변경에 다른 속도 저하
    • 개발자의 요청 등
  2. 인덱스 변경
  3. 기존 프로그램 동작 영향성 검토
  4. 인덱스 변경 공지
  5. 기존 프로그램 변경

같이 보기[edit | edit source]