테이블 인덱스: Difference between revisions

From CS Wiki
No edit summary
No edit summary
 
(One intermediate revision by the same user not shown)
Line 4: Line 4:
*그 이상의 데이터를 처리할 땐 성능상 오히려 불이익이 있을 수 있음
*그 이상의 데이터를 처리할 땐 성능상 오히려 불이익이 있을 수 있음


== 인덱스 적용 ==
==인덱스 적용==


===인덱스를 사용하는 경우===
===인덱스를 사용하는 경우===
Line 14: Line 14:
*NOT BETWEEN
*NOT BETWEEN


=== 인덱스가 사용되지 않는 경우 ===
===인덱스가 사용되지 않는 경우===


* NOT 연산자 사용
*NOT 연산자 사용
* IS NULL, IS NOT NULL
*IS NULL, IS NOT NULL
* [[데이터베이스 옵티마이저|옵티마이저]] 취사 선택
*[[데이터베이스 옵티마이저|옵티마이저]] 취사 선택
* Suppressing: 인덱스 칼럼에 변경을 가하는 경우
*인덱스 칼럼의 변형(Suppressing)
** '''External Suppressing''': 코딩상 적용된 서프레싱
**'''외부 변형(External Suppressing)''': 코딩상 적용된 서프레싱
*** WHERE SUBSTR(col, 1, 1) = 'C'  -- SUBSTR 대신 LIKE를 사용하면 인덱스 사용 가능
***WHERE SUBSTR(col, 1, 1) = 'C'  -- SUBSTR 대신 LIKE를 사용하면 인덱스 사용 가능
*** WHERE col1||col2 = 'COL1COL2'
***WHERE col1||col2 = 'COL1COL2'
*** WHERE TO_CHAR(date, 'YYYYMMDD')  -- DATE 타입 칼럼인 경우 TO_DATE 등으로 통일
***WHERE TO_CHAR(date, 'YYYYMMDD')  -- DATE 타입 칼럼인 경우 TO_DATE 등으로 통일
*** WHERE num * 12 > 100000  -- num > 100000/12 로 사용하면 인덱스 사용 가능
***WHERE num * 12 > 100000  -- num > 100000/12 로 사용하면 인덱스 사용 가능
** '''Internal Suppressing''': 데이터베이스 내부에서 이루어지는 서프레싱
**'''내부 변형(Internal Suppressing)''': 데이터베이스 내부에서 이루어지는 서프레싱
*** WHERE num1 > num2 + '100'  -- 타입 혼합
***WHERE num1 > num2 + '100'  -- 타입 혼합
*** WHERE regdate  = '20210809'
***WHERE regdate  = '20210809'


===인덱스 머지와 결합인덱스===
===인덱스 머지와 결합인덱스===
Line 36: Line 36:
**A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 더 높은 성능을 발휘
**A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 더 높은 성능을 발휘
**결합 인덱스를 구성하는 모든 칼럼이 사용되지 않고 첫번째 칼럼만 사용되어도 사용 가능
**결합 인덱스를 구성하는 모든 칼럼이 사용되지 않고 첫번째 칼럼만 사용되어도 사용 가능
=== 옵티마이저에 의한 인덱스 선택 ===
* '''(1단계)''' 매칭률 = WHERE절 첫번째 칼럼부터 연속하여 값을 '='로 비교하는 칼럼 수 / 인덱스를 구성하는 칼럼 총 개수
* '''(2단계)''' 1단계의 매칭률이 같은 경우 인덱스를 구성하는 칼럼의 개수가 많은 경우 선택
* '''(3단계)''' 1~2단계가 모두 같은 경우 가장 최근에 선택된 것을 우선 선택


==인덱스 선정 고려사항==
==인덱스 선정 고려사항==
Line 58: Line 64:
#기존 프로그램 변경
#기존 프로그램 변경


== 같이 보기 ==
==같이 보기==


* [[데이터베이스 옵티마이저]]
*[[데이터베이스 옵티마이저]]
* [[데이터베이스 인덱스]]
*[[데이터베이스 인덱스]]

Latest revision as of 22:03, 28 August 2021

데이터베이스에 저장된 자료를 더욱 빠르게 조회하기 위해 사용

  • 일반적으로 인덱스는 테이블 전체 데이터 중 10~15%의 데이터를 처리하는 경우 효율적
  • 그 이상의 데이터를 처리할 땐 성능상 오히려 불이익이 있을 수 있음

인덱스 적용[edit | edit source]

인덱스를 사용하는 경우[edit | edit source]

  • 고유(Unique) 인덱스 일치(Equal) 스캔
  • 고유(Unique) 인덱스 범위(Range) 스캔
  • 중복(Non-Unique) 인덱스 범위(Range) 스캔
  • OR / IN
  • NOT BETWEEN

인덱스가 사용되지 않는 경우[edit | edit source]

  • NOT 연산자 사용
  • IS NULL, IS NOT NULL
  • 옵티마이저 취사 선택
  • 인덱스 칼럼의 변형(Suppressing)
    • 외부 변형(External Suppressing): 코딩상 적용된 서프레싱
      • WHERE SUBSTR(col, 1, 1) = 'C' -- SUBSTR 대신 LIKE를 사용하면 인덱스 사용 가능
      • WHERE col1||col2 = 'COL1COL2'
      • WHERE TO_CHAR(date, 'YYYYMMDD') -- DATE 타입 칼럼인 경우 TO_DATE 등으로 통일
      • WHERE num * 12 > 100000 -- num > 100000/12 로 사용하면 인덱스 사용 가능
    • 내부 변형(Internal Suppressing): 데이터베이스 내부에서 이루어지는 서프레싱
      • WHERE num1 > num2 + '100' -- 타입 혼합
      • WHERE regdate = '20210809'

인덱스 머지와 결합인덱스[edit | edit source]

  • 인덱스 머지: A칼럼 인덱스와, B칼럼 인덱스가 각각 존재
    • A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 두 인덱스를 모두 활용하여 검색
  • 결합 인덱스: A칼럼+B칼럼 인덱스
    • A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 더 높은 성능을 발휘
    • 결합 인덱스를 구성하는 모든 칼럼이 사용되지 않고 첫번째 칼럼만 사용되어도 사용 가능

옵티마이저에 의한 인덱스 선택[edit | edit source]

  • (1단계) 매칭률 = WHERE절 첫번째 칼럼부터 연속하여 값을 '='로 비교하는 칼럼 수 / 인덱스를 구성하는 칼럼 총 개수
  • (2단계) 1단계의 매칭률이 같은 경우 인덱스를 구성하는 칼럼의 개수가 많은 경우 선택
  • (3단계) 1~2단계가 모두 같은 경우 가장 최근에 선택된 것을 우선 선택

인덱스 선정 고려사항[edit | edit source]

  • 기존 프로그램의 영향도
  • 모든 테이블에 대한 Access Path
  • 인덱스 칼럼 분포도
  • Critical Access Path 및 우선순위
  • 인덱스 칼럼의 조합 및 순서
  • 인덱스 추가에 대한 DML 속도 저하
  • 개별 칼럼의 분포가 좋지 않은 경우에도 결합 인덱스 검토

변경 절차[edit | edit source]

규모가 있는 기업에서 DBA가 인덱스 변경을 맡아서 수행하는 경우를 상정

  1. 수요 발생
    • 데이터 증가, 조인 조건 변경에 다른 속도 저하
    • 개발자의 요청 등
  2. 인덱스 변경
  3. 기존 프로그램 동작 영향성 검토
  4. 인덱스 변경 공지
  5. 기존 프로그램 변경

같이 보기[edit | edit source]