관계 대수

From CS Wiki

Relational Algebra

관계 대수는 관계형 데이터베이스에서 데이터를 조회하고 조작하기 위한 수학적 언어를 말한다. 관계 대수는 테이블(관계)에 대한 여러 가지 연산을 정의하며, 이러한 연산을 통해 데이터를 필터링하고 조합할 수 있다.

개요[edit | edit source]

  • 릴레이션 조작을 위한 연산의 집합으로 피연산자와 결과가 모두 릴레이션이다.
  • 일반 집합 연산과 순수 관계 연산으로 구분된다.
  • 질의에 대한 해를 구하기 위해 수행해야 할 연산의 순서를 명시한다.
  • 원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절차적 특징을 가지고 있다.
  • 기본적으로 관계해석과 관계대수는 관계 데이터베이스를 처리하는 기능과 능력 면에서 동일하다.

요약[edit | edit source]

순수 관계 연산자[edit | edit source]

연산자 기호 표기법 설명 예시
SELECT δ(시그마) δ<조건>(R) 선택 조건, 열 조회 δDNO=4(EMP)
PROJECT π(파이) π<리스트>(R) 속성 선택, 행 조회 πDNO,NAME(EMP)
JOIN ⋈(보타이) R⋈<조건>S 두 릴레이션 결합 DEPT⋈dssn=essn EMP
DIVISION ÷(나누기) R÷S R 중 S 기준 교집합 EMP÷DEPT

일반 집합 연산자[edit | edit source]

연산자 표기법 집합 표현 카디널리티
합집합 R∪S = {t|t∈R∨t∈S} |R∪S|≤|R|+|S|
교집합 R∩S = {t|t∈R∧t∈S} |R∩S|≤MIN(|R|,|S|)
차집합 - R-S = {t|t∈R∧t∉S} |R-S|≤|R|
교차곱(=카티션 프로덕트, 크로스 조인) × R×S = {rs|r∈R∧s∈S} |R×S|=|R|×|S|

설명[edit | edit source]

DIVISION[edit | edit source]

DIVISION, 즉 DIVIDE 연산은 관계 대수(Relational Algebra)에서 특정 조건을 만족하는 모든 값을 가지는 튜플을 찾는 데 사용되는 연산이다. 특히, 이 연산은 "A가 B의 모든 조건을 만족하는가?"와 같은 상황을 처리하는 데 유용하다. 예를 들어, 모든 과목을 들은 학생이나 모든 상품을 구매한 고객을 찾는 문제에서 사용할 수 있다.

Divide 연산의 기본 개념

  • R ÷ S는 R의 속성 중 S의 속성들과 일치하는 속성들을 기준으로 나눈다는 의미이다.
  • R은 피제수(dividend)라고 하며, 이 관계는 전체 데이터가 포함되어 있다.
  • S는 제수(divisor)라고 하며, 이 관계는 조건을 나타낸다.
  • R ÷ S의 결과는 S에 있는 모든 값과 일치하는 R의 튜플들을 반환한다.

예시

  • R(학생 이름, 과목): 학생이 수강한 과목 정보 릴레이션
  • S(과목): 특정 과목들의 릴레이션 (예: {과목: 수학, 과학})
  • 우리는 S에 있는 모든 과목을 들은 학생들을 찾고자 한다.
R DIVIDED-BY S R÷S
학생 이름 과목
Alice 수학
Alice 영어
Bob 수학
Bob 과학
Charlie 수학
Charlie 영어
Charlie 과학
÷
과목
수학
영어
학생 이름
Alice
Charlie

집계 및 그룹 함수[edit | edit source]

Aggregate Functions and Grouping

원래 그룹핑과 집계는 관계 대수에서 지원되지 않는다. 하지만 DB에서 흔하게 사용되는 SUM, AVERAGE, MAXIMUM, MINIMUM, COUNT 등을 표현하기 위해 후대에 생겨났다. 표현법은 아래와 같다.

<그루핑 속성><집계 함수> (R)

예를 들어 SUM과 COUNT를 표현하려면 아래와 같이 할 수 있다.

SELECT SUM(RECORD) FROM EMP_PERFORM GROUP BY SSN -- 사람으로 묶여서 RECORD의 합을 구한다 SSNSUM RECORD (EMP_PERFORM)

SELECT COUNT(RECORD_NO) FROM EMP_PERFORM -- 특정 그룹핑 기준이 없을 경우 ℑ COUNT RECORD_NO (EMP_PERFORM)

현대 SQL에서의 GROUP BY와 같이 집계 결과와, 집계 기준이 되는 속성만 SELECT를 할 수 있다. 집계된 결과들은 그 자체로 속성 명이 없기 때문에 별도로 부여할 수 있다. 새롭게 정의하는 속성명으로 구성된 집합을 만드는 것이다.

ρR(Dno, No_of_employees, Average_sal) (DnoCOUNT Ssn, AVERAGE Salary (EMPLOYEE))

예시[edit | edit source]

아래 두 릴레이션을 사용하여 몇 가지 관계 대수 연산의 예를 살펴본다.

1. EMPLOYEE 테이블

Ssn Name Age Dept_no
123-45-6789 Alice 30 1
234-56-7890 Bob 40 2
345-67-8901 Charlie 35 1
456-78-9012 David 28 3
567-89-0123 Eva 50 2

2. DEPARTMENT 테이블

Dept_no Dept_name
1 HR
2 IT
3 Finance

예시 1: 선택 조건 (Selection)

조건: 나이가 30세 이상인 직원의 정보를 선택한다.

관계 대수:

σ(Age ≥ 30)(EMPLOYEE)

결과:

Ssn Name Age Dept_no
123-45-6789 Alice 30 1
234-56-7890 Bob 40 2
345-67-8901 Charlie 35 1
567-89-0123 Eva 50 2

예시 2: 속성 선택 (Projection)

  • 쿼리: 직원의 이름과 나이만 선택한다.
  • 관계 대수:

    π(Name, Age)(EMPLOYEE)

  • 결과:
Name Age
Alice 30
Bob 40
Charlie 35
David 28
Eva 50

예시 3: 선택 조건과 선택 속성 (Selection and Projection)

  • 쿼리: 나이가 40세 이상인 직원의 이름만 선택한다.
    • 조건을 먼저 정하고 선택된 결과 중 속성을 선택하는 것이 일반적이다.
  • 관계 대수:

    π(Name, Age)(Age ≥ 40)(EMPLOYEE))

  • 결과:
Name
Bob
Eva

예시 3: 조인 (Join)

  • 쿼리: 각 직원의 이름과 소속 부서 이름을 함께 출력한다.
  • 관계 대수:

    EMPLOYEE ⨝ (EMPLOYEE.Dept_no = DEPARTMENT.Dept_no) DEPARTMENT

  • 결과:
Ssn Name Age Dept_no Dept_name
123-45-6789 Alice 30 1 HR
234-56-7890 Bob 40 2 IT
345-67-8901 Charlie 35 1 HR
456-78-9012 David 28 3 Finance
567-89-0123 Eva 50 2 IT

관계대수와 관계해석 비교[edit | edit source]

구분 관계 대수 관계 해석
예시 δLev=4(EMP) EMP(t) and t.Lev>3 }
목적 어떻게(How) 무엇을(What)
기반 집합과 관계연산 프레디킷 논리
접근법 절차적 비절차적
관점 규범적 기술적
표현력 동일

같이 보기[edit | edit source]