상관관계 분석

From CS Wiki
Revision as of 07:56, 12 December 2020 by 빅터기사 (talk | contribs)
Correlation

한 변수와 다른 변수가 함께 변하는 함수관계

방향성과 강도

  • 방향성
    • 양의 상관관계: X가 증가할 때 Y가 증가
    • 음의 상관관계: X가 증가할 때 Y가 감소
  • 강도
    • 상관관계의 강하고 약하고의 정도
    • 강한 상관관계일수록 공분산, 또는 상관계수의 크기가 큼
    • 약한 상관관계일수록 공분산, 또는 상관계수의 크기가 작음

공분산과 상관계수

공분산

Covariance 2개의 변수 사이의 상관 정도로, 범위의 영향을 크게 받음

  • COV(X,Y) = E(X-μx)(Y-μy)
  • 양의 상관이면 공분산이 +로 점점 더 커짐
  • 음의 상관이면 공분산이 -로 점점 더 작아짐
  • 상관이 없으면 0에 가까움
  • 범위의 영향이 적도록 표준화한 것이 상관계수

상관계수

Correlation Coefficient

  • 일반적으로 -1 ~ +1까지의 범위로 나타남
  • 1인 경우: 완벽한 양의 상관관계
  • -1인 경우: 완벽한 음의 상관관계
  • 0인 경우: 상관관계가 없음

변수의 수

  • 단순상관분석: 2개의 변수 간 상관관계 분석
  • 다중상관분석: 3개 이상의 변수 간 상관간계 분석
  • 편상관계분석: 다중상관분석에서 다른 변수와의 관계를 고정하고 나머지 두 변수 간 상관관계 분석

상관관계와 인과관계

상관관계는 단순히 변수간 선형 상관성을 의미할 뿐, 인과관계로 볼 수는 없다

  • 인과관계: 원인과 결과의 관계
    • ex) 저녁을 먹었기 때문에 배가 부르다
  • 상관관계: 변수간의 선형 상관성
    • ex) 저녁을 먹는 양에 따라 배 부른 정도가 증가한다.