python/machine learning
[K-MOOC] 통계학의 이해, 상관관계에 관한 인사이트
incastle
2020. 4. 4. 16:13
표본 공분산의 문제점
- 측정 단위에 영향을 받기 때문에 그 값 자체로 선형 관계의 정도를 알 수는 없음
- 반대로 생각하면 측정 단위가 중요하면 공분산을 사용하는 게 옳을 수 있다.
표본 상관관계
- r이 0이면 상관관계가 없다고 함
- 상관관계가 없다는 것은 아무런 관계가 없다는 것은 아니다.
- '선형' 상관관계가 없을 뿐, 다른 관계가 있을 수 있다.
- 또한 상관관계는 인과관계가 아니다.
- 실제로는 관계가 없는데 잠복 변수를 통해서 발생할 수 있다.
잠복 변수
- 두 변수에 영향을 주는 변수
통합된 그룹의 상관관계
- 데이터 안에 그룹이 지어져 있다면, 적절히 그룹을 나눠서 상관관계 분석을 실시해야 한다.