python/machine learning

[K-MOOC] 통계학의 이해, 상관관계에 관한 인사이트

incastle 2020. 4. 4. 16:13

표본 공분산의 문제점

- 측정 단위에 영향을 받기 때문에 그 값 자체로 선형 관계의 정도를 알 수는 없음

- 반대로 생각하면 측정 단위가 중요하면 공분산을 사용하는 게 옳을 수 있다. 

 

표본 상관관계

- r이 0이면 상관관계가 없다고 함

- 상관관계가 없다는 것은 아무런 관계가 없다는 것은 아니다.

- '선형' 상관관계가 없을 뿐, 다른 관계가 있을 수 있다.

이런 관계 일 때!

- 또한 상관관계는 인과관계가 아니다.

- 실제로는 관계가 없는데 잠복 변수를 통해서 발생할 수 있다.

 

잠복 변수

- 두 변수에 영향을 주는 변수

 

통합된 그룹의 상관관계

- 데이터 안에 그룹이 지어져 있다면, 적절히 그룹을 나눠서 상관관계 분석을 실시해야 한다.