2012/02/10 14:23

자료 바로읽기 - 상관관계와 인과관계 (1) 논리와사고

 안녕하세요 커티군입니다.

 논리와사고 카테고리에 마지막으로 글을 쓴지 어느새 일주일이 지났네요. 이번 방학 안에 관련 내용을 다 정리하고 싶은데 글쎄, 잘 될지 모르겠네요.

 지난번에는 논리적 오류 피하기 시리즈를 정리했었습니다. 이번에는 이와 비슷하지만 조금 다른 시리즈를 시작해 보려 합니다. 사실(Fact)를 정확히 파악하기 위한 첫 걸음, 자료 바로읽기 시리즈입니다.



 자료 바로읽기 - 상관관계와 인과관계 (1)

 상관관계(Correlation)와 인과관계(Causation)의 차이점은 많은 사람들이 알고 있습니다. 하지만 자료나 글 속에서 이 둘을 정확하게 구분해 내는 일은 쉽지 않습니다. 왜냐하면 글이나 자료 속에서 이 둘을 가르는 논리 구조가 쉽게 보이지 않기 때문이고, 선입견에 빠져 상관관계를 인과관계로 착각하기 쉬우며, 악의적인 왜곡에 의해 둘의 차이점이 무시되기 쉽기 때문입니다.

 먼저 상관관계와 인과관계를 간단한 설명과 예시를 통해 소개하고, 마지막에 이 둘을 구별하는 좋은 방법을 하나 소개하고자 합니다.


 상관관계(Correlation)은 요인A와 요인B가 나란한 움직임을 보일 때 그 둘의 관계를 지칭하는 표현입니다. 두 요인이 나란히 증가하거나, 나란히 감소하거나, 한쪽이 증가할 때 한쪽이 감소하거나, 한쪽이 감소할 때 한쪽이 증가하는 관계가 지속될 때, 우리는 두 요인이 상관관계에 있다고 말합니다.

 대표적인 예로는 다음과 같은 것들이 있습니다.


아이스크림의 판매량과 상어에게 공격받은 피서객의 숫자

코스피 지수와 여성의 치마 길이


 이 둘은 모두 나란히 증가하거나 감소하는 양의 상관관계에 있습니다. 특히 주식시장과 여성의 치마 길이는 상당한 관계가 있다고 알려져 있습니다. 이에 대한 자세한 설명은 잠시 밀어두겠습니다.


 인과관계(Causation)은 요인 A와 요인 B가 서로 원인과 결과의 관계에 묶여 있을 때 그 둘의 관계를 지칭하는 표현입니다. 요인 A에 의해 요인 B가 영향을 받거나, 요인 B에 의해 요인 A가 영향을 받을 때, 우리는 두 요인이 인과관계에 있다고 말합니다.

 대표적이 예로는 다음과 같은 것들이 있습니다.


교통사고 당사자의 출혈량과 생존률

일조량과 농작물의 수확량


 이 둘은 출혈량이 생존률의 원인이 되며, 일조량이 농작물의 수확량의 원인이 되는 인과관계에 놓여 있습니다. 인과관계는 더 단순한 요인들, 예를 들면 컴퓨터의 전원 버튼을 누르는 행위와 컴퓨터가 켜지는 결과 등도 포함하고 있습니다.


 그렇다면 이 둘을 명확하게 가르는 논리적 구조는 어디에 있을까요? 둘의 논리적 차이점은 한 쪽이 반대쪽의 직접적인 원인이 되느냐 마느냐에 있습니다. 인과관계는 원인이 결과를 이끌어내는 방향을 가지고 있습니다. 이 방향성은 일방통행으로써, 결론이 원인을 이끌어 낼 수 없습니다. 하지만 상관관계에는 이러한 직접적인 원인-결과 관계가 없습니다. 위의 예시를 다시 살펴보겠습니다.


아이스크림의 판매량과 상어에게 공격받은 피서객의 숫자


 이 둘은 양의 상관관계에 놓여 있습니다. 게다가 둘은 같은 원인-여름에는 날이 덥다-을 공유하고 있지요. 하지만 인위적으로 아이스크림의 판매량을 끌어 올린다고 해서 상어에게 공격받은 피서객의 숫자가 늘어나지 않습니다. 역으로, 상어에게 공격받은 피서객의 숫자를 인위적으로 늘린다고 해서 아이스크림의 판매량이 늘어나지 않습니다. 즉, 둘 사이에 직접적인 원인-결과 관계가 존재하지 않습니다. 같은 방식으로 인과관계의 예시도 다시 살펴봅시다.


교통사고 당사자의 출혈량과 생존률


 교통사고를 당한 사람의 출혈량을 의도적으로 늘린다면 그 사람의 생존률은 심각하게 떨어질 것입니다. 하지만 그 역은 어떨까요? 생존률을 억지로 끌어 올렸다고 해서, 그 사람의 출혈량이 줄어들지는 않습니다. 즉, 출혈량과 생존률은 직접적인 원인-결과 관계가 존재하며, 출혈량은 반드시 원인이며 생존률은 반드시 결과여야만 합니다.

 이렇듯 상관관계는 두 요인 사이에 그 어떠한 직접적인 원인-결과 관계도 보이지 않습니다. 반면, 인과관계는 반드시 두 요인 사이에 하나의 직접적인 원인-결과 관계를 보여주며, 그 방향성은 역으로 갈 수 없습니다. 이 직접적인 원인-결과 관계가 둘을 구분짓는 가장 큰 요소입니다.


 다음 포스팅에서는 상관관계가 가질 수 있는 관계들에 대해 살펴보겠습니다.

덧글

  • 지나가다 2012/02/10 18:14 # 삭제 답글

    상관관계는 인과관계의 상위개념입니다... 상관관계에선 방향성이 있을 수도 있고 없을 수도 있죠. 방향성 유무를 따지지 않습니다...
  • 커티군 2012/02/10 19:30 #

    으앜! 감사합니다. 직접적인 인과관계와 방향성을 헷갈렸네요.
  • 나츠메 2012/02/10 23:18 # 답글

    상관관계는 둘 이상의 '변인'간의 관련성을 나타내는 말입니다. 따라서 방향성이 존재하는지, 존재한다면 방향성이 어떻게 작용하는 지 따지지 않습니다. 그리고 이 같은 상관도를 객관화시킨 수치로 나타내는 것이 상관계수입니다.
댓글 입력 영역