2011/03/30 11:46

[이오공감] 전쟁보다 고속도로가 위험하다? - 통계의 함정 과학이야기

원전 던지기 by.아이추판다 에서 트랙백





 1+1은 무엇일까?

 예전에 1+1의 답을 구하는 개그가 있었다. 일반인은 "2 입니다" 라고 대답하지만, 통계학자들은 갑자기 커튼을 치더니 나즈막한 목소리로 "1+1이 무엇이 되기를 원하십니까?" 라고 물어본다는 개그였다.

 위 개그는 통계를 잘 조작하면 자신이 원하는 대답을 만들어 낼 수 있다는 것을 풍자한 것이다. 실제로 통계는 그 기법에 따라 같은 데이터에서 수 많은 다양한 결과값을 갖게 된다. 예를 들어 골다공증의 평균적 발병율을 알고자 할 때, 60세 이상 노인들을 대상으로 조사할 것인지, 70세인지, 혹은 50세부터 조사할 것인가에 따라 그 확률은 크게 차이가 날 것이다.

 그러나 이렇게 직접적인 방법 외에도 은연 중에 통계로 사람들의 심리를 조작하는 방법이 있다. 다음은 미국 교통수송 연구 분야에서 널리 알려진 그림이다. 





 얼핏 보면 200년간 전쟁에서 사망한 사람보다 고작 76년간 고속도로에서 사망한 사람의 수가 2배나 많으므로, 고속도로가 전쟁보다 더 위험하다고 생각하게 된다.

 그러나 조심스럽게 생각해 보면 이 결과는 고속도로가 전쟁보다 더 위험하다는 것을 보여주기에 적합하지 않다. 왜냐하면 다음과 같은 사실을 고려하지 않았기 때문이다.


1. 전쟁은 200년간 쭉 지속되지 않는다.

2. 전쟁에 참가한 사람의 수와, 고속도로를 사용하는 사람의 수는 다르다.


 고속도로는 하루 24시간, 수백 수천만대의 자동차가 이용하고 있다. 그러나 전쟁은 수천, 수만의 인원이 짧게는 몇 달에서 길게 몇 년간 제한적으로 지속된다. 만일 위의 통계에서 전쟁이 지속된 기간 중 전사한 군인의 숫자를 집계하여 시간당 사망률을 계산했거나, 혹은 전쟁에 참가한 군인들 중 전사한 군인의 비율을 조사했더라면 그 수치는 상당히 치솟을 것이다. 베트남전에 참전했던 미군 소위들의 평균 생존시간이 단 몇 분에 지나지 않는다는 이야기가 있을 정도로 전장에서의 시간당 사망률은 매우 높다.

 그러나 위의 사진에서 보여준 통계에 수학적 오류나 편법이 존재하지는 않는다. 엄연한 객관적 사실만을 제시했을 뿐이고 이것을 보는 사람들의 심리를 유도하는 그 어떠한 직접적인 문구도 없다. 그러나 이러한 순수한 팩트만으로도 통계는 독자를 혼란스럽게 만들 수 있다.


 이번에 모 대학의 교수가 "원자력 발전소가 5등급 이상의 대형사고를 일으킬 확률은 1.33%" 라고 말했다. 1.33%를 계산한 근거는, 전 세계에 가동중인 450개 원전 중 6개가 5등급 이상의 대형사고를 일으켰으니 6/450=0.0133 의 확률이 나온다는 것이다.

 1.33%가 도출된 계산은 순수한 팩트다. 혹시나 전 세계의 원자로가 450개가 아니라던가, 혹은 대형사고를 낸 원자로가 6기가 아니었다면 이야기가 다르겠지만, 만일 두 수치가 정확하다면 1.33%는 아무런 조작도 가하지 않은 순수한 확률이다.

 그러나 이 계산은 전쟁과 고속도로를 비교한 수치보다 더욱 기이하다. 1.33%를 계산한 스스로가 "오래 된 원전일수록 위험하다"고 지적했으면서 원전의 사고 확률을 계산할 때에는 시간에 대한 고려를 전혀 하지 않았다. 또한 문제가 되는 많은 원자력 발전소들이 안전장치나 안전점검 등에서 많은 문제점이 있었던 것 또한 고려하지 않았다. 슬럼가의 폭력발생빈도를 치안이 잘 발달된 대도시에 끼워맞추는 것이 무리이듯이, 체르노빌 이후에 급격히 강화된 안전장치나 안전기준 등을 고려하지 않은 채 단순히 6/450을 하는 것은 매우 위험하다.

 게다가 우리나라의 원전은 이번에 사고가 난 구형 원전과는 구조가 다른 신형이다. 설사 저 1.33%가 맞더라 하더라도 이는 구세대 원전이 포함된 전체 원전의 사고 확률일 뿐이다. 우리나라의 원전 사고확률을 구하고 싶다면 가압경수로 원전의 사고율을 따로 구해야 할 것이다.




ps. 원 트랙백 내용을 고치고 새로 올립니다.

ps2. 아이추판다님이 1.33%를 주장하신 것은 아닙니다.

핑백

  • Orca의 雜想 note : 24% 혹은 0.00001%, 원자력 발전의 위험에 대한 잡상 2011-04-02 23:18:49 #

    ... <a title="전쟁보다 고속도로가 위험하다? - 통계의 함정" href="http://www.egloos.com/4951045" name="4951045">전쟁보다 고속도로가 위험하다? - 통계의 함정</a> ... more

  • 무늬만 고양이집 : 원자력 잡설 04.04 2011-04-05 00:02:41 #

    ... 원하지 못했고, 그렇게 지원을 했는데도 실효성이 없어서 실패한 사업으로 낙인찍히기 직전입니다. 제가 1.33%를 까는 글을 써서(전쟁보다 고속도로가 위험하다? - 통계의 함정) 원전을 매우 좋아하는 사람으로 오해하는 분들이 계신 듯 한데, (에너지 part.1 원자력 발전)에서도 밝혔듯이 전 원자력이 이상적 ... more

  • 무늬만 고양이집 : 자료 바로읽기 - 통계 (1) 2012-04-06 21:50:14 #

    ... 로 이것이 위 문구가 말하고자 하는 진짜 의미지요. 따라서 통계는 내용을 조작하기도 쉽고, 의미를 조작하기도 매우 쉽습니다. 예전에 올렸던 전쟁보다 고속도로가 위험하다? - 통계의 함정 에서도 통계가 내포하는 의미를 쉽게 조작할 수 있다는 점을 이야기했었지요. 교수님의 말씀을 믿는다면, 통계 결과를 분석하는 기자들 중의 대다수 ... more

덧글

  • asdfkj 2011/03/30 12:35 # 삭제 답글

    100%엄밀성은 무리한 이야기고, 저게 무의미한 수치도 아닌데 과민반응들 하시는 듯. 완전 엉터리 통계가 아님은 님이 트랙백 한 글에 있으며, 그 근거인 1.33%이 주장하는데 그렇게나 문제있는 수치도 아니지 않나요? 과대해석이라고 하는데는 동의하겠는데, 터무니없을 정도의 과대해석으로도 별로 보이진 않는군요.

    "급격히 강화된 안전장치나 안전기준 등을 고려하지 않은 채 단순히 6/450" 라고는 하지만.... 복잡성이 문제를 증가시키고, 안전을 위한 장치가 다른 종류의 사고를 불러오기도 하는데, 그런걸 다 고려해서 과연 수치변동이 얼마나 될찌는 글쎄요....
  • 커티군 2011/03/30 12:50 #

    문제가 큽니다. 극심한 예를 들어서, 만약에 원전에서 하루에 1건 이상의 사고가 날 확률이 1.33%라면 전 세계의 원전을 지금 당장 중지시키는게 맞습니다. 그러나 40년 이상 된 원전에서 1년 안에 사고가 날 확률이 1.33%라면 40년 되기 전에 안전검사를 새로 하거나 중지시키는게 맞겠지요.

    그리고 안전을 위한 장치가 다른 종류의 사고를 불러오기도 하지만 안전장치 자체는 사고확률을 줄이기 위해 존재합니다. 즉, 안전장치가 원인이 되어 고장이 날 확률보다는 안전장치가 다른 고장을 억누를 확률이 더 큰 것이 일반적이지요. 만약 안전장치때문에 사고확률이 높아진다면 그 장치가 안전장치로 분류될 수 없지 않습니까?

    그리고 민감한 사항에 대해서 신문 같은 대중매체에 교수라는 이름을 걸고 글을 쓰기 위해서는 적어도 "그런걸 다 고려해서 과연 수치변동이 얼마나 될지" 고려해야 한다고 봅니다. 아니면 적어도 "그런걸 다 고려해도수치변동이 거의 없을 것이다"는 가정을 한 근거라도 제시를 했어야 했을 것입니다.
  • asianote 2011/03/30 13:11 # 답글

    로또 당첨확률을 두배로 높이는 방법은?

    하나 더 구매한다!
  • 커티군 2011/03/30 15:38 #

    그리고 구매에 앞서 로또의 당첨 확률을 정확히 계산한다!
  • check4me 2011/03/30 17:59 #

    로또 당첨 확률을 무려 열 배로 높이는 방법은?

    로또를 열 개 구매한다!

    ㅋㅋ
  • sac 2011/03/31 08:00 # 삭제

    정확히 얘기하면 "단, 두장의 로또번호 조합은 같지 않다."
  • leestan 2011/03/30 15:05 # 답글

    이글루스에서 계속나온 글을 쭉 읽어본 결과

    항상 이런 종류의 일이 일어날때 마다 느끼는 것이지만, 결국 사람들에게 중요한 것은 팩트나 통계적 수치와 같은 보이는 양보다는 원하는 단어, 원하는 문장들을 보는거 같습니다. 결국 취사선택을 하는 것이지요.

    여러 문맥이나 상황들은 전혀고려하지 않고 말하던 중간에있는 단어나 단락들을 재조합하여 원하는 결과만을 자신의 머리속에 집어넣는 행위들을 말하는 것이지요.. 정신승리라고 하던가요..

    결국 어떠한 전문가가 나오든 이런저런 설명을 하든, 명확한 사실을 바탕으로 설명을 해주던 간에 원전이 고쳐지지 않는이상 이 논란을 계속될거 같네요..

    P.S.)결국 이글과 전혀 상관없는 off-topic을 말한거군요 전ㅋㅋㅋ
  • 커티군 2011/03/30 15:44 #

    결과를 정해 놓고 글을 읽다보면 결과에 도움이 되지 않는 부분은 필터링이 되어 말씀하신 것과 같은 문제가 일어나지 않나 싶습니다. 저도 레포트용 자료를 찾을 때 몇번 저질렀던 실수라서 주의하고 있기는 하지만...ㅠ

    최근에는 그 결과가 정치와 깊게 관련되서 여러가지 부작용이 있지 않나 싶습니다.
  • 위장효과 2011/03/30 17:38 # 답글

    그런데 그 원글-아이추판다님 글 말고 신문 기사요-의 작성자가 모 의대 미생물학과 교수던데...

    의대 통계학 시간에도 저런 문제의 함정정도는 배웁니다(다 까먹어서 그렇지). 사망률이니 유병률, 그리고 질병의 원인과 결과등 인과관계 따질 때 저런 실수하지 말라고 무지 주의듣거든요.(다 까먹어서 문제지) 같은 업계인으로서 정말 창피하더군요.
  • 커티군 2011/03/30 18:59 #

    교수님도 교수님이지만 저걸 기사화시킨 신문사 기자도 문제가 좀 있다고 생각합니다. 요즘 기자분들 왜 이렇게 실수를 많이들 하시는지...
  • 트윗덱 2011/03/30 18:07 # 답글

    1.33% 는 현재까지 건설됬던 원전 450개중 한개를 집었을때 그 원전이 사고가 발생했던 원전일 확률일 뿐이지

    그이상도 그이하도 아닙니다.. 이거가지고 지지고 볶고 해봤자 죽도밥도 안되는 쓰래기밖에 안나오죠
  • 커티군 2011/03/30 19:01 #

    그러고보니 정보시스템에서 배웠던 내용이, 데이터를 통계적 기법으로 처리하면 정보가 된다고 했었습니다. 트윗덱님 댓글을 보니 문득 생각이 나네요. 이번 사태는 데이터를 이상한 통계적 기법으로 처리해서 의미 없는 정보가 탄생한 케이스 되겠습니다...
  • 풍신 2011/03/30 18:08 # 답글

    1.3%는 정말 너무나 엉성한 계산이죠. 원자력 발전소가 신형인지 구형인지, 지진대에 있던 없던(...이거 중요?), 그런 것 하나도 생각 않은 숫자니...솔직히 저런 식의 통계로 내는 퍼센티지는 조건을 살짝 바꿔서 1% 부터 99%까지 맘대로 조종할 수 있다는...
  • 커티군 2011/03/30 19:02 #

    지진대도 중요하다고 봅니다. 차마 위에서는 못적었지만 이번 사태는 쓰나미만 아니었으면 얌전히 넘어갈 사태였으니까요. ;ㅂ;
  • PFN 2011/03/30 18:32 # 답글

    어떡하죠 .저렇게 위험한 고속도로를 자꾸 우리나라 땅에 지어대는게 과연 옳은 일인지 모르겠습니다.

    안그래도 원전때문에 심란한데 이젠 고속도로까지 걱정이네요
  • 커티군 2011/03/30 19:03 #

    세상에 믿을 놈 하나 없네요. 에구.
  • 2011/03/30 19:21 # 답글 비공개

    비공개 덧글입니다.
  • 커티군 2011/03/30 19:50 #

    처음 들어보는 이름입니다 ~_~
  • 공태훈 2011/03/30 19:48 # 답글

    갑자기 나심 탈레브의 블랙 스완이 생각나는 군요.

    50년대 이후 대공황이 없었으니 대공황이 없을 것이다. 라든지...
    60일 동안 칠면조는 잘 살았으니 앞으로도 잘 살것이라든지.....

    통계는 그냥 연역적 추론을 숫자상으로 입증하기 위한 도구일 뿐인데 말이죠.
  • 커티군 2011/03/30 19:52 #

    그래도 통계 자체는 아주 유용한 도구입니다. 물론 잘 사용했을 때라는 조건이 붙기는 하지만요...
  • 전뇌조 2011/03/30 20:55 #

    통계는... 그냥 일기예보 같은 거라고 생각되더군요.
    참고는 하지만 전적으로 믿을 수는 없는 그런 거.
  • 평민 2011/03/30 21:15 # 답글

    경찰관이 많아서 범죄율이 높아진다 같은 괴상한 통계법이 언제까지 나올까요;;
  • 커티군 2011/03/30 22:20 #

    아...그것도 상당히 유명한 이야지요 -_-ㅋ
  • virustotal 2011/03/30 21:53 # 답글

    솔직히 통계를 보고 말하자면

    전쟁나면 군대로 가야 합니다. 통계상 전쟁나면 민간인 희생자가 더 많아요

    그리고 취직안되면 대선이나 정치인 출마를 해야합니다.

    확률상 대통령 한다는 놈이 몇놈이나 되요?

    한 100명 많아야 1000명인데

    그럼 전국민대비 1000명이면 널널한 경쟁률이죠

  • 커티군 2011/03/30 22:21 #

    정말인지 조건 같은거 생각하다보면 통계 내는 사람들이 참 대단해 보이지 말입니다...
  • 토텐코프 2011/03/30 22:49 #

    현대전에서는 민간인 사망자 수가 더 많은게 당연합니다.

    생존기술 및 장비들이 넘쳐나잖아요 -_-bb
  • 청풍 2011/03/30 22:13 # 답글

    밥을 먹는 사람들의 100%가 120년 안에 사망합니다. 덜덜덜..
  • 커티군 2011/03/30 22:22 #

    밥은 위험합니돠아....
  • ^^ 2011/03/30 22:40 # 삭제 답글

    퍼센트와 퍼센트포인트..

    빨고 싶으면 2퍼센트 포인트 올랐다고 안 하지요.. 20% 올랐다고 하지..

    까고 싶으면 2퍼센트 포인트 내렸다고 안 하지요.. 20% 내렸다고 하지..

    2와 20은 대중이 받아들이는 임펙트 자체가 틀리기 때문에..

    통계를 알아야 하는 이유는? 통계에 속지 않기 위해서.. 라는 명문이 있지요..



  • 커티군 2011/03/30 22:41 #

    모 수학과 교수님은 이러한 명문을... "수학은 조금만 먼저 배워도 남을 골탕먹일 수 있지요" ㅠㅠ
  • dasf 2011/03/30 22:54 # 삭제 답글

    분명히 예전에 읽었던 어느 일반인 대상 경제학 개론 책에선가 봤었던 유머인데...

    뭔가 재미있는 유머들이 이거 말고도 많았는데 잘 생각이 안 납니다.
  • 커티군 2011/03/31 08:10 #

    유명한가보네요ㅋㅋ 전 통계 관련 책에서 읽었던 것 같습니다
  • 궁극사악 2011/03/30 22:55 # 답글

    저 1 더하기 1 의 일화는 통계학자가 아니고 회계사...일겁니다 ㅋ
  • 커티군 2011/03/31 08:10 #

    아, 그랬던가요? 하도 오래 전에 읽어서 가물가물 하네요 ㅋ
  • 몽몽이 2011/03/30 23:48 # 답글

    트랙백 원문에도 덧글 달았지만
    애당초 원전사고 '확률'의 개념조차 모호한 것부터가 문제성인데
    독립'시행'이 아닌 문제에 이항분포를 적용한 것이 넌센스라고 생각합니다.
  • 커티군 2011/03/31 08:13 #

    그래도 확률 말고는 뾰족한 계산 방법이 없으니 확률을 사용해야 하기는 하지만...말씀하신대로 이번 계산법은 문제가 좀 있는 것 같습니다.
  • 도미니카 2011/03/30 23:51 # 삭제 답글

    따라서 확률치 자체는 큰 의미가 없는거죠. 확률이 0이 아닌 이상 대비할 수밖에 없습니다. 지극히 낮은 확률의 지진과 쓰나미가 지금 일본을 저모양으로 만들어 놓았거든요.
  • 커티군 2011/03/31 08:15 #

    하지만 확률이 사고를 대비하는 아주 좋은 도구인 것을 확실합니다. 대비해야 한다는 것 또한 맞고요. 다만 이번 사건처럼 민감한 사항에 대한 의견을 낼 때 부정확한 도구를 사용해서 과격한 주장을 하는건 문제가 있다고 생각했습니다.
  • 雲手 2011/03/31 00:07 # 답글

    한가지 지적하고 싶은 것은..
    1.3%라는 것은 과거에 이런 일이 있었다는 비율, 즉 사건이 이미 일어난 빈도(Frequency)지 앞으로 일어날 확률이 아니라는 점입니다.
    과거에 이런 빈도로 일어났다고 해서 앞으로 그런 빈도로 사건이 일어날 개연성이 있다고 주장하는 것은 논리의 오류입니다.
    게다가 이 1.3%라는 것도 일정시점동안 450개 원전이 존재했고 그 450개 중에서 사건이 일어난 것도 아니고 사건이 일어난 기간 중에 원전의 수도 변화하였을테니 엄밀한 Fact도 아닙니다.
  • 커티군 2011/03/31 08:19 #

    그래도 과거의 빈도가 미래의 불확실성을 줄여주는 역할을 한다고 생각합니다. 자동차 사고 확률, 상품의 판매량 예측 등 과거의 데이터로 미래를 예측하는 케이스는 많지요. 다만 그러기 위해서는 여러가지 조건 등을 엄밀하게 따져 봐야 하는데 이번 사태는 그러한 조건 등에 대한 고민을 전혀 한 것 같지 않은 것 같습니다...
  • 고어씨 2011/03/31 00:26 # 답글

    고속도로의 폭력성을 확인해 보기위해 고속도로를 지어보았습니다
  • 커티군 2011/03/31 08:20 #

    핫 챠! 이게 왜 사고가 나는고야!
  • 라면사리 2011/03/31 01:00 # 답글

    교수님께서 계산하는 방식은 기억하고 계시나 어떤 상황에서 적용시켜야 하는지는 기억을 못하시는거 같네요.
  • 커티군 2011/03/31 08:20 #

    계산을 너무 단순화시키신 것도 같고요...
  • 2011/03/31 10:34 # 답글 비공개

    비공개 덧글입니다.
  • 커티군 2011/03/31 12:08 #

    감사합니다 ~_~ 그래도 아직 제 블로그에서 그런 일은 없었으니 다행이지요ㅋ
댓글 입력 영역