에이.. 설마....

오늘은 혈액형에 근거해서 판단한 성격의 허구성을 의학에서 이용되는 더블 블라인드 테스트(이중 맹검 검사)와 논문 출판 프로세스로 논하고자 한다. 항상 다 쓰고 깨닫는 것이지만, 페북에서 읽기에는 글이 항상 길다. 나를 아주 사랑해주는 와이프도 가끔 읽다가 지칠 때가 있다고 한다. 그러니 길다 싶으면, 그냥 "좋아요" 누르고 넘어가길 추천한다.(뭥미???) 그럼 누군가는 본다. (????)

 

뭐 혈액형 말고도, 자신의 경험에 근거한 일반화의 오류를 저지르는 경우는 많다. 예컨대, 경상도 사람, 전라도 사람, 서울 사람 등등 지역이나 출신에 근거한 성향들. 그리고 한국, 일본, 중국, 인도, 미국 등 다양한 나라의 사람들의 성격 등.. 그리고 남, 녀의 차이 등등..

 

세상에는 자신도 모르는 사이에 자신의 기억 속에 쓰여진 "편견"이라는 이름의 괴물이 존재한다. 이 괴물은 너무나도 강력해서, 가끔은 자신의 결정을 뒤엎기도 하고, 때로는 말도 안되는 결정을 이르게 만들기도 한다. 하지만, 따지고 보면 이런 것들은 어디까지나 카더라 혹은 일부 예가 확대 편향되어 사실과 다른 경우가 많다.

 

중 고등학교 그리고 대학을 다니던 시절, 싸이월드에서는 유난히 혈액형에 근거한 성격론이 난무했다. 그리고 어처구니 없게도 이를 토대로 영화까지 만들어지기도 했다. 어딜가나 B형 남자는 공격을 당해야만 했다. 그리고 그것들이 사실이 아니라고, 떠들고 다니기에는 내 시간이 너무나도 아까워 보였다. 그리고, 생명과학과 의학이 최첨단을 달리는 현시점에도, 여전히 이런 것들이 심심찮게 페이스북에 보이는데, 이제는 당당하게 이야기할 수 있어야 한다.

 

이런 혈액형에 근거한 성격 평가는 개소리라고.

 

그리고 이런 혈액형 뿐만 아니라, 많은 카더라 식의 근거없는 주관성 역시 개소리라고 하겠다. 근거는 이러하다.

의학에는 다른 학문과는 다르게 치료법을 철처히 검증하는 시스템이 존재한다. 바로 더블 블라인드 테스트(double blind test)라는 것이다. 이중 맹검 시험이라고도 한다.

 

간단하게 설명하자면, 약 준 사람, 먹는 사람 둘다, 진짜 약인지 가짜 약인지 모르고 테스트하는 상황을 말한다.

 

어떤 약이 만들어 졌을 때, 그 약이 특정 질병에 진짜 효능이 있는지를 확인을 하는 과정이 필요하다. 이 과정에서, 의사가 아주 많은 수의 환자 군을 두 그룹으로 나누어서 테스트한다. 약을 준 그룹과 가짜 약을 준 그룹.

 

단순히 이 약을 주니깐, 잘 낫더라가 아니라, 이 약을 준 사람들과 이 약을 안 준 사람들을 비교해 보니깐, "안 준 사람보다 준 사람들이 훨씬 더 병이 빨리 낫더라"라는 결론은 만드는 것이다. 이 이유는 가끔씩, 가짜 약을 줘도, 심리적으로 반응을 하는 환자들이 존재하기 때문에 그러하다. (그러니 체했다고 손을 따기도 하지... 에구구.. )

 

그런데, 이렇게 하다보니깐, 의사의 편견이 들어갈 수가 있다. 예컨대, 의사가 이 약은 진짜 약, 이 약은 가짜 약이라고 알고 있는 상태에서 환자에게 약을 주면, 의사 역시 "진짜 약을 준 그룹이 더 효과가 좋을 거야" 라는 생각에, 자신도 모르게 환자의 경과를 더 긍정적으로 평가할 가능성도 생긴다.

 

그래서, 이 부분 역시 차단하기 위해서, 의사에게도 진짜 약인지 가짜 약인지 알려주지 않고, 똑같은 형태로 약을 준다. 그러면, 의사는 약을 줄 때, 이 약이 진짜인지 가짜인지 모르기 때문에, 모든 약을 진짜 혹은 가짜일 것이라고 생각하기에, 의사의 편견이 들어갈 여지가 없어지게 된다.(물론 이를 역추적하는 컨트롤 타워가 있다.)

 

이 두 가지 상황, 즉, 환자가 진짜 약을 먹는지를 의사도 모르고, 환자도 모르는 시스템을 더블 블라인드 테스트라고 한다. 물론, 이 시스템에도 단점이 없는 것은 아니지만, 개인적으로 느끼기에, 편견을 막을 수 있는 현존하는 시스템에서 가장 완벽한 시스템 중 하나라고 생각한다.

 

따라서, 어떤 치료법이 효과가 있고, 혈액형이 성격을 결정 짓는다는 결론은 얻으려면 최소한 이런 "테스트"는 해야지 믿을만 하다는 것이다.

 

예컨대, 저 혈액형 근거를 실험으로 수행한다는 예로 들어 보자. (사실 이런 연구는 말도 안된다. 성격을 판단한다는 그 변수가 너무나도 "주관적"이기 때문이다.) 그럼에도 불구하고, 창의적(?)이라는 이름하에 이 말도 안되는 연구를 한다고 생각해보자.

 

한 개인이나 연구자가, 충분한 수(개인적으로 생각하기에 적어도 1000명 이상은 수행해야 한다고 생각한다. )의 사람들을 모아놓고, 4그룹으로 나눈다. A,B,AB,O 형 네 그룹으로 250명을 할당한다. 개인적으로는 RH+/-까지 변수로 넣어서, 총 여덟 그룹으로 나누고 싶지만, 구하기가 힘들기 때문에, 접자(?). 이렇게 각 그룹에 250명을 할당한 후에, 이 할당된 사람의 혈액형 정보를 지운다. (물론, 나중에 다시금 연구자가 분석하기 위해서 이 지운 원본 데이터는 보존한다. 이거 까지 날리면, 다시 찾아볼 수가 없으니 연구 자체가 삽질이 된다)

 

그리고, 최대한 객관적으로 성격을 객관화시킨다. 이 부분이 사실상 제일 어렵다. 성격이라는 factor 자체가 multiple factors의 집합체이기 때문이다. 이 경우에 단순히 하나의 객관화 시킬 수 있는 종속 변수로 귀결되면, 훨씬 더 쉽겠지만, 그렇게 되면 통계적 유의성이 없을 가능성이 클 것이다. 여하튼, 성격을 최대한 객관화시켰다고 우기자.

 

그리고 나서, 주변인들을 설문 조사해서, 성격을 최대한 조사 한다고 해보자. 이 부분 역시도 문제가 있다. 주변인들이 그 사람을 느끼는 정도가 완벽하게 "통제"되어 있지 않기 때문이다.

 

예컨대, 그 사람의 성격을 엄마의 경우라면, "우리 애가 까칠하긴 해도 성격이 참 좋아요" 하면서 긍정적으로 평가할 가능성이 크고, 그 사람과 원수인 사람은 "그 새끼 개객끼" 라며, 오히려 부정적으로 평가할 가능성이 크다.

 

학술적으로 다양한 사람들을 주변 탐구해서 결론 내놓은 한 사람의 성격 자체의 통계적 유의성이 없을 수 있다는 말이다. 즉, 그 사람의 성격이 어떤 성격인지 "객관화할 수 없다"는 문제가 있는 것이다.

 

그럼에도 불구하고, 이상적으로 모든 사람들에게 동일한 성격이라고 인정받는 이상적인 인간이 있다고 치자. 어찌 되었든, 그런 인간들을 1000명 모았다고 치고, 그 성격에 대한 분포도를 그리고, 어떤 특정 "성격"의 분포 그룹을 만들어 보자. 다시 한번 언급하지만, 이 때, 연구자는 혈액형 분포를 모른다. 이 때 연구자가 분포도를 들여다 보고 성격 분포도를 만드는 순간 편견이 간섭한 것이다.

 

그 이후에 할 일은, 그 분포 그룹이 특정 혈액형 집단과 연계가 있는지를 확인하는 작업이다. 예컨대, 까칠한 성격을 가진 그룹에서 A형 모두가 완벽하게 소속되었다든지, 통계적으로 유의미하게 다른 그룹과 구별될 정도로 다수가 소속되어 있다든지.. 등등

 

사실, 이 연구에서 이런 결론을 얻기 위해서 사용되는 통계학적 도구들이 결국 그 학자의 질적 수준을 평가하고, 궁극적으로 연구의 질적 수준으로 귀결된다. 그냥 대충, 오~ 비슷하던데... 오~ 상관 관계가 있는데... 이런 수순이 아니라는 것이다.

 

그리고 어떻게든 우겨서, 그렇게 연구를 해서 특정 연관 관계를 보여주는 연구 결과를 논문에 서브미션 했다고 쳐보자. 수준이 높은 저널일 수록, 이런 연구가 과연 근거가 있는 연구이며, 연구 결과가 가치있고, 의미있는 학문적 발전을 이루어 놓은가에 대해서 집요하게 따져들게 된다.

 

그렇기 때문에, 저런 연구를 해서, 수준 높은(이 역시도 아주 주관적이지만,) 논문에 던지면, 당연히 이 연구는 흥미는 있으나, "우리 저널이랑은 안 맞아요" 라는 점잖은(이라고 쓰고 변명이라고 읽는다) 거절 의사가 온다. 왜냐하면, 혈액형과 성격이 연관성이 있을 수 있을만한 기존 연구가 없으며, 상식에도 맞지 않기 때문이다.

 

즉, 근거 없는 연구를 시작해서, 전혀 엉뚱한 포인트를 잡고 있기 때문이다. 그리고 연구 자체가 가지고 있는 임상적 의의나 활용도가 상대적으로 적기 때문에 대부분의 논문에서는 거절 의사를 밝힐 것이다. 아무리 창의적인(?) 연구라고 해도, 연구 시작 전에 수준 높은 지적 근거가 있어야지, 그런 것이 없으면, 전혀 황당무개한 이야기가 되기 때문이다. 선풍기 바람에 사망한 어처구니 없는 주장처럼.

 

여하튼, 또 어떻게든 우겨서 논문에 잘 제출했다고 치자. 이까지 올때, 꽤나 과학적이네 하면서 고개를 끄덕이는 사람이 있을 수도 있겠다. 오 더블 블라인드. 제대로된 4그룹. 연구 좀 되겠는데.. 하면서, 하지만 이제 시작이다.

 

논문을 제출한 이후에는, 그 분야 전문가들이 리뷰를 하게 된다. 만약 내가 리뷰를 하게 된다면, 저 혈액형 그룹이라는 변인에서, 제대로 그룹을 나누었는지를 먼저 확인할 것 같다.

 

즉, 모든 조건이 동일하게, 예컨대, 나이, 성별, 체중 등 기본적인 사항과, 성격을 형성할 수 있는 가족 사항, 학문적 배경, 사회적 배경, 수입 등등 한 사람의 성격 형성에 기여할 수 있는 모든 부분이 저 혈액형 A,B,AB,O 네 가지 그룹에 동일하게 통제되었는지를 제일 처음에 물을 것 같다.

 

그리고 두 번째로는 성격이라는 주관적 요소를 최대한 잘 객관화 하였는지, 편견이 들어갈 여지가 없는지 등에 대해서 물어볼 것 같다. 그리고 세번째로는, 그렇게 그룹을 나누고 분석을 한 결과가 통계적으로 잘 수행되었는지를 물어볼 것 같다.

 

딱 보면 알겠지만, 처음 물어본 그룹이 잘못되어 있으면, 두번째, 세번째는 거의 의미가 없다. 그렇기 때문에, 저 연구는 처음 순간 제대로 계획하지 않으면, 모든 과정이 삽질이라는 이야기이다. 하지만, 대부분의 연구가 처음 상황에서 "한번 해보자"라는 보스의 어처구니 없는(?) 아이디어로 시작하고... 하다보니깐 어 안되네... 하게 되고, 어쩔 수 없이 이리 비틀고 저리 비틀다가 결론이 산으로 가는 경우가 많다.

 

아울러, 저 변인 통제 부분이 사실상 아주 어려운 부분인데, 연구자에 따라서, 이것 저것 우기고, 같다고 할 수 없는 것을 같다고 가정하고, 결론에 이르는 과정에서 영향을 줄 수 있는 변수임에도, 줄 수 없는 것처럼 가정하는 행위들이 가능하게 되는 것이다.

 

물론, 제대로된 리뷰어라면, 이런 부분을 충분히 파악하고 있기 때문에, 아주 Harsh한 리뷰가 오게 된다. 어... 리뷰어의 의견대로라면, 연구를 아예 새로 해야할 것 같은데... 라는 리뷰를 받았다면, 바로 이런 부분에서 자신이 간과한 것들이 있는 셈이다. 그리고 결국은 리젝션을 먹게 된다. 물론, 모든 리젝셕인 이런 것은 아니다. 출판사 페이지 한계도 있고, 정치적인 이유도 있고.. 다양하다. 단, 지금 혈액형에 관한 이야기를 하고 있다. 괜히 자신의 이야기로 감정 이입하거나 몰입하지 마세요. 

 

그렇게 리젝션을 몇 번 먹다 보면, 그저 그런 논문에 실리게 된다. 그리고 신문사에는 대문짝만하게, "국내 연구진 세계 최초로 혈액형과 성격의 연계성 보고, A,B,AB,O형 모두 다 까칠할 수 있다(???뭥미???)"고 나오게 되는 것이다. 하지만, 일반인들은 잘 모르니깐, 저 신문 기사만 보고, 아 내가 알던 그 까칠한 놈이 A형이였지. 역시 그 녀석은 혈액형대로 까칠했어. 역시 내 생각이 맞았어! 하면서 맞장구를 치는 것이다.

 

위와 같은 이유로 혈액형과 성격의 연계성을 제대로 파악하는 논문은 나오기가 쉽지 않다. 그리고 나온다고 해도, 그 퀄리티는 낮을 가능성이 높고, 그 결과는 신빙성 없는 연구일 것이다. 물론, 아주 수준 높은 연구가 나올 가능성도 있다. 하지만, 개인적으로 그 논문의 결론은 "통계적으로 의미 없음"이 될 것이라고 보고 있다. 현재까지는 그런 논문이 나오지 않은 것 같다. 그러니, 혈액형에 관해서 누가 "성격을 보면, 너는 혈액형이 B형일 것 같아." "넌 의외로 꼼꼼한데, 혈액형은 또 의외로 O형이네" 라는 드립을 날려준다면, 이렇게 대답해 주자.

 

"현존하는 실험 결과로 보았을 때, 혈액형과 성격에 관한 논문들 중에서 엄격하게 더블 블라인드 테스트를 한 실험은 없으며, 있다 하더라도, 성격은 다양한 변수를 모아놓은 주관적인 집합체이기 때문에, 종속 변수로 상정하기 힘들고, 아울러, 혈액형 외적으로 성격 형성에 영향을 줄 수 있는 변인 통제가 불가능하기 때문에, 니가 한 말은 통계적으로 유의하지 않을 가능성이 높아"

 

라고 이야기 해주자.

 

그러면 상대편은 똥씹은 얼굴을 하면서 "이 무슨 개소리야!!" 하고 답변할 가능성이 크다. 단, 간신히 잡은 소개팅에서는 그러지 말자.

 

왜 이런 일이 생기는가 - 결국은 자신이 보고 싶어하는 것만 보기 때문이다.

 

그 사람이 가진 다양한 성격 중에 자신이 가지고 있는 편견에 맞는 것만 취사 선택하기 때문에 이런 일이 발생하는 것이다. 제대로 된 더블 블라인드라는 지식 체계를 갖춘 사람의 입장에서 본다면, 마늘을 먹으면 피가 맑아진다느니.. 죽염을 먹으면 건강이 좋아진다느니... 고문서에 적힌 약초나 이집트 시대 치료법들은 가차없이 더블 블라인드 탈락인 셈이다.

 

그렇다고 무작위로 이게 효능이 좋다고 더블 블라인드 테스트를 하는 것 역시 국력과 세금의 낭비이다. 과학적, 의학적으로 검증된 근거있는 실험을 통해서 엄선하고 정제되어도 탈락하는 것들이 많은 것이 연구이고, 신약이다. 그러니, 주변에서 어떤 게 몸에 좋다. 사실 몸에 좋다는 것도 따지고 보면 아주 주관적이다. 어떤게 좋은건지???? 나는 몸이 좀 아파서 학교 결석하고 집에서 만화볼 때가 제일 좋던데 

 여하튼, 결론은

 

더블 블라인드가 아니라면, 콩으로 메주를 쓴다고 해도 믿지 말 것 (근데 콩으로 메주를 쓰는 건 믿어도 될 듯).
그 데이터 안에서도 어떤 변수(통제 변인)가 결론이 될 만한 변수(종속 변인)를 건드릴 여지가 있다면, 의심하고 볼 것.

그리고 혈액형으로 성격 파악하고자 하는 사람들에게 일침을 날려줄 한 마디는 꼭 기억해 두자.

 

"개소리 하지마~ 이 고조선에 태어나서 청동기 숟가락으로 밥 퍼 먹을 무식한 놈아~(때로는 "년"이 될 수도 있다. 뜬금없이 병신년 새해복~) 혈액형 성격은 더블 블라인드 테스트를 안 했어!!! 그러니믿을 게 못된단다~"

 

P.S. 여기에 혈액형 성격 분석만 넣어 두었지만, 지역별 사람 성향, 민족별 사람 성향, 나라별 사람 성향 등 역시 딱히 하나의 결론으로 귀결되지 않을 것이라고 생각해요. 물론, 특정 지역이나 나라에 국한된 문화로 인해서, 그런 성향이 있을 수는 있지만, 그 역시, 더블 블라인드로 변인 통제를 한 것이 아니기 때문에, 믿지 않아요. 아울러, 사람 역시, 제가 직접 그 사람을 겪지 않았다면, 좋은 소문은 참고하지만, 나쁜 소문이나 좋지 않은 루머들을 가급적이면 저는 믿지 않아요. 어디까지나 그것 역시 그 사람을 겪은 주관적인 판단이기 때문에 그러해요.

 

이 글을 많이 퍼가도 됩니다. 개인적으로 혈액형 성격 분석은 일제 시대 유물 청산보다도 더 사라져야 하는 엉터리 과학이라고 생각하고 있기에 그러해요.

 

 

+ Recent posts