에이.. 설마....

오늘은 혈액형에 근거해서 판단한 성격의 허구성을 의학에서 이용되는 더블 블라인드 테스트(이중 맹검 검사)와 논문 출판 프로세스로 논하고자 한다. 항상 다 쓰고 깨닫는 것이지만, 페북에서 읽기에는 글이 항상 길다. 나를 아주 사랑해주는 와이프도 가끔 읽다가 지칠 때가 있다고 한다. 그러니 길다 싶으면, 그냥 "좋아요" 누르고 넘어가길 추천한다.(뭥미???) 그럼 누군가는 본다. (????)

 

뭐 혈액형 말고도, 자신의 경험에 근거한 일반화의 오류를 저지르는 경우는 많다. 예컨대, 경상도 사람, 전라도 사람, 서울 사람 등등 지역이나 출신에 근거한 성향들. 그리고 한국, 일본, 중국, 인도, 미국 등 다양한 나라의 사람들의 성격 등.. 그리고 남, 녀의 차이 등등..

 

세상에는 자신도 모르는 사이에 자신의 기억 속에 쓰여진 "편견"이라는 이름의 괴물이 존재한다. 이 괴물은 너무나도 강력해서, 가끔은 자신의 결정을 뒤엎기도 하고, 때로는 말도 안되는 결정을 이르게 만들기도 한다. 하지만, 따지고 보면 이런 것들은 어디까지나 카더라 혹은 일부 예가 확대 편향되어 사실과 다른 경우가 많다.

 

중 고등학교 그리고 대학을 다니던 시절, 싸이월드에서는 유난히 혈액형에 근거한 성격론이 난무했다. 그리고 어처구니 없게도 이를 토대로 영화까지 만들어지기도 했다. 어딜가나 B형 남자는 공격을 당해야만 했다. 그리고 그것들이 사실이 아니라고, 떠들고 다니기에는 내 시간이 너무나도 아까워 보였다. 그리고, 생명과학과 의학이 최첨단을 달리는 현시점에도, 여전히 이런 것들이 심심찮게 페이스북에 보이는데, 이제는 당당하게 이야기할 수 있어야 한다.

 

이런 혈액형에 근거한 성격 평가는 개소리라고.

 

그리고 이런 혈액형 뿐만 아니라, 많은 카더라 식의 근거없는 주관성 역시 개소리라고 하겠다. 근거는 이러하다.

의학에는 다른 학문과는 다르게 치료법을 철처히 검증하는 시스템이 존재한다. 바로 더블 블라인드 테스트(double blind test)라는 것이다. 이중 맹검 시험이라고도 한다.

 

간단하게 설명하자면, 약 준 사람, 먹는 사람 둘다, 진짜 약인지 가짜 약인지 모르고 테스트하는 상황을 말한다.

 

어떤 약이 만들어 졌을 때, 그 약이 특정 질병에 진짜 효능이 있는지를 확인을 하는 과정이 필요하다. 이 과정에서, 의사가 아주 많은 수의 환자 군을 두 그룹으로 나누어서 테스트한다. 약을 준 그룹과 가짜 약을 준 그룹.

 

단순히 이 약을 주니깐, 잘 낫더라가 아니라, 이 약을 준 사람들과 이 약을 안 준 사람들을 비교해 보니깐, "안 준 사람보다 준 사람들이 훨씬 더 병이 빨리 낫더라"라는 결론은 만드는 것이다. 이 이유는 가끔씩, 가짜 약을 줘도, 심리적으로 반응을 하는 환자들이 존재하기 때문에 그러하다. (그러니 체했다고 손을 따기도 하지... 에구구.. )

 

그런데, 이렇게 하다보니깐, 의사의 편견이 들어갈 수가 있다. 예컨대, 의사가 이 약은 진짜 약, 이 약은 가짜 약이라고 알고 있는 상태에서 환자에게 약을 주면, 의사 역시 "진짜 약을 준 그룹이 더 효과가 좋을 거야" 라는 생각에, 자신도 모르게 환자의 경과를 더 긍정적으로 평가할 가능성도 생긴다.

 

그래서, 이 부분 역시 차단하기 위해서, 의사에게도 진짜 약인지 가짜 약인지 알려주지 않고, 똑같은 형태로 약을 준다. 그러면, 의사는 약을 줄 때, 이 약이 진짜인지 가짜인지 모르기 때문에, 모든 약을 진짜 혹은 가짜일 것이라고 생각하기에, 의사의 편견이 들어갈 여지가 없어지게 된다.(물론 이를 역추적하는 컨트롤 타워가 있다.)

 

이 두 가지 상황, 즉, 환자가 진짜 약을 먹는지를 의사도 모르고, 환자도 모르는 시스템을 더블 블라인드 테스트라고 한다. 물론, 이 시스템에도 단점이 없는 것은 아니지만, 개인적으로 느끼기에, 편견을 막을 수 있는 현존하는 시스템에서 가장 완벽한 시스템 중 하나라고 생각한다.

 

따라서, 어떤 치료법이 효과가 있고, 혈액형이 성격을 결정 짓는다는 결론은 얻으려면 최소한 이런 "테스트"는 해야지 믿을만 하다는 것이다.

 

예컨대, 저 혈액형 근거를 실험으로 수행한다는 예로 들어 보자. (사실 이런 연구는 말도 안된다. 성격을 판단한다는 그 변수가 너무나도 "주관적"이기 때문이다.) 그럼에도 불구하고, 창의적(?)이라는 이름하에 이 말도 안되는 연구를 한다고 생각해보자.

 

한 개인이나 연구자가, 충분한 수(개인적으로 생각하기에 적어도 1000명 이상은 수행해야 한다고 생각한다. )의 사람들을 모아놓고, 4그룹으로 나눈다. A,B,AB,O 형 네 그룹으로 250명을 할당한다. 개인적으로는 RH+/-까지 변수로 넣어서, 총 여덟 그룹으로 나누고 싶지만, 구하기가 힘들기 때문에, 접자(?). 이렇게 각 그룹에 250명을 할당한 후에, 이 할당된 사람의 혈액형 정보를 지운다. (물론, 나중에 다시금 연구자가 분석하기 위해서 이 지운 원본 데이터는 보존한다. 이거 까지 날리면, 다시 찾아볼 수가 없으니 연구 자체가 삽질이 된다)

 

그리고, 최대한 객관적으로 성격을 객관화시킨다. 이 부분이 사실상 제일 어렵다. 성격이라는 factor 자체가 multiple factors의 집합체이기 때문이다. 이 경우에 단순히 하나의 객관화 시킬 수 있는 종속 변수로 귀결되면, 훨씬 더 쉽겠지만, 그렇게 되면 통계적 유의성이 없을 가능성이 클 것이다. 여하튼, 성격을 최대한 객관화시켰다고 우기자.

 

그리고 나서, 주변인들을 설문 조사해서, 성격을 최대한 조사 한다고 해보자. 이 부분 역시도 문제가 있다. 주변인들이 그 사람을 느끼는 정도가 완벽하게 "통제"되어 있지 않기 때문이다.

 

예컨대, 그 사람의 성격을 엄마의 경우라면, "우리 애가 까칠하긴 해도 성격이 참 좋아요" 하면서 긍정적으로 평가할 가능성이 크고, 그 사람과 원수인 사람은 "그 새끼 개객끼" 라며, 오히려 부정적으로 평가할 가능성이 크다.

 

학술적으로 다양한 사람들을 주변 탐구해서 결론 내놓은 한 사람의 성격 자체의 통계적 유의성이 없을 수 있다는 말이다. 즉, 그 사람의 성격이 어떤 성격인지 "객관화할 수 없다"는 문제가 있는 것이다.

 

그럼에도 불구하고, 이상적으로 모든 사람들에게 동일한 성격이라고 인정받는 이상적인 인간이 있다고 치자. 어찌 되었든, 그런 인간들을 1000명 모았다고 치고, 그 성격에 대한 분포도를 그리고, 어떤 특정 "성격"의 분포 그룹을 만들어 보자. 다시 한번 언급하지만, 이 때, 연구자는 혈액형 분포를 모른다. 이 때 연구자가 분포도를 들여다 보고 성격 분포도를 만드는 순간 편견이 간섭한 것이다.

 

그 이후에 할 일은, 그 분포 그룹이 특정 혈액형 집단과 연계가 있는지를 확인하는 작업이다. 예컨대, 까칠한 성격을 가진 그룹에서 A형 모두가 완벽하게 소속되었다든지, 통계적으로 유의미하게 다른 그룹과 구별될 정도로 다수가 소속되어 있다든지.. 등등

 

사실, 이 연구에서 이런 결론을 얻기 위해서 사용되는 통계학적 도구들이 결국 그 학자의 질적 수준을 평가하고, 궁극적으로 연구의 질적 수준으로 귀결된다. 그냥 대충, 오~ 비슷하던데... 오~ 상관 관계가 있는데... 이런 수순이 아니라는 것이다.

 

그리고 어떻게든 우겨서, 그렇게 연구를 해서 특정 연관 관계를 보여주는 연구 결과를 논문에 서브미션 했다고 쳐보자. 수준이 높은 저널일 수록, 이런 연구가 과연 근거가 있는 연구이며, 연구 결과가 가치있고, 의미있는 학문적 발전을 이루어 놓은가에 대해서 집요하게 따져들게 된다.

 

그렇기 때문에, 저런 연구를 해서, 수준 높은(이 역시도 아주 주관적이지만,) 논문에 던지면, 당연히 이 연구는 흥미는 있으나, "우리 저널이랑은 안 맞아요" 라는 점잖은(이라고 쓰고 변명이라고 읽는다) 거절 의사가 온다. 왜냐하면, 혈액형과 성격이 연관성이 있을 수 있을만한 기존 연구가 없으며, 상식에도 맞지 않기 때문이다.

 

즉, 근거 없는 연구를 시작해서, 전혀 엉뚱한 포인트를 잡고 있기 때문이다. 그리고 연구 자체가 가지고 있는 임상적 의의나 활용도가 상대적으로 적기 때문에 대부분의 논문에서는 거절 의사를 밝힐 것이다. 아무리 창의적인(?) 연구라고 해도, 연구 시작 전에 수준 높은 지적 근거가 있어야지, 그런 것이 없으면, 전혀 황당무개한 이야기가 되기 때문이다. 선풍기 바람에 사망한 어처구니 없는 주장처럼.

 

여하튼, 또 어떻게든 우겨서 논문에 잘 제출했다고 치자. 이까지 올때, 꽤나 과학적이네 하면서 고개를 끄덕이는 사람이 있을 수도 있겠다. 오 더블 블라인드. 제대로된 4그룹. 연구 좀 되겠는데.. 하면서, 하지만 이제 시작이다.

 

논문을 제출한 이후에는, 그 분야 전문가들이 리뷰를 하게 된다. 만약 내가 리뷰를 하게 된다면, 저 혈액형 그룹이라는 변인에서, 제대로 그룹을 나누었는지를 먼저 확인할 것 같다.

 

즉, 모든 조건이 동일하게, 예컨대, 나이, 성별, 체중 등 기본적인 사항과, 성격을 형성할 수 있는 가족 사항, 학문적 배경, 사회적 배경, 수입 등등 한 사람의 성격 형성에 기여할 수 있는 모든 부분이 저 혈액형 A,B,AB,O 네 가지 그룹에 동일하게 통제되었는지를 제일 처음에 물을 것 같다.

 

그리고 두 번째로는 성격이라는 주관적 요소를 최대한 잘 객관화 하였는지, 편견이 들어갈 여지가 없는지 등에 대해서 물어볼 것 같다. 그리고 세번째로는, 그렇게 그룹을 나누고 분석을 한 결과가 통계적으로 잘 수행되었는지를 물어볼 것 같다.

 

딱 보면 알겠지만, 처음 물어본 그룹이 잘못되어 있으면, 두번째, 세번째는 거의 의미가 없다. 그렇기 때문에, 저 연구는 처음 순간 제대로 계획하지 않으면, 모든 과정이 삽질이라는 이야기이다. 하지만, 대부분의 연구가 처음 상황에서 "한번 해보자"라는 보스의 어처구니 없는(?) 아이디어로 시작하고... 하다보니깐 어 안되네... 하게 되고, 어쩔 수 없이 이리 비틀고 저리 비틀다가 결론이 산으로 가는 경우가 많다.

 

아울러, 저 변인 통제 부분이 사실상 아주 어려운 부분인데, 연구자에 따라서, 이것 저것 우기고, 같다고 할 수 없는 것을 같다고 가정하고, 결론에 이르는 과정에서 영향을 줄 수 있는 변수임에도, 줄 수 없는 것처럼 가정하는 행위들이 가능하게 되는 것이다.

 

물론, 제대로된 리뷰어라면, 이런 부분을 충분히 파악하고 있기 때문에, 아주 Harsh한 리뷰가 오게 된다. 어... 리뷰어의 의견대로라면, 연구를 아예 새로 해야할 것 같은데... 라는 리뷰를 받았다면, 바로 이런 부분에서 자신이 간과한 것들이 있는 셈이다. 그리고 결국은 리젝션을 먹게 된다. 물론, 모든 리젝셕인 이런 것은 아니다. 출판사 페이지 한계도 있고, 정치적인 이유도 있고.. 다양하다. 단, 지금 혈액형에 관한 이야기를 하고 있다. 괜히 자신의 이야기로 감정 이입하거나 몰입하지 마세요. 

 

그렇게 리젝션을 몇 번 먹다 보면, 그저 그런 논문에 실리게 된다. 그리고 신문사에는 대문짝만하게, "국내 연구진 세계 최초로 혈액형과 성격의 연계성 보고, A,B,AB,O형 모두 다 까칠할 수 있다(???뭥미???)"고 나오게 되는 것이다. 하지만, 일반인들은 잘 모르니깐, 저 신문 기사만 보고, 아 내가 알던 그 까칠한 놈이 A형이였지. 역시 그 녀석은 혈액형대로 까칠했어. 역시 내 생각이 맞았어! 하면서 맞장구를 치는 것이다.

 

위와 같은 이유로 혈액형과 성격의 연계성을 제대로 파악하는 논문은 나오기가 쉽지 않다. 그리고 나온다고 해도, 그 퀄리티는 낮을 가능성이 높고, 그 결과는 신빙성 없는 연구일 것이다. 물론, 아주 수준 높은 연구가 나올 가능성도 있다. 하지만, 개인적으로 그 논문의 결론은 "통계적으로 의미 없음"이 될 것이라고 보고 있다. 현재까지는 그런 논문이 나오지 않은 것 같다. 그러니, 혈액형에 관해서 누가 "성격을 보면, 너는 혈액형이 B형일 것 같아." "넌 의외로 꼼꼼한데, 혈액형은 또 의외로 O형이네" 라는 드립을 날려준다면, 이렇게 대답해 주자.

 

"현존하는 실험 결과로 보았을 때, 혈액형과 성격에 관한 논문들 중에서 엄격하게 더블 블라인드 테스트를 한 실험은 없으며, 있다 하더라도, 성격은 다양한 변수를 모아놓은 주관적인 집합체이기 때문에, 종속 변수로 상정하기 힘들고, 아울러, 혈액형 외적으로 성격 형성에 영향을 줄 수 있는 변인 통제가 불가능하기 때문에, 니가 한 말은 통계적으로 유의하지 않을 가능성이 높아"

 

라고 이야기 해주자.

 

그러면 상대편은 똥씹은 얼굴을 하면서 "이 무슨 개소리야!!" 하고 답변할 가능성이 크다. 단, 간신히 잡은 소개팅에서는 그러지 말자.

 

왜 이런 일이 생기는가 - 결국은 자신이 보고 싶어하는 것만 보기 때문이다.

 

그 사람이 가진 다양한 성격 중에 자신이 가지고 있는 편견에 맞는 것만 취사 선택하기 때문에 이런 일이 발생하는 것이다. 제대로 된 더블 블라인드라는 지식 체계를 갖춘 사람의 입장에서 본다면, 마늘을 먹으면 피가 맑아진다느니.. 죽염을 먹으면 건강이 좋아진다느니... 고문서에 적힌 약초나 이집트 시대 치료법들은 가차없이 더블 블라인드 탈락인 셈이다.

 

그렇다고 무작위로 이게 효능이 좋다고 더블 블라인드 테스트를 하는 것 역시 국력과 세금의 낭비이다. 과학적, 의학적으로 검증된 근거있는 실험을 통해서 엄선하고 정제되어도 탈락하는 것들이 많은 것이 연구이고, 신약이다. 그러니, 주변에서 어떤 게 몸에 좋다. 사실 몸에 좋다는 것도 따지고 보면 아주 주관적이다. 어떤게 좋은건지???? 나는 몸이 좀 아파서 학교 결석하고 집에서 만화볼 때가 제일 좋던데 

 여하튼, 결론은

 

더블 블라인드가 아니라면, 콩으로 메주를 쓴다고 해도 믿지 말 것 (근데 콩으로 메주를 쓰는 건 믿어도 될 듯).
그 데이터 안에서도 어떤 변수(통제 변인)가 결론이 될 만한 변수(종속 변인)를 건드릴 여지가 있다면, 의심하고 볼 것.

그리고 혈액형으로 성격 파악하고자 하는 사람들에게 일침을 날려줄 한 마디는 꼭 기억해 두자.

 

"개소리 하지마~ 이 고조선에 태어나서 청동기 숟가락으로 밥 퍼 먹을 무식한 놈아~(때로는 "년"이 될 수도 있다. 뜬금없이 병신년 새해복~) 혈액형 성격은 더블 블라인드 테스트를 안 했어!!! 그러니믿을 게 못된단다~"

 

P.S. 여기에 혈액형 성격 분석만 넣어 두었지만, 지역별 사람 성향, 민족별 사람 성향, 나라별 사람 성향 등 역시 딱히 하나의 결론으로 귀결되지 않을 것이라고 생각해요. 물론, 특정 지역이나 나라에 국한된 문화로 인해서, 그런 성향이 있을 수는 있지만, 그 역시, 더블 블라인드로 변인 통제를 한 것이 아니기 때문에, 믿지 않아요. 아울러, 사람 역시, 제가 직접 그 사람을 겪지 않았다면, 좋은 소문은 참고하지만, 나쁜 소문이나 좋지 않은 루머들을 가급적이면 저는 믿지 않아요. 어디까지나 그것 역시 그 사람을 겪은 주관적인 판단이기 때문에 그러해요.

 

이 글을 많이 퍼가도 됩니다. 개인적으로 혈액형 성격 분석은 일제 시대 유물 청산보다도 더 사라져야 하는 엉터리 과학이라고 생각하고 있기에 그러해요.

 

 

내가 하버드에서 본 일이다.

 

늙은 포닥 하나가 대학 도서관에 가서 떨리는 손으로 꼬깃꼬깃한 논문 한 편을 내놓으면서,

 

"황송하지만 이 논문이 SCI인지 아닌지 좀 보아 주십시오."

 

하고 그는 마치 선고를 기다리는 죄인과 같이 도서관 사서의 입을 쳐다본다. 도서관 사서는 포닥을 물끄러미 내려다보다가, 중국인이 공유한 SCI 엑셀 파일을 두들겨 보고

 

"좋소."

 

하고 내어 준다. 그는 '좋소'라는 말에 기쁜 얼굴로 논문을 받아서 가슴 깊이 집어 넣고 절을 몇 번이나 하며 간다. 그는 뒤를 자꾸 돌아보며 얼마를 가더니 또 다른 행정실을 찾아 들어갔다. 품 속에 손을 넣고 한참 꾸물거리다가 그 논문을 내어 놓으며,

 

"이것이 정말 SCI급 논문입니까? " 하고 묻는다.

 

행정 실장도 호기심 있는 눈으로 바라보더니,

 

"이 논문을 어디서 훔쳤어?" 포닥은 떨리는 목소리로

 

"아닙니다, 아니에요."

 

"그러면 길바닥에서 주웠다는 말이냐?"

 

"누가 SCI 논문을 그냥 주나요? 서브미션하면 피어리뷰는 안 하나요? 어서 도로 주십시오."

 

포닥은 손을 내밀었다. 행정 실장은 웃으면서

 

"좋소."

 

하고 던져 주었다.

 

그는 얼른 집어서 가슴에 품고 황망히 달아난다. 뒤를 흘끔흘끔 돌아다보며 얼마를 허덕이며 달아나더니 별안간 우뚝 선다. 서서 그 논문이 빠지지나 않았나 만져 보는 것이다. 거친 손가락이 누더기 위로 그 논문을 쥘 때 그는 다시 웃는다. 그리고 또 얼마를 걸어가다가 어떤 공동기기실 으슥한 곳으로 찾아 들어가더니 클린 벤치 밑에 쪼그리고 앉아서 논문을 손바닥에 놓고 들여다보고 있었다. 그가 어떻게 열중해 있었는지 내가 가까이 선 줄도 모르는 모양이었다.

 

"누가 그렇게 많이 도와 줍디까?"

 

하고 나는 물었다. 그는 내 말소리에 움찔하면서 손을 가슴에 숨겼다. 그리고는 떨리는 다리로 일어서서 달아나려고 했다.

 

"염려 마십시오, 1저자는 뺏어가지 않소."

 

하고 나는 그를 안심시키려 하였다.

한참 머뭇거리다가 그는 나를 쳐다보고 이야기를 하였다.

 

"이것은 훔친 것이 아닙니다. 길에서 얻은 것도 아닙니다. 누가 저 같은 놈에게 논문을 줍니까? PCR (Polymerase Chain Reaction) 사진 한 장을 받아 본 적이 없습니다. 논문 코멘트 한 마디 주시는 분도 백에 한 분이 쉽지 않습니다. 나는 세포 하나 하나 비교해 가며 Immuno 사진을 한 장씩 모았습니다. 이렇게 모은 In vitro Figure 10장으로 In vivo 마우스 데이터를 바꾸었습니다. 이러기를 여섯 번을 하여 겨우 이 귀한 ‘논문 (論文)' 한 편을 갖게 되었습니다. 이 논문을 얻느라고 여섯 번 리비전이 걸렸습니다."

 

그의 뺨에는 눈물이 흘렀다. 나는

 

"왜 그렇게까지 애를 써서 그 논문을 만들었단 말이오? 그 논문으로 무얼 하려오?"

 

하고 물었다. 그는 다시 머뭇거리다가 대답했다.

 

"이 논문 한 개가 갖고 싶었습니다."

 

알파카 MD and PhD 페이스북에 있는 원글

 

인공 지능(Artificial Intelligence)은 사람과 같은 "생각"을 할 수 있는 컴퓨터를 말한다. 단순한 질문에 대한 답을 넘어서는 고차원적인 대답을 할 수 있고, 그 문장에서 정확한 정보를 캐치하고, 그에 따른 판단을 하는 것을 말한다. 그 외에도 체스, 퀴즈쇼 등 다양한 분야에서 다양한 형태로 인공 지능이 개발되고 있고 아직도 현재 진행 중이다. 

 

결국, 궁극적인 인공 지능의 목표는 "사람과 같은 사고를 하고, 사람과 비슷한 대화를 하는 존재"를 만들어 내는 것이다. 기계가 인공 지능을 가졌는지 아닌지를 판단하는 튜링 테스트도 그런 맥락에서 이해할 수 있을 것이다.

 

생각해보면, 같은 말이라도, 말하는 상황, 뉘앙스에 따라 똑같은 문장이라도 다른 정보를 포함할 수 있다. 예컨대,

 

밥은 먹고 다니냐?

 

라는 문장을 예시로 들어 보자. 질문 자체는 아주 간단하고, "예-아니오"로 답할 수 있는 문장이지만, 질문을 그대로 받아들여서는 안된다. "살인의 추억"에서 송강호가 질문하는 뉘앙스, 사업이 망하고 나서 오랜만에 만난 친구, 다이어트를 열심히 하고 있는 여자 친구 등 대상에 따라서 각기 다른 뉘앙스를 가지고 있는 것이 사실이다. 인간은 이런 은유적 질문, 혹은 상황을 판단해서 던지는 질문에 충분히 적절한 반응을 할 수 있다.


(왓슨이 무엇인지를 보여주는 그림 - IBM 공식 홈페이지)


하지만, 컴퓨터의 입장으로 돌아간다면, 이는 아주 어려운 상황이 된다. "밥은 먹고 다니냐?"라는 단순한 말 하나에 대답하기 위해서 컴퓨터는 여러가지 판단을 해야만 답을 할 수 있다.


첫째로는, 이 질문이 진짜 사실을 묻는 것인지 아닌지를 판단해야 한다. 은유적인 표현일 가능성이 있기 때문이다. 둘째로, 과연 그 사람이 어떤 의도로 말을 하는지 유추해야 한다. 뉘앙스를 판단하는 과정이다. 셋째로, 이 질문에 대해서 내가 처한 상황을 적절히 반영하는 "예-아니오"가 아닌 대답을 해야 한다. 그 외에도 다양한 판단 과정이 존재할 가능성을 내포한다. 

 

이렇게 컴퓨터가 직접적으로 알아듣기 힘든 대화(코드가 아닌)를 인공 지능에서는 "자연어"라고 이야기한다. 인간이 대화하는 모든 언어는 사실상 자연어라고 생각하면 된다. 매 질문마다, 다양한 판단을 요구하지만, 충분히 자연스럽게 대화가 되는 과정. 이것은 인간이 가진 고유의 능력이라고 여겨져 왔다. 


이런 상황이 최근 IBM에서 개발한 왓슨에 의해서 깨지고 있다. 참고로, 여기에서 나오는 왓슨은 DNA의 그 왓슨이 아니라 IBM의 창립자 토머스 왓슨이다. 그리고 이제 조만간 왓슨은 인공 지능의 대명사로 그 둘보다 더 유명해질 가능성이 있어 보인다. 물론 아직까지는 완벽하다고 볼 수 없지만, 적어도, 퀴즈쇼 영역에서 만큼은 그런 일이 벌어졌고, 이미 지난 과거의 일이 되어 버렸다.


미국 퀴즈쇼 중에서 아주 유명한 Jeopardy라는 퀴즈쇼가 있는데, 이 퀴즈쇼에서 엄청난 차이로 우승을 한 것이다. (참고하실 분은 아래 동영상을 참고해 보세요. ^^) 사람처럼 질문이 끝나기도 전에 대답하는 것은 물론, 은유적인 단어를 포함한 질문에까지 대답을 한다. 물론 영어로 된 표현이긴 하지만, 기존의 컴퓨터로는 단순히 대답하기 힘들었던 자연어를 이해하고, 대답하는 인공 지능의 시대가 열린 셈이다. 



이제 의사의 영역으로 돌아 보자. 사실, 방대한 지식, 그리고 정확한 판단, 시진, 촉진, 청진 등 다양한 감각과 복잡한 정보가 꼬여있는 의료 영역에 인공 지능의 관여는 한계가 있는 것처럼 보인다. 그럼에도 불구하고, 의료 영역에까지 인공 지능 왓슨이 다가 오고 있다. 그것도 아주 빠른 속도로. 실제로 이런 대세를 이제는 거스를 수는 없는 것 같다. 상당한 뉘앙스가 들어 있는 질문까지 대답할 수 있는 인공 지능 컴퓨터. 인공 지능의 "의사 놀이"는 이제 놀이를 넘어서, 진단의 영역까지 들어온 것 같다. 왓슨은 이제, 의료 영역에서

 

"진단을 위해 더 필요한 history는 무엇인가.


그리고 그 finding을 통해서 어떤 진단을 유추할 수 있는가" 

 

까지 왔다.


이제, 의사의 할 일을 재정의하고, "어떤 방향으로 의사를 교육할 수 있느냐"가 의사라는 "인재 양성"에 새로운 개념이 되지 않을까? 하는 생각을 해본다. 예컨대, 단순한 의학 지식을 암기하는 것이 아니라, 인공 지능에 저장된 정보를 적절한 형태로 응용해서 환자에게 도움을 주는 판단을 내리는 의사의 역할 말이다. 마치 현재 아무도 스마트폰에 저장된 전화 번호를 하나하나 외우지 않는 것처럼, 의료 지식 역시 단순한 지식의 저장과 리콜보다 지식의 응용과 판단을 조금 더 강조하는 형태로 말이다.
 

 (의사의 판단에 도움을 주는 인공 지능, 의사라는 직업이 없어지지는 않겠지만, 분명히 형태와 교육은 변할 것이다)


전통적인 의미에서의 허준 시대의 의사가 더 이상 외과적 수술을 포함한, 다양한 내과 질환을 치료할 수 없다. 하지만, 당시의 의사의 개념과는 달리, 현대의 "의사"의 개념은 완벽히 진화되었고, 그 당시와는 다르게 재정의되었다.


이제 의사는 약초를 구하러 다니는 것이 아니라, 정제된 약을 "적합한 통계와 근거"기반해 효능을 검증하고, 환자에게 처방한다. 그에 따른 교육도 필요에 따라 대치되었고 현재 평균 수명은 그 어느 때보다 높고, 앞으로 더 발전된 가능성이 크다. 그 결과, 비록 시대는 다를지라도, 의사는 의사로서의 역할을 완벽히 수행하고 있다. 그에 발맞추지 못한 의사 집단들은 도태되고 있을 뿐이다.

더 이상 의사는 직접 X-ray를 찍지 않고, 피를 뽑아 직접 검사하지 않아도 된다. 시진, 문진을 하긴 하겠지만, 결과를 통합적으로 살펴보고 그에 근거한 판단이 의사의 주 역할이 되었다. 이 때, 의사의 역할은 다양한 환자 정보를 통합적으로 판단해서 근거에 기반한 치료를 하는 것이 된 셈이다. 이제 "인공 지능"이 완벽하지는 않지만, 단순한 계산을 넘는 이런 통합적 판단도 가능하게 되었음을 이야기한다.


(UC irvine에서 시도되는 색다른 시도. 이런 변혁과 도전이 가능한 학교가 우리 나라에도 있을까?)


현재, 의료계에서 화두가 될 가능성이 큰 구글 글래스 역시 그런 맥락에서 바라봐야 할 것이다. 단순히 기록한다는 것을 넘어서, 정보를 저장하고, 인공 지능과 결부되어 정확하고 필요한 근거를 제공하는 것. 궁극적으로 판단은 의사가 하겠지만, 단순히 내가 알고 있는 병의 가능성보다 훨씬 더 큰 가능성을 제공해주는 인공 지능. 의학에서의 인공 지능의 묘미는 여기에 있을 것이다. 이론적으로는 인공 지능을 사용하는 모두가 "예외적 질병"을 잘 발견하는 닥터 하우스[각주:1]가 될 가능성이 있다는 말이다.


("예외적 질병"을 잘 발견하는 닥터 하우스)


개인이 이런 상황에서 어떤 방향으로 자신을 계발할 것인지는 개인에 따라 다르다고 보겠다. 극단적으로 본다면, 저장의 기능을 완전히 인공지능 혹은 기계에 맡기고, 판단을 우선으로 하는 의사. 반대로, 저장의 기능을 충실하게 따라서 환자에게 신속한 진단을 내리는 고전적인 형태의 의사. 어떤 모습이 더 올바르다고 할 수 없다. 그 나름의 장점과 단점이 있기 때문이다.


비지니스의 관점에서는 과연 어떤 형태로, 정보를 취득하고, "의사에게 올바른 근거를 어떤 우선순위로 보여줄 것인가"가 인공 지능의 핵심이 되지 않을까 하는 생각을 조심스럽게 해본다. 정보가 충분히 있는 어느 순간부터는 "정보가 많은 것이 문제"가 되기 때문에, 적절히(라고 말하지만 아주 어렵다) 취사 선택한 정보를 제시하는 똑똑한 인공 지능의 개발은 의료의 발전에 아주 큰 영향을 미칠 것이라고 확신한다.


끝으로, 왓슨 개발자 중 하나인 Ken의 TED Seattle에서 강연이다. 충분히 의미 있는 강연이고, 위에 언급한 질문에 대해 많은 insight를 주는 강연인 것 같다. 한 번 살펴 보면서, 미래에 대비하는 것은 어떨까?

 

 


과연 "의사"라는 직업인이 이런 인공 지능과 공존하기 위해서 나아 가야할 방향은 무엇일까? 그리고 이 때, "준비해야 할 소양은 무엇일까"에 대해서 진지한 고민을 할 타이밍이 온 것 같다. 그렇게 하지 않는다면, 퀴즈쇼에서 자기 나름대로 최선을 다했지만, 멀뚱히 인공지능이 우승하는 것을 지켜볼 수밖에 없었던 도전자 꼴이 될 수밖에 없을 것 같다.


  1. 사실 닥터 하우스는 일반적인 의사의 관점에서는 아주 이상한 의사라고 할 수 있다.most common disease를 항상 rule out하기 때문이다. 틀렸다고 보기는 힘들지만, 경우에 따라서 꼭 좋은 의사는 아닐 수 있다. [본문으로]



사도 OST - 아모리 만조상해원경 

올 가을 극장가를 강타하고 있는 "사도: 가장 비극적인 연차평가 이야기"의 예고편입니다. 난생 처음 연구비를 받고 재미있게 연구를 하고 싶어하는 사교수의 요절복통 연차평가 이야기가 아주 애잔하게 그려져 있습니다. 커밍 순.


간만에 다시 돌아온 우울한마빈의 문화산책입니다. 사실 오늘 페이스북을 보다가 mad scientist님의 글(https://goo.gl/8o8Zwh)을 보고 필 받아서 발로 만들었습니다. 

사실 선진국의 반열에 올라선 우리나라의 연구비는 다른 선진국들에 비해서 형편없이 모자란 건 아니에요. 다만, 방향성에 있어서는 좀 생각해 볼 부분이 많은 것 같습니다. 특히 선정된 연구과제들이 보다 재미난 연구결과들을 도출할 수 있도록 만들기 위해 진지하게 고민하기 보다는 기계적으로 정량화된 평가를 통해 연구의 창의력을 억누르는 결과로 나오는 경우들이 많습니다. 그리고 이 과정에서 많은 연구자들이 재미있는 연구보다는 살아남기 위한 연구를 하게 되는 결과로 이어지게 되는거구요. 

노벨상 노벨상 말로만 떠드는 것이 아니라, 정말 많은 연구자들이 자신이 재미있어 하는 연구를 안정적으로 할 수 있는 환경을 만들어야 하는데, 그게 쉽지 않으니 문제이지요. 특히 IBS등 대단위 연구로 대표되는 연구비의 블랙홀들이 많은 연구자들의 연구기회를 상대적으로 박탈하고 있다고 느끼게 하는 것도 큰 문제입니다. 연구과제보다는 사람을 향하는 연구비가 필요합니다. 그것도 몇 몇의 사람들이 아니라 다양한 사람들이 다양한 연구를 할 수 있는 환경 말이에요. 

뭐, 위의 내용은 패러디입니다. 저 정도로 빡쎄지는 않아요. 하지만, 과장을 좀 하기는 했어도, 연구자들에게 돌아오는 압박은 현실에서 크게 벗어나 있다고는 생각하지 않아요. 이건 다~ mad scientist 때문입니다! 전 연구재단을 사랑해요! 우!윳!빛!깔 미!창!부! 교육부 반자이! 그러니깐 연구비 좀 ㅎㅎ

인류 사회에는 언제 어디서나 ‘일부일처제가 옳으냐, 일부다처제를 허용해야 하느냐, 일처다부제는 왜 안 되냐’는 등등의 인간의 짝짓기 제도에 관한 수많은 의견들이 있어왔다. 현대 사회에서는 고대로부터 전 세계에 각지에 걸쳐 존재했던 일부다처제가 그 설 자리를 잃었고, 일부일처제를 공식적으로나 비공식적으로 보편타당한 제도로 인정하고 있다. 누군가가 일부다처를 주장했다가는 미개인 혹은 남성우월주의자로 낙인찍히기 딱 좋다.

영화 글루미 선데이에서는 여자 주인공이 동거인 남성과 피아니스트 둘 사이에서 누구를 선택할까 고민을 하다가 결국 세 명이서 사이좋게 연애를 하게 되는 아주 독특한 형태의 짝짓기 방식이 연출이 되는데, 이 상황을 극대화하고 정형화한다면 ‘일처다부제’라고 할 수 있을 것이다. 일부다처제는 전 세계 어느 곳에서나 발견되는 일반적인 폴리아모리의 형태이지만, 일처다부제가 보고된 곳은 티벳의 일부 지역밖에 없다. 이 지역은 유목 사회의 특징 때문에 일처다부제를 할 수 밖에 없는 어떤 당위성이 존재한다 (이 경우에는 형제들이 한 여자를 공유). 우선, 일부다처제나 일처다부제, 일부일처제의 장단과 현실성을 알기 위해서는 인간의 짝짓기 행동에 대한 보편적 특징을 알고 있는 것이 도움이 될 것이므로 한번 정리를 하도록 하자.


첫째, 여성들은 일부다처제를 허용하는 사회에서조차도 공통적으로 일부일처제 결혼을 추구한다. 드물게 예외적인 경우가 있기는 하지만, 여성들은 신중하게 남자를 선택하고자 하며, 그러고 나서 남자의 가치가 존재하는 한 일생 동안 한 남자를 독점하고, 아이를 기르는 데 그 남자의 도움을 받고, 십중팔구는 죽을 때도 함께 죽기를 원한다.

둘째, 여성들은 본질적으로 성관계의 다양성을 추구하지 않는다. 물론 예외가 있기는 하지만, 소설에 등장하는 여자 주인공들이나 현실의 여성들은 전혀 색광증에 매력을 느끼지 않는다며 끊임없이 주장을 하며, 우리가 그 말을 믿지 못할 이유도 없다. 이름도 모르는 남자와의 하룻밤 정사에 흥미가 있는 요부는 남성들의 포르노그라피가 만들어낸 환상이다. 남자 동성연애자 즉, 게이의 경우 일생동안 보통 100명에서 1,000명의 파트너와 성관계를 맺지만 여성의 경우(레즈비언)는 5명 내외로 제한된다. 남성과 여성의 성적 행동 추구는 근본부터 다르다고 할 수 있다. 즉, 남자들은 결혼이라는 사회적 제도 안에서 한 여자와의 삶을 강요받지 않는다면 (그것이 가능하다면) 전 세계 수많은 여자들과 섹스를 하게 될 것이다. 자신의 유전자를 퍼트리는 게 개체의 목적이라는 점에서 수컷이 지니는 성관계의 다양성의 추구는 전혀 이상할 것이 없다. 반면 여성의 경우 여러 남자와 무분별하게 섹스를 하는 것은 자신에게 이득이 될 것이 별로 없는데, 자신의 유전자를 남길 자식의 숫자가 임신 횟수의 제한으로 인해 어느 정도 한계가 있기 때문이고, 수컷의 도움 없이 자식을 홀로 키워야할 위험성이 커지기 때문이다. 결론적으로 성적 기회주의에서 얻을 수 있는 것이 거의 없다. 그보다는 자신을 보호해주고 자녀를 함께 키워줄 성실한 수컷을 골라서 안정된 성관계를 가지는 것이 훨씬 더 유리하다.

셋째, 그럼에도 불구하고 여성들도 가끔 부정을 저지른다. 모든 불륜이 남성들에 의해서만 일어나는 것은 아니다. 여성들이 남창이나 낯선 사람과의 일시적인 성교에 관심이 거의 없거나 전혀 없다 하더라도, 일일연속극 같은 생활에서 그녀가 그 시기에 ‘행복한’ 결혼 생활을 하고 있다 하더라도, 여성은 아는 남성과의 불륜을 받아들일 수 있다. 이는 모순적인 상황이긴 하지만, 현실에서 일어나는 일이다. 그 원인으로는 불륜남의 강한 유혹, 불행한 결혼 생활, 생물학적 측면에서의 성교 계획 변경 등을 들 수 있으나 모두 가설에 불과하다.


        


자, 이제는 인간 세계를 뛰어넘어 인간의 성생활과 유인원과의 성생활을 비교해보자. 영국의 생물학자 로저 쇼트의 1970년대 연구는 매우 쇼킹하고 의미가 있다. 그는 유인원의 해부학적 구조에서 독특한 점을 발견하였는데 침팬지는 거대한 정소를 가지고 있는 반면에, 고릴라는 매우 작은 정소를 가지고 있다는 것이다. 고릴라는 침팬지보다 몸무게가 4배나 더 무겁지만, 정소는 침팬지가 고릴라보다 4배나 더 무겁다. 쇼트는 이 사실에 의문을 품었고 그것이 교미 체계와 관련이 있을 것이라고 제안을 했다. 쇼트의 제안에 의하면, 수컷의 정소가 크면 클수록 암컷은 더 일처다부성을 띄게 된다.

그 이유는 쉽게 알아볼 수 있다. 만약 암컷이 서너 마리의 수컷과 교미를 하게 되면, 각 수컷의 정자들은 암컷의 난자에 가장 먼저 도달하려고 경쟁할 것이다. 수컷이 이 경주에서 자기가 우세하게 이기는 최선의 방법은 더욱 많은 정자를 생산해서 경쟁을 압도해버리는 것이다. 침팬지는 서너 마리의 수컷이 암컷 한 마리를 공유하는 집단을 이루고 살기 때문에, 자주 사정하고 많이 사정할 수 있는 능력에는 포상이 따른다. 왜냐하면 그렇게 하는 수컷이 아버지가 될 가능성이 가장 높기 때문이다. 이 추측은 모든 원숭이와 설치류에 해당한다. 고릴라처럼 성교의 독점을 확신하면 할수록 수컷의 정소는 작아진다. 즉, 암컷이 여러 마리의 수컷과 난교를 이루는 무리에서 살수록 수컷의 정소는 더 커진다.

수컷의 정소가 크면 암컷은 일처다부성이다’라는 쇼트의 주장은 동물의 교미 체계에 대한 해부학적 실마리를 잡은 것처럼 보이기 시작했다. 유인원인 사람의 정소는 중간 크기로, 고릴라의 정소보다는 상당히 큰 편이다. 침팬지의 정소와 마찬가지로 인간의 정소는 이미 만들어진 정자를 서늘하게 보관할 수 있도록, 말하자면 정자의 저장 수명을 늘릴 수 있도록 몸 바깥으로 늘어져 있는 음낭 속에 저장되어 있다. 이 모든 것들이 인간에게 나타나는 정자 경쟁의 증거로 보인다.

그러나 인간의 정소는 침팬지의 정소만큼 크지 않으며, 예전처럼 전력을 다해 작동하고 있지도 않다는 몇 가지 잠정적인 증거가 있다 (한때 인류의 정소는 훨씬 컸을 것으로 추정된다). 몸무게 1그램당 정자의 생산율을 보면, 인간은 현저하게 낮다. 무엇보다 여성은 성적인 면에서 그렇게 문란하지 않다고 결론짓는 것이 타당해보이며, 그것은 또 진화학자들이 기대했던 바이기도 하다.

아무리 일부다처제가 강한 사회라도 아내 집단이 한 남성에게서 다른 남성으로 넘겨지는 식으로 조직된 곳은 없다. 인간 사회의 아내 집단은 한 명씩 들어와 형성된 것이므로, 일부다처제를 장려하는 사회에서도 대부분의 남성은 한 명의 아내와 관계를 유지한다. 이와 마찬가지로 프리섹스 공동체를 만들려는 다양한 시도가 있었지만, 각각의 남성들이 각각의 여성들과 짧은 성관계를 반복하는 그런 사회는 만들어진 적도 없고 유지된 적도 없다.

사실 인간의 짝짓기 체계도 유인원 못지않게 특징적이다. 부부간 결속이 오래 유지되고, 일부일처제 중심이지만 때로 일부다처제가 혼재하는 양상, 침팬지처럼 대규모 무리나 부족에 포함되는 것 등이 그 특징이다. 이와 마찬가지로 남성들 사이에 고환의 크기가 아무리 다양할 지라도 고환이 체중에 비례해서 고릴라처럼 작거나 침팬지처럼 큰 사람은 존재하지 않는다. 체중에 비례하여 인간의 고환은 고릴라의 다섯 배 정도이고 침팬지의 3분의 1 수준이다. 이것은 여성의 정절을 어느 정도 보여주는 일부일처제의 종에게 적합하다.

다시 글루미 선데이의 다자 연애로 돌아가 보자.

영화에서 여 주인공은 유태인 식당 주인과 4년간의 동거를 하고 있는데, 갑자기 경쟁자인 피아니스트가 등장을 한다. 마음씨 좋은 유태인 식당 주인은 그녀가 본인과 피아니스트 중 하나를 선택할 기회를 주는데 여 주인공은 피아니스트에게 가게 된다. 그녀를 포기할 수 없었던 유태인 식당 주인은 다시 한번 그녀에게 구애를 하지만 사정이 여의치 않자 그냥 사이좋게 세명이서 사귀자고 제안을 하게 되고 이게 받아들여지면서 위태로우면서도 낭만적인 떼사랑 상태에 들어가게 된다.

그러나, 이런 식의 폴리아모리가 가능한 것은 이 관계가 단지 ‘연애’의 목적에만 충실하기 때문이라고 볼 수 있다. 이게 만약 결혼의 상태고 자식을 낳아서 길러야 하는 상황이라면 이런 관계는 깨질 수밖에 없지 않을까? 만약 여 주인공이 임신을 하고, 아이를 낳았다고 치자. 그럼 이 아이는 누구의 아이인가? 남자 둘 중 그 누구도 자신의 아이라고 확신을 할 수 없는 상황에서는 아기가 아빠 수컷으로부터의 든든하고 지속적인 지원을 기대하기 어렵다.

수컷은 자신이 아이를 낳지 않기 때문에 자식의 유전자가 자신의 것임을 확신하기 위하여 암컷을 구속하는 행동을 한다. 그것이 결혼이다. 일반적으로 수컷의 질투가 암컷의 그것보다 훨씬 더 강하고 집요한데, 이는 원칙적으로 자신의 유전자를 확인할 수 있는 길이 없기 때문이다. 대체로 수컷은 새끼가 자신의 유전자를 상속하였다는 확신이 없거나, 남의 자식이 확실한 경우 물질적, 정서적 지원을 전혀 하지 않게 된다. 원시 부족의 상당수에서는 그 사회 내에서 재혼을 할 때는 여자에게 자식들을 죽이고 새 시집을 오게 하는 규칙이 존재한다. 일처다부제가 존재할 수 있는 경우는 티벳처럼 2~3명의 형제(근연도 50%)가 한 여성을 공유하고, 자신 집안의 재산을 보호하고자 하는 목적이 있을 때나 가능하다. 글루미 선데이에서 나오는 폴리아모리가 일생동안 지속될 것이라고 생각하는 것은 착각에 가깝지 않을까? 그런 식의 형태로 성생활을 하며 살기에는 암컷들의 유전자는 너무 보수적이며, 수컷들의 유전자는 너무 이기적이기 때문이다.


참고 문헌

-붉은 여왕 (매트 리들리 저) -진화심리학 (데이비드 버스 저) -본성과 양육 (매트 리들리 저)


BGM


↑ 클릭하면 움직여요. 움짤이야.

간만에 문화산책입니다. 매드맥스:분노의 포닥이 곧 극장가를 강타할 예정이라고 합니다. 

사실 IBS 문제는 처음 시행될 때 부터 말들이 많이 나왔죠. 정부에서는 재원이 다르기 때문에 일반 개인연구자들에게 가는 피해는 전혀 없을 것이라고 공언했지만, 연구자들이 실제 체감하는 연구비 사정은 조금 다른 듯 싶어요. 

노벨상을 타기 위해 개인에게 연간 100억씩 준다는 발상이 참 해괴망측하기도 하고, 연구에 자본주의의 잣대를 들이대는 꼬라지가 우리나라 천민자본주의의 극치를 보는 것 같아 입맛이 쓰기는 합니다만, 개인적으로는 IBS 단장님들이 꼭 반드시 노벨상을 타시기를 매일 매일 정화수 떠놓고 기도드립니다. (그리고 이거 없어지면 내가 가끔씩 이렇게 깔 께 없어져서 심심해져요.)







과거 회상 중










현재




(하)에서 계속



+ Recent posts