첫 글로서, 제가 공부하고 있는 분야인 genome에 대해 간단히 (하지만 최선을 다해) 설명드리고자 한다.

휴먼 게놈? 지놈제목을 어떻게 읽으셨을지 모르겠다. Genome은 독일 사람이 처음 만든 단어이므로(1) 게놈이라 읽는게 맞겠지만, 영어에서 지놈으로 읽으므로 국제 회의에서 대부분 '지놈'으로 통용된다.

double helix

[이중나선의 DNA]

Genome에 대해서 어렵게 느끼고 있는 분들이 생각외로 많다. 많은 의사들도 genome이라면 어려워한다. (이것에 익숙하시다면 당신은 대단한 분이다!) 의과대학 curriculum에서 배운 기억이 별로 없기 때문일지도 모른다. 그도 그럴것이 human genomics (인간 유전체학)라는 학문이 제대로 정립된 것이 'Human Genome Project'가 완성된(2) 2000년대 초반 부터이므로, 좁은 의미의 역사만 놓고 보면 10년 정도. 반면 그동안의 발전속도는 역사상 유례가 없을 정도다. 상대적으로 보수적인 의학 교육이 이 속도에 쫓아오지 못하는 것은 어찌보면 당연한지도 모른다.

So, what is the GENOME?

[도대체 genome 이 뭔가요...@.@]

Genome이 한 생명체 내의 전체염기서열이라는 둥 유전자의 총이라 등의 건조한 설명은 처음 입문하는 분들에게 큰 도움이 되지 않는 것 같다. 그러면 '염기가 뭐에요?' '유전자는 뭐죠?' 이런 질문이 반드시 나온다. 좋은 현상이다. 하지만 이것들을 글로 써 내려가면 하나의 교과서가 집필될 것이고, 그것은 정확한 전달 방법이 될지언정 이 블로그의 목표와는 벗어난다고 본다. 이것을 원하시는 분은 유전학 교과서를 구입해서 공부하시길 권한다.

'콩심은데 콩난다'라는 속담이 있다. 매우 insightful한 속담인데, 이것은 아버지-어머니 콩에서 아들-딸 콩으로 정보가 필히 전달되어야 한다는 것을 뜻한다. "너는 팥이 아니라 '콩'이다" 라는 정보가, 어떤 형태로든지 말이다. 그 정보 안에는 '넌 동그랗고, 초록색이고, 크기는 얼마얼마 정도고..' 이런 세부사항이 포함되어 있을 것이다. 이런 정보를 '유전' (inheritance)이라고 한다. 이런 부모의 (거의) 모든 유전정보는 genome 을 통해 전달되는 것이다. 너 자신을 알기 위해서 먼저 당신의 genome 을 알아야 하는지도 모른다.


[염색체. 이 사람은 남자일까요, 아니면 여자일까요?]


'눈에 보이는' 실체로서의 genome은 염색체(chromosome)이다. '사람은 23쌍의 염색체가 있고, 다운 증후군은 21번 염색체가 3개...' 할 때의 그 염색체 말이다. 염색체가 전달하는 유전정보는 염색체를 이루고 있는 DNA라는 물질에 코딩되어 있다. 그렇다면 어떻게 코딩되어 있느냐? 

그것이 바로 유전학을 하는 사람들이 풀고자 하는 궁극의 질문이다.

현존하는 생명체는 30억년 간 진화해오며 그들의 자손에게 계속 유전정보를 전달해 왔다. (그렇지 못했다면 대를 잇지 못한 것이다!) 우리의 genome에는 우리가 조상들에게 받은 모든 생명정보가 포함되어 있는데, 따라서 우리가 쓸 수 있는 생물학적인 전략은 결국 이 범위를 벗어날 수 없다. 그래서 때론 유전은 무섭기도 하다.

Genome의 단순구조는 상당히 잘 알려져 있는 편이다. 한글은 자음 14자/모음 10자로, 영문은 ABCD 알파벳 26자로, 십진법 수는 0,1,2,3,4..9 숫자 10개로 표현되는, genome은 염기 4개 (A,C,G,T 염기)로 코딩되어 있다.


[Genome 서열 (sequenceA,C,G,T @.@]


그렇다면 전체 사람 genome 의 코드 길이는? 약 30억개 (bp로 표시, base-pair) 이다. 사람(Homo sapiens) 종의 30억 bp (3,000,000,000 !!)의 서열을 처음으로 밝혀 낸 작업이 Human Genome Project(2)이다. 1990년부터 약 13년간, 1조원 이상의 연구비를 들여 완성된 대규모 국제협력 프로젝트였다. 30억개나 되는 방대한 길이다보니, 컴퓨터 및 통계학의 도움은 필수적이었고, 이로써 biology, computer science, statistics, informatics가 만나게 된다.


[역사적인 Human Genome 초안 발표, Bill Clinton, 2000년 6월.]

오른쪽은 HG Project를 이끈 Dr. Francis Collins (현 NIH 원장), 

왼쪽은 Celera라는 회사를 만들어 HG Project와 경쟁했던 Dr. Craig Venter 


그렇다면 큰 돈과 시간, 노력을 들여 도대체 왜 human genome의 A/C/G/T 서열을 밝히려 했는가? 그것은 모든 생명현상의 가장 아래에는 바로 genome 이 있기 때문이다. 그래서 genome을 생명의 설계도라 한다. 물질을 쪼개고 쪼개고 또 쪼개면 드디어 '원자'라는 실체가 나타나듯이 (물론 쿼크와 렙톤도 있다지만, 이들은 사실 나의 인식범위 밖이다), 사람에서 모든 (대부분의) 생명현상을 확대하고 확대하면, 결국 맨 바닥에서 만나게 되는 것은 human genome이다. human genome 이하의 계층 (layer)은 존재하지 않는다. 맨 바닥의 근본을 이해하지 못하고 생명현상을 설명할 수는 없다. 이와 같은 맥락에서, 인간의 많은 질병 역시 결국 genome과 연관된다. 물론 질병마다 그 연관정도가 다르긴 하겠지만.

의학 역사를 통틀어 오랜동안 대부분의 질병은 '임상적'인 측면에서 '거시적'으로 연구되었다. 폐에 암이 생기면 폐암, 위에 암이 생기면 위암인 식이다. 병리학과 분자생물학이 발전하면서 같은 폐에 생긴 암이라 하더라도 폐선암 (lung adenocarcinoma), 폐편평상피암과 같이 조금 더 미시적인 이해가 가능해졌다. (이 둘은 같이 폐에 생기지만, 완전히 다른 암이다.) 질병 genome 분석을 통해 궁극적인 분석이 가능해진다. 정확한 원인의 이해는 정확한 치료가능성으로 이어진다. 그리고 기술의 발전으로 이제 그것이 가능한 시대가 도래했다. (이에 대해서는 언젠가 다른 글을 통해 설명하도록 하겠다) 개인적으로 암의 genome (cancer genome)을 연구하고 있기 때문에 암의 예를 들었으나, 다른 질병에도 일반적으로 통용될 것이다.

Genomics (유전체학)이 가장 fancy한 학문이라는 것을 주장하고자 하는 것은 아니다. 다만, 최근에 사람의 genome분야가 급속도로 발전하고 있고, genomics발전의 최대 수혜자는 바로 의학임은 두말할 필요도 없다. 분명히 genomics의 발전은 5년 이내에 현재의 임상의학의 모습을 직접적으로 바꾸어 놓을 것이다. 또한 이미 genome technology의 발전은 다른 의생명과학 분야와 접목되어 새로운 차원의 이해를 가능케 하고 있다. 예측할 수 없는 빠른 변화가 일어나는 시기가 바로 지금이다. 이런 의미에서, 우리는 어쩌면 물리학의 상대성 이론과 양자역학이 태동하던 20세기 초와 같은 대단한 시기에 살고 있는지도 모른다. 적어도 필자는 그런 생각(혼자만의 착각?) 속에 살고 있다. 그리고 이러한 파급력을 감안한다면 의과대학 교육에서 genomics에 대한 관심이 훨씬 높아져야 한다. 아마도 머지 않은 미래에 그렇게 될 수밖에 없을 것이다.

다음 글에서는 조금더 세부적인 내용을 언급해 보고자 한다. 본업이 글쓰기가 아니다보니 차분하게 글 쓸 여유가 또 주어지기만을 바랄 뿐이다. 

참고문헌

(1) http://ko.wikipedia.org/wiki/게놈 

(2) http://en.wikipedia.org/wiki/Human_Genome_Project


+ Recent posts