Genome은 서열이 아니라, 세포가 지나온 시간의 기록이다

2026. 1. 29. 17:00Science 생각들

많은 사람들이 Genome 분석을 한다고 말합니다.

하지만 실제로 대화를 해보면, 상당수는 sequence를 보고 있을 뿐입니다.

Sequence는 문자입니다.

A, T, G, C의 나열이고, 비교적 정적인 정보입니다.

반면 Genome은 구조이며, 맥락이며, 역사입니다.

저는 오랫동안 Whole Genome Sequencing 데이터를 다루면서

“이 변이가 있다/없다”라는 질문보다
“이 변이가 왜 여기에서, 이 형태로 존재하는가”

라는 질문을 더 많이 하게 되었습니다.

그렇기에, Genome을 본다는 것은 단순히 변이를 찾는 것이 아니라,
그 변이가 어떤 세포 계통에서 생겼고, 어떤 시간축을 따라 축적되었으며,

어떤 구조적 제약 속에서 살아남았는지를 함께 해석하는 일입니다.

같은 single nucleotide variant라도 어떤 것은 noise이고(passenser mutation),
어떤 것은 주인공입니다(driver mutation).


또 어떤 것은 lineage의 흔적이며(early embryonic post-zygotic mutation)
어떤 것은 구조를 바꾸는 신호(codon optimization variants)입니다.


이 차이는 sequence만 보고는 절대 구분할 수 없습니다.

이 관점은 단백질 생산과 세포주 개발에서도 그대로 이어집니다.

같은 유전자가 들어가 있고, 같은 아미노산 서열을 가진 단백질이 나온다고 해서
그 세포들이 “같은 세포”라고 말할 수는 없습니다.


Genome은 기억합니다.


integration의 흔적을, 증폭의 상처를, 선별 과정에서 살아남은 이유를.

그래서 저는 생산세포주를 볼 때도

“얼마나 나온다”보다
“이 Genome이 어떤 상태인가”를 먼저 봅니다.

그렇기 때문에, 발현은 결과이고, Genome은 조건입니다.

조건이 다르면, 결과는 언젠가 달라집니다.

지금은 같아 보여도, 시간이 지나면 반드시 차이가 드러납니다.

Sequence를 읽는 것은 출발점이지만, Genome을 이해하는 것은 방향을 정하는 일입니다.