Human Genome 관련 기본 상식 내용 – 기사 모음
인간유전자 3~4만개뿐– 게놈지도 공개
인간의 유전자 수는 최대 10만개에 달할 것이라는 일반적인 추산과 달리 초파리보다 배 정도 많은 3만∼4만개에 불과한 것으로 나타났다. 이 같은 사실은 지난해 6월 인간의 유전자 정보를 담은 게놈 지도 초안을 발표했던 다국적 연구팀인 인간게놈프로젝트(HGP)와 미국의 셀레라 제노믹스사가 완성해 12일 공개 예정인 게놈 지도 내용에서 밝혀졌다. 11일 이 내용에 따르면 HGP는 인간의 유전자 수를 3만∼4만개, 셀레라측은 2만6000∼3만9000개로 추정했다. 유전자 수는 하등 식물이 2만5000개, 작은 벌레 종류가 1만9000개, 초파리는 1만3600개 정도이다. HGP의 에릭 랜더 박사는 “인간의 유전자 수가 초파리의 배 정도에 불과하다는 것은 놀라운 사실”이라면서 “비슷한 유전자 수에도 불구하고 인간이 벌레보다 복잡한 구조를 가진 이유는 여전히 미스터리”라고 지적했다. 이 연구에 참여하고 있는 영국 과학자들은 또 치명적인 각종 질병을 유발하는 유전자들이 가장 많이 집중돼 있는 이른바 ‘킬러 염색체’들을 발견했다고 외신은 전했다.
인간 게놈 지도의 완성은 알츠하이머병 등 치명적인 질병과 알코올 및 마약 중독, 암, 심장병 같은 유전성 질환의 원인 규명과 치료에 획기적인 발전을 가져다 줄 것으로 기대되고 있다.
인간게놈프로젝트가 밝힌 생명의 신비8
1인 3역 수행하는 소수정예 유전자 군단
인간게놈지도 완성. 인간이라는 생명에 담겨있는 모든 유전정보가 한권의 책으로 편찬된 것에 비유될 수 있다. 인간게놈프로젝트에 의해 밝혀진 새로운 사실에는 무엇이 있을까. 그리고 그 사실들은 우리에게 어떤 의미를 던지고 있을까.
한마디로 이번에 발표된 연구결과는 인간이라는 생명의 유전정보가 담긴 한권의 책을 편찬한 것에 비유될 수 있다. 향후 계속적인 연구를 통해 이 책 속의 유전정보들은 생명의 신비를 풀어줄 수 있는 도서관으로서의 제 기능을 발휘할 수 있을 것으로 기대된다. 물론 여전히 채워야 할 1% 정도의 공백이 남아있기는 하지만 말이다.
현재 발표된 인간게놈의 지도작성이 왜 놀랄만한 화제가 되고 있는지 그리고 이것이 우리 인류에게 주는 메시지는 과연 무엇인지에 대해 알아보자.
인간 자존심에 상처 입혔다? – 초파리 2배 정도의 유전자수
인간의 유전자는 초파리의 2배정도일 뿐아니라 쥐의 유전자95%정도를 공유한다. 하지만 이것을 이용하면 쥐의 유전정보를 이용 신약개발이 가능하다.
인간 유전자의 정확한 개수는 더 많은 실험을 통해 결정돼야 하겠지만, 현재 다국적팀과 셀레라는 대략 3만-3만5천개 정도가 게놈에 존재한다고 예상하고 있다. 이 새로운 추정치에 따르면, 인간은 선충이나 초파리에 비해 단지 2배 정도 많은 유전자를 가지고 있을 뿐이다. 만물의 영장이라는 인간의 자존심이 상처를 입을 만큼 적은 수치다. 그렇다면 이렇게 적은 수의 유전자로 어떻게 인간의 생물학적 복잡성을 설명할 수 있을까.
분명 유전자의 수적인 측면에서 인간은 매우 검약정신이 강한 생물체다. 게놈에서 실제 발현된염기서열조각(EST, expressed sequence tags)을 연구한 결과에 따르면, 인간의 경우 하나의 유전자에서 하나의 단백질을 생성하는 것이 아니라 평균 3개의 서로 다른 단백질을 만든다고 예측되기 때문이다.
다시 말해 인간과 다른 생물 종 사이에 존재하는 생물학적 복잡성의 차이가 그들의 유전자 숫자와 큰 관계가 없다는 얘기는 인간이 유전자들을 활용할 수 있는 어떤 ‘내부혁명’을 통해 더 복잡한 일을 성공적으로 수행하고 있다고 추정해볼 수 있게 한다. 즉 인간, 선충, 그리고 초파리 등의 한 유전자에서 단백질을 암호화하는 부위의 크기는 비록 같다고 하더라도, 인간 유전자는 유전정보를 담고 있는 엑손(exon) 부위를 다양하게 조합하고 정교한 세포 내 편집과정을 통해 다른 생물보다 평균 3배 정도 많은 단백질을 생산할 수 있다
는 말이다.
그러나 여기서 한가지 짚고 넘어가야 할 문제는 게놈연구에서 추정된 인간 유전자 수는 여전히 논란의 여지가 있다는 점이다. 이것은 게놈연구에서 사용된 유전자 예상 프로그램의 한계 때문이다. 이 프로그램은 이미 잘 알려진 유전자의 구조를 바탕으로 새로운 유전자의 존재 가능성을 분석한다. 따라서 유전자 발현정도가 매우 낮아 현재의 유전자 선별기법으로는 검증되지 못하는 유전자들은 제외될 수밖에 없다는 말이다.
그러므로 인간의 생물학적 복잡성은 단순히 유전자 개수로 설명할 수 있는 사안이 아니다. 유전정보를 담고 있는 유전자의 암호를 풀어 단백질을 만들어내는 과정인 유전자 발현에서 설명되는 것이 더 설득력이 있다고 생각된다.
유전자는 밀집된 도시를 이룬다 – 무 척추생물과 구분되는 불규칙 분포
인간 염색체상의 유전자 분포는 매우 놀랍다. 즉 인간의 염색체 안에는 많은 유전자들이 서로 가까운 거리에 위치해 마치 밀집된 도심과 같은 형태를 이루고 있다는 말이다. 그리고 전체 게놈 중 약 95%정도를 차지하는 ‘JunkDNA’들은 마치 거대한 사막지대처럼 펼쳐져 있다.
이와 같이 인간 유전자의 불규칙한 분포는 애기장대, 선충 또는 초파리와 같이 유전자들이 상대적으로 게놈 위에 고르게 분포하고 있는 무척추생물과 뚜렷이 구분되는 점이다. 그러므로 왜 인간의 유전자들은 모여 있으며, Junk DNA의 존재가 정확히 무엇을 뜻하는지 새롭게 주목해야 할 것이다.
또 인간게놈의 약 40-48% 정도는 특정 염기서열이 반복돼 있는 반복염기서열(repetitive sequence)로 이뤄져 있다. 가장 일반적인 형태의 반복구조를 Alu라고 하는데 전체 게놈 중에서 대략 10% 정도나 차지하고 있다. 그리고 계통학적으로 더 오래된 Alu일수록 유전자들이 많이 밀집돼 있는 부위에 위치하고 있다. 이 사실은 Alu 염기서열이 어떤 의미를 가지고 게놈에 함유돼 있음을 시사한다.
일반적으로 알려진 반복염기서열, 즉 염색체의 끝부분에 해당하는 텔로미어(telomere, 말단소립)와 염색체 중앙의 동원체(centromere) 부위에 존재하는 반복염기서열은 염색체보호나 세포분열이라는 특정 기능을 담당하고 있다. 이런 반복염기서열과는 구별되는 특정 반복염기서열들이 왜 인간에 더 많이 축적돼 있는지에 대해서는 아직까지 정확한 이유를 알 수 없다.
하지만 Alu와 같은 반복염기서열이 한 유전자로부터 여러 단백질을 생성하는데 필요한 메커니즘을 제공한다고 추정될 수는 있다. 즉 유전자의 수적 측면에서 인간은 선충에 비해 겨우 30% 정도 많음에도 불구하고 훨씬 복잡한 고등생물이라는 점에 이런 반복염기서열이 기여하고 있다고 추측해보는 것이다.
유전자 보호하는 반복염기서열 – 5천만년 전 활동 중단
우리 인간은 애기장대(11%), 선충(7%) 또는 초파리(3%)보다 훨씬 많은 50% 정도의 반복염기서열을 가진다. 또한 놀랍게도 과거 5천만년 전에 인간게놈의 반복염기서열의 활성이 급격하게 감소했다고 추정된다. 즉 인간이 5천만년 전에 반복염기서열 DNA를 수집하는 일을 그만뒀다는 말이다.
반면 설치류에서는 그런 반복염기서열의 감소현상을 발견할 수 없었다. 이와 같은 연구결과는 반복염기서열 DNA의 새로운 역할에 대해 조명할 수 있는 좋은 기회를 제공한다. 앞에서도 말했듯이 반복염기서열 DNA는 유전자가 많이 포함된 장소에 밀집해 있으면서 유전자의 재배열을 통해 한 유전자로부터 여러 단백질이 만들어질 수 있는 기반을 제공할 수 있다. 더 나아가 이런 반복염기서열 DNA는 전체 게놈에 존재함으로써 유전정보를 담고 있는 엑손이라는 부위의 DNA가 환경유해인자로부터 손상을 입을 가능성을 상대적으로 감소시키는 역할을 할 수도 있다.
설치류에서 반복염기서열 DNA의 축적이 계속되고 있는 것은 인간에 비해 DNA 염기서열상의 손상을 원상 회복시키는 메커니즘의 효율이 상대적으로 낮기 때문에 세포분열과정 동안 인간보다 훨씬 많은 돌연변이가 축적되는 현상으로 생각할 수 있다. 만일 반복염기서열 DNA가 유전암호부위인 엑손에 발생하는 손상을 보호하는 역할을 한다면, 설치류는 더 많은 반복염기서열 DNA를 모으는 것이 생존을 위해 필요하다.
바이러스 닮은 유전물질 운반책 – 반복염기서열의 불가사의한 분포
일반적으로 반복염기서열의 요소(repeat elements)들은 게놈 상에서 AT염기서열은 풍부하지만, GC 염기서열은 상대적으로 적은 황량한 사막과 같은 구역에 자리잡고 있다. 그러나 SINE(short interspersed elements) 요소라고 부르는 반복염기서열 종류는 게놈 내에서도 GC 염기서열이 풍부한 지역에 터를 잡고 있다. 과거 생물학자들에게는 SINE 요소가 기생충 같은 불쾌한 존재로 여겨져 왔으나, 현재는 생명체에서 유익한 공생체로 작용할 가능성이 높다고 예상되는 이유다.
과연 반복염기서열의 분포가 의미하는 바는 무엇일까. 현재의 생물학적 분석기술 수준으로 반복염기서열요소가 수행하는 정확한 역할을 예상하거나 분석하는 일은 매우 어려운 과제인 것은 분명하다.
SINE는 3백개 정도의 염기로 구성된 반복염기서열 요소로서 LINE(long interspersed elements)와 함께 바이러스와는 구별되는 레트로트랜스포존(retrotransposon, RNA를 청사진으로 하여 유전물질을 운반하는 바이러스 같은 존재)의 하나로 알려져 있다. 이 SINE는 보통 포유동물 종 사이에는 50-60% 정도, 그리고 단일 종 내에서는 80% 정도 유사성을 갖는 반복염기서열이다. SINE는 게놈 내에서 여기저기로 옮겨 다닐 수 있기 때문에 유전물질의 운반수단으로 알려져 있으며 특히 어떤 경우에는 질병의 원인이 된다고도 밝혀져 있다.
인간 게놈에서 발견되는 가장 보편적인 SINE는 AluI이라는 제한효소에 의해 인식되는 특이 염기서열을 가지고 있어 Alu 염기서열이라고도 부른다. 이들의 생체 내 역할은 정확하게 밝혀진 것은 없지만 현재 생명체내에서 새로운 유전자를 만드는 수단으로 사용될 가능성이 높게 점쳐지고 있다.
이와 관련돼 셀레라는 적어도 97개의 암호화 부위(conding region)가 반복염기서열 요소들에 의해 게놈상의 다른 곳으로 운반됐을 가능성을 제시했다. 게놈 속에서 반복염기서열의 재배열을 통해 완전히 새로운 유전자를 창조하거나 기존의 유전자를 변형시킴으로써 새로운 모습의 게놈으로 탈바꿈할 수 있게 했을 지도 모른다는 얘기다.
세균으로부터 유전물질 전달받다 – 박테리아 유전자 2백 개 발견
인간게놈 연구결과 박테리아의 유전자와 비슷한 인간유전자가 2백개 정도 존재하고 있다는 사실이 새로 발견됐다. 더욱이 이 유전자들은 선충이나 효모같은 무척추생물에서도 발견되지 않는 종류다. 박테리아의 유전자와 비슷한 인간 유전자들은 진화적으로 척추동물이 탄생했던 시기보다 최근에 획득된 것으로 추정된다. 이는 인간게놈으로 전달된 유전자들이 서로 다른 세균으로부터 독립적으로 전달됐다는 점을 시사한다.
이와 같은 유전자 획득은 세균 종류에서는 쉽게 발견되는 현상이다. 한예로 질병을 유발하는 세균의 경우, 항생제에 대해 저항성을 갖는 유전자를 다른 종으로부터 쉽게 획득하기도 한다.
따라서 유전자의 획득이 인간과 같은 척추동물과 무척추 생물을 구분 짓는 주요 인자로 간주하기에는 다소 무리가 따른다. 왜냐하면 무척추동물도 인간과 같은 척추동물에 존재하지 않는 유전자를 공생세균들로부터 획득했을 가능성이 높기 때문이다. 그러므로, 이 세균유래 유전자에 대한 의미부여는 좀더 체계적인 연구를 통해 가까운 미래에 가능할 것으로 생각된다.
남성 유전자가 여성보다 돌연변이 많다 – 진화과정 단서 제공하는 Y염색체
반복염기서열이 특징인 우리 인간의 Junk DNA는 과거 진화과정을 추적할 수 있는 좋은 화석기록에 비견될 수 있다. 다국적팀과 셀레라는 3백만개 이상의 반복염기서열을 사용해 DNA의 연대를 매기고 있다. 이를 통해 그들이 언제, 어디서 왔는지를 정확히 밝혀서 반복염기서열의 가계도를 그리고 있다. 연구팀들은 약 3백만개의 반복염기서열의 나이를 추정했다.
그런데 남성의 Y 염색체에 산재하는 반복염기서열의 패턴이 흥미롭다. 남성과 여성의 생식세포가 될 부분(germ line)에서 상대적인 돌연변이빈도를 측정해본 결과, 남성이 여성에 비해 2배 정도 높은 돌연변이를 보였다. 남성이 유전자적으로 취약하고 여성은 잘 견뎌낸다는 말이다. 이는 난자형성보다 정자형성에서 세포분열의 횟수가 많기 때문에 남성에게 상대적으로 많은 돌연변이가 축적됐다고 추정된다.
한편 남성 유전자는 돌연변이 빈도는 높지만 대부분 염기 한두개가 바뀌는 점돌연변이가 많다. 반면 여성 유전자는 잘 바뀌지 않는 대신 한번 바뀌면 수십개가 없어지거나 삽입되는 형태의 돌연변이다.
맞춤의약의 학문적 기초 제공– 단일염기다형성(SNP) 지도작성
인간게놈지도의 완성과 함께 얻어진 또 한가지의 성과로는 그 동안 과학자들이 연구 해 온 게놈상의 약 1백4십만개에 달하는방대한 수의 단일염기다형성(SNP, single nucleotide polymorphism)이 밝혀졌다는 것이다.
앞으로 이 SNP를 게놈지도상에 정확하게 표시할 수 있게 됐으며, 이러한 SNP 지도 는 향후 질병지도를 작성하고 인류의 기원을 추적하는데 지대한 공헌을 할 것으로 기대되고 있다. 따라서 게놈상의 SNP 지도가 제공할 수 있는 잠재적 활용가치에 대해 주목할 필요가 있다.
SNP란 인간 개체별로 게놈상의 염기서열이 동일하지 않은 것이 약 1천개의 염기 중 1개 정도의 빈도로 나타나는 현상이다. 따라서 특정 유전질환의 원인이 되는 유전정보상의 변이는 개인별로 다를 것이므로 질병의 예방과 치료를 위해서는 개인의 유전 특성에 맞는 약을 개발해 제공할 수 있다고 기대되는 것이다. 또한 이 결과는 모든 질병의 유전적 기초를 밝히는데 중요한 실마리가 될 것이다. 소위 말하는 개인별 맞춤의약의 현실화는 바로 이 SNP 연구로부터 가능할 것이며, 따라서 제약회사들은 SNP를 이용해 신약의 특이성을 높이는데 필요한 성과를 얻어낼 수 있을 것으로 기대된다.
그러나 그동안 연구된 암호화 부위에 해당하는 SNP 지도로는 각 개인에 따라 질병에 걸릴 확률의 차이를 설명하는데 매우 미흡한 실정이었다. 유전자 발현에 영향을 미치는 프로모터나 유전자상의 비암호화 부위인 인트론(intron) 염기서열의 변이 등에 대한 정보의 축적이 필수적이라는 얘기다. 우리 게놈상의 염기서열변이 중 기능적으로 중요성을 지니는 부위를 찾는 작업은 향후 과학자들에게 주요 도전과제로 남아 있다. 물론 SNP 지도가 작성되더라도 모든 인간이 혜택을 누리지는 못할 지도 모른다. 중요한 문제는 각 개인별 SNP 지도를 작성하고 개별 맞춤형 신약을 선별해 조제하는데 드는 시간과 비용이 될 것이다.
예상보다 복잡한 단백질 상호작용 – 적은 수로 창조적 활동 수행
많은 과학자들은 게놈이 만드는 산물, 즉 단백질 전체를 의미하는 프로테옴(proteome)의 경우 인간이 무척추생물보다 훨씬 복잡하다고 예상하고 있다. 예를 들어 인간을 비롯한 척추동물은 원래 존재하는 단백질의 기능부위, 즉 도메인(domain)만을 고쳐서 새로운 단백질을 만들 수 있다. 다시 말해 인간은 더 복잡한 단백질 생산을 위해 새로운 전략을 수립하기보다는 다른 생물에서 이미 검증돼 있는 단백질을 받아들이고 재배열해서 새로운 혁명을 이룩할 수 있었다는 것이다.
게놈 안에 포함될 수 있는 모든 단백질 구조를 분석한 결과, 인간이 다른 동물에 비해 특별히 많은 종류의 도메인을 갖고 있지는 않았다. 따라서 이런 도메인을 보다 창조적으로 사용함으로써 상대적으로 훨씬 복잡한 생명체로 진화할 수 있었지 않았나 추정해볼 수 있다. 셀레라는 이런 가설을 뒷받침하는 특정부류의 단백질집단을 발견했는데, 바로 액틴세포골격에 포함되는 구조 단백질과 신호전달과 면역기능에 관련된 단백질들이다.
인간의 게놈지도 작성이후의 생물학 연구는 프로테오믹스(Proteomics)라고 불리는 대단위의 단백질 연구에 초점이 맞춰질 것이다. 그런데 이런 단백질 연구가 과거에는 존재하지 않던 전혀 새로운 분야는 아니다. 단지 그동안 가내공장 식으로 진행해 오던 단백질의 구조·기능분석 연구들이 마이크로어레이(microarray)와 같은 고용량 자동화처리기법을 통해 그리고 완성된 게놈 정보를 바탕으로 체계적으로 진행될 수 있게 됐다는 사실을 의미한다.
앞으로 이런 대단위의 단백질 연구는 게놈 분석과 마찬가지로 인간이란 생명의 정체를 밝는데 결정적으로 공헌할 것으로 기대된다. 그러나 한가지 분명한 사실은 단백질의 구조와 기능을 연구하는 일에는 이전의 다른 어떠한 분야보다 훨씬 복잡하고 많은 시간이 요구된다는 점이다. 특히 예상보다 훨씬 적은 수의 인간 유전자가 발견됐다는 사실은 특정 생명현상에서 작용하는 여러 단백질들 사이의 상호관계가 예상보다 훨씬 복잡하다는 사실을 암시한다.
[유전자치료 1]유전자 치료란 무엇인가?
생명공학의 발전과 유전자 치료
21세기의 벽두에서, 21세기를 대표하는 과학기술이 무엇이 될 것인가를 한 번쯤 생각하게 되는 것은 당연한 일이다. 많은 사람들이 21세기를 주도해 나갈 과학기술이 정보통신과 생명공학이라고 이야기하는데 주저함이 없다.
2001년에 들어오면서 이중 생물학 분야에서 획기적인 일이 하나 마무리돼 가고 있다. 바로 게놈프로젝트. 그런데 왜 사람들은 인간의 유전자를 해독하려고 하는 것일까? 과학자들은 지금가지 미생물 유전자에 대한 연구 결과, 유전자 내에는 질병을 일으킬 수 있는 인자 등을 포함한 다양한 정보가 숨겨져 있다는 걸 알고 있다. 따라서 게놈 연구를 통하여 이러한 유전적 정보를 알게 되면 질병의 예방 및 치료를 할 수 있으며, 또 이것은 자본의 논리로 보아도 상당한 가치를 지닌 일임에 틀림없기 때문이다.
비이글 개 다리뼈 유전자 치료. 절단된 개의 다리뼈에 유전자 치료를 한 결과 절단된 부위에서 뼈가 재생되고 있슴을 보여 준다. 좌로부터 치료 후 2, 8, 12, 16, 18 주 후의 상태를 방사선을 이용해 촬영했다.
게놈프로젝트와 맞물려 가장 관심을 끄는 이슈중의 하나가 ‘유전자 치료‘다. 게놈프로젝트가
완성되면, 어떤 사람의 유전자를 해독하게 될 것이고, 그 해독된 유전자를 근거로 어떤 질병이 발병할 것인 가를 예측할 수 있게 된다. 그리고 상당 부분의 질병은 예방이 가능할 것으로 믿고 있다.
이미 분자 생물학의 한 분야인 ‘바이러스학‘ 분야에서는 인류를 위한 획기적인 질병 예방책을 제시했는데, 그것이 지금까지 잘 알려졌으며 또 많이 쓰이는 ‘예방 접종‘이라고 불리는 바이러스 면역 방법이다. 유전자 치료를 연구하는 과학자들은 유전자 치료가 이 면역학처럼 인류를 위해 큰 역할을 할 것으로 믿고 있으며 많은 유전자 관련 질병들이 유전자 치료를 통하여 해결될 것으로 생각하고 있다.
유전자 치료란?
유전자 치료는 유전자의 이상으로 발생하는 질병, 예를 들어 암, 당뇨병, 심장병 등을 유전자를 투입해 치료하는 방법이다. 유전자 이상과 관련된 질병은 보통 어떤 단백질의 과다 발현 혹은 적은 발현으로 일어나게 된다. 예를 들어 암 세포는 성장에 관련된 단백질은 과다 발현되며, 성장 억제 단백질은 적게 발현된다. 이상적인 몸의 상태는 성장에 관련된 단백질과 성장 억제와 관련된 단백질이 서로 견제하여 적절한 평형상태를 유지하는 것인데 이 균형이 깨어져 어느 한 편이 일방적으로 우세한 경우가 되면 ‘질병‘이 된다.
유전자 치료는 이런 몸의 불균형을 보완하기 위해 인체 밖에서 인위적으로 유전자 물질을 주입해 평형 상태를 유지시키는 것을 의미한다. 이런 유전자 치료에는 단백질을 직접 주입하는 방법에서부터 몸 안에 있는 특정 유전자 발현을 도와주거나 억제하는 약물치료법, 그리고 DNA라고 불리는 유전자 정보를 가진 물질을 몸 안에 주입하여 주입된 유전자가 발현하게 하는 방법 등이 있다.
단백질 약품을 직접 몸 안에 넣는 방법은 많은 제약이 따르게 된다. 그 제약은 아이러니칼하게도 우리 몸의 외부 물질에 대한 저항력 즉 면역에 의해 발생하게 된다. 이미 알고 있는 바와 같이 면역이란 외부 물질(항원)이 생체 내에 들어오게 되면 생체 내에 있는 단백질들에 의해 항원들이 파괴되고 이 파괴된 항원 조각들을 면역 세포들은 기억하게 돼, 다음에 똑같은 물질이 들어오게 되면 면역 세포들은 즉시 파괴시켜 버린다. 우리가 생체 내에 넣어 주는 단백질은 생체의 입장에서 본다면 분명히 항원이며, 한 번 기억된 면역 세포들은 다시 들어오는 물질들을 즉시 파괴하게 된다.
그러나 사람에 관계없이 단백질의 아미노산 서열이 같다면 면역 세포들은 이 물질이 외부에서 공급된 것인지 생체 내에서 만들어진 것이지 구별 못하게 돼 이 면역체계를 피하여 갈 수 있다. 흔히들 당뇨병 치료제로 알고 있는 인슐린은 아미노산 수가 51개 밖에 되지 않는다. 즉 사람에 따라 인슐린의 아미노산 서열이 다르지 않으므로 성공적으로 단백질 약품으로 쓰이고 있다.
단백질 의약품의 또 다른 단점은 지속적인 주입이 필요하다는 것이다. 즉 단백질 스스로는 생체 내에서 단백질을 만들어 낼 수 없고, 생체 내에서 어느 정도 시간이 지나면 생체내의 호르몬 등의 단백질에 의해 파괴가 된다. 생체 내에서 단백질은 필요에 의해 DNA로부터 만들어지고 또 적정한 생체 조건을 위해서 파괴되어지고 또 만들어진다. 또한 단백질 의약품은 여러 하등 생물이나 다른 동물 등을 통해 만들어지므로 생산비용이 비싼 단점이 있다.
이러한 단백질 약품의 문제점을 극복하기 위하여 생각해낸 개념이 유전자 이용 방법이다. 흔히 DNA라고 불리는 유전자는 생체내에서 단백질을 만들어 낼 수 있는 능력을 가지고 있다. 그래서 기존의 단백질을 직접 주입하는 방법에서 DNA를 생체내에 주입하여, 주입된 DNA가 지속적으로 단백질을 만들어 내게 한다는 것이 유전자 치료의 기본적인 생각이다.
바이럴 벡터와 비바이럴 벡터
유전자 치료의 기본적 구성 요소는 세가지로 구분된다. 첫 번째가 어떤 특정한 단백질을 만들어 낼 수 있는 유전 암호를 가진 유전자라고 불리는 DNA조각이다. 과학자들은 주로 돌연변이를 만들어 이 DNA가 생체 내에서 어떤 역할을 하는 지 밝혀 낸다.
다음으로는 이 유전자를 발현시킬 수 있는 체계인 일반적으로 플라스미드라고 불리는 유전자 발현 체계이다. 즉 특정 유전자를 이 유전자를 발현시킬 수 있는 요소들을 갖춘 큰 체계의 유전자 사이에 끼워 넣어 이 부분을 발현시킬 수 있게 만든 체계를 플라스미드라고 부른다. 플라스미드 내에 유전자를 끼워 넣을 때는 제한 효소를 이용하며, 만들어진 플라스미드는 대장균 등의 균주에 넣어 대량으로 증식시킨다.
다음으로 필요한 것은 특정 유전자가 포함된 운반체를 원하는 위치까지 안전하게 운반시킬 수 있는 수송체가 필요하다. 운반체로 쓰이는 물질들은 단백질이나 천연 고분자 혹은 합성 고분자나 리포좀을 이용한다. 이런 방법을 이용하여 질병을 치료하는 방법을 비바이럴 벡터에 의한 유전자 치료라고 부른다.
반면 바이럴 벡터는 DNA 조각을 바이러스의 유전자에 끼워 넣거나 재 조합하여 사용하는 방법이다. 바이럴 벡터에서 사용하는 바이러스로는 아데노 바이러스, 아데노어쏘씨에이트 바이러스 또는 레트로 바이러스 등이 사용되는데, 특정 원래의 바이러스 유전자 사이에 끼워 넣거나 재 조합해 사용한다.
바이럴 벡터와 비바이럴 벡터는 서로 장단점을 가지고 있다. 일반적으로 바이럴 벡터의 장점은 비바이럴벡 터의 단점이고, 비바이럴 벡터의 장점은 바이럴 벡터의 단점일만큼 서로 상반된 방향에서 연구를 해나가고 있다. 그러나 그 둘의 궁극적 목표는 같은데, 첫번째 공동 목표는 안전성을 들 수 있다.
바이럴벡터는 일반적으로 만들어지는 구성요소가 바이러스라는 생물질이므로 구성 요소면에서는 안전한 물질이다. 반면 생체 내에서 바이러스를 증식시킬 수 있다는 위험이 있다. 바이럴 벡터를 연구하는 사람들이 가장 중심적으로 생각하는 부분이 어떤 식으로 유전자들을 구성해 두면, 바이러스의 증식을 막을 수 있느냐에 있다고 해도 과언은 아니다.
비바이럴 벡터의 안전성 문제는 유전자에 기인하지는 않는다. 수송체의 용도는 플라스미드 DNA가 생체 내에서 DNA 분해 효소로부터 분해되는 걸 방지하며, DNA를 조밀하게 싸서 부피를 작게 만들어 세포 내로 이동하기 쉽게 만들고, 특정 세포에 부착되게 도와주거나 세포 내 핵으로 유전자를 이송하는데 도움을 주는 역할 등을 담당하게 된다. 일반적으로 비바이럴 벡터에서 쓰이는 수송체들은 생체 내에 존재하는 물질이 아닌 합성 물질이 많다. 이 합성 물질들은 생체 내에서 독성을 나타낼 수 있다. 따라서 비바이럴 벡터를 개발하는 사람들이 고려하는 수송체의 중요하게 여기는 부분 중 하나가 독성을 감소시키거나 독성이 없는 물질을 찾아내는 일이다.
두 번째 목표는 특정 세포나 기관으로 보내는 방법이다. 예를 들어 간암을 치료하기 위하여 유전자를 주입했는데, 허파에서 발현한다면 병을 고칠 수 있는 능력도 떨어지게 된다. 특히 자살 유전자를 주입할 때에는 죽일 세포로 정확히 운반해야 된다. 그렇지 않으면 정상적인 일반세포까지도 파괴시킨다.
일반적으로 세포들은 ‘리셉트‘라고 불리는 세포 표면의 단백질을 이용하여 물질을 세포 내로 받아들이고 있다. 이 리셉트들은 특정한 리간드라고 불리는 물질들과 결합하게 되는데, 유전자 치료에서는 주로 특정 리셉트와 결합하는 특정 리간드를 이용하게 된다.
다음으로 고려하는 사항이 발현의 정도를 높이는 문제이다. 바이럴 벡터는 일반적으로 유전자 운반 효율이 높고 생체 내에서 발현도 잘 하므로 큰 문제가 없다. 그러나, 비바이럴 벡터에서의 발현 정도는 굉장히 중요한 이슈임에 틀림없다. 지금까지 잘 만들어진 비바이럴 벡터의 발현 정도는 바이럴 벡터에 비해 1,000-100,000 분의 1 수준이다. 비바이럴 벡터를 개발하는 사람들의 첫번째 목표가 바이럴 벡터의 수준을 보일 수 있는 수송체의 개발이라고 하여도 과언은 아닌 것이다.
30억개 문자의 정체를 밝힌다
예정보다 2년 앞선 2003년 완성
‘인체 설계도‘를 손에 쥐는 일이 초읽기에 들어갔다. 2000년 3월경 인간게놈프로젝트의 90% 이상이 완수되고, 2003년 마침내 인간 유전자의 비밀문자가 완전히 해독된다. 이미 30여종의 생물 게놈연구는 완료된 상태다. 총 30억달러의 비용 부담을 감수하며 야심차게 추진해온 인간게놈프로젝트는 우리에게 어떤 의미를 던져줄까. 그리고 새롭게 떠오르고 있는 후속 연구과제는 무엇일까.
머지않아 우리는 사람의 유전체에 담겨있는 모든 유전정보를 알게된다. 인간게놈프로젝트가 예정보다 2년 앞선 2003년 완료됨에 따라 사람의 게놈 설계도가 완전히 밝혀진다. 신비의 영역에 놓여있던 ‘생명‘이라는 막연한 개념이 이제 구체적인 형태를 갖추고 우리앞에 다가온 것이다. 엄청난 사건임이 분명하다.
다른 생물의 게놈 설계도 역시 속속 완성되고 있다. 이미 30여종에 달하는 생물의 게놈 정보가 모두 밝혀졌고, 그 세세한 설계도를 인터넷을 통해 감상할 수 있다.
게놈 정보를 알아냈다는 말은 구체적으로 무슨 뜻일까. 왜 인간게놈프로젝트의 성과가 전세계 과학자들의 관심을 집중시키고 있을까.
전체의 2%만 기능 알려져
게놈(genome)은 유전자(gene)와 염색체 (chromosome) 두 단어를 합성해 만든 말로서, 생물에 담긴 유전정보 전체를 의미한다. 그렇다면 유전자는 우리 몸의 어디에 존재할까. 세포다.
인체는 수조(兆)개의 세포로 이뤄져 있다. 각 세포의 핵에는 1쌍의 성염색체(여성은 XX, 남성은 XY)를 포함한 23쌍의 염색체가 존재한다. 염색체를 구성하고 있는 주요 성분이 이중나선 모양의 DNA다.
유전자의 비밀은 바로 DNA에 담겨 있다. DNA는 A(아데닌), C(시토신), G(구아닌), T(티민)이라는 4가지 염기를 가지고 있다. 이 가운데 아데닌은 티민과, 구아닌은 시토신과 화학적으로 결합을 이룬다. DNA는 이런 염기끼리의 결합에 의해 두가닥이 서로 붙어 나선형으로 꼬여 있는 형태다.
사람의 경우 대략 30억개의 염기가 존재한다. 인간게놈프로젝트는 바로 30억개의 염기가 어떤 순서로 배열돼 있는지를 밝히는 작업이다.
이 염기의 배열이 왜 중요할까. DNA의 염기배열 정보는 DNA와 구조가 비슷한 또다른 유전물질 RNA로 전달된다. 이 RNA의 염기 3개에 맞춰 아미노산 하나가 만들어진다. 아미노산은 인체에서 다양한 생리현상을 주관하는 단백질의 기본단위다. 따라서 DNA의 염기배열에 따라 궁극적으로 어떤 단백질이 만들어지는지가 결정된다. 현재 염기배열만 알면, 즉 염기 3개의 성분이 무엇인지 알면 어떤 아미노산 1개가 만들어지는지가 밝혀져 있다. 이런 의미에서 DNA의 염기배열을 가리켜 ‘생명의 설계도‘라고 부른다.
하지만 30억개의 염기가 모두 단백질을 만들어내는 것은 아니다. 현재까지 알려진 인간의 단백질 종류는 약 10만개에 달한다. 그런데 이 단백질을 만드는 염기의 수는 30억개의 2%에 불과할 뿐이다. 나머지 98%는 어떤 기능을 하는지 거의 알려지지 않았다. 흔히 ‘유전자가 몇개다‘라고 말할 때의 ‘유전자‘는 바로 단백질을 만드는 2%의 DNA를 의미한다. 인체의 단백질이 10여만개가 있으므로, 유전자의 수 역시 10여만개로 추정된다.
1990년 미국과 영국을 필두로 인간게놈프로젝트가 출범했다. 이 프로젝트는 인체를 비롯해 여러 생명체의 게놈 염기서열을 규명하는 일을 포함하고 있었다. 15년에 걸쳐 30억 달러가 투자되고 있다.
연구는 순조롭게 진행되고 있다. 인간게놈프로젝트가 출범한지 한지 9년이 지난 현재 이미 대장균(E. coli), 헬리코박터(Helicobacter pylori)를 비롯한 20여종의 미생물과 효모, 그리고 다세포 생물인 선충(Caenorhabditis elegans) 등 다양한 생명체들의 염기서열이 모두 밝혀졌다. 인간게놈 연구도 원래 계획보다 훨씬 빠른 속도로 진행되고 있는데, 2000년 봄까지 90% 정도 골격이 완성되고 2003년에는 프로젝트가 완료될 예정이다.
하지만 인간게놈프로젝트는 막대한 비용과 노력을 요구하는 ‘만만치 않은‘ 작업이다. 만약 생물 게놈의 길다란 DNA를 한꺼번에 죽 해독할 기술이 있다면 연구는 간단히 끝난다(세포 하나에 존재하는 DNA를 모두 연결하면 길이가 약 1.5m에 달한다).
DNA 실타래 풀기
그러나 현재의 기술로는 이 일이 불가능하다. 무엇보다 복잡한 실타래 모양으로 얽힌 DNA 가닥을 풀어놓기가 어렵다. 과학자들이 생각한 묘안은 ‘일단 자르고 다시 붙이기‘였다. 즉 DNA를 특정 효소를 이용해 토막을 낸 후 연결점을 찾아내 다시 연결하면 ‘매끈한‘ 선 형태의 DNA 가닥을 만들 수 있다. 뒤엉킨 실을 풀 때 가위로 여러 곳을 싹둑 자른 후 그 토막들을 순서대로 붙여 한줄로 길게 늘어뜨리는 것과 비슷한 방식이다.
문제는 이 DNA의 염기서열이 어떤지를 분석하는 과정이 엄청난 경비와 기술적 혁신을 요구한다는 점이다. 예를 들어 염기 하나를 해독하는데 소요되는 비용은 1달러다. 사람 게놈의 염기가 30억개에 달하므로, 게놈프로젝트를 완수하려면 총 30억달러가 필요하다는 계산이 나온다.
또 염기서열을 해석하는 정확도는 완벽하게 100%이어야 한다. 해석 기술이 99.99%의 정확도를 가졌다 해도 턱없이 부족한 값이다. 0.01%가 틀렸다는 말은 사람의 경우 무려 30여만개의 염기를 잘못 해석했다는 의미이기 때문이다.
환자 개인별로 맞춤약 개발된다
약효 미세한 차이 규명
‘인체 설계도‘를 손에 쥐는 일이 초읽기에 들어갔다. 2000년 3월경 인간게놈프로젝트의 90% 이상이 완수되고, 2003년 마침내 인간 유전자의 비밀문자가 완전히 해독된다. 이미 30여종의 생물 게놈연구는 완료된 상태다. 총 30억달러의 비용 부담을 감수하며 야심차게 추진해온 인간게놈프로젝트는 우리에게 어떤 의미를 던져줄까. 그리고 새롭게 떠오르고 있는 후속 연구과제는 무엇일까.
2003년 인간게놈프로젝트가 완료되면 인류는 A, G, C, T 4가지 알파벳으로 이뤄진 모든 유전정보를 얻을 수 있다. 이를 모아 책으로 만들면 1천쪽자리 책 2백권에 해당하는 분량이다.
그러나 이 정보 자체로는 아무런 의미가 없다. 마치 해독할 수 없는 문자로 이루어진 거대한 고대 도서관의 유적을 발굴한 것에 불과하다. 이 염기들이 어떤 기능을 수행하는지 해석하지 않고서는 아무런 가치를 찾을 수 없다.
인간게놈프로젝트가 완료된 후 연구의 나아갈 길은 크게 두가지다. 하나는 유전자가 어떤 기능을 가지는지 밝히는 기능유전체학(functional genomics)이다. 그리고 다른 하나는 개인들의 염기서열이 어떻게 차이가 나는지를 규명하는 비교유전체학(comparative genomics)이다.
집안 수명 내력 비교
유전자의 기능을 알아내는 방법으로는 생물학적 접근과 생화학적 접근이 있다. 생물학적 접근은 실험실에서 사용되는 모델동물로부터 특정 유전자를 제거해 생 리작용이 변화하는 상태를 관찰하는 방식이다. 이를 통해 어떤 유전자가 질병의 원인인지를 알아낼 수 있다. 인간과 유전자 구조가 비슷한 동물들로부터 얻은 데이터가 인간의 유전자질환의 원인 규명에 도움이 될 것이 틀림없기 때문에 의학계는 벌써부터 술렁이고 있다.
이에 비해 생화학적인 접근은 이미 알고 있는 유전정보로부터 어떤 단백질이 만들어지는지를 추적하고 제조해 그 구조와 기능을 밝혀내는 방법이다. 예를 들어 세포의 여러 소기관을 인공적으로 조립할 수 있고, 나아가서 인체의 모든 생체부품이 실험실에서 만들어져 상품으로 등장할 수 있다는 말이다.
인간의 경우 현재까지 밝혀진 10여만개의 단백질 가운데 기능이 제대로 알려진 것은 9천여개에 불과하다. 따라서 9만개가 넘는 나머지 단백질의 기능을 파악하는 것이 지금 생명과학을 연구자들의 가장 큰 숙제로 남아 있다.
한편 비교 유전체학은 간단히 말해 ‘사람마다 모습이 다른 것은 어떤 유전자 때문인가?’ ‘장수하는 집안과 단명하는 집안 사이의 차이점은 무엇인가?’를 밝히는 연구 분야다. 즉 개인간, 인종간, 그리고 생물간 게놈 정보를 비교해 차이점을 찾아내고, 이로 인한 생체기능의 차이를 추적하는 방법이다. 특히 사람간의 차이를 조사하는 단일염기변이(SNP, single nucleotide polymorphism), 즉 염기 하나의 차이를 비교하는 일은 유전병을 찾아가는 중요한 시발점이 되고 있다.
정상적인 사람들일지라도 염기 1천개에 1개꼴로 차이가 있다. 즉 차이가 난다고 해서 모두 유전병의 원인으로 작용하는 것은 아니다. 그렇다면 어느 정도의 차이가 나야 유전병이 발생하는지를 밝혀내는 일이 중요하다.
현재까지 알려진 유전질환은 5천여종에 이른다. 하지만 이 가운데 관련 유전자가 분명히 밝혀진 것은 15%에 지나지 않는다. 나머지 대부분은 유전성향은 의심되지만 관련 유전자가 여러개이거나 아직 밝혀지지 않은 질환들이다.
어째서 생명과학이 눈부시게 발달하고 있는 요즘에도 아직 이렇게 모호한 부분이 많이 남아 있을까? 생물학의 중요한 기본 개념인 중복성과 다양성을 고려하면 이를 쉽게 이해할 수 있다. 고등생물에는 한가지 기능을 수행하는 유전자가 여러개 존재하는 경우가 많다(중복성). 또 한가지 유전자가 여러 기능을 수행하기도 한다(다양성). 만일 한가지 유전자에 이상이 생기면 그 기능을 다른 유전자들이 떠맡게 된다. 생명체는 자연의 ‘보이지 않는 손‘으로부터 보호받고 있는 셈이다. 그러므로 대부분의 질병들에 관련된 유전자들이 여러가지라는 사실은 놀랄 일이 아니며, 이 유전자들을 모두 발굴하는 일이 결코 쉽지 않은 것이다.
SNP를 발굴하는 연구가 진전됨에 따라 1996년도까지만 해도 이름이 존재하지 않던 약리유전체학(pharmacogenomics)이 요즘 생물공학 분야에서 각광을 받고 있다. 약리유전체학은 약물유전학(pharmacogenetics)과 신기술인 유전체학(genomics)이 결합한 학문으로, 환자들의 유전성향의 차이 때문에 여러 의약품에 대한 반응이 다양하게 나타난다는 점에 초점을 맞추고 있다.
침팬지 게놈프로젝트
사람마다 키, 피부와 머리 색깔, 성격, 병에 대한 감수성 등이 분명하게 다른 것과 마찬가지로 의약품의 대사와 반응 역시 환자별로 다양하게 나타난다. 이 차이는 대개 유전적 성향 때문에 발생한다. 그렇다면 환자가 어떤 약의 효과를 볼 것인지 또는 부작용이 생길 위험이 있는지를 알려주는 유전적 요인들을 이해하면 투약 전에 이런 반응들을 예견할 수 있는 임상검사를 개발할 수 있다.
이 검사의 장점은 자명하다. 우선 환자에게 무슨 치료가 가장 좋을지 알기 위해 여러 복잡한 검사들을 거치지 않고도 가장 적절한 약을 즉시 처방함으로써 환자가 빨리 회복될 수 있다. 이때 의료비는 물론 절감된다. 따라서 굴지의 제약회사들이 더 나은 치료제를 개발할 수 있는 약리유전체학의 잠재력에 흥분돼 있는 것이 당연하다. 실제로 파리에 위치한 한 게놈 전문회사(Genset)는 특정 약품에 대해 반응의 차이를 보이는 사람들의 DNA 염기서열을 비교할 수 있는 인간게놈지도를 작성했다.
비교유전체학은 사람끼리의 차이를 연구하는데 그치지 않는다. 동물들 가운데 사람과 유사한 유전자를 가진 종류가 많다. 예를 들어 침팬지의 유전자는 사람과 98% 정도가 유사하다고 알려졌다. 만일 인간게놈프로젝트와 마찬가지로 침팬지게놈프로젝트가 완성돼 침팬지 유전자의 모든 염기서열이 밝혀진다면, 인간의 질환 연구에 큰 도움을 받을 수 있다. 침팬지를 모델동물로 사용해 특정 유전자를 변형시킴으로써 질병을 일으킬 때 보다 정확한 데이터 를 바탕으로 진행시킬 수 있기 때문이다.