20 年前由人类基因组计划(Human Genome Project)与塞雷拉基因组公司(Celera Corporation)定序完成的人类基因组序列其实并不完整。受限于技术,当时科学家无法确认一些 DNA 片段彼此顺序及关系,特别是带有许多重复序列的片段,因此约有 15% 的序列在当时并没有定序。这些年来科学家陆续解开某些片段,但是科学家从 2013 年开始参考使用的人类基因序列版本也仍缺少 8% 序列。
包含全球 30 所研究单位的研究者共同合作的 Telomere-to-Telomere(T2T)Consortium 计划,将过去基因序列缺漏的部分补上了。圣塔克鲁兹加利福尼亚大学(University of California Santa Cruz)基因体学家 Karen Miga 与同事们在 5 月 27 日发表的一篇预印论文公布定序成果,人类基因体序列终于完整呈现。DNA 碱基数从 29.2 亿增加至 30.5 亿,增加 4.5%。研究团队更在过去缺漏的序列发现约 115 个能够表现蛋白质的新基因,使目前已知基因总数达 19,969 个。
欧洲分子生物学实验室(European Molecular Biology Laboratory,EMBL)副主任 Ewan Birney 表示,过去的基因组定序研究不是将 DNA 分子从头到尾一一定序,也因此有所限制,但现在这项研究成果显示科学家已经能够做到将 DNA 分子序列完整定序,对未来研究也有重要影响。
美国国家生物技术资讯中心(National Center for Biotechnology Information)生物资讯学家 Kim Pruitt 认为这项研究是一个重要的里程碑,并且对于这些新资讯将能对许多难解的问题提供重要的线索,并帮助科学家们找到答案。
新定序技术突破过去的障碍
这次新定序出的基因组片段被称为 T2T-CHM13,为 2013 年后使用的人类基因组序列资料增加将近 2 亿个序列。
研究团队所使用的 DNA 样本并非来自某个个体,而是来自称为完全性葡萄胎(hydatidiform mole)的组织分离出的细胞株,是由精子与没有细胞核的卵子结合形成无法发育的异常受精卵而来。由于这种组织内的细胞只有父亲染色体,因此研究者不需区分两组来自不同人的两套染色体。
Miga 表示,团队之所以能够成功定序先前遗漏的基因序列一大部分也是仰赖新的定序技术所赐。美国加州太平洋生物科学公司(Pacific Biosciences)所提供的定序技术,利用激光扫描一次性地对细胞中分离出的 DNA 序列进行快速且大量的定序分析。相较之下,传统的定序技术一次只能定序几百个碱基对,因此需要分段定序,再由研究者将定序资料像拼拼图一样重新排序组合起来。新技术能够一次进行长片段的定序,各个片段序列之间有了更多的重叠部分,也让研究者更容易整合序列资料。
虽然人类基因体全序列已经定序完成,但这并不代表 T2T-CHM13 就是人类基因体全序列拼图的最后一块,参与 Telomere-to-Telomere(T2T)计划的科学家研究在染色体上某些片段序列碰到一些问题,过去定序完成的序列估计约 0.3% 有误,因此仍需要仰赖后续研究一一解开。
更多元化的样本基因组定序
T2T-CHM13 解出的序列只能代表一个人的基因组,但 T2T Consortium 已与 Human Pangenome Reference Consortium(HPRC)合作,希望在未来三年内收集超过 300 位世界各地人们多样化的样本进行基因组定序。Miga 表示接下来的研究能以他们的序列资料为参考,进一步了解基因组哪些位置的序列会因人而异。Miga 团队已对 Y 染色体序列定序,而未来他们更能进一步用同样的方式定序包含父母双方染色体的基因组,挖掘过去不了解的部分。
Miga 表示,有了更多更新的基因序列资料补足过去缺少的资讯,遗传学家就能快速找到新解出的序列有哪些基因可能与疾病发生有关。过去人类基因组定序结果出来时,科学家还没有足够的技术与资源立刻深入研究,但随着资源与技术的进步与更新,现在的科学家应能快速掌握新定序序列中基因的功能及资讯。
Miga 希望未来人类基因组序列能够越来越完善,包含更多新解出的片段,而不是只有过去容易解开的部分。现在已有完整基因组序列参考,并找到突破障碍的新技术,因此这项工作应能越来越顺利。她也表示期望未来基因组定序成为常态性,让资讯不断扩充更新也更完善。
- A complete human genome sequence is close: how scientists filled in the gaps
- Researchers claim they have sequenced the entirety of the human genome — including the missing parts
(首图来源:shutterstock)
延伸阅读:
- 基因定序翻案?澳洲科学家连署要求正视杀婴案科学证据
- 结合人工智能与基因定序,科学家运用噬菌体来消灭超级细菌
- 只要花 1 千美元,你就能带着基因定序仪随处走