虽然人类的参考基因组(human reference genome)是目前最准确、最完整的脊椎动物基因组,但即使经过 20 年改进,完整的 DNA 序列始终存在缺口。现在,一组国际遗传学团队首次确定了人类 X 染色体从头到尾(端粒到端粒)的完整序列,没有空缺且准确性达到空前水准。
对一般人类来说,23 对染色体中有一对称为性染色体(决定性别),女性的性染色体中有 2 条 X 染色体(X chromosome),男性则 X、Y 染色体各有 1 条,然而这 2 个 X 染色体并不相同,它们的 DNA 序列存有许多差异。
来自美国国立卫生研究院(NIH)国家人类基因组研究所(NHGRI)、加州大学圣克鲁斯分校、华盛顿大学医学院等 20 多个机构的科学家们,没有选择利用一般人类细胞的 X 染色体进行测序,而是挑选一种特殊细胞类型,它们具有 2 个相同的 X 染色体。
过去基因组测序遇到的一个大问题是,传统技术一次只能读取 DNA 的短片段,然后科学家将之一段一段拼凑起来,但当这些片段一遍又一遍重复时,拼装工作就变得困难重重,团队形容就像在组装单一色彩的拼图。
此外,X 染色体最难探索的区域是高度浓缩的着丝粒(centromere),为了解决这个难题,研究团队使用新方法读取更长的 DNA 序列,其中一种称为奈米孔技术,让单个 DNA 分子穿过一个小孔,然后借由检测电流变化来进行测序,一次能读取数十万个碱基对,跨过曾经被当作难处理的区域。
最终,研究团队得以填补着丝粒的研究空白地带,包括发现约 310 万个之前映射不出的 DNA 碱基对,并发现在参考序列中有缺口的区域,实际上是变异最丰富的区域。
这项发现有助于解开更多人类疾病与生物学谜团,X 染色体只是个开始,团队表示,他们计划在 2020 年底之前将其他染色体 DNA 序列全部测出,也许我们很快就会拥有完整的人类基因组序列。
新论文发表在《自然》(Nature)期刊。
- Human X chromosome completely sequenced for the first time
- First end-to-end sequence of human X chromosome assembled
- Scientists achieve first complete assembly of human X chromosome
- NHGRI researchers generate complete human X chromosome sequence
- NIH researchers generate complete human X chromosome sequence
(首图来源:pixabay)