很难想像生物体中的蛋白质,会和日常生活用到的语言有相似之处吧?德国马克思普朗克协会发育生物学家 Andrei Lupas 的研究团队就利用了生物资讯的方法,取经语言学研究的技术,比对了现今常见的蛋白质序列,以此重建了古代蛋白质的样貌,在这项研究中鉴定出多达 40 种的古代氨基酸序列,甚至可以追溯至 35 亿年前,也就是第一个地球上第一个蛋白质出现的时间。
事实上,生物学家在研究蛋白质的结构时的确运用了很多和语言学研究类似的技术,蛋白质序列中的基础建构单元,就像语言学中的字根,分析各种不同的排列组合,就能从中得到许多资讯。语言学家能够比对现代语汇进而重现古代字汇,而生物学家也能用同样的方法重建古代蛋白质结构。
蛋白质在所有已知的生物体内扮演着非常多元且重要的角色,首先,蛋白质是构成细胞的主要成分,一个细胞大约一半的重量是蛋白质;除了支撑结构的功能之外,我们常听到的具有催化体内化学反应的各种“酵素”,也是蛋白质的一种,占了目前已知蛋白质大约五分之一数量,在生物体内的重要性不言而喻,我们的饮食代谢,都和体内功能各异的酵素密切相关。除此之外,蛋白质还在生物体内扮演了各种保护、储存、运动、防御、调节等功能,生命的运行可以说是由这些蛋白质化学所构成。目前所知的蛋白质都是由仅仅几千个已知的结构单元(domain)所构成,虽然我们对于这些结构都已有一定程度的了解,但不清楚他们的来源。
Lupas 这项研究中推测蛋白质的来源,是在大约 35 亿年前,连细胞的结构都尚未发展完全的原始 RNA 生物世界,第一个蛋白质结构单元便从一些简单的氨基酸组成的胜肽链彼此融合,一个一个组合而成。透过分析现代的蛋白质,科学家们从看似彼此不相关的蛋白质中,找到 40 种有着非常相似的序列及结构的胜肽链片段。这些氨基酸序列出现在大多数的历史悠久的蛋白质之中,并且在生物体内扮演着和 RNA 或 DNA 结合等这些基础而重要的功能。因此,科学家们推测这些片段便是从古代 RNA 生物世界流传至今,仍然存在于世上的早期蛋白质线索,也就是如今 DNA 为主的生物世界源头。
这些氨基酸片段的结构研究,在未来或许能为人类开启新的科技,也就是透过这些研究使人类得以运用已存在的蛋白质加以设计,产生自然界中不存在的新蛋白质,这些新蛋白质能够依照人类新的需求来设计,在医疗、食品、保健、能源、美容、环保等不同领域之中都能够有所发展,解决问题甚至改善生活。为此,Lupas 表示,透过了解这些蛋白质结构进化发展的过程,我们能够创造出新形式的蛋白质,将是生物科技令人期待的一大进展。
- Scientists identify fragments of proteins that already existed billions of years ago
- A vocabulary of ancient peptides at the origin of folded proteins