基因检测过去曾是用来亲子鉴定、犯罪侦查的专业工具,如今已成为直接面向消费者的产品。最近一项新研究指出,随着越来越多人对这项服务感兴趣,不久的未来即使你没有做 DNA 测试,技术仍能透过远亲的 DNA 来找到你的身份。届时,我们都不会是随意“无名小卒”。
最近刊登在《科学》(Science)期刊的研究指出,截至 4 月,已有超过 1,500 万人使用消费者取向的基因测试,由于多数基因测试公司都允许客户下载原始遗传讯息文件,这也刺激一些公司推出第三方服务,允许人们上传原始数据进行额外分析,像是血统搜索或家谱研究。
GEDmatch 便是推出家谱研究的公司之一,最近在美国金州杀手(Golden State Killer)的追踪发挥了重要作用。金州杀手在 1970~1980 年代犯下一系列强奸和谋杀案,命案发生 30 年后,调查人员运用犯罪现场留下的 DNA 进行家谱研究,并顺藤摸瓜找到 72 岁的嫌犯 Joseph James DeAngelo,接着在标准 DNA 测试下证实了他的身份。
传统的案件调查是,警方能将 DNA 片段与潜在嫌疑人匹配。但这些片段只能在严格监管的数据库中辨识一个人或他们的近亲。而在 GEDmatch 的协助下,调查人员分离了犯罪现场可疑 DNA 遗传物质后,透过在公共数据库搜寻 DNA 匹配的第三代堂兄弟并收集相关讯息(如报纸讣告),成功创建出嫌疑人祖先和亲属家谱,在这之后,调查人员从 DeAngelo 收集了一份全新 DNA 样本,并确认与犯罪现场 DNA 完美匹配。
金州杀手一案为消费者基因检测服务公司 MyHeritage 带来启发。为了确认透过远亲 DNA 找到某人身份有多么容易,MyHeritage 的研究团队展开了这项研究。查看了超过 120 万笔上传自 MyHeritage 测试的匿名数据,并排除数据库也有直系亲属的人以后,团队开始试着使用陌生 DNA 来破解身份。
这项调查中团队也意外发现,数据中的人有一半以上是远房亲戚。对于占样本 75% 的欧洲人后裔来说,约有 60% 匿名个体可找到第三代或更近的表亲,其中 15% 样本甚至能找到第二代或血缘更近的近亲。
团队后续也在 GEDmatch 重复这个过程,并得到非常相似的结果。与金州调查案非常相似,随着确认血缘,透过使用这些远房亲戚和其他不太具体的人口统计讯息,像是目标的年龄或可能的居住地,追溯并辨识出对象是可行的。
目前许多美国执法者都将这项技术用于解决悬案,而这确实也协助破获了不少案件,然而可想见,随着技术不断发展,出于非法目的使用这些技术的情况也会出现;包含试图从其他项目辨别出研究对象的科学家,以及试图在其他地方利用、出售个人资讯的的公司或个人,以及更严重的遗传歧视问题。
官方的法条制定或许能协助管理。目前包含美国卫生及公共服务部(HHS)等机构对许多涉及人类受试者的研究制定了通用规则,这些指南的修订版将于 2017 年实施,但直到 2019 年才会完全生效。虽然目前通用规则并不认为人们的基因组是可辨识的讯息,但随着技术进步,HHS 保留改变这种状态的可能;这可能会阻止肆无忌惮的科学家,如果他们被抓到试图窃取人们的身份,他们将失去官方资金投入。
基因检测服务也可采取像加密签名的措施来保护消费者。只有在确认查询来自客户时,家谱服务才会透过数据库搜寻。像是 MyHeritage 就不允许研究人员或官员在未经许可的情况下使用他们的家谱服务,根据公司透露,目前还没有人获得许可。
只是几乎可以肯定,即使你我都拒绝出于善意的免费测试 DNA 邀请,只要有约 2% 成年人口将自身 DNA 资讯输入数据库,从未知 DNA 样本追踪任何人的远亲并发现他们的身份“理论上”就是可行,而我们也越来越接近转折点了。
哥伦比亚大学的电脑工程师、MyHeritage 首席科学长 Yaniv Erlich 表示,一旦人数达到 2%,大概所有人都会找到第三代表亲,而许多人还会找到更亲的第二代表亲,“我认为对欧洲人后裔来说,我们将在两三年内达到这个门槛”。
- You might not be anonymous, thanks to genealogy databases
- Ancestry Sites Could Soon Expose Nearly Anyone’s Identity, Researchers Say
(首图来源:pixabay)