就像 Facebook、Google 这些科技公司需要更多数据了解用户,医学界近 10 年来也致力于建立“生物数据库”,希望能探索人类的基因密码与疾病之间的关联性。
英国跑最快,帮民众做基因体定序
根据台湾人体生物数据库统计,这股热潮至少已在全球 16 个国家展开,包括韩国、日本、爱沙尼亚、德国、美国、加拿大等,每个国家的遗传基因都有独特性,生活型态与致病因素也与其他国家不同,因此均建立专属的人体生物数据库。像是冰岛人口虽不到 40 万,却有四分之一参与生物资料计划。
其中,英国的进展格外受到瞩目。2006~2010 年间,英国人体生物数据库(UK BioBank)收集了 50 万名志愿者的血液、尿液和唾液样本,并在参与者同意后,取得病历和访谈生活习惯。另外,也透过磁振造影(MRI)扫描约 10 万名参与者的脑部及腹部。
值得注意的是,他们在 2018 年 4 月宣布投入约 3,000 万英镑(约新台币 11.7 亿元),要帮参与数据库的 5 万人执行全基因体定序(whole genome sequencing),目标延伸到所有参与者;10 月,更首次有研究团队运用数据库数据,发表两篇论文至《Nature》期刊。
镜头转到台湾,台湾人体生物数据库于 2012 年正式展开运作,计划邀请 20 万名一般民众参与,同时也邀请 10 万名常见的 10 至 15 种疾病患者加入。收集的资料包含参与者健康情形、医药史、生活环境资讯与生物检体, 长期追踪健康参与者与疾病患者的健康变化情形与治疗状况。
台湾人体生物数据库,6 年累积 11 万人参与者
▲ 统计发现,台湾人体生物数据库的参与者,超过 9.2% 有家族肝癌病史。(Source:台湾人体生物数据库)
统计至 2018 年 11 月 30 日止,台湾人体生物数据库已累计约 11 万参与总数,并延伸出多项成果。像 2015 年时,透过数据库筛选出台湾人特有的 65 万个基因,从中比对出“41 个”与糖尿病相关基因,未来若能连结健保数据库,让民众透过抽血检测这 41 个基因位置,就能提高预测未来罹患糖尿病的概率。
根据台湾人体生物数据库网页,目前规划释出的数据,包含约 27,700 笔全基因体定型资料(Whole-genome genotyping);2,000 笔全基因体定序资料。数量虽不算多,但高雄大学与高雄医学大学的研究团队,分析其中 3,000 多笔资料,2018 年找出“ABCG2”是造成国人痛风的主要基因,显示人体生物资料对精准医学的发展,仍有巨大帮助。
“我认为要透过 AI 分析基因体数据与疾病的关联性,至少需要 10 万笔资料,最好能有百万笔。”台大医院基因医学部主治医师陈沛隆表示。
由台湾人工智能实验室创办人杜奕瑾领军的 AI 基因分析平台 TaiGenomics,正是希望能加速分析、比对基因的漫长过程。不过,即便他们能取得已公开的台湾人体生物数据库的基因定序资料,数量仍相当有限。
筛检费用高,基因样本取得不易
再加上“价格因素”,即便是龙头教学医院──台大医院,也无法轻易获得大量检体。
“基因筛检几万块费用,并不是所有病人都愿意付”,台大医院基因学部暨小儿部主治医师胡务亮,同时也是“台大医神──精准医疗人工智能辅助决策系统”的成员之一,他认为,医师的价值在于基因比对后的分析与判断,但光是前期的基因样本取得,其实很有难度,因此只能透过计划补助费,帮患者免费尝试。
由于全台 19 处的人体生物数据库,目前并未有统一的数据规格,不利于研究团队运用。因此,行政院正在研拟统整,并串连健保数据库,希望让基因分析更有效率。
台湾投入基因资料、分析的时间点,或许落后其他国家,但当 AI 工具、生物数据库都有进展时,又有本土强大医疗团队协助,迈向精准医疗的步伐,正逐渐加速。
(本文由 数位时代 授权转载;首图来源:pixabay)