未来的医疗科技若只仰仗分子生物学家、脑神经科学家的努力,能说的故事有限,内容也不够精彩,但若将资料科学家的意见纳入,或许就能解开许多看似无解的医学谜题,甚至还能促进医疗品质的提升。
Google 在 2008 年推出流感趋势预测,借由统计关键字的搜寻次数,就能预测全球各地的流感疫情发展,不仅资讯更即时,准确率甚至超过政府的预警系统,Google 以此首开大数据(Big data,又称巨量资料)应用到医疗领域的创举,不仅让其他几家搜索引擎纷纷跟进,如中国互联网巨头百度(Baidu),近日宣布与中国疾病预防控制中心合作,利用大数据预测流感疫情,也打开资料分析者对于数据的想像力。
大数据竞赛中,社群媒体的角色
除了搜索引擎对于疫情的预测,社群媒体如 Twitter、FB 也逐渐在这场大数据竞赛中找到自己的定位。加州大学洛杉矶分校(UCLA)以 Twitter 的讯息量、发信地点,来追踪性病扩散率与毒品滥用的行为,他们搜集 5 亿 5000 万条“推特文”,使用算法筛检出含有“性”、“快感”的字眼,并记录发布内容的地区,最后用统计模型观测这些区域是否有 HIV 新病例通报。结果发现两者之间有很显著的关系,当某地区的推文呈现很高的“性指数”,HIV 的新感染病例也高。
若将 Google 搜索引擎与 Twitter 结合,还能精准看出一些社会风气的变化。两位美国经济学家结合两者资讯,发现当《16岁怀孕》和《小妈咪》两部美国影集播放时,青少年怀孕生子数比例大幅降低。
原本看似无用的手机讯号,在大数据的浪潮下也找到着力点。2014 年中国春运高峰期,百度就利用手机用户的位置讯号,进行人口流动的实况调查,让全球最大规模的人口迁移得以最直观的方式呈现,这种大数据和交通运输产业结合的概念,激发许多数据分析师将此延伸应用到医疗领域中,而受益最多的当属传染病预防。
大数据与传染病预防
谈到 21 世纪最令人恐慌的传染病,SARS 绝对榜上有名。SARS 在短时间从本土性传染病摇身变为全球性传染病,所凭借的就是大量的人口移动与快捷的交通运输。虽然在疫情蔓延时,网络上曾传出不少疾病资讯,但中国政府为掩盖真相,一律封杀相关讨论,使得原本能因资讯的流通而达到预警效果,演变为各国防疫单位措手不及,最后引发全球性的恐慌。
(图片来源:cfr)
从 SARS 的例子可以看到,若在当时的时空下,政府或民间机构能从搜索引擎或人口流动来监测,疫情就不会来的又快又猛,让人类毫无招架之力,而这样的预警方式就算用在落后国家,也能起上一定的作用。
由英国、美国和纳米比亚所共同合作的计划,就是借助手机用户的讯号,来判断霍乱疫情可能的热点,并根据当地的疫情早一步设计出预防方式。研究人员搜集 119 万手机用户资料(约占 52%的人口数),重建人口流动的状况,接着结合各地霍乱疫情报告与地形气候数据,预测可能的爆发地点,并尽早做准备。
一般医疗应用
在一般医疗领域,大数据的应用也能帮助医师分析病历资料、临床实验数据与医疗文献,协助医生决定每一位患者最佳的治疗方法,不仅能减少医疗纠纷,更能减少用药浪费的发生,并提升医疗效率,根据麦肯锡全球研究院(McKinsey Global Institute)调查,如果美国医疗产业能善用大数据分析,每年可以增加 3,000 亿美元的产值。
但想要进行大数据分析,就必须有庞大、结构性、能数字化的数据数据库。虽然医疗资料够庞大,但资料属性却特别复杂,除了有一般结构性资料,还包括非结构性资料,如病历、影像等,导致分析和处理时相对困难,再加上这些资料并非集中一处,握有资源的人往往将此视为机密资料,不愿分享出去,使得医疗产业对于大数据的应用远远落后于其他产业。
虽然医疗资讯的统整仍然困难重重,但大数据的应用趋势势必将继续发展下去,在未来的十年内,有越来越多的医疗工作将被数据分析取代,医疗产业不会像今天一样,壁垒分明,保护主义浓厚,因为大数据的应用没有局限。