从网友的点阅行为可以预测疾病大流行即将发生,甚至可以在 28 天前就能预知到。研究发现维基百科的点阅趋势确实可以显示出某个国家某种疾病的未来发展情形,而用 Twitter 的推文也可以用来了解当下社会可能面临的心理疾病趋势,可供相关单位医疗政策与实际行动参考。
28 天前预警全靠维基百科点阅趋势
用维基百科来研究疾病趋势并不是头一遭,之前就有研究以特定的词条为基础,试图研究特定疾病的可能疫情发展;Google 流感趋势则是另一个从网络上搜集资料进行流感疫情追踪的工具。而在这次发表在美国“公共科学图书馆 计算生物学” (PLOS Computational Biology) 期刊网站的研究,则是想要确认维基百科的流量资料,是否与前述这些研究方法一样,可以为可能将发生的疾病疫情提出预警。
美国洛斯阿拉莫斯国家实验室 (Los Alamos National Laboratory, LANL) 的研究团队调查维基百科 2010 年到 2013 年十四个流行疾病的疫情相关文章每日点阅数字,例如 2010 年海地的霍乱、2011 年至 2012 年乌干达的埃博拉病毒感染。
(图片来源:© Tim Pannell/Corbis)
他们发现,这种方法针对流感与登革热特别有效,但面对一些新增案例变动很缓慢的疾病,则无明显趋势,例如艾滋病。而不令人意外的是,网络不发达或是网络人较少的地区,例如撒哈拉沙漠以南非洲地区,也较难有显著的结果。
该实验室的研究员 Sara Del Valle 表示,这种全球疾病预测系统将可改变我们对于流行疾病的应对方式,就好像我们每天早上起来会看天气预报,公共卫生部门也可以根据这些监测资料及早做好准备。
另一个有趣的数据则表明,跟世界卫生组织或美国疾病控制中心的埃博拉病毒感染相关网页比较,近期维基百科的埃博拉病毒词条以 1,700 万点阅数遥遥领先,这说明了维基百科词条的权威与重要性。
社群平台推文可即时掌握群众心理状态
从公开的资讯中寻找整体社会对特定疾病的关心度以预测疫情,绝不只有利用维基百科词条的点阅来判断;社群网络性质更浓厚的即时通讯软件,恐怕更能直接找出许多与心理疾病相关的情绪状态。美国约翰霍普金斯大学便以国外较流行的 Twitter 为研究的目标,从中找出当下社会可能面临的心理疾病趋势。研究结果或许不令人意外,但可明确提供医疗机构与决策单位参考。
这项自 2013 年开始的研究发现,近期频繁部署在伊朗与阿富汗军事设施的人员,有很高的创伤后压力症候群 (post-traumatic stress disorder, PTSD) 情况;另外,在失业率较高的地方,忧郁也有增加的趋势。
这项计划的缘起之一,其实不脱我们一般人的想像:面对一些心理方面的困难或因某些疾病造成的心理困扰,其实我们都很难对着不熟悉的人侃侃而谈,这让传统的学术研究工作面临一定的困难度;然而,即时通讯软件的便利性,却可以让多数人有意或无意、不管有没有人搭理,都可以三不五时写一下一些心里的话,也就因此透露出许多让学术界加以研究并协助人们的线索,而他们透过程式过滤并分析网友们的公开讯息,也不会有侵犯个人资料的问题。
研究团队将研究的目标放在 PTSD、躁郁症与季节性情绪失调(注)三种疾病上,透过网友公开讯息中提到的诊断资讯及所使用的文字词句,寻找其中的关连。研究的第一阶段是先从上亿条推文中找出跟“诊断出疾病”相关的讯息,例如“我被诊断出有忧郁症了”,接着,程式算法基于一般使用语言的方式,去寻找推文中跟心理健康相关的线索。
该校语言发展中心研究员 Glen Coppersmith 举例表示,像忧郁的人常常会谈及更多负面的情绪,与其他人相较,他会用更多“我”这个字眼。最后一个阶段,则是将这种算法扩及一般网友,并做一个简单的分组,例如是不是退伍军人。研究团队表示这样的调查将有助于医疗从业人员与政府决策官员了解哪里需要投注更多资源,同时可以用更快速且成本较低的方式回应当前正在发展中的疾病趋势。
注释
seasonal affective disorder, SAD。又称冬季忧郁症,一般在北纬 30 度以北地区或南纬 30 度以南地区人们较多见。南北朝鲜的分界线大约是北纬 38 度。(回到本文)
相关资讯
- Global Disease Monitoring and Forecasting with Wikipedia
- Quantifying Mental Health Signals in Twitter
- Wikipedia Could Predict Disease Outbreaks
- Researchers track mental illness with Twitter