相信维基百科是许多人的最爱,尤其是需要做书面报告的学生。不过维基百科不单是写报告的数据库与懒人包的来源,它还可以追踪现实世界流感疫情。用的方式也很简单,只要计算与流感相关词条的点阅数。这项研究刊登在美国公共科学图书馆计算生物学(PLOS Computational Biology)期刊网站。
这项研究关注的词条跟流感有关,但不限于只有流感,而是包含了类似其他类似症状的词条。这项研究之所以有意义,在于资料汇整比传统方法要快速。以美国来说,疾病管制中心要花两个星期的时间,从各地医院收集资料、分析,才能得到流感疫情发展的确切结论,但两个星期实在有点久,要做好疫情控制,时间上必须更快才行。
团队选择了 35 个词条为目标,包括 Influenza 及 Common_cold。此外,他们也参考了维基百科首页或 CDC 的条目做为背景资料。负责这项计划的哈佛医学院研究员 David Mclver 说,这有助于演算过程更为精确,这在 2009 年猪流感流行期间已获得验证。
▲Google 流感趋势利用网络搜寻相关关键字计算疫情,但被批评不够准确。(图片来源:Google)
除了这项研究以外,Google 流感趋势则是另一个从网络上搜集资料进行流感疫情追踪的工具,只不过这个工具饱受批评,主要在于 2009 年猪流感流行期间,Google 流感趋势过于高估了疫情,使得媒体也跟着过度报导,事实上,Google 流感趋势是以一般搜寻结果做为演算时的资料,这个做法正好就会被使用者因为看到媒体的报导而强化,形成恶性循环。
虽然也有论文指出 Google 流感趋势在不断增加新资料的情形下将会更为精确,不过 Google 流感趋势并没有公开他们的算法,而是视为商业机密,因此 Mclver 认为他们将自己的研究公开是正确的做法。
不过 Mclver 的算法还是有局限。因为维基百科只提供以国家为单位的资料,使得他们无法做跨境的汇整。算法也假设一个使用者不会多次造访同一个词条,同时也无法了解造访的目的究竟是因为他得了流感,或是纯粹只是想学点什么。Mclver 表示,他们的目的不是要取代传统的疫情评估方法,而是希望两者能相辅相成。
本文转自健康达人网