3 月 31 日,Google 宣布启动名为新型冠状病毒公用数据库(COVID-19 Public Datasets)计划,托管与疫情相关的公用资料资料程式库,并对外开放,供外界自由存取和分析。
Google 表示,目的是消除障碍,并为研究人员提供快速便捷的关键资讯存取途径,无需搜寻和携带大型数据档案。
所谓的公用数据库,包括约翰‧霍普金斯大学系统科学与工程中心(JHU CSSE)数据、世界银行的全球健康资料和 OpenStreetMap 数据,所有都免费储存在 Google Cloud──Google 表示将与这些数据库背后的组织商议。
按照 Google 安排,数据库将有“COVID-19”标签、说明和几个范例查询,可从 Google Cloud Console Market 和 BigQuery 用户界面搜寻,其中 BigQuery 标记为“freebqcovid”。
值得一提的是,研究人员可使用 Google 的 BigQuery ML 服务,用户可使用 SQL 查询在 BigQuery(完全托管的数据仓)建立和执行机器学习模型,进而在 COVID-19 数据集训练机器学习模型。
基于项目的公用属性,用户查询时完全免费,且查询免费政策一直到 9 月 15 日。但 Google 指出,如果将任何数据库与非 COVID-19 数据库结合,处理的字节将计入 BigQuery Sandbox,每月有 10GB 储存空间和 1TB 查询限制──会按量收费,防止滥用。
Google BigQuery 产品经理兼 GIS 负责人 Chad W. Jennings 和开发者倡导者 Shane Glass 于部落格表示:
这些数据库内容仅出于教育和研究目开放大众,Google Cloud 小组衷心希望 COVID-19 公用数据库能更好、更快赋能研究,阻止疾病蔓延。
除了 COVID-19 公用数据库计划,Google 也进行许多对抗新型冠状病毒的努力。
比如说,Google 捐赠 8 亿美元的广告和贷款给,添加新型冠状病毒提示 Google Assistant 的快捷功能,并与微软和 Palantir 合作,为英国国家卫生局(National Health Service)建立资讯发布平台。
另外,Google 还推出专门页面和搜寻入口整理 COVID-19 相关资源,母公司 Alphabet 也增加湾区疾病筛查计划的力度。
- COVID-19 public dataset program: Making data freely accessible for better public outcomes
- Google Cloud releases COVID-19 data sets to foster coronavirus-fighting AI models
(本文由 雷锋网 授权转载;首图来源:Google Cloud)