欢迎光临GGAMen游戏资讯




分享 Google Brain 跨领域合作成果,简立峰:开放源码让工程师与科学家能互有贡献

2024-12-25 212

在人工智能(AI)技术持续进化之下,许多领域的发展都有了都有了长足的进步,面对无法人工检查或处理的庞大资料,机器学习及深度学习便成了绝佳解决方法,Google 6 日特别分享了一些 Google Brain 在天文及生物医学合作方面的成果,希望借此让大家体会到开源和数据的重要性。

Google  台湾董事总经理简立峰表示,在 NASA 的开放数据下,工程师也能够对科学有所贡献,基因组序列也是有着开放数据库才能顺利研究,而 Google 也在开发出运用深度学习的测序工具后便进行了开源,相信若许多科研领域若愿意开放数据提供研究,各个产业的进步也将会更为快速。

用机器学习辨识新行星

美国太空总署(NASA)在 2009 年展开了开普勒任务(Kepler mission),透过开普勒太空望远镜的观测及记录,4 年期间总计搜集逾 20 万颗恒星、每颗恒星 7 万次亮度的纪录。

在检查超过 3 万个望远镜收集的讯号后,科学家已经能够认定其中约有 2,500 个是来自于行星,但这样的人工检查过程相当耗时,加上有些外在因素(如恒星上的斑点)导致讯号较弱的无法倚靠人工判读,单以人力进行可说是相当吃力不讨好。

▲望远镜收集了许多讯号,无法全部都以人工检查。(Source: Google )

而机器学习便在这时候派上用场,在与 NASA 的合作中,Google Brain 团队将寻找行星的过程主要分成两个阶段,先是由电脑算法找出潜在行星讯号后,再由天文学家判断哪些讯号是来自真实的行星。

为此 Google 特别运用通常用于图像分类的卷积神经网络(CNN)建立了模型,再透过 15,000 个天文学家已人工标记的开普勒讯号来训练模型辨识。在经过训练后,Google 的算法在开普勒数据库中的 670 个恒星中,发现了新行星开普勒“90 i”和开普勒“80 g”。

与人工判读的不同,Google Brain 团队提供给神经网络的主要是较弱的讯号,这些讯号由于较难判读、存在行星的比例也较低,过去并不会将人工时间运用于此,但透过机器学习的模型大量筛选了讯号,天文学家只需要从少量讯号中进行判断即可。

▲ 上方为 Kepler-90 系统行星,下方则为太阳系行星。(Source:NASA)

但机器学习在搜寻上仍有一些尚未能解决的问题。像是在有数个邻近恒星的情况下,模型还无法辨别行星的讯号是来自何者,目前这点仍仰赖人工方式协助模型确认,团队计划未来将更新系统,加入位置资讯辨识,来达到下一个目标:运用模型辨识整个开普勒数据库中超过 20 万颗恒星。

深度学习与基因变体识别(Variant Calling)

基因组测序技术在近几年来相当火红,透过捕获遗传密码中的各项讯息,对于癌症标靶治疗的疗效、新生儿疾病的病因寻找都十分有帮助,而变体识别(Variant Calling)便是测序过程中相当重要的一环。

虽然变体识别并无法预测变体是否会产生疾病,但透过找出“个体”和“参考基因组”间的差异,将能做为许多医疗及药物开发的第一步,只是考量到人类基因组的庞大资料量,以及测序仪不完整且碎片化的读取特性,变体识别仍在持续发展当中。

▲ 变体识别。(Source: Google )

现有普遍的变体识别工具仍维持传统的统计技术,仰赖大量人工参与,也因此需要花费专家多年时间进行,为了协助提高基因组测序准确性,Google Brain 团队与 Verily Life Sciences 合作花了两年多时间开发出 DeepVariant,透过深度学习大量省去了人工手调参数的时间。

在将测序仪的数据编码为图像后,DeepVariant 便能使用常见的图像分类算法训练出准确的识别模型,目前 DeepVariant 主要进行 DNA 序列分析,在去年 12 月正式开源后,一周内便成为 GitHub 上最热门的生物资讯工具。

目前 Google Brain 正与 Google Cloud 合作,计划运用 GCP 上的技术再提升 DeepVariant 的性能,团队计划未来将 DeepVariant 应用到农业及其他生物的研究上,但现阶段仍在寻求更多临床验证的合作机会,才能进一步验证 DeepVariant 的准确性及衍生应用的帮助。

(首图来源:科技新报)

延伸阅读:

  • 用机器学习发现新行星,Google 这样做
  • 无需程式设计仅用镜头,Google 最新专案让你 3 分钟学会机器学习
  • NASA 宣布重大消息!与 Google AI 合作发现“迷你太阳系”
2019-03-12 21:31:00

标签:   游戏头条 资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条 科技资讯头条 ggamen游戏财经 新闻网 科技新闻网 科技新闻 ggamen ggamen游戏新闻网 科技新闻 新闻网 ggamen游戏财经 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 资讯头条 游戏头条 ggamen ggamen游戏新闻网 科技新闻 科技新闻网 ggamen游戏财经 科技资讯头条 ggamen科技 ggamen科技资讯 资讯头条 游戏头条
0