欢迎光临GGAMen游戏资讯

更多关注 收藏本站

Google：即使用了机器学习仍有人力帮忙制作地图空间，但减少人力是努力方向

2025-04-20 210

不少网站防止 BOT 攻击的机制采用 CAPTCHA，要你辨识图像中的数字与文字，从而分辨人类与 BOT。但你知道吗，这些人类顺手之劳的打打字小工作，不少次是帮助 Google 地图做机器学习，辨识街景中出现的门牌与路名。

即便像 Google 这类大量依靠机器学习的公司，仍有不少地方要靠人工去做，要靠大量的人力协助辨识门牌、路名区块中，里面出现的数字或是文字。Google 地图软件工程师 Andrew Lookingbill 表示，不只是 Google 地图采用机器学习的问题，这是整体机器学习技术领域遇到的挑战。长远的目标会是减少涉入的人力，但又不会破坏建立的模型，仍然能用既有模型去跑。

Lookingbill 说采用深度学习处理电脑视觉板题，是相当高难度的事情，街景车每天上街拍摄的照片数量相当庞大，但仍然需要有方式处理。一般人很快就能辨识出门牌及街上路牌上的路名，用深度学习则是挑战。Google 地图采用递归神经网络 (recurrent neural network, RNN)，找出街景车拍摄的照片，辨识不同角度照片中出现的路牌资讯，从中截取需要的路名或是门牌资讯。

▲ 尼日利亚的拉哥斯，Google 运用机器学习找出建筑的门牌号码。(Source：科技新报)

商家的店面入口除了店名之外，还有贩售产品资讯、特价优惠等文字。上述资讯也许当地人能找出店家叫什么，但对于机器来说，以及远在天边并不是当地人，训练 AI 的工程师来说，是相当有挑战性的事情。Google 地图团队运用注意力机制 (Attention Mechanism)，从街景车拍摄的店面，找出人类视觉集中之处，从而判断店家店名。

▲ 运用递归神经网络 (recurrent neural network, RNN)，训练算法辨识不同角度拍的影像，路牌上的路名。(Source：科技新报)

路名常用缩写表示，而对当地人来说，很容易还原完整的路名，但机器就未必了。Lookingbill 说他们会对路名做规范化 (Normalization) 工作，处理路名中的缩写，像是 Av. 代表 Avene，Pres. 则是 President 的缩写。

▲ 运用注意力机制 (Attention Mechanism)，模仿人类视觉焦点，从而找出影像中的商家店名。(Source：科技新报)

Lookingbill 还提及 Google 地图整合经机器学习方式绘制的 1.1 亿栋建筑外框，补充说道没有特定加某个地方的建筑，而是看那个地方影像适合他们模型，能得到最好的结果。

▲ Google 运用机器学习，最终加了 1.1 亿建筑到 Google 地图上。(Source：科技新报)

Google 街景车当初推出是相当大的噱头，但如今是喂养 Google 机器学习模型的庞大资料。当被问到街景影像以及卫星图辨识的问题，Lookingbill 说影像如有遮荫，会增加辨识建筑物的困难度。

Lookingbill 谈到用机器学习处理地图资讯，技术本身是其次，而是要怎么将不断变动的现实世界，相关变动反映到地图，而且尽可能缩短地图资料处理时间。更快速的反映现实变化的地图，Lookingbill 说这是他们的团队一直在努力的方向。

(首图来源：科技新报)

2019-03-12 14:31:00

标签: 游戏头条资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条科技资讯头条 ggamen游戏财经新闻网科技新闻网科技新闻 ggamen 科技新闻科技新闻网新闻网 ggamen游戏财经科技资讯头条 ggamen科技资讯头条 ggamen科技资讯资讯头条游戏头条 ggamen ggamen游戏新闻网科技新闻科技新闻网新闻网 ggamen游戏财经科技资讯头条 ggamen科技资讯头条 ggamen科技游戏头条

热门推荐

最新内容

关于我们

新闻资讯

意见反馈

网站地图

扫码关注我们