为了体验如今人工智能的自然语言处理有多强大,Google 近日发表了语义体验网站“Semantic Experience”,其中有一个全新的书籍搜索引擎“Talk to Books”,以及两个基于机器学习的单词关联游戏。
相比平常我们搜寻一本书,主要是透过书名、作者等关键词检索,Talk to Books 里,我们可以像平常讲话输入一句话,随后搜索引擎就会解读和预判这句话,给予搜寻结果。
也就是说,你可以用“聊天”方式找到你想看的书。
试着在搜寻框输入一个问题:
What is the best programming language?(什么是最好的程式语言?)
排在第一位的搜寻结果,是一本用 C 语言写程式的书《C Programming for Arduino 》,作者是 Julien Bayle。这本书有一句话,搜寻结果里有加粗:
There is no scientific or universal way to define what is the absolute best style of programming. (目前没有一个科学或广义方式定义什么是绝对完美的程式。)
在搜寻结果中,能回答这个问题的句子或段落加粗显示,下方还有作者及书籍讯息。我们用聊天方式向 Talk to Books 提问,然后它用搜寻结果告诉你,这本书里这段话,可以回答你的问题,这些或许就是你想找的书。
另一个名为“SEMANTRIS”的页面,有两个基于机器学习的单词游戏 Arcade 和 Blocks。
▲ Arcade。
玩 Arcade 时,需要在一定时间内输入与某个目标词语最相关的单词、短语或句子,越相关得分越高,同时目标词语会下移。
▲ Blocks。
Blocks 则像无时间限制的消去游戏。输入某个单词、短语或句子后,游戏会自动判断页面哪个单词与之最相关,然后这个单词所在的方块,以及相邻同色的方块就会消除。每次消除都会有新方块掉下来,方块堆积到达顶部,游戏结束。
“Semantic Experience”这个项目呈现的是机器学习“词向量”技术,这项技术能让机器更快、更准确理解人类的语言。目前 Google 已在自家人工智能开源软件库 TensorFlow 开源了一个预训练语义的模组,开发者可使用自己的词汇或语句实验,训练自己的模型。
(本文由 爱范儿 授权转载;图片来源:Google)