微软在 Build 大会上面,揭露智慧助理如何带给人更好的生活。其中透过 Cortana 加 Bot Framework 实现的个人语音秘书,以及直接在 Build 大会会场的即时会议逐字稿系统,看到微软在语音资料处理和转换的能耐,将要逐步商品化进入大众的生活当中。
Cortana 加 Bot Framework 制作的个人语音秘书功能愿景,透过事前录制的情境影片,人人都有的行事历程式加上语音指令功能,而且不只是简单辨识你说的话语,还能做出对应的后续行动。像是更改行程,原先的餐会确认谁会不会与会,并且确认后,自动完成邀请原先没有在名单上的人,全部靠说话方式下完指令,就像董事长、总经理身边的秘书,全部改由 Bot 处理。
尽管微软影片中的语音秘书还是未来愿景,Build 大会上随着舞台上演讲、展示人员的说话话语,Conversation Transcription 即时对话转文字系统默默的运作,在屏幕上稍微延迟的时间差,即时出现台上人的话语语音辨识,以及转换为文字。尽管仍有大约 5 秒钟的差距,对于事后弄逐字稿,可说相当方便。
▲ 微软的影片展示微软 Cortana 和 Bot Framework 技术,能够做到未来个人语音秘书,用语音排定和调整行事历行程。 (Source:微软)
微软为了取信大家,特地安排微软人员现场示范念一段含有专有名词的话语。示范人员用一般电脑上的麦克风取音,一位念了一段包括大量资讯技术术语的片段,一位念包含一堆医学相关术语的片段。结果均成功抓到对的字词。
▲ Conversation Transcription 即时对话转文字系统成功辨识专有名词,如资讯与医学相关的专有名词。(Source:微软)
微软在语音辨识和智慧应用上有相当深厚的基础研究,开发应用上也相当注重人们的需求。微软在 Build 大会上面火力展示,有未来技术愿景,还有现在技术能做到的程度。目前 Conversation Transcription 处与 preview 状态。
- What’s Microsoft’s vision for conversational AI? Computers that understand you