我们都曾经在电影中看过这样的场景:由于怀疑有窃听设备,主角们运用纸张沟通并不出声响的进行任务。在语音助理应用普及后,许多人也都开始有了被智能产品监听的疑虑,以现在来说,“不说话”确实能够应对被监听的可能,只是随着科学家开发出能以高频率声波掌握环境的装置,在未来,即使是在独处不说话的时候,这些产品仍可能知道你的一举一动。
许多动物都能透过回声定位(echolocation)掌握周遭环境状况,过去研究也曾成功让盲人及视力正常者学会回声定位,而在中国武汉理工大学的研究中,团队则是成功运用麦克风阵列(microphone array)和算法让机器也具有相同能耐。
在这项已刊载于《应用物理快报》(Applied Physics Letters)期刊的研究中,团队打造了一台与笔记型电脑大小差不多的设备,能够发出人耳无法听见的极高频率声波,并使用其中嵌入的数百个麦克风来监听回声,再透过 AI 技术从声音反射中解读人的行为,尽管目前技术仍处于发展阶段,但团队已经取得了一些有希望的初步成果。
在初步研究中,团队对 4 名不同的大学生进行了测试,结果发现透过回声定位,他们可以完全准确的辨识出确定这个人究竟是坐着、站着、走路还是摔倒,虽然这项技术是否适用于更多人、是否能辨别更广泛的行为都还有待确认,但这项研究已经显示出一种辨识人体动作的新技术潜力。
就像现在流行的智慧手表一样,团队开发的设备也是收集讯号后透过电脑进行分析,在设备收集回声之后,算法会去除一些环境噪声并开始分析数据的模式,Guo 认为如果使用更多的麦克风来获取回声,各种动作间的音调差异将会更为明显,算法的准确性也将随之提高。
团队的麦克风阵列总计共有 256 个麦克风,由于太过笨重且成本过于昂贵,设备并无法大规模生产,团队在尝试提高精确度的同时也在试图在减少麦克风的数量。以目前来说,并未有公司将类似的行为检测技术发展为商业产品,但 Guo 已经对未来的应用有了一些想法。
除了能将纳入类似 Amazon Echo 的设备中,让使用者能更轻松关心自己家中的老人,在一些影像监视无法很好辨别的环境,也能够作为影像辨识软件的替代品。Guo 甚至认为基于声音的监控能比影片监控更好的去保护个人隐私,这或许会使人们更愿意在家中接受这种技术。
然而其他人并不这么想。纽约研究机构 Data&Society 技术伦理学家 Jake Metcalf 认为,声音监控很容易就能和影像结合,打造出一种更深入的监控形式。就像历史上的许多发明一样,尽管原始开发者希望的是某种正向用途,但他们并无法控制人们最终如何使用。
Metcalf 认为,整合监控或许真能挽救一些年迈长者的生命,但也可能被国家用来寻找、迫害特定族群,像是需要定时跪拜祈祷的穆斯林,同时也可能被骇客用来“偷听”特定对象的亲密行为。
以目前来说,团队还必须进一步开发这种设备,才能将其应用到任何产品中。为了需要缩小硬件并保持功效,团队计划进行更多测试,来确保算法适用于更多族群及环境,随着设备越来越进化,也许有人会为其找到适合的应用方式。
只是最终会应用在什么样的环境中,就不得而知了。
- THIS AI USES ECHOLOCATION TO IDENTIFY WHAT YOU’RE DOING
(首图来源:pixabay)
延伸阅读:
- 会回声定位的不只是蝙蝠,人类也能学得这一技能?
- 人脑无极限!研究证实人类也拥有回声定位能力
- 他们测试了上万款 App,看看哪些软件在偷听使用者