微软小娜、苹果Siri等语音助理都还存在一大缺陷

7月18日消息,国外媒体VentureBeat近日发布文章称,苹果Siri、微软Cortana等个人助手服务如今颇为流行,它们有望成为下一个人机界面。但该类服务目前均面临着一大发展障碍:多代理问题。该问题能否有效解决,将关乎个人助手服务的影响力大小。

微软小娜、苹果Siri等语音助理都还存在一大缺陷

以下是文章主要内容:

个人助手服务如今广为流行,各家公司似乎都在展开这方面的研发。人们认为它们将成为下一个人机界面——当你可以直接叫你的助手给你办事时,何必还要费劲去使用应用和网络搜索呢?

然而,理想的个人助手服务和现实之间还存在一大障碍:多代理问题。大多公司都不愿意讨论该问题。它的解决方案将会最终决定个人助手服务会有多大的影响力。

个人助手的运作模式

个人助手服务其实有个不为人知的小秘密:它们实际上并不理解你。至少,它们不像你想象的那么理解你。

为了使得个人助手服务更易于部署和重复使用,早期开发者将它们设计得不只有一个大程序,而是有很多的小程序——每个程序专门负责完成某项特定的任务,如预约、叫车、设定闹钟等等。他们将这些小程序称之为代理。个人助手本身不必具体了解这些任务,它只是负责理解用户的口令,为他们指派的任务寻找最合适的代理。

时下几乎所有的现代个人助手服务都采取这种模式。部分助手,如亚马逊Alexa和微软Cortana,甚至允许外部开发者添加新代理(亚马逊将其称作“技能”,微软则将其称为“聊天机器人”)。

该模式其实存在一些严重的缺陷。

由于任务相关的所有知识都存在于代理内,个人助手本身对你说的话背后的意思其实并不理解。相反,它只会寻找模式——关键词和词组——然后猜测你的意思。如果你识别不出部分词语,它就会忽视它们,寄望于它无法理解的部分不大重要。

这就是为什么个人助手服务很容易被戏弄;它们实际上并不理解你的话的意思。你或许也注意到,当你稍微改一下你的语音指令,它们有时候会做出全然不同的事情。

对于当下的个人助手服务来说,处理要求激活一个以上的代理的任务难度很大。举例来说,如果你叫你的助手给你推荐一处吃早午餐的地方,同时还叫它帮你叫车,它会不知道该激活哪个代理,不知道哪个代理最适合处理你的任务——找餐厅的代理,还是叫车的代理。

如果开发商将它的助手服务开放给外部开发者,那情况会更加复杂。那意味着该助手必须要懂得分辨数十个代理:那些代理个个都声称自己处理特定任务最厉害。例如,如果个人助手服务同时拥有Yelp、Foursquare、TripAdvisor和Google Places这几个代理,那它要如何判断哪一个能够帮助你找到约会的好去处呢?

这是多代理问题的关键所在:对这个世界了解很有限、有多个功能重复的代理的个人助手服务,要如何选择代理,从而很好地响应人们的每一个指令呢?

如何解决多代理问题

早期的个人助手服务,如Siri和Alexa的初期版本,主要通过谨慎展示它们理解的代理、关键词和词组来解决这一问题。就像魔术师小心翼翼地使出伎俩来让你看到某种幻象,设想周到的设计师制造了一种这些助手的能力远远超过其实际情况的幻象。

随着人们期待从个人助手服务获得更多的功能服务,开发商面临着将它们开放给外部开发者的压力。这让多代理问题变得不可避免。

Alexa和Cortana均部分通过迫使用户自行选择代理来解决该问题(“Alexa,叫Dominos给我寄送比萨饼。”)。苹果则采取相对保守慎重的策略,仅提供数量有限的代理。它们主要处理预约和叫车任务。

该领域的开发商大多希望自然语言处理或者机器学习技术的改进将会带来解决方案。微软、谷歌、苹果和Viv都在大力投资发展那些技术。有的开发商则试图通过使得个人助手本身更加理解周遭世界来更进一步。例如,Ozlo正致力于直接分析代理内部的数据来试图提升自身的理解能力。

目前还不清楚哪种策略哪种解决方案能够奏效。不过,我们倒可以回顾初期的网络搜索来进行平行比较。

早期的搜索引擎采取的模式类似于当下的个人助手服务。它们并非直接分析网页,而是依靠于作者提供的网页描述,即元数据。例如,如果你在开发有关狗的网站,你可能会在你的元数据中加入诸如“dog”(狗)、“canine”(犬)和“pets”(宠物)的关键字。搜索引擎会完全根据元数据中的单词来显示结果。

没过多久,诸多的网站都自称是其所在资讯领域最好的站点。随着互联网的发展,为了获得更多的流量,一些不大严谨的网站作者甚至在其元数据中填入与其网页无关的关键字。

最终,为了解决该问题,谷歌增加了浏览网页本身内容流程,有时候甚至忽略元数据。从那时候开始,网络搜索才开始接近人们所期望的那种质量。

然而,个人助手服务的多代理问题,并没有像网络搜索的早期问题那么容易解决。二者的用户需求、技术甚至所涉及的数据都千差地别。或许,直到个人助手服务开始理解它们正提供给用户的任务之前,它们都将难以达到人们对其的高期望。

时间会证明一切。该类服务还处于初生阶段,仍在不断进化。不过正在正面解决多代理问题的公司值得关注,因为它们很有可能会统治下一波智能助手。

win10ghost

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: