Alexa、Siri和Google听不懂你说的话

像Alexa、Google Assistant和Siri这样的语音助手在过去几年里取得了长足的进步。但是,尽管他们取得了很大的进步,但有一件事阻碍了他们:他们不理解你。他们过于依赖特定的语音命令。

语音识别只是一个魔术

语音助理听不懂您的话。不管怎样,不是很喜欢。当你与谷歌主页(Google Home)或亚马逊回声(Amazon Echo)交谈时,它本质上会将你的话转换为文本字符串,然后将其与预期的命令进行比较。如果找到完全匹配的项,则会遵循一组指令。如果没有,它会根据它确实拥有的信息寻找替代方案,如果不起作用,您会收到一条失败消息,如“对不起,但我不知道”。这不过是施展魔术的花招,目的是让你以为它能理解。

它不能使用上下文线索来做出最佳猜测,甚至不能使用对类似主题的理解来指导其决策。语音助理也不难被绊倒。而你可以问亚历克莎“你为国安局工作吗?”如果你问“你是不是国家安全局的秘密成员?”您会得到一个“我不知道那一个”的响应(至少在撰写本文时是这样)。

真正理解语言的人类不是这样工作的。假设你问一个人,“天空中的克拉瓦恩是什么?”它是拱形的,充满了红色、橙色、黄色和蓝色等条纹颜色。“。尽管klarvain是一个虚构的词,但你问的人很可能会从上下文中看出你在描述一道彩虹。

虽然你可能会争辩说,人类正在将语言转化为思想,但人类随后可以运用知识和理解来得出答案。如果你问一个人他们是否秘密为美国国家安全局工作,他们会给你一个肯定或否定的答案,即使答案是谎言。人类不会对这样的问题说“我不知道那个”。人类会撒谎,这是一种真正的理解。

语音助理不能超越他们的编程

语音助理最终受限于编程的预期参数,在它们之外徘徊会破坏这一过程。这一事实表明,当第三方设备进入市场时,就会出现这种情况。通常,与这些交互的命令非常笨拙,相当于“告诉设备制造商命令可选参数”。确切的例子是:“告诉惠而浦暂停烘干机。”举一个更难记住的例子,日内瓦的Alexa技能控制着一些通用电气的烤箱。该技能的用户需要记住“告诉日内瓦”,而不是“告诉GE”,然后命令的其余部分。虽然你可以要求它将烤箱预热到350度,但你不能再要求将温度再提高50度。不过,人类可以遵循这些要求。

亚马逊和谷歌已经非常努力地克服了这些障碍,这表明了这一点。以前你必须按照上面的顺序来控制智能锁,现在你可以说“锁前门”。亚历克莎过去常常被“给我讲个狗笑话”搞糊涂,但今天你只要开口说一个,它就会奏效。他们为您使用的命令添加了变体,但最终您仍然需要知道正确的命令。您需要以正确的顺序使用正确的语法。

如果您认为这听起来很像命令行,那么您就没有错。

语音助理是一种花哨的命令行

命令行被狭义地定义为执行简单任务,但前提是您知道正确的语法。如果您滑出正确语法,键入DYR而不是dir,则命令提示符将给您一条错误消息。您可以使用别名以便于记忆命令,但您必须了解原始命令是什么,它们是如何工作的,以及如何有效地使用别名。如果您不花时间学习命令行的内部和外部,您将永远不会从中得到很多东西。

语音助理也不例外。你需要知道说命令或问问题的正确方式。你还需要知道如何为Google和Alexa设置群组,为什么对你的设备进行分组很重要,以及如何给你的智能设备命名。如果你不遵循这些必要的步骤,你会感到沮丧,因为你会要求你的语音助手关闭学习,结果却被问到,“哪项研究”应该关闭。

在上面的示例中,给出了命令“将计时器设置为半小时”。Google Home中心创建了一个名为“Hour”的计时器,然后询问计时器应该有多长。然而,将相同的命令重复另外三次都是正确的,并创建了30分钟的计时器。使用命令“将计时器设置为30分钟”可以在更一致的基础上正确工作。

虽然与谷歌主页或回声的交谈可能会更流畅,但在幕后,语音助手和命令行的工作方式是相同的。你可能不需要学习一门新的语言,但是你需要学习一种新的方言。

对语音助理的狭隘理解将限制增长

所有这些都不能阻止谷歌助手和Alexa这样的语音助手工作得足够好(尽管Cortana是另一回事)。谷歌助手和Alexa可以得体地在线搜索问题,尽管谷歌在搜索方面做得更好并不令人惊讶,而且可以回答基本的问题,如测量换算和简单的数学。有了正确设置的智能家居和训练有素的用户,大多数智能家居命令都将按预期工作。但这是通过工作和努力实现的,而不是智力上的理解。

定时器和闹钟过去都是简单化的。随着时间的推移,添加了命名,然后增加了向计时器添加时间的能力。他们从简单到复杂。语音助理可以回答更多问题,并且每天都会带来新的技能和功能。但这不是来自学习和理解的自我成长的产物。

而所有这些都没有提供使用已知事物到达未知世界的固有能力。对于每一个起作用的命令和问题,总会有三个不起作用。如果人工智能没有取得突破性进展,赋予人们类似人类的理解能力,语音助理就根本不是助手。它们只是语音命令行-在正确的场景中很有用,但仅限于那些它们被编程为能够理解的场景。

换句话说:机器在学习东西,但不能理解它们。

相关:人工智能的问题:机器在学习东西,但不能理解它们

相关文章