您需要了解的有关 Google Duplex 的所有信息

您需要了解的有关 Google Duplex 的所有信息

本周,谷歌在 I/O 大会上预览了 Google Assistant 的一项新功能。这项功能名为 Google Duplex,其目的是代替我们拨打电话,以自然流畅的方式进行对话,以帮助执行“现实世界”的任务。

任何足够先进的技术都与魔法无异

阿瑟·克拉克

这是一个经常被滥用的短语,在新闻业中是被禁止的,但在听了谷歌独立预订餐桌和预约理发的演示后,这位编辑真诚地认为它在这里很适用。

如果你还没有听过 Google Duplex 的操作,那么请听下面的例子:

Duplex 安排理发预约: 您的浏览器不支持音频元素。
音频由 Google 提供

这听起来很诡异,不是吗?Google Duplex 甚至与“图灵测试”有关。图灵测试是艾伦·图灵在 50 年代开发的一项测试,用于确定人工智能的行为是否与人类的行为没有区别 - 确实值得高度赞扬。当然,我们只听到了最好的例子,即使我们很想让谷歌发布 Google Duplex 早期对话的“搞笑片段”!

Google Duplex 的重大改进是,它能够进行自然的对话,这得益于它在理解、互动、计时和说话方面的进步,确保接收者不必适应与机器交谈。正是这种成功“愚弄”电话另一端的人的能力引发了哲学和伦理方面的担忧。

谷歌随后做出回应,表示 Google Duplex 会在对话过程中表明自己的身份。

Google Duplex 如何实现这一点?

Google Duplex 采用 TensorFlow Extended (TFX) 机器学习平台创建循环神经网络 (RNN),通过自动语音识别 (ASR) 和文本转语音 (TTS) 引擎根据情况控制语调来执行语音处理任务。

自动语音识别 (ASR) 将接收者的语音转换为文本,根据上下文分析文本,并通过文本转语音 (TTS) 引擎将响应转换为接收者的语音。

为了达到所需的互动质量,Google Duplex 会在预约理发等特定领域进行训练。训练是实时进行的,由人工操作员监督,操作员将监控互动并在适当的时候进行干预。这些训练有素的教练会持续监督训练,直到对话达到所需的质量水平。此时,Google Duplex 可以自由地独立运行。

Google 会记录每一次通话吗?在英国和美国的许多州,你只需要一方同意,就可以合法地记录通话。但是,美国某些州要求双方同意。在呼叫该州时,Google Duplex 会无法运行吗?还是 Google Duplex 会请求许可?——如果我们听说过,那将是一个破坏对话的事件。

随着 Google Duplex 扩展到其他领域,为了满足您的要求,可能还需要知道更多的个人信息。我们可以决定不提供这些信息,但会损害 Google Duplex 所能提供的服务质量。

像我们一样说话和倾听

时间上的细微差别也有助于保持自然转换。根据用户研究,Google 能够将其延迟与人们的期望相匹配。

快速回应“你好”,并在回答问题时停顿以做出更周到的回答,这更好地模仿了我们的对话方式。此外,Google 还利用语音不流畅来在对话中制造停顿,例如“呃”、“嗯”,这使得 Google Duplex 产生的语音听起来更加自然。

理解人类的反应更加困难,因为我们使用的句子很复杂,有时自相矛盾,通常不成结构,依赖于上下文,背景噪音很大。在较长的对话中,“4 人可以”可能指的是预订时间或人数。

复杂语句的示例: 您的浏览器不支持音频元素。
音频由 Google 提供

我们又要犯一次新闻失礼行为,并引用另一句被滥用的引言

你只有一次机会给人留下第一印象,最好把它做好

要让 Google Duplex 成为我们日常生活的一部分,它必须为我们和企业做好一切。我们的数字助理有多少次未能按照我们的要求去做事了?

作为用户,我们经常会放弃那些无法满足我们期望的功能 - 但有了 Google Duplex,顾名思义,它是双向的。如果另一端的企业认为由于互动不佳而浪费了时间,那么不久我们就会看到企业放弃使用 Google Duplex 的电话或完全屏蔽这些号码。

Google 表示,Google Duplex 具有自我监控功能,如果出现无法自主完成的任务,它会向人工操作员发出信号,由人工操作员完成任务。在某些极端情况下,此功能在现实中如何体现还有待观察。

预测下一步?

从逻辑上讲,我们预计 Google Duplex 将在很多场景中发挥作用。

鉴于我们与汽车的集成程度比现在更深,设想这样的场景:在发生碰撞时,如果我们的安全气囊弹出,Google Duplex 可以自动代表我们呼叫紧急服务。

中风可能导致说话困难,这也是 Duplex 可用于呼叫紧急服务的另一个场景。只需在家中放置经济实惠的智能家居按钮,结合 IFTTT,Google Duplex 便可在出现问题时为老年人呼叫帮助。

对于大多数人来说看似平凡的任务对于残障人士来说却极具挑战性。在这些情况下,Google Duplex 将真正解放这些人士。

一旦支持更多语言,我们度假和侨民的体验将得到极大改善。

目前,Google 专注于 Google Duplex 为我们发起呼叫。Duplex 在我们忙碌时接听我们的电话并采取适当的行动之前,这并不是一个巨大的飞跃。

即使在今天,它似乎至少能够为我们转录语音邮件。如果电话/转录来自 Duplex 第一次拨打时“忙碌”的美发沙龙,它也会采取行动并回拨。或者更有用的是,直接回复美发沙龙的回电。

有了 Google Duplex 打电话,我们的思维自然而然地超越了智能手机。随着 Google 的触角不断扩大,包括我们的手腕、电视、扬声器和厨房里的数字显示屏,我们完全有可能从所有联网设备发起请求,而无需掏出手机。

从字面和比喻意义上讲,您还没有听到 Google Duplex 的最新消息,Google 计划于今年夏天进行测试。但与此同时,您可以听听下面的一些其他示例:

复式预订桌: 您的浏览器不支持音频元素。

处理中断: 您的浏览器不支持音频元素。

进一步阐述: 您的浏览器不支持音频元素。

另一家餐厅预订: 您的浏览器不支持音频元素。

询问节假日营业时间: 您的浏览器不支持音频元素。

音频由 Google 提供

来源

<<:  Moto C2 和 C2 Plus 首次亮相渲染图

>>:  每周民意调查结果:LG G7 获得粉丝青睐

推荐阅读

AMD 宣布推出 RX 6000M 系列移动显卡和 FidelityFX 超级分辨率

AMD 今天在 2021 年台北国际电脑展上发布了一系列新产品,其中第一款是 Radeon RX 6...

优惠:原装三星 Gear IconX 降至 50 美元

随着新一代 Gear IconX 耳机进入商店,三星正在清理旧款耳机的库存——这是一笔划算的交易。这...

优惠:eBay UK 为多款手机和电子产品提供 20% 折扣

eBay 英国站正在推出一项多卖家促销活动,其中包括 23 位科技和时尚界的知名人士。有一个 20%...

据称,三星 Galaxy S9+ 将使用 1/2.55 英寸 IMX345 传感器

从零售包装盒的背面,我们知道 Galaxy S9 双摄将重新配备可变光圈——相机可以在 f/1.5 ...

三星 Galaxy Z Fold3 相机详情

如果@FrontTron的信息可信的话,三星 Galaxy Z Fold3 将搭载与其前代产品类似的...

华为 MateBook 16 亮相,搭载 Ryzen 5800H APU、16 英寸 3:2 显示屏和不到 2 千克的金属机身

最新发布的华为 MateBook 16 在性能和便携性之间实现了完美平衡。这是一款 16 英寸笔记本...

Realme 透露明天将发布新手机,这可能是新手机的发布日期

TENAA 上出现了几款 Realme 设备,虽然我们猜测它们可能是期待已久的 X3 Pro 的变种...

小米宣布其“迄今为止最大的派对”,将于12月8日在纽约举行

小米喜欢派对——今天该公司宣布其“迄今为止最大的派对”,将于 12 月 8 日在纽约举行。此前一天,...

Google Photos 进行重大重新设计,推出新图标、照片地图搜索和简化的用户界面

从今天开始,谷歌将开始对其 Google Photos 应用进行全新更新。这款照片保存应用已有五年历...

官方 Google Pixel 3 XL 手机壳上手体验

今天我们带来了 Google Pixel 3 XL 的官方手机壳。粉色月光是这款手机的四种颜色之一,...

小米 2018 年第二季度智能手机出货量达 3200 万台

2018 年第二季度已经过去,各大公司纷纷公布季度财务业绩。最新公布业绩的智能手机制造商是小米,该公...

从明天开始,在 Verizon 购买 Pixel 2 或 Pixel 2 XL 即可获得最高 300 美元折扣

Pixel 2 和 Pixel 2 XL 将于明天(10 月 19 日)在 Google 在线商店和...

Oppo F9 Pro 现已在印度各大线上和线下商店发售

上周,Oppo 在印度发布了其华丽的中端手机 F9,即 F9 Pro。该设备一经发布便开始接受预订,...

苹果将​​在年底前决定 2020 年 iPhone 是否使用京东方 OLED 面板

据日本商业日报《日经新闻》最新报道,苹果目前正处于认证京东方 OLED 屏幕的最后阶段,该屏幕将用于...