揭秘谷歌语音战略 智能助手活跃用户去年增长7倍-编程之家

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在 2019 年I/O开发者大会上演讲

  腾讯科技讯,5 月 13 日消息,据外媒报道,在 2018 年I/O开发者大会上,当谷歌演示其会话式人工智能服务 Duplex 代替人类打电话时,该公司很大程度上强调了它像人类那样说话的能力。对有些人来说,这项技术给人带来的担忧甚至超过“恐怖谷效应”(Uncanny Valley)。不过现在看来,这是一种短视的评估。

  Duplex 的出现为谷歌不断扩大的语音战略打开了序幕。谷歌不仅为世界级的 AI 助手提供支持,为消费者提供通过自动聊天机器人与企业互动的能力,同时还为企业提供会话服务,帮助他们与客户互动。自从 Duplex 面世以来,谷歌云计算平台 Google Cloud 就推出了 Contact Center AI,用以管理客户服务中心,并增加与客户的对话。

  谷歌的语音战略随着该公司积极的国际扩张而继续,首先是能够读取 Android Go 上几乎所有的文本,Android Go 是安卓操作系统的轻量级版本。语音也被用来为使用经典 T9 手机的人填写文本字段。谷歌智能助手 Google Assistant 还学习了新的语言,现在它掌握了 30 多种语言,在 80 多个国家和地区可供使用。

  在美国以外的某些地区,Google Assistant 的使用增长很快。今年早些时候,谷歌在世界移动大会上宣称,Google Assistant 的使用在印度、印尼、墨西哥以及巴西等地的活跃用户增加了 7 倍。

  人员和企业对话

  去年秋天,就在谷歌扩大 RCS 计划,与三星合作开发更丰富的短信服务时,Duplex 也开始推出,现在美国大部分地区都可以在 Pixel 手机上使用这种会话式 AI。

  为了帮助人们获取诸如电影和餐馆之类的信息,今年 2 月,谷歌推出了 Google Assistant 安卓信息推荐服务,这项服务将根据文本对话中使用的单词来建议用户采取行动。上个月,Google Voice 向所有 G Suite 客户提供了电话服务。它可以创建客户问候语,从简单的问候语到呼叫者的分支选择。

  上个月,谷歌推出了 Calljoy,以帮助小型企业利用语言模型实现来电管理自动化。Calljoy 在发布时被贴上了谷歌 Area 120 的标签,但 Duplex 在发布时也被称为实验。

  这些产品中的每一款都改进了现有的功能,比如用于对话操作的 Actions on Google 平台和用于会话聊天机器人的谷歌 NLP 引擎 Dialogflow。在今年的I/O开发者大会上,谷歌通过设备上的机器学习加速了其语音策略,使 Google Assistant 的性能提高了 10 倍,并为 Duplex For The Web 等计划提供支持。

  Duplex 的最新版本将可帮助填写有关用户的信息,以便更快、更轻松地完成购买。继 Google Assistant 今年早些时候被添加到谷歌地图、去年被添加到 Android Auto 后,Google Assistant 还出现在汽车的“驾驶模式”中。谷歌还展示了在会话 AI 领域开拓新领域的努力,以及为残疾人增加语音识别能力的努力,包括使用 AI 帮助聋哑人或听觉有障碍者进行语音电话通话等。

  此外,谷歌还展示了使用 Google Assistant 的计算机视觉工具 Lens 的新方法,包括 100 多种语言的文本实时翻译。还有新的 Nest Hub Max,这款设备类似于内置屏幕的智能音箱,将声音和视觉体验结合起来。Nest Hub Max 使用面部识别软件帮助打造个性化的屏幕显示内容。语音认证和面部识别相结合的生物识别技术将来可能成为无缝、无摩擦支付的基础。

  谷歌过去一年中推出的每项功能、产品或服务都融入了一个单一的战略,即连接企业和客户。

  语音聊天侧重于用例

  本周 Duplex For The Web 选择的用例是 Hertz 租车,通过 Google Assistant 进行的航班登记将从联合航空公司(United Airlines)开始。然而,Duplex 并不是一种通用工具,它只适用于呼叫餐馆和发廊等企业。

  这是个经典的会话商务用例,自 2016 年 Messenger 平台出现以来,Facebook 一直坚持这一用例,包括 WhatsApp Business。但是谷歌的方法看起来更加灵活,能够同时进行语音和文本交互。

  在这里,我们看到一家公司正通过全面和无处不在的方式推动其“语音优先”战略。“无处不在”是 Alexa、Siri、Bixby 和其他语音助手经常使用的词,用来形容它们在家庭、汽车和工作场所提供服务的雄心,但 Google Assistant 更是如此,它现在可以在超过 10 亿台设备上使用。

  所有这些加起来可以让我们得出这样一个结论:从某种程度上说,谷歌可能已经赢得了聊天大战的胜利,即科技巨头之间说服世界在智能音箱、电视、智能手机和汽车等设备上采用他们 AI 助手的竞争。

  市场研究机构 Strategy Analytics 2 月份发布的报告显示,在智能音箱领域,亚马逊继续引领全球销售,2018 年第四季度销售了 1370 万台智能音箱。谷歌紧随其后,出货量为 1150 万台。然而在过去一年里,亚马逊的全球市场份额已从近 80% 下滑至与谷歌相当的 30%。

  市场研究机构 Canalys 和 Strategy Analytics 甚至还发现,2018 年第二季度,谷歌的 Home Mini 智能音箱的销量超过了全球其他智能音箱品牌。尽管智能音箱和智能显示器越来越受欢迎,但谷歌的主导地位基于这样一个事实:智能手机仍然是人们最有可能与智能助手互动的方式。

  微软上个月发布的一项调查显示,Siri 和 Google Assistant 是最受欢迎的 AI 助手:36% 的受访者表示他们分别使用过这两种智能助手,其次是 Alexa (25%)和 Cortana (19%)。

  现在每月 25 亿台活动设备运行安卓系统,使其成为地球上最受欢迎的移动操作系统。Chrome 也支持谷歌语音控制功能,它是世界上最流行的网络浏览器,占全球网络流量的大多数。还有谷歌的搜索垄断。

  但那是消费者的意愿。过去一年标志着谷歌向吸引更多小型企业和企业客户方向转变,在谷歌试图说服企业客户采用他们的解决方案的过程中,最大的竞争者之一是微软及其 Cortana。

  区别于微软战略

  尽管微软做出了努力,但 Cortana 尚未被整合到亚马逊的 Alexa 和 Google Assistant 支持的各种家电中。而且在消费者使用或制造商采用方面,Cortana 也未能带来引人注目的增长。

  本周在西雅图举行的 Build 开发者大会上,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)强调了对多智能助手世界的需求。这是亚马逊、Facebook 和微软经常提到的概念,但谷歌和苹果此前从来没有提到过。

  微软还展示了其会话式 AI 的进步,它在几年前就能与人类相媲美。微软去年收购了一家初创公司 Semantic Machines,以促使 Bot Framework 和 Cortana 这样的智能助手将能够处理更多的多轮会话。微软还敦促企业客户创建自己类似 Cortana 的助手,以提高员工的工作效率。

  在这种情况下,微软和谷歌的不同之处在于,微软正在向现有客户推销,其中包括财富 500 强企业中的大多数客户。另一方面,谷歌拥有着无与伦比的优势,其愿景是使用最简单的用户界面(语音)来提升其与企业客户的商业利益。在搜索引擎、智能手机和网络浏览器这三种现代生活的基本工具上,虚拟垄断也推动了这一努力的发展。

  Facebook 仍然拥有地球上多款最常用的聊天应用,微软仍然与世界上许多企业客户保持着联系,亚马逊的 Alexa 仍然拥有美国最受欢迎的智能音箱载体。但谷歌的语音策略仍然比其他公司的策略更全面、更容易理解、更有说服力。(腾讯科技审校/金鹿)