余晖落尽暮晚霞,黄昏迟暮远山寻
本站
当前位置:网站首页 > 编程知识 > 正文

冒险搭载多轮语音交互的搜狗地图,能否从百度和高德的夹击中脱颖而出?

xiyangw 2023-10-03 16:27 47 浏览 0 评论

李根 发自 一路向南G71

量子位报道 | 公众号 QbitAI

AI代表的新技术可能不光开拓新领域,也在冲击固有市场格局。

新技术+旧产品,这样的趋势变革正在发生。

语音交互+地图=?

2016年年底,网易北京搬离清华科技园启迪科技大厦,隔壁的搜狗随即租下两层,安排搜狗地图和搜狗语音团队入驻。半年后,这两支协同工作的团队推出完全语音驱动的语音地图产品,取名“智能副驾”。

这是一款语音驱动的手机导航地图产品,完全基于手机,完全语音交互。之所以取名“智能副驾”,是因为搜狗希望它在车内充当起“副驾”的作用,有问有答。这算不上是全新的产品,本质还是手机地图导航。

在这个领域,百度和高德占据了大部分市场份额,在移动互联网时代厮杀了整整7年,并且在产品细节和体验上费尽心思,连导航的语音包都花样百出,希望覆盖到所有目标群体。

更主要的是,语音为核心交互的地图导航,在手机之外的终端硬件上早已试水,特别是此前竞争激烈的车机和当前愈加火热的后视镜上,通过语音驱动拿下车载场景,有巨头玩家,也有初创厂商,有前装合作方,也有后装搅局者。

但搜狗智能副驾又确实在创造一种不同的形态。之前没有完全基于手机终端的语音交互地图,也未见百度高德等市场大份额玩家将此提上公开议程——即便这是一个显而易见的大方向。

量子位试用了一下搜狗地图这个支持多轮语音交互的新功能。

你可以用语音说出想去的目的地,如果是去一个公园,还能继续用语音确定抵达哪个门,路线确定后,还能继续用语音进一步规划:比方要求不走二环或者中途加油等。这的确与百度、高德地图的基本语音交互不同。

当然这个功能算不上100%成熟。多轮交互失败的情况并不罕见,如果要增加一个途经点,有可能会打乱之前的行程规划。方言识别肯定是不行,即便是普通话也做不到100%。

另有数据称车载情况下,语音识别准确率只有90%左右。

这是一个有点冒险的尝试。

“趟过不少坑”

显然,对于市场份额更大的厂商来说,冒险的成本更大。

一是基于手机的多轮语音交互,识别准确率是个大问题,从硬件方面的麦克风阵列,到手机运算资源消耗的考量,技术挑战不小。

二是用户体验要求高,一旦上线多轮语音交互,内在要求必定是又快又准,一旦识别有误,或交互“弱智”,用户体验就会大打折扣,除了让人骂娘,可能还会客观上助攻竞争对手。

所以把多轮语音交互带入手机地图,多少算是“激进”之举。但对搜狗地图来说,包袱要小得多,转身和尝试可以快得多,即便技术上的坑不少。

搜狗地图总经理孔祥来也承认,在产品立项的半年内,“在技术上趟过不少坑”。

首先是语音识别问题。车载环境,手机终端,应用环境接近远场识别,需要面临降噪、回声、纠错等语音识别方面的技术挑战,而且导航地图需求中,只要一个字、一个词识别不准,都会造成意图错误,用户体验差。

其次是语义理解。车载环境需要尽可能降低眼和手的使用,全靠人机语音对话理解意图,而多轮交互还会对对话模型和引导模型提出高要求。

最后是数据重构,文字输入客观上要求极尽准确,但语音交互却可能语焉不详,单如“首都机场”,就可能面临“航站楼T1、T2、T3”和“出发/到达”等数据的结构关系构建,换而言之是要让机器模型建立起“知识体系”。

而这次新产品的发布,就是搜狗对上述技术挑战交出的答卷。孔祥来告诉量子位,主要有三方面:

一围绕语音识别,针对性做了4000小时车载语音训练,并专门针对POI(兴趣点,包括商家商铺和标志性建筑物等)数据的优化提升语音识别准确率,还要建立语音、语义、地图概率模型,在多个识别结果中做反向挑选,以此作为准确率辅助手段。

二是在最后产品中准备了10万个对话路径,用启发式对话模型,不断细分搜索结果类型,通过对话引导,让机器理解人类的真正意图。

最后则是POI数据的重构,按照现实世界的隶属关系,组成父子、容器、区域从属关系,为语音对话提供相应精准的领域知识,保障播报和上下文理解能力。

孔祥来还说,在三步语音交互方案实现后,目前的搜狗地图,可能在AI新能力的基础上,拥有了新的产品形态,产生新模式。

但就此会改变手机地图竞争格局吗?

难。

换道竞争

在孔祥来看来,之所以此时上马“智驾副手”,重点并不在重新抢夺手机地图市场份额——意义已非常有限。

“现在市场份额抢夺、用户增长,可能不是最主要的目的。我们现在赋能地图,希望通过这样的尝试去获得车厂的认可。其实语音交互大方向已经被认可了,但之前车厂尝试过语音方案后,认为效果一般,所以现在我们相当于通过手机去进行验证,再进一步获得车厂认可,比我拿着PPT去车厂硬讲,要靠谱很多。”

此外,孔祥来也认为:新的竞争已经不再围绕旧形态展开,即不再围绕“手机地图”展开。

“语音交互引入地图、车内场景后,手机地图可能要被重新定义了,将不再是传统的工具软件。”这位搜狗地图总经理说。

语音交互+地图,会构建一种全新的形态和模式。用户可以在导航中可以用语音说任何事情,不光是导航,可以提供更多服务:问答的能力、搜索水平。这个能力、习惯形成,那远比在地图里做O2O靠谱。

“更加直白地说,相当于得到了一个车内语音交互的入口,就不再是一个地图软件+语音,而是在车内的语音助手,只不过拥有了导航的能力而已,用户在车内的语音助手,提供车内的任何服务,这跟地图导航不再是一个维度的事情。”

听起来像是利用新一代技术,换到了更高的维度参与竞争,然后高维打低维,在新场景新模式中完成“弯道超车”。

但事情也并没有那么简单,百度和高德也在利用新技术加码布局,方向不尽一致而已。

百度的大方向是车,无论是车联网、智能驾驶还是无人车,地图的核心功能是不断精确的路网数据和搜索能力,把AI、AR等一系列新技术叠加到产品中。

而多轮语音交互方面,实际百度已经在车机产品CarLife、后视镜CoDriver中引入,何时迁移应用到手机地图中,可能只是时间问题。

高德的方向是“数据中心”。在最新阐述的AI应用中,高德的方向是“活地图”,利用机器模型搭建交通大脑,在实时数据计算的基础上,把实时路况、动态预测和用户偏好作为体验改善的大方向。

目前,语音交互在高德地图中,被当做了辅助性的搜索手段,技术由科大讯飞提供,这也意味着如果高德在地图导航中上马语音交互,多半会与讯飞进一步合作,产品的磨合或许挑战相对更大。

当然,阿里集团CTO王坚也曾公开表示,利用阿里云的计算力和大数据模型,阿里自主研发的语音交互也迅速取得了突破,但是否会直接赋能高德,目前难以获悉。

不过可以确定的是,原本以为竞合格局已定的领域,现在又因为AI浪潮的到来,展现出新的可能,新一轮比拼再度开启,固有优势带来的机会,有可能稍纵即逝。

这可能会是很长一段时间内的趋势。

关于市场格局

最后,量子位补充一点背景资料。

根据搜狗地图2015年5月公布的数据,在手机地图市场,激活用户共计1.5亿,排名第三。百度地图去年6月公布的数据为5亿用户。高德地图去年10月公布的数据为7亿用户。这些数据,听听就好。

实际上,虽然搜狗地图的知名度,远不能跟输入法、搜索和浏览器相比,但始终是搜狗内部业务中不可或缺的一环,否则很难解释这样一个“买来的”业务,已经让很多用户忘记了“来路”。

老一辈互联网从业者和用户或许有所了解,搜狗地图也并非完全来自搜狗内部的创造孵化。

它的前身是现任搜狗地图总经理孔祥来创立的电子地图服务平台go2map,可追溯至1999年,其后2005年4月,Go2map被搜狐全资收购,成为现在的搜狗地图,孔祥来也进入搜狗,成为地图业务的负责人。

在此前的地图导航竞赛中,搜狗地图一度有机会。在2008年,它是北京奥运的官方合作伙伴,在2011年,它已面向移动端推出了路况导航产品,直至2015年5月,官方披露的数据中,手机客户端的激活用户还有1.5亿,总量排名第三。

但后来的故事我们都知道了,随着阿里收购高德,百度加码O2O,手机地图的竞争逐渐成为B和A的竞技场,二者抢占了更多的市场份额,在整个移动互联网时代,百度和高德为谁是第一,打了整整一个时代。

至今,双方围绕市场份额和排名,依旧口水仗不断,难解难分。

【完】

相关推荐

排序算法--归并排序_归并排序例题讲解

原理如图所示(先分割再合并):归并排序代码工作原理:1、申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列2、设定两个指针,最初位置分别为两个已经排序序列的起始位置3、比较两个指针所...

八大排序算法-归并排序_归并排序 算法

算法思想归并排序分为三个步骤:1.分解:将数列分解成n个子数列。(如果是将数列分成2个子数列则为2路归并)2.治理:对每个子数列进行排序操作3.合并:将两个排好序的子数列进行合并生成新的数列算法实现P...

高级排序之归并排序、希尔排序_希尔排序和归并排序区别

前言继上次排序算法简单排序算法之冒泡、插入和选择排序-Java实现版后,本文学习高级排序算法——归并排序、希尔排序,快速排序将在后续更新。本文实现代码调用方法,部分来自前一个文章:简单排序算法之冒泡、...

Excel办公应用:按合并单元格排序的三大方法

1.按姓名对科目排序重点:在"C2"中输入公式=IF(A2<>"",1,C1+1),然后下拉填充。2.按姓名添加连续序号(方法一)重点:选择"A2:A11"单元格区域,在编辑栏中输入公...

快速排序 Vs. 归并排序 Vs. 堆排序——谁才是最强的排序算法

知乎上有一个问题是这样的:堆排序是渐进最优的比较排序算法,达到了O(nlgn)这一下界,而快排有一定的可能性会产生最坏划分,时间复杂度可能为O(n^2),那为什么快排在实际使用中通常优于堆排序?昨天刚...

归并排序思路图解 #归并排序_归并排序百度百科

排序算法1.图解。OK,让它排一下。看好了,要开始排了。能看出来像递归吗?肯定算法难,但是这个次数非常的多,不用管次数。这个是帝规,就是递归。这是并,这是并,这是两个有序数,组合成一个最后的大的有序数...

排序算法学习——归并排序_归并排序算法稳定吗

我们先看归并排序的定义归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(DivideandConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每...

动画|经典的归并排序究竟怎么玩儿?

作者|菠了个菜责编|郭芮由于LeetCode上的算法题很多涉及到一些基础的数据结构,为了更好的理解后续更新的一些复杂题目的动画,推出一个新系列——《图解数据结构》,主要使用动画来描述常见的数据...

Excel中,多列数据统一排名,Rank函数直接搞定

Rank实现多列联合排序排序,那太简单啦,Excel中,升序降序,一个按键就可以。但,那是针对单列情况,若需要联合多列数据进行排序呢?如下图所示,需要对1、3、5列进行统一排序,咋弄嘞?联合排序案例先...

【数据结构与算法】归并排序_数据结构中归并排序

归并排序是建立在归并操作的一种高效的排序方法,该方法采用了分治的思想,比较适用于处理较大规模的数据,但比较耗内存,今天我们聊聊归并排序排序思想一天,小一尘和慧能坐在石头上,眺望着远方师傅,我听山下的柳...

C++基础算法:归并排序_经典排序算法-----归并排序(c语言实现)

归并排序(MergeSort)是建立在归并操作上的一种有效,稳定的排序算法,该算法是采用分治法(DivideandConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列。...

马士兵说之归并排序_马士兵教育的内推是真的

大家对于排序应该是挺熟悉的吧,马士兵老师特意为排序出了一波视频,当然文章是转自博客园的,马士兵老师的视频观看请点击下方的了解更多概要本章介绍排序算法中的归并排序。内容包括:1.归并排序介绍2.归并...

C++快速排序和归并排序_c++快速排序sort

快速排序每一轮挑选一个基准元素(随机选择,编程时一般选取第一个),并让比它大或小的元素移动到基准元素的两边,把数列拆解成了两个部分。而后对这两部分分别进行快速排序。时间复杂度:O(nlogn),辅助空...

经典的排序算法——归并排序_归并排序算法步骤

归并排序(MergeSort)是一种基于分治策略的高效排序算法。它将原始数组不断地分割成两个子数组,直到每个子数组只剩下一个元素为止(即基本有序),然后再通过合并已排序的子数组来最终得到完全有序的大...

归并排序_归并排序c++实现

归并排序概念:归并排序中涉及到一个概念就是分而治之,总序列化成小序列,将小序列排序好,利用排序好的小序列,再归并排序成原来要排序的序列。所以排序前先要分:functiondivide(arr){...

取消回复欢迎 发表评论: