智能对话爆发,但要做引擎的百度大脑已经提前赢下这场AI竞赛

  • A+
所属分类:智能化

文|曾响铃

来源|科技向令说(xiangling0815)

全面战争不断深入的重要表现,是局部的深度战争。

AI大竞赛就是如此。5月15日,百度大脑召开了一场名为“与未来对话”的发布会,百度大脑“智能对话引擎”及其核心产品UNIT3.0亮相,智能对话在AI竞赛中的位置全面提升。

事实上,自从语音、视觉在各个场景应用中大放异彩后,AI一直在等待新的爆发点,现在,创新内涵、应用前景都十分丰富的智能对话开始接棒,包括百度在内,诸多大佬级AI平台都盯上了智能对话。

以百度此次发布会为标志,这个AI新的爆发点正式起爆,一场AI全面战争下的局部深度战争打响,而百度凭借AI技术的先期积累,已经占据有利位置。

不过,对似乎提前锁定胜局的百度而言,要以行业“引擎”的姿态做智能对话,下一步要面临的挑战也有不少。

1.png

“复杂系统”下,智能对话更需要开放式行业平台

智能对话,从概念上看,其着眼点在“对话”,也即其AI能力扩展到了人机交互的更高层面——像人一样进行对话式互动,而不只是下达和响应被限定的命令。

这给了智能对话提出了更独特的行业发展要求。

1、智能对话是一个“复杂系统”

目前,智能对话在车载、音箱、客服、机器人领域都有广泛的应用。普通人在网络购物、享受服务的过程中,通过聊天框流畅对话的,很可能就是AI而非客服小姐。

不仅如此,现在的智能对话已经能实现语音实时沟通,某些营销电话的对接,可能就是由智能客服完成,而可以做到消费者浑然不知。

很明显,这种“自然”对AI来说要求变得更高了。

与语音操作、视觉识别等成熟AI智能产品相比,要实现尽可能自然的对话,智能对话需要在NLP(自然语言处理,“听见”讲了什么词组、句子)、知识图谱(即AI懂的知识,只有“懂”才能去“聊”)、语音语义一体化(听见的音节能转化成现实的理解,没有这个就好像不懂外语的听外语)等方面都有深度积累。

智能语音无法通过简单的数据+模型训练就能形成单个产品,在本质上,它是一组技术和资源的总集成,需要全面的技术布局和深厚的技术积累,也因此,我们看到,智能语音在语音操作、视觉识别火了很久之后,才“姗姗来迟”迎来爆发。

2、做好智能对话,三个“池”缺一不可

正因为是“复杂系统”,所以做好智能对话,其能力需求也十分“立体”。

至少,这三个“池子”的条件平台方必须具备:

首先,要有丰富的“资源池”。如同婴儿学习对话,需要父母不断进行输入,更大量更多样化的输入才能让婴儿更快地实现语言能力成长。智能对话需要大量语料输入,并不断学习外界的“知识”。

然后,是强化学习能力的“技术池”。在输入的基础上,还得有消化能力,不管是新开发的AI技术,还是通用AI技术的借用,智能对话的“复杂系统”都要求AI有更复杂的学习方式和学习过程.

最后,是能够练手的“实践池”。只有具备高密度的现实应用,智能对话才能从“温室”走出,适应“社会环境”,没有真刀真枪上阵,耍再多把式也没用。

3、BAT级平台被智能对话天然“预订”

很显然,有大量语料、知识库,又具备充分的AI技术积淀,还有自家练手的场景应用,全部具备三大“池”资源的只有BAT这样的平台级企业,小公司几乎不具备从零起步构建智能对话产品的能力,或者说,投入太过巨大而没有现实价值。

与简单要求下的语音、视觉不同,智能对话从一开始就锁定了BAT级平台。

而这其中,正是凭借其技术领先、能力丰富的优势,百度大脑才能在这个爆发的节点上,发布其智能对话引擎;在此基础上,百度大脑还针对对话系统定制平台UNIT发布9大核心特性,形成了全新的对话系统定制平台UNIT3.0。

相对于有所动作但幅度并不算大的A\T两家AI平台,百度智能对话已经取得行业领先。

搜索出身给了百度巨大的先发优势。不论是天气、星座、美食、快递、团购、小说等信息资源,还是人物、地理、历史体育等问答资源,都让百度的智能对话有了业内难以企及的语料和知识来源。

此外,AI战略让百度为智能对话积累了大量通用技术基底,以及快速上手的能力;而百度地图、Apollo、DuerOS、小度机器人等“真实业务”又成为百度智能对话的练兵场,积淀了可以转化到生态伙伴身上的大量预置技能(可以理解为经过了广泛“实习”)。

百度大脑为什么敢用“引擎”定义智能对话平台?

值得一提的是,智能对话玩家们往往发布都在发布“XX平台”、“XX产品”,而百度此次是直接用“引擎”来定义其智能对话平台。

这固然有拔高竞争维度、强化相对优势的动机,但百度大脑敢这个爆发的关键节点用上“引擎”一词,没有起码的实力是不敢这么高调的。

这里认为,百度大脑能提出“引擎”,基于这三个方面的准备:

1、禀赋上,智能对话平台早已成型

某种程度上,百度此次的发布会并不是在发布一个“新产品”或“新平台”,而更像是一次过去智能对话能力、产品、平台、生态的整合与升级。

在今天正式发布智能对话引擎及其UNIT3.0之前,百度智能对话对自家产品、生态伙伴的赋能,已经累计实现交互460亿+次,而且这次百度大脑推出的UNIT3.0版本,在搭建技能、构建知识和整合技能与知识上也做了全面升级,就技能搭建而言,包含预置技能和自定义技能。其中预置技能就包括智能问答、设备控制、影音休闲、生活服务等58大项,沉淀了全网最全面最优质的信息类资源。

可以说,百度的智能对话平台已经是全行业技术最强、能力最丰富、规模最大的平台,这样一个本身就具备业务基础的平台,再次升级只能是朝着更高的行业价值定位方向走。

从而,由“产品”或“平台”转向“引擎”也就自然而然了,毕竟,AI竞赛尤其是平台型AI之间的生态竞争,除了技术和商务的深入还会在定位上不断升级维度。

可以预见,若干时间之后,A/T甚至科大讯飞也会跟上“引擎”的定位。

2、技术上,已实现快速冷启动+高精度长尾优化

在技术层面,百度智能对话引擎及其核心产品UNIT3.0有一个长达100多页的PPT详尽介绍其各类技术优势,其技术储备的丰富与深度可见一斑(具体见相关报道)。

但总体看来,这里认为,该引擎在技术上有两个分阶段的优势:部署后的快速冷启动,运行过程中的高精度长尾优化。

说白了,既然是引擎,“加速度”能力是十分重要的。

按百度方面的说法,其UNIT3.0能通过平均77个模板就能实现对话技能的快速冷启动,对比行业需要高达800+模板;以地图导航为例,百度大脑智能对话引擎通过10-100个模板、10-100个样本就能快速启动,实现90%的的准确率。

这意味着,开发者和企业几乎拿来就能满足基本的需求,部署十分简单,对环境要求不高。

而在冷启动完成之后,智能对话的能力PK就转移到第二个阶段:精度的上限能到多少。

90%只是开始,100%只能无限接近。百度智能对话引擎目前已经能实现95%的精度(即机器与人对话,95%是成功理解和互动的),注意,这不是普通的指令式语音互动,这个数字已经在智能对话领域已经远远高于多数玩家。

值得一提的是,精度从冷启动到向上优化的过程,本质上是长尾的过程,在频繁、大量的对话可能性之外,不断覆盖那些出现频率不高的内容。而这一过程仍然需要人力完成数据的归纳、标注等动作(等于教会机器新鲜词汇或词组的现实意义)。

百度大脑智能对话引擎不仅在做AI的事,还帮助这种“人力”的节省。其DataKit等产品能够大幅提升样本生产和标注效率,官方称能把效率提升8倍(从16人/天到2人/天),这一定程度上解决了需要啃食数据的AI发展所自带的人力瓶颈问题。

3、应用上,拥有典型场景并继承百度开放特质

除了具体的数字,在实现场景上,百度大脑也在百度引以为傲的开放特质下,完成了多个典型场景的敷设。

目前,百度智能对话引擎已经在智能客服(中国联动、南方电网、东方航空、浦发银行、广州银行等)、消费电子(家教机、伴学机器人等)、车联网(Apollo、小度车载OS平台等,涵盖上汽通过、福特等车企)等核心应用领域进行深度应用。

这些典型场景一方面是百度大脑智能对话引擎的实力证明,另一方面也在不断外延的场景实践中,进一步提升“引擎”的多面适用性,积攒推动更多场景前进的“马力”。

在BAT甚至整个互联网的竞争格局中,百度“最开放”的优势仍将保持下去,更多对智能对话有需求的开发者、企业方将能获得平等、便捷的开放生态。

百度大脑智能对话生态这趟车,还会有更多“乘客”,这种预期下,把平台定位为“引擎”也就顺理成章。

强化“引擎”的生态推动力,百度大脑未来的三大看点

成为“引擎”不意味着结束——现实生活中的引擎往往都在追求更强的推力、更低的油耗,智能对话“引擎”也不例外。

要让“引擎”获得更强的生态推动力(也意味着百度获得更强的竞争力),百度大脑还需要在这三个层面突破升级的关卡:

1、普惠化:让高可用性智能对话实现低门槛获取

AI终将成为全社会的基础设施,智能对话的普惠化将是这个庞大基础设施体系的一部分。

而技术的普惠化,往往又与技术的深度背道而驰。

霍金能够用最后一片能动的肌肉实现打字、演讲,靠的是IBM独家提供的设备的强大技术实力。但这种技术的造价高昂,只能用于少数人身上。

智能对话比其他AI技术更复杂,决定了它的实现难度更大,所需投入的资源也更多,普惠化面临巨大的门槛压力。而高可用性的智能对话,最终目标一定是实现“图灵测试”突破,人人可享用真正智能化的对话机器人,听起来并不“便宜”。

于是,如何降低门槛就成了关键词。

百度智能对话引擎的庞大预置技能,以及快速冷启动、智能化人工标注,都是降低智能对话应用门槛的动作。在百度智能客服人工智能3.0的规划中,“限定轮次”实现“图灵测试”被写入,这说明,在“引擎”阶段就尽量实现技术的简单易行,将是普惠化的可行方式。

2、定制化:多级生态模式满足不同深度的智能对话需求

既然是生态,智能对话绕不过的问题一定有定制化与标准化的协同问题。

平台提供的产品往往以标准化内容为主,如此在商业上更易于实现规模化;而客户的需求往往带有大量的个性化内容,这样才能更好地匹配只属于自己的用户/消费者实际。

又要标准化、又要定制化,是“平台”们面临的共同难题,也是钳制生态规模的重要因素。

从这个角度看,百度大脑智能生态引擎在具体技术内容上,提供的一些工具或模块,就在尝试解决这类问题。

例如,UNIT3.0内嵌一个称为US Kit的开源中控模块,能无缝对接UNIT平台能力,在此基础上快速生产定制化对话中控,且开源架构能够不断延展、支持添加各种新能力。

用大白话说,开发者能够通过配置各种标准化技能(接入多个对话场景),快速搭建和定制符合自己业务场景的对话中控,这种对“标准化”的整合与统一,反过来又现实了属于开发者的定制化对话服务。

3、共赢化:用对话服务模式的变革推动全产业升级

为了强调“对话技术进入工业级落地的各项基础条件已具备”,百度方面用了这样一些数据:38%的企业已应用基于智能对话的系统;44%的企业计划在2年内使用智能对话;83.3%企业认为智能对话能有效降低运营成本;78.6%的企业认可智能对话能改善客户体验……

事实上,换个角度看这些数据:对话服务方式的改变,使得智能对话引擎某种程度上成为产业升级浪潮的助力,而不再仅仅是平台、企业、开发者之间的AI商业互动。

为产业中某企业服务的智能对话引擎,在事实上加速着企业(并通过企业改变产业本身)与互联网信息时代融合的速度,在这个过程中,由于客户体验的改变、信息沟通反馈的便捷,企业以及产业的闷头干活的发展方式也将被改变。

而这,正是产业升级的内容。

智能对应引擎所形成的行业生态从客服等职能切入,但沟通方式改变对许多产业的影响却是整体的。百度大脑的智能对话引擎,不仅仅在形成百度自己的AI垂直生态,也在用对话服务模式的变革推动全产业升级。

*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

【完】

曾响铃

1钛媒体、品途、人人都是产品经理等多家创投、科技网站年度十大作者;

2虎啸奖高级评委;

3作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;

4《商界》《商界评论》《销售与市场》等近十家杂志撰稿人;

5钛媒体、界面、虎嗅等近80家专栏作者;

6“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业。

7现为“今日头条问答签约作者”、多家科技智能公司传播顾问。

  • 我的微信
  • 扫一扫撩我
  • weinxin
  • 微信公众号
  • 扫一扫有惊喜
  • weinxin
avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: