能听会说更懂人 “AI助手”助力行业升级换代

来源：人工智能日报 2020-09-18 03:39:59 栏目：机器人 326 次编辑

数字化时代风口常立，身处潮起浪涌的技术圈，越能从前沿动态中感受行业动态与趋势。在这个融合物理与虚拟的全新时代，由AI驱动的AI助手如同互联网时代的PC，移动互联网时代的智能手机，成为我们进入智能时代的超级入口。

在主题为”未来经济，数字优先”的2020腾讯全球数字生态大会上，AI行业内的专业人士集中讨论了AI助手演进的最新成果。作为智联网时代人机交互入口，AI助手在AI赋能下带来行业解决方案，以AI语音交互能力为核心，结合知识图谱、IP虚拟形象、全双工等优势能力的打造，对传统对话机器人做全方位升级，让AI助手也能具备社会人的属性。

简单来说，就是AI助手能够满足更多个性化、场景化、情感化的需求，在“工作岗位”上帮助企业提升效率、节约成本、增强效果，而这一切，离不开AI语音助手从技术层面为AI助手“大开脑洞”。

结合腾讯智能平台副总裁李学朝在论坛上以“腾讯云小微，打造数字员工助力行业升级”为主题的演讲，让我们走进AI技术赋能下AI助手的技术和应用升级。

全双工交互实现AI助手自然对话，打造情感化的语音交互

从技术层面来看，实现AI助手的对话交互难度并不大，面对一般指令如“今天的天气怎么样”，或者是执行一些简单的任务，如播放音乐等，每一次问答都属于语音交互的范畴。

但是如何让交互变交流，打造自然流畅的对话体验，更符合真实业务场景的需求，就需要在技术端通过技术创新赋予AI助手有情感的灵魂。

为此，腾讯云小微AI语音助手提供了解决方案，以全领域、全双工实现全业务场景覆盖，以ASR+NLP双向拒识判断极大降低错误响应概率(误识率 < 0.01 且拒识率 < 0.1)，以流式语义+语义VAD在低延迟下真正做到边听边思考，共同组成AI助手自然对话的基础。

其中全双工交互可以做到一次唤醒实现多轮连续自由对话，并且可以随时打断，AI助手也可以准确拾取相关指令并作出正确反馈。相较于“单工”和“半双工”技术，可以做到双向实时交流。单一场景下的全双工交互技术比较好理解，例如播放音乐时可以连续指令“现在播放的这首歌是什么名字”、“帮我收藏这首歌“等等。

而在全领域人机交互中，人们的对话可能穿插着很多议题，不受场景的限制实现自然交互。面对任务型+问答型+闲聊的全业务场景，如在车载环境中，腾讯云小微车载语音助手能够根据车内收音的音区判别发出指令的用户，同时结合背景噪音的识别、多人聊天背景音等环境音的识别分析，拾取用户跟车机对话的指令，回答用户所需。

与此同时，腾讯云小微AI语音助手实现的AI助手还整合了语音交互、自然语言理解、声纹识别、图像识别等AI能力，面向不同场景复杂噪声针对性提升技术能力，不断提高复杂噪声环境下唤醒率、语音识别准确率及意图理解准确率，为用户提供自然、丰富的交互服务。其中以ASR+NLP双向拒识判断为技术特点，极大降低错误响应概率，误识率< 0.01且拒识率< 0.1。

另外在自然交流中从听懂到准确表达，还需要AI助手在流式语义处理方式取得突破，腾讯云小微AI语音助手能够以200毫秒为单位上传语音，让云端大脑能够做到边听边想，同时结合场景和上下文预测用户语义，提前思考怎么回复，在低延时特性下从加快响应的速度。

知识图谱提升AI助手生产力，成为AI语音助手进步的阶梯

在大会中，李学朝对AI助手的专业抛出了这样的观点，“人工智能不是人工智障，云小微的知识图谱能力作为机器人的大脑，将专业知识网状串联起来，不仅直线思考，还能推理、判断，提供更加专业的业务服务。”

其实对于AI领域来说，知识图谱的重要性在现在、未来都不言而喻。知识图谱对于人工智能的重要价值在于，知识是人工智能的基石。机器可以模仿人类的视觉、听觉等感知能力，但这种感知能力不是人类的专属，动物也具备感知能力，甚至某些感知能力比人类更强，比如狗的嗅觉。

如何让AI助手具备认知能力，从而有效提升生产力?腾讯云小微的做法值得思考，在程序设计上详细展示了AI助手的“成长”经历。

一是通过知识抽取，构建行业知识图谱。为了让AI助手更深刻的理解行业知识，云小微知识图谱平台支持从行业数据中抽取出行业知识，助力行业伙伴构建行业专属的知识图谱。如在旅游行业，AI导游福大人身为内阁大学士，不仅能跟游客闲聊互动，还能为游客推荐个性化的游览路线，讲解景点文物，畅聊历史趣闻轶事。在大数据的支持下，源源不断的旅游行业知识图谱和资源数据涌入AI导游福大人的通用知识库，让AI助手在行业服务中发挥显著作用。

二是通过知识融合，打破行业知识孤岛。为了打破各行业间的知识孤岛，云小微以自有的海量通用知识为中心，通过实体链接、属性融合等多种知识融合技术，连接各行业的知识图谱。如在AI助手的客服应用落地中，腾讯云小微AI语音助手重视知识图谱的作用，将文本模式分类拆分为知识库检索、服务售前、服务售后等模式，检索为功能性检索，售前、售后可根据问题回答策略转向人工模式。其中分层模块的搭建上注重知识库的基础搭建，使得模块分工明确，流程简单。

三是通过知识关联，整合行业资源数据。通过知识关联将多源异构的行业资源链接到知识图谱中，形成知识大脑，赋予数字员工更丰富的能力。这一点AI助手利用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系，把行业知识、资源数据与通用图谱进行关联，形成知识大脑，让AI助手成为具备问答、可视化、数据治理、主动服务等能力的知识图谱平台。

因此在不同领域，AI技术将碎片化、多模态的数据经过抽取、融合、关联后形成知识图谱，高效利用原始数据，进而支撑数据推理、模型应用分析，真正实现专业能力的提升。

虚拟形象赋予AI助手个性化特征，让人机交互体验耳目一新

随着人工智能水平的不断进步，AI早已不再是冷冰冰的科技，而是演变成为能帮助人类享受智慧生活、守护情感世界的好帮手。其中AI助手所实现的数字员工如虚拟导游、虚拟客服、虚拟老师，以丰富的 IP 形象库+细腻的情感呈现让AI助手带来的人机交互体验更为形象生动。

比如在AI助手形象塑造上，通过腾讯云小微AI语音助手提供的虚拟形象服务，腾讯云小微AI语音助手提供了包括从语音的识别到形象输出的全链条完整方案。客户可以根据实际使用场景的需要，来选择不同的方案落地。如果对形象有要求，腾讯云小微支持为企业打造专属的2D3D形象;腾讯云小微还与腾讯海量的IP资源进行授权合作，企业可以结合热门IP，打造更加有特色的数字化服务，引发更多的关注及话题。

如在虚拟客服的应用中，AI助手通过AI自动预测表情、实时处理唇形，语音合成技术，使得效果逼真足以媲美真人;提供50+种不同男女声音色，个性化音色定制能力，王者荣耀妲己、李白定制语音包;采用业内领先的算法，优化不同场景中的语音音色，以及语音识别、语义理解等智能交互技术，让AI语音助手发声更为自然。

如果对情感呈现有要求，通过AI助手细腻的情感化呈现技术方案，虚拟人的情绪可以表现在跟用户互动过程中的肢体动作、面部表情以及声音情绪等上面，让虚拟人的表现更加情感化。

如在本次大会上亮相的《镜·双城》中的女主那笙，从动漫世界走进论坛现场，化身为能说会道，还能思考，推理判断，业务能力超强的AI助手，通过表情、动作一边说话一边表达情绪，让机器人的服务不再冷冰冰，而是更加立体、有温度。

拥抱数字化未来，专业、自然、形象的AI助手拥有怎样的“未来密码”？

从前沿科技到行业落地有多远?在数字化浪潮中，一个专业、自然、形象的AI助手无疑会成为行业升级的可靠助力，随着5G高带宽与实时运算的不断增强，AI助手的应用场景还将进一步得到激活。

正如李学朝对未来的展望所言，“腾讯云小微会持续发力优势赛道，结合场景打造产品化能力，在出行、政务、文旅、教育等行业，通过我们技术-产品-场景化方案，优化企业成本结构，挖掘产业新价值，打造产业新动能。”

利用越来越自然的人机交互方式，AI助手结合IP虚拟形象和语音交互，成为文旅、在线教育、客服等领域的常客，丰富生动的形象还可以在深度开发中实现性格的定制，提升服务价值。

作为全面链接智能的新生态，AI助手利用自身强大的AI能力帮助行业为用户提供从需求到服务被满足的智慧链接。如在虚拟客服的应用中，AI助手更加智能，更懂用户需求，即时、流畅的应答，极大的提升了用户的使用体验。同时还能通过算法的优化为出行生活增添便利，帮助用户在细微琐事上完成决策，用“信息便利”减少“身体能量消耗”，让精力用到更值得的地方。

未来，AI助手还将持续为产业互联提供新动能，不断助力企业提升服务水平，为消费者带来更好的使用体验。

THE END

二维码

智能建造观摩会|好运达智能工厂：创新研发智能技术，助推基建产业升级

< <上一篇

洗衣护衣推陈出“新”，智享之选助力第十一届衣物洗涤及护理家电行业年会

下一篇>>

搜索内容

能听会说更懂人 “AI助手”助力行业升级换代

热门文章

热门话题

最新文章

​能听会说更懂人 “AI助手”助力行业升级换代

热门文章

热门话题

最新文章

能听会说更懂人 “AI助手”助力行业升级换代