同盾科技智能语音亮相世界互联网大会 AI技术让你“闻声识人”

11月7日至9日,第五届世界互联网大会·乌镇峰会拉开帷幕。作为国内外创新创业成果集中亮相的平台,每年大会上呈现的“黑科技”都成为社会各界关注的焦点。本届互联网之光博览会主要围绕人工智能、5G、大数据、网络安全等领域,带来了众多智能新体验。

用AI解析声音里的秘密

“我的声音居然和延禧攻略里的魏璎珞有83%相似,柔和度和穿透力高、浑厚度低…是挺准的…”在同盾科技的展台内,许多观众被其声纹实验室的一个测试小游戏《你的声纹最像哪个影视名角》牢牢吸引,通过一句3-5秒的语音录制,就能解析出说话者的声纹与哪位影视明星匹配度最高,此外还可以分析说话者声音的柔和度、细腻度、亲和力、穿透力、浑厚度。

工作人员告诉记者,所谓声纹就是携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官——舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。

该测试的原理是通过说话人特征提取,利用声纹识别模型与声纹库中的所有影视角色进行相似度计算,去发掘声学特征中的说话人信息差异,从而提取出声学特征中的说话人信息。同盾科技创始人、CEO蒋韬表示:“声纹识别已经逐渐成为身份认证的重要技术之一,我们希望通过这样一种游戏互动的方式,让大家更直观地了解声纹技术。”

声纹技术成安全应用新黑马

近年来, 伴随着各种线上业务的推进,身份验证这一关键问题也变得日益突出。传统的密码已经很难抵御住黑客的攻击,而且众多复杂的密码也难于记忆。此时,利用“生物特征”来进行验证就成了很好的解决方案,由于每个人的指纹、面部、瞳孔、声音等特征都不相同,所以这种“活体密码”的安全性也无疑会高出许多。在与其他生物特征的比较之中,声纹又具有无可比拟的优势。

首先,语言是人类沟通最自然的工具,且具有指令性。语音作为最天然入口,在万物互联的时代无疑是爆点之一。同时,相较于其他生物识别技术,声音语料收集的方式也更为自然,平时自然交谈的内容都可以作为数据录入。

第二,具备内容变化特点。在身份识别过程中,语音具有内容变化,可以随机改变朗读内容,所以即便在网上或其他地方留下的声音信息,也难以被复制和盗用。

第三,使用成本低。人脸识别需要摄像头,而声纹识别只需要麦克风,这两者相比,后者的造价和安装成本都更低。且物联网正在蓬勃发展,对于没有屏幕和键盘或是屏幕非常小的硬件,语音是最直接的交互方式。

同盾智能语音战略布局

智能语音技术大体包括了自然语言理解和自然语言生成两个部分,其中所涉及的包括语音识别、语义识别、自然语音处理、声纹识别等技术分支在人工智能领域占有很高的地位。目前在智能客服、智能翻译、信息安全、身份认证、智能催收以及智能安防等领域均有广阔的应用空间。

作为国内智能风控和分析决策服务提供商,同盾科技也已开启了智能语音的战略布局。

在金融领域,同盾创新性地研发了逾期管家和逾期精灵两款产品,通过智能语音识别、语音合成、语义理解以及交互话术共同形成高度智能化、精准化的催收策略,解决金融机构催收业务的合规、合法、效率等问题。产品一投入市场便受到了极大的关注,很多金融机构、互联网平台客户均进行了深度体验,催收效率有明显提升,并极大降低了成本和人为因素造成的风险。

此外,同盾相继与浙江大学、西北工业大学达成合作,组建了人工智能实验室及智能语音技术联合实验室,希望搭建一个智能语音领域高端人才的培养阵地和科技成果转化基地,共同探索语音技术的应用空间。

据悉,同盾科技将在互联网大会期间同步发布全新智能语音服务平台,该平台将专注于金融保险证券等全连接的智能人机交互服务,通过智能语音服务解决业务过程中重复性的劳动,帮助生态伙伴提高智能化、信息化、数字化综合能力。

THE END
分享
二维码

< <上一篇
下一篇>>