阿里巴巴的语音识别算法可以隔离嘈杂人群中的声音

中国企业集团阿里巴巴是全球最大的电子商务公司之一,但越来越多的人将注意力转向人工智能(AI)。2017年3月,它成立了医疗保健和制造业的人工智能服务部门。9月,其公共云部门 - 阿里巴巴云 - 公布计划建立一个专门的子公司,并生产可用于物流的自行开发的AI推理芯片。和自动驾驶。

不用说,阿里巴巴手指上有很多AI馅饼。今天早上在蒙特利尔举行的NeurIPS 2018会议上,它发布了跨公司工作的最新消息。

阿里巴巴数据科学研究所院长荣金说:“我们正在解决......看似困难的情景。” “人工智能与创新[正在帮助]解决一些有趣的挑战。”

其中一个挑战是在嘈杂的环境中进行语音识别,例如拥挤的地铁系统或拥挤的会议中心。阿里巴巴的解决方案是部分硬件,部分软件:远场麦克风阵列和复杂的深度学习算法,可以隔离人群中的声音,大大降低错误率。

与单独使用麦克风阵列的“最佳”语音识别技术相比,84%的准确度相比,阿里巴巴声称其模型的准确度在94%到95%之间,即使使用重度重音的扬声器也是如此。它已经被部署为上海的基于语音的地铁票务系统的一部分,阿里巴巴正在谈判将其带到“一些[其他]城市”。

“如果你没有得到足够的信号,那么没有什么可以拯救你,”金说。

口语不是阿里巴巴正在处理人工智能的唯一领域。使用自然语言处理,它在云中实时自动翻译,以便阿里巴巴在俄罗斯和马来等国家的零售客户可以用他们的母语与人类代理交谈。它采用算法来支持其支持中心每天通过阿里巴巴的智能客户服务引擎Alime接收的数万个呼叫的一部分。

Alime与Google的Duplex很像,可以进行电话交谈并回答基本问题而不涉及人类。也许更令人印象深刻的是,在聊天机器人环境中,它能够从提供的文档中自动提取文本和图像,并且具有“比人类更好”的性能。

在一个舞台上的演示中,一位客户向阿里巴巴的回答机器人戴小米询问了特定蓝牙音箱的促销活动,比如他们购买时会收到什么样的免费礼品,以及如何将礼品送到他们的住所。(今年晚些时候推出的未来版本将为优先案例添加情绪分析和自动警报。)另一个演示展示了聊天机器人的一个人形化身 - 一个原型,Jin告诉观众 - 协调的眼睛,嘴唇和头部动作。

这对拥挤的阿里巴巴部门如阿里巴巴(拥有超过1.5亿用户和数百万商户)以及菜鸟(其人工和机器人每年履行超过10亿份订单)有利。在光棍节这一天 - 11月11日的中国购物假期,今年产生了308亿美元 - 阿里巴巴的代理商在24小时内收到的电话数量是其五倍,如果没有人工智能的帮助,这几乎是不可能的。

阿里巴巴表示,Dian Xiaomi目前每天为近350万用户提供服务。

但自然语言处理只是阿里巴巴人工智能冰山的一小部分。在零售商的二手商品市场西安,该公司部署了一个价格谈判机器人,与买家谈判以确定价格。

机器人的发展不是一个小步骤 - 它需要学习谈判策略和有效的方法来产生激励来回谈判的文本 - 但最终结果令人印象深刻。当在同一平台上向1000万用户发布时,机器人的交易机会比典型的人高出20%。

“大多数[用户]都不是专业卖家,”金说。“他们不知道如何设定价格或与买家交谈。”

在库存管理和图像搜索领域,阿里巴巴正在利用可扩展的计算机视觉架构来筛选数亿个实体。它的云图搜索算法可以识别对象并查找包含相似或相同图像的图像,其中一个商店管理应用程序 - 在货架上挑选多个项目以生成包含不同品牌分布的摘要 - 可以检测到超过100,000个具有“高精度”的SKU(阿里巴巴致力于实现1000万SKU的目标。)

两者都赞扬阿里巴巴的阿里智能供应链(ASSC),这是一套人工智能工具,可帮助阿里巴巴商家预测产品需求,分配库存和选择定价策略。

阿里巴巴的机器视觉工作延伸到卫星图像。使用从中国最大的地图和导航提供商AutoNavi收集的数据,其拥有超过7000万用户,其系统能够识别最近建造的新建筑物,并收集与道路工程和兴趣点相关的信息。

阿里巴巴也在使用计算机视觉来防止入店行窃。在其超过66家Hema实体店,其自助结账亭的离线算法可以防止新井客户仅扫描第一件物品和一篮子但不扫描其余物品,或者隐藏物品来自头顶相机的视图。

“目标是......让计算机视觉系统弄清楚客户是否有意或无意地扫描物品,”Jin说。“机器发现事情没有被扫描。”

它采用深度学习算法--AliFPGA-X100 - 运行在现场可编程门阵列上,是信息亭内的可重新配置集成电路。阿里巴巴表示,与基于GPU的同类系统相比,它能够以高达170倍的速度处理图像。

阿里巴巴也正在将AI应用于其视频托管服务优酷。机器学习算法自动为其每天数千万活跃用户上传的大约200,000个视频生成缩略图,并使用所述缩略图定位某些细分受众群。(例如,女性用户可能会看到给定视频的预览图像与男性用户不同。)他们的点击率提高了15%,停留时间提高了12%。

今天的调查是在阿里巴巴的新研究组织 - 发现,动力和展望(或DAMO)学院 - 首次亮相后一年,旨在解决机器学习和网络安全等新兴技术,以及在圣马特奥开设实验室,加州; 华盛顿州西雅图; 俄罗斯莫斯科; 以色列特拉维夫; 和新加坡。紧随其后的是阿里巴巴的天猫精灵(Tmall Genie)的推出,这是一款人工智能语音助手,自2017年7月上架以来销量已超过500万台。

它在2017年10月告诉Quartz,阿里巴巴计划到2020年在研发上花费超过150亿美元。

THE END
分享
二维码

< <上一篇

下一篇>>