欢迎来体验
什么是最懂你的中文语音识别算法
华少的快,矮大紧的京范儿口音,神仙打架的《奇葩说》,这些复杂场景的语音识别有多难?今天依图带你领略新鲜出炉的语音识别算法实力。
今天开始,依(zei)图(hao)语音开放平台上线了!
业内首次
系统测试主流语音识别厂商的技术性能
(测试完成于2018年11月底)
在全球最大中文普通话数据库AISHELL-2的三个测试子集、Accent近场口音测试集、Chat近场安静聊天测试集上,依图语音识别算法最近测得多项第一。AISHELL-2数据规模达1000小时,是目前全球最大的中文开源数据库。在AISHELL2-2018A-EVAL数据集中,依图语音识别准确率达到96.29%,字错率(CER)为3.71%,领先第二名约17%。
无论是语音助手还是节目,电话客服或是闲聊,依图更懂你。
依图语音识别性能优于第二名约17%
语音未来任重道远
通过手机近距离收集声音,依图优于第二名约17%,字字再现强时效内容
语速超快又有地方口音?依图和讯飞挺下来了
考验系统是不是够“皮实”、够“稳健”的时候到了!在远距离场景,环境中会存在噪声、混响和反射,依图和讯飞听见优势明显
从技术性能来说,字错率曲线抖动越小,算法的场景通用性越好。综合各场景测试的结果,业界主流算法中,依图和讯飞的算法字错率抖动相对较小。
但是同样说明了语音识别的发展既有惊喜也有遗憾。各大厂商的近场场景识别能力让我们感受到了科技的力量,而加入远场演讲的高难度场景的识别能力不足,也表明了未来的路还很远。
花式挑战算法性能
依图表现稳定
听写大会小程序一经发布,各种评(tiao)测(xi)汹涌而来。依图语音凭借自身优秀的技术,展现了极其稳定的语音识别能力。
再热血的足球解说我们hold住
绕口令?依图能听清!
语音识别歌词,依图可带劲啦!
吕昊博士现场演示的这款“听写大会”小程序也是业界第一次基于公开 API 将市场上的主流语音识别技术性能做比较——欢迎大家去花式调戏!
此次测试的安静对话和混响的数据集,依图也将在线公布,敬请期待!
您可以复制这个链接分享给其他人://dribblessportsbar.com/node/539