主页 > 科技 > 正文

儿童语音识别比赛斩获两项冠军 网易有道AI技术获国际认可

更新时间:2021-04-23点击数:文字大小:

近日,网易有道在语音研究领域顶级峰会INTERSPEECH 2021上的儿童语音识别比赛 ETLT 2021上荣膺英语开放赛道和封闭赛道两项第一。INTERSPEECH是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会。作为年度一次的语音界盛会,全球众多语音领域以及人工智能领域的知名学者、企业以及研发人员都会前往出席会议。

据悉,此次竞赛的赛题是解决非母语儿童语音识别问题。由于儿童语音天生的差异性,包含生理差异如儿童声道长度较短、认知差异如语言习得水平较低,常出现语法逻辑错误、发音前置错误、发音不完整和语种混杂等情况,以及行为差异如儿童习惯低声私语等,导致通用语音识别模型难以适配,这就让非母语儿童语音识别系统的构建更具挑战性。另一方面则是非母语儿童语音的数据资源较为稀缺,使得常规声学建模方法在该场景下很难奏效。

图片1.png

网易有道团队凭借在多年对ASR自动语音识别Automatic Speech Recognition技术研发以及实际教育场景中积累的丰富经验,充分结合儿童语音在生理特征及语言认知方面的特殊性,获得了英语开放赛道和封闭赛道两项第一。其中,封闭赛道中的主要难题在于如何在非英语母语儿童语音数据稀缺的情况下获得优秀的识别效果;而开放赛道则聚焦于如何有效地将大量的成人语音数据迁移到儿童语音识别模型训练中。从数据中不难看出,网易有道能够面对复杂的环境下有出色表现,在众多竞争对手中脱颖而出获得大奖,无疑是对有道在ASR技术研发及应用领域的认可。

此次网易有道的获奖并不意外,在 2020年 INTERSPEECH口音英语语音识别挑战赛中,有道研究人员提交的系统在口音识别任务中就排名第二。有道的吴昊、王海魏等人,仅准备了十天时间就在口音种类识别和英语语音识别两个赛道上获得了第二名、第三名的好成绩。

有业内人士表示,相比打比赛,一项技术的工程落地是个长期过程。而网易有道的这支语音团队一直秉承着以技术落地为导向,以用户反馈为指标。

网易人工智能对语音识别技术ASR的研究开始于2014年。目前,网易有道K12教育领域上有诸多儿童语音识别方面的应用,例如有道乐读,有道精品课等。其中,有道乐读的在线教学过程中,通过ASR技术,儿童可进行语音互动答题,不必进行手动选择答案。而有道精品课在高中语文课程中,则上线了“智能背诵计划”功能,通过AI识别语音中的错漏内容,并给予完成度打分,学生可以根据自己的学习节奏进行有效练习。经过测试,有道语音识别技术在一些场景上识别准确率超过98,不止支持中文、英文,还支持日、韩、法、德等多种语言。

近年来,以翻译技术起家的有道,在AI时代攻坚神经网络翻译技术NMT,目前其NMT准确度已达到国际领先水平;作为王牌技术之一的OCR识别技术,已经能支持26种主流语言文字,是目前国内识别语言最多的OCR识别引擎。有道在AI领域除了不断更新迭代的有道词典笔等硬件产品,有道精品课、有道词典等产品上也应用了语音识别、口语打分、AI作文批改等智能技术。只有有符合市场需求的技术才能在一代代产品的稳定推出中,扎实生根。


关于我们 | 联系我们 | 招聘信息 | 版权申明 | 广告服务 | 联系我们 |

免责声明:本站为非营利性网站,部分图片或文章来源于互联网如果无意中对您的权益构成了侵犯,我们深表歉意,请您联系,我们立即删除。