人民日报社中国经济周刊官方网站  中央新闻网站  互联网新闻信息稿源单位

经济网 中国经济论坛

首页 > 公司 > 正文

科大讯飞九度问鼎国际语音合成大赛冠军

文章导读: 7月29日,在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,以科大讯飞和语音及语言信息处理国家工程实验室联合报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。

科大讯飞九度问鼎国际语音合成大赛冠军

经济网讯(记者 孙冰) 7月29日,在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,以科大讯飞和语音及语言信息处理国家工程实验室联合报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。这已是科大讯飞自2006年起第九次蝉联该项赛事桂冠,持续巩固了讯飞智能语音技术的全球领先地位。

作为国际上规模最大、最具影响力的语音合成大赛,历届Blizzard Challenge吸引了国际一流的科研单位和一流企业参加。参赛单位包括CMU (美国卡耐基-梅隆大学)、Edinburgh University(英国爱丁堡大学)、Nitech (日本名古屋工业大学)、ATR(国际电气通信基础技术研究所)、IBM 研究院、微软亚洲研究院等语音技术领域的世界知名研究机构。

与往届相比,本次大赛首次将主要测试语种由英语转换到了非英语语种,要求提交的合成系统包括印地语、阿萨姆语等六种印度语种,并增加了这些语种与英文混读情况下的合成测试,进一步提高了参赛系统的构建难度。在最终评测过程中,组织方选择了5个语种基于统一测试平台进行主观测听,每个语种的测试指标包括相似度、自然度、可懂度、英文混读相似度和英文混读可懂度共5项指标。

科大讯飞和语音及语言信息处理国家工程实验室的研究团队克服了时间紧、语种多、小语种资源受限等困难,充分发挥公司在多语种语言处理以及语音合成核心技术上的优势,采用基于统计声学模型的单元挑选与参数合成技术方案,并研发了基于深度神经网络的语音合成新方法,在不到两个月的时间内完成了所有语种高质量语音合成系统的构建。最终提交的参赛系统获得了印地语合成语音相似度与可懂度、印地语英语混读合成语音相似度与自然度等共计11个指标的第一名。

作者
  • 微笑
  • 流汗
  • 难过
  • 羡慕
  • 愤怒
  • 流泪
责任编辑:林灵
0