人民日报中国经济周刊官方网站国家一类新闻网站

经济网 中国经济论坛

首页 > 经济 > IT > 正文

乌镇大咖秀| 搜狗CEO王小川首秀机器同传黑科技

文章导读: “技术的进步不会停止,而我们要做的是,敞开怀抱,更好地接纳技术,让其为我们所用。”

中国经济周刊-经济网讯 (记者 刘照普) 12月4日,在第四届世界互联网大会“大连接时代:创新智能变革”分论坛上,搜狗CEO王小川发表了主题为《人工智能带来的大连接时代》的演讲。此外,搜狗“基于语音合成的机器同传”也在该次论坛上首次亮相,如果说搜狗机器同传还只是在抢同传的饭碗,搜狗最新的“基于语音合成的机器同传技术”就已经把速记、同传,甚至配音演员的工作都做了。基于搜狗的语音识别、机器翻译以及风格迁移技术,机器同传不仅能实现语音到文字的中英实时同步翻译,还可以根据说话人的声音进行数据训练,然后将其音色附加到翻译内容中,并输出与说话人原语音音色相同的译文语音,达到真正“音意同步”的同传效果。

搜狗CEO王小川在第四届世界互联网大会分论坛上发表演讲

搜狗CEO王小川在第四届世界互联网大会分论坛上发表演讲

基于此项技术,王小川与在场的嘉宾讨论了人工智能与大连接时代的关系。他认为,人工智能技术的应用,将解决互联网时代连接的瓶颈,从“解决信息的流动和不对称”走向“帮助用户进行判断决策”,最终带来大连接时代。

传统的连接,是指连接人和人、人和信息、人和交易,包括现在的连接服务和连接设备。但是在大连接时代,下一步连接会向什么方向发展?在演讲中,王小川表示,连接的下一步发展,开始需要人工智能技术的接入。“人工智能解决的问题主要有三类,识别、生成、决策。这三个模式将重新赋能大连接时代。”

人工智能正以超乎我们想象的速度发展:一年前的世界互联网大会上,搜狗首次展示了机器同传技术。随着其在CCF-GAIR、香港RISE峰会等会议中的落地应用,这项技术逐渐走向成熟。而一年后,重登乌镇舞台的“升级版”,在语音合成的加持下,正为同传界拓展一个全新领域。

王小川提到与语言相关的人工智能技术在其中起到了重要作用,而搜狗的人工智能技术就是以语言为核心的。“从狭义的人工智能,到广义的人工智能,语言是中间的交界点。因为语言既可以做简单处理,同时也是通用人工智能时代推理和知识的载体。语言可以承载我们的感知,将听觉、视觉获取的信息转化为文字”,比如在展会上,搜狗展示的唇语识别技术:不用听声音,只需要看说话人唇部的动作,就能识别其说话内容。“此外,文字本身也能建立问答、对话和翻译的能力,通过这种能力,能给大连接时代提供更好的机会。”

“今天,大部分人还是基于中文交流,如果要与西方人交流,这时就需要翻译系统”。王小川以落地在输入法中的翻译技术为例,解释了人工智能如何解决人与人之间的连接问题:借助搜狗输入法中的即时翻译功能,在对话中,无需切换到翻译软件,只要点击左下角的“翻译”按钮,便可以实现中英文的转换,甚至可以直接用中文与说英文的朋友沟通。

12月4日,搜狗CEO王小川在发表演讲时身后屏幕上同步呈现中英文双语字幕,英文译文也以与王小川相同音色的语音放出

12月4日,搜狗CEO王小川在发表演讲时身后屏幕上同步呈现中英文双语字幕,英文译文也以与王小川相同音色的语音放出

当谈到人与信息的连接时,王小川指出搜索在其中承担了重要的作用。而机器翻译技术和问答在搜索里的应用,能使得人们连接到更加全面、有用的信息。一方面,通过英文搜索,不擅长英文的人也能搜索和阅读全世界的医疗,科技,人文信息。相对于传统搜索,中国人获取信息的能力大幅提升;另一方面,借助问答能力,我们在搜索问题时,将能获取直接的答案,而非一堆链接。

王小川告诉《中国经济周刊》记者,“技术的进步不会停止,而我们要做的是,敞开怀抱,更好地接纳技术,让其为我们所用。人工智能技术的应用,将解决互联网时代连接的瓶颈,从‘解决信息的流动和不对称’走向‘帮助用户进行判断决策’,为人类的发展提供更多机会。”


中国经济周刊-经济网版权作品,转载时须获得授权并注明来源,违者将被追究法律责任。

(网络编辑:崔晓萌)
  • 微笑
  • 流汗
  • 难过
  • 羡慕
  • 愤怒
  • 流泪
0