当前位置:首页>电商巨头 > >正文

SOGOU同声传译3.0在线,AI第一次同声传译,能听、看、想。

时间:2020-11-22 20:04:26


12月21日,第一个具有多模认知能力的同声传译系统在极客公园创新会议上被使用。在索沟最初的语境引擎的基础上,索沟同声传译3.0以多模和自主学习为核心,增加了视觉和思维能力,使机器同声传译不仅能听,而且第一次也有看到、理解和推理的能力,从而将艾同声翻译带入了多模态认知时代。

人工智能的同声传译一直是人工智能技术的重点。2016年,在第三届乌镇互联网大会上,搜狗发布了行业首个商用人工智能同声传译产品--搜狗同声传译1.0。在建立这一新的范畴时,人工智能技术被用来帮助同声传译产业,有效地促进跨语言的交流和表达。2018年发布的Sogou同声传译2.0为用户提供了更个性化的定制功能,并且可以根据用户的实时定制进行识别和翻译。苏沟两代人同声传译的核心能力在于听。他们两人都采用了索沟领先的语音识别和机器翻译技术,实时地将声音转换成相应的中英文字幕。

然而,通过数千台机器同声传译的实际应用,索沟发现,业界主流的语音同声传译系统已不能满足各种稳定、高质量的演讲场合的需要,而且在演讲内容中专业词汇的识别和翻译效果不佳,这在很大程度上影响了机器同声传译的实际效果。

为了解决上述问题,索沟在人工智能同声传译领域开创了语境引擎,使索沟能够在倾听的基础上解锁能看见和理解与理性的两种新技能,不仅能观察演讲者报告的内容,还能通过理解和思考进行高质量的识别和翻译,再次引领了业界的技术进步。

可以看到是指同声传译第一次具有视觉能力,基于索沟OCR(光学字符识别)技术,SOGOU同声传译可以实时、准确地观察说话人的ppt内容,将ppt的图像内容转换成语言,充分获取当前语音的个性化信息。

能够理解和推理意味着同声传译有能力感同身受。这是由于Sogou的上下文引擎的应用。该技术的原理是以索沟的知识图和百科全书的知识推理能力为基础,通过OCR技术自动生成语音内容的核心知识,并通过索沟的主导知识图--索沟知识立方体实时推理获得完整的背景知识。同时,以索沟百科全书中英术语数据库为基础,进行中英双语对比,实时优化同声传译的识别和翻译效果。

SOGOU同声传译3.0基于索古语境引擎,为说话人构建了一个个性化的认知语境,能够与说话人进行思考。这无疑是人工智能同声传译领域的又一次技术创新。特别是经过多次感觉呼叫后,索沟同声传译不仅可以实现更快、更准确的翻译,而且更自然、更专业、更智能。结果表明,在听、看、思三位一体的条件下,索沟多模态同声传译系统对ppt内容的识别准确率和翻译准确率分别提高了21.7%和40.3%。今后,该系统将应用于会议演讲、视频翻译、实时字幕等场景,为人们提供准确、流畅的同声传译服务。

索沟同声传译一直是人工智能同声传译领域的佼佼者。因此,每一项技术创新和产品变革,都在行业中起着重要的领导作用。

三年前,索沟首次发布商业人工智能同声传译,借助索沟领先的语音识别和机器翻译技术,可以更准确、更快地将声音实时转换成相应的中英文字幕,与手工同声传译形成互补,彻底改变了各种行业会议只能依靠人工同声传译、低容错性的问题,同时也将同声传译行业带入了人工智能时代。

这一次,索沟同声传译3.0,利用索沟原有的语境引擎,除了听和边看边想的同时,使识别精度和翻译精度有了很大提高,人工智能同声传译行业也迎来了多模认知的新时代。

下一条: 最后一页
热点专题
热点专题
关于我们 - 资讯中心 - 网站团队 - 人才招聘 - 广告业务 - 网站地图 - 在线投稿 - 合作伙伴 - 客户投诉 - 数字报订阅

 
QQ:2820-8476-56 
地址: