新闻中心

搜狗同传3.0上线，AI同传首次实现“能听会看会思考”|狗万app官方网站

发布日期：2024-11-23 05:10浏览次数：

本文摘要：12月21日，首个不具备多模态理解能力的同传系统——搜狗同传3.0在极客公园创意大会上用于。

12月21日，首个不具备多模态理解能力的同传系统——搜狗同传3.0在极客公园创意大会上用于。基于搜狗独有的“语境引擎”，搜狗同传3.0以“多模态”和“自律自学“为核心，重新加入视觉和思维能力，让机器同传不仅不会听得，还首次不具备了会看、能解读不会推理小说的能力，引导AI同传转入了多模态理解时代。搜狗同传技术再行升级，关卡两项“超能力”AI同传仍然是人工智能技术的重点领域。

2016年，搜狗在“第三届乌镇互联网大会”上公布行业第一个商用AI同传产品——搜狗同传1.0，在打造出了这一全新品类的同时，用AI技术助力齐声口译行业，有效地推展了横跨语言的交流和传达。2018年公布的搜狗同传2.0，为用户获取了更加非常丰富的个性化自定义能力，需要基于用户动态自定义辨识和翻译成。两代搜狗同传的核心能力都在于“听得”，都是利用搜狗领先的语音辨识和机器翻译等技术，将声音动态切换为适当的中英文字幕。

但通过数千场机器同传的实际应用于，搜狗找到，业内主流的语音同传系统无法平稳并且高质量的符合多样化的演说场合市场需求，不存在演说内容中专业词汇的辨识和翻译成效果不佳的情况，这在相当大程度上影响了机器同传的简单效果。为了解决问题上述问题，搜狗在AI同传领域首创“语境引擎”，使得搜狗同传在“能听得”的基础上，又关卡了“不会看”和“能解读不会推理小说”两项新技能，不仅需要通过“观赏”自律自学演讲者的报告内容，更加需要通过“解读”和“思维”，作出高质量的辨识和翻译成，这再度引导了行业的技术变革。AI同传技术新的突破，与演讲者一起“边看边思维”“不会看”，意味著同传首次不具备了视觉能力。基于搜狗OCR（光学字符识别）技术，搜狗同传可以动态精确“观赏”演讲者的PPT内容，将PPT的图像内容转化成为语言文字，充份提供到当前演说的个性化信息。

“能解读不会推理小说”，则意味著同传不具备了与人“共情”的能力。这得益于搜狗语境引擎的应用于。该技术的原理是基于搜狗科学知识图谱和百科的科学知识推理小说能力，将通过OCR技术提供的演说内容自动分解核心科学知识，并通过搜狗领先的科学知识图谱-搜狗闻立方动态推理小说扩展，提供充份的背景科学知识，同时基于搜狗百科的中英术语库获得中英双语对照，动态优化同传辨识和翻译成的效果。

基于搜狗语境引擎研发的搜狗同传3.0 为演讲者建构了个性化的理解语境，需要追随演讲者一起“思维”，毫无疑问是AI同传领域的又众多技术创新。尤其是经过多重“感官”的调用，搜狗同传不仅可以做翻译成更为较慢和精确，而且不会更为大自然，更为专业，更为智能。数据表明，在“听得”“看”“思维”三位一体的起到下，搜狗多模态同传系统针对PPT内容的辨识准确率提高21.7%，翻译成正确率提高40.3％。

未来，这一系统将不会在大会演说、视频翻译成、动态直播字幕等场景获得应用于，为人们带给精确简洁的齐声口译服务。搜狗再度引导AI同传转入新时代搜狗同传仍然代表着AI同传领域顶级的水平。

所以，每一次技术创新和产品更替，都对行业有明显的引导起到。三年前，搜狗首次公布商业化AI同传，借助搜狗领先的语音辨识和机器翻译等技术，需要更为精确较慢的将声音动态切换为适当的中英文字幕，与人工同传构成有序，彻底改变了各种行业大会不能依赖人工同传，容错亲率较低的问题，打造出全新品类的同时，也引导同传行业转入了AI时代。而这次上线的搜狗同传3.0，运用搜狗独有的语境引擎，除了“能听得”还能同时做“边看边思维”，使得辨识准确率和翻译成正确率皆取得大幅度提高，AI同传行业由此也步入了全新的“多模态理解”时代。

版权文章，予以许可禁令刊登。下文闻刊登须知。

本文关键词：狗万·ManBetX,狗万官网唯一,狗万ManBetX官网登录入口,狗万ManBetX下载,狗万app官方网站

本文来源：狗万·ManBetX-www.mr-fan.cn