人类有超过7000种语言,其中包括使用人数不多、相关资料稀少的“小众语言”。美国“元”公司新研发的一个人工智能模型,能翻译200种不同语言,实现了对较多“小众语言”在线翻译。
人工智能翻译目前多利用基于人工神经网络的模型翻译各种语言。这些模型通常需要大量可在线获取的训练数据。不过,有些特定语言的数据尚不能公开和低成本获取或普遍可及,这类语言又被称为“低资源语言”。
“元”公司团队新研发的一种跨语言技术,能让基于人工神经网络的翻译模型学习如何利用已有的翻译高资源语言的能力来翻译低资源语言。团队应用该技术开发了一个名为NLLB-200的在线多语言翻译工具,可容纳200种语言,其能翻译的低资源语言的数量是高资源语言数量的3倍。这一研究成果近期发表在英国《自然》杂志上。
由于研究团队在许多低资源语言上只能获取1000至2000例样本,为扩大NLLB-200的训练数据量,他们利用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘这些语言与英语的双语文本数据,帮助提升模型的翻译质量。
研究者称,该翻译工具可帮助低资源语言使用者使用互联网等技术,且这一模型还可用于教育,帮助这类人群获取更多图书和论文资料。不过研究者也表示,这一工具的误译情况仍有可能出现。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
上一篇:海底自动埋设管缆机器人自主研制成功...
下一篇:返回列表
随着消费者对美白需求的不断升级,光电美白赛道迎来了更大的想象空间。近日,全球...
2024-06-09 03:56:16
今天上午,首届浦东新区“森兰杯”城市龙舟赛在森兰湖畔拉开帷幕。这是森兰绿地自...
2024-06-09 03:09:53
2024京东工业数智供应链大会日前在上海举行,京东工业分享了其工业服务供应链...
2024-06-09 02:21:40
6月7日,HTX作为黄金赞助商重磅亮相GMVietnam2024。此举是HT...
2024-06-09 00:45:09
各位游戏迷、硬件发烧友们,一场盛大的狂欢正在悄然逼近!在这个618购物狂欢节...
2024-06-09 00:38:19
来自上海数据交易所的消息,上海数据交易所近日入选人民银行上海总部金融“五篇大...
2024-06-08 23:11:22
、GoDaddy(GDDY.US)加入标普500指数股价盘后飙升) 标准普...
2024-06-08 12:33:30
穿过漆黑的隧洞,眼前豁然开朗,仿佛跨越时空之门。我站在刀削斧劈般的绝壁之上,...
2024-06-08 11:01:17
根据《药物研发与技术审评沟通交流管理办法》,沟通交流会议分为Ⅰ类、Ⅱ类和Ⅲ类...
2024-06-08 09:44:18
塑料制品在日常生活中无处不在,从小小的塑料瓶、包装袋、外卖盒到大型的电子产品...
2024-06-08 08:24:00