苹果研究破解 AI“英语口音”难题,提升多语言自然性
作者:周末游戏网时间:2025-06-21 14:35:35
本站 5 月 17 日消息,苹果与多国高校及研究院联合发布最新成果,揭示了大语言模型存在的“英语思维定式”问题,并提出创新解决方案。本站注意到,科研人员中不乏中国学者的存在。
研究人员针对非英语语种输出中普遍存在的语法与词汇偏差问题展开了深度剖析,测试覆盖中文、法语、英语(基于维基百科)语料。
测试发现,即使专为中文优化的 Qwen 模型,其母语表现仍落后人类水平;Meta 的 Llama 3.1 综合表现最佳,但自然度仍存在显著差距;所有模型在非英语输出中均残留英语语法结构。
换句话说,即使模型在用中文或法语进行对话,但它仍在用英语进行“思考”,而且非英语输出仍然遵循类似英语的语法和词汇模式。
针对大语言模型的遣词造句,研究团队提出两项量化指标:
https://arxiv.org/abs/2410.15956
词汇自然性(Lexical Naturalness):评估 LLM 用词是否符合母语习惯
句法自然性(Syntactic Naturalness):检验 LLM 语句是否贴合本土语法
为了缩小差距,研究人员通过“回译法”自动生成训练样本,将人工撰写的流畅中文内容先翻译成英文,再逆向翻译成带有 "翻译腔" 的“反面”样本。利用这类对比数据训练模型加强自然表达能力,在保持基准性能的前提下显著改善语言输出质量。
论文地址:
相关文章
-
为应对关税政策,日本拟将特斯拉超级充电桩纳入当地“国补”本站 5 月 17 日消息,日本 TBS 电视台今日报道称,在日美就削减关税削减展开磋商期间,日本方面正考虑为特斯拉充电桩建设提供补贴。本站从报道中获悉,日本政府仅为采用日本首创充电标准“CHAdeM
-
任天堂确认自家 Switch 2 游戏不采用实体密钥卡,坚持传统形式卡带本站 5 月 17 日消息,如今许多游戏商计划为Switch 2推出游戏密钥卡,相应卡带不包含游戏数据,实际上只是用于验证玩家购买了游戏,需要先联网下载游戏数据才能游玩。对此,外媒NintendoLi
-
新研究发现 AI 无法读懂模拟时钟,还不能告诉你某天是周几本站 5 月 17 日消息,根据外媒 LiveScience 今日报道,有些人类能轻松完成的任务,AI 却无法胜任。譬如,AI 能编程、画出逼真的图像、生成接近人类语气的文本,甚至在部分考试中取得不错
-
宏碁推出暗影骑士 PG271K“可移动”显示器:4K 72Hz / FHD 144Hz 双模本站 5 月 17 日消息,宏碁昨日宣布推出暗影骑士 Nitro PG271K“多功能可携式荧幕”,与华硕此前推出的 ZenScreen MB27ACF 类似也属于大屏轻薄“可移动”显示器范畴。相较商
-
奇瑞再被曝将在英国建汽车厂,目前在当地已有 70 余家经销商本站 5 月 17 日消息,据外媒 AutoCAR 报道,奇瑞汽车英国公司负责人 Victor Zhang 透露,未来将在英国设立工厂,以及包含上下游产业链的制造基地,另一位奇瑞英国高管则表示,英国生
-
刘强东给母校中国人民大学捐赠的教学楼“京东群学楼”今日投用本站 5 月 17 日消息,据“京东黑板报”,中国人民大学社会学院楼“京东群学楼”今日在通州校区正式启用。“群学”,为社会学的旧译名,亦指学派交汇,融会贯通。京东群学楼为人大校友、京东集团创始人、董事