百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5!
作者:周末游戏网时间:2025-09-10 13:52:33
今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。
百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。

一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。
官方介绍称,相比文心大模型X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。
百度表示,在多个权威基准评测中,文心大模型X1.1整体表现超越DeepSeek R1-0528,在部分任务上展现出领先优势。同时,在与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。
目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1也已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

相关文章
-
《洛奇手游》即将通过直播公布全新版本更新近日,《洛奇手游》开发总监李镇勋通过官网开发者笔记公布了未来计划:将推出可进入 "马斯地下城深渊地狱6 7层 "的新内容,并于8月通过直播披露详情。 此次新增的 "深渊地狱 "6-7层延续了当前马斯地下城玩法
-
100分满分神作!《空洞骑士:丝之歌》M站早期评分出炉万众瞩目的类银河战士恶魔城游戏《空洞骑士:丝之歌》已于9月4日正式发售!截止至发稿时,本作在M站的媒体评分已出炉,PC平台获得了100分的评价!虽然目前仅收录了4家媒体的评测,但它们无一例外均给出了1
-
DNF韩国开发商工会正式宣布罢工计划:今日起全面罢工日前,韩国全国化学纤维食品产业劳动组合NEXON支会Neople分会(以下简称,Neople工会)宣布,将从8月1日起展开全面罢工。Neople工会计划于当天下午5点在首尔AutoWay Tower和
-
N站不少R18 MOD遭下架!受国外最新监管政策影响据报道,受英国《网络安全法》和欧盟《数字服务法》的要求,全球最大的模组网站Nexus Mods平台正在收紧对成人内容的访问方式。据推主@Pirat_Nation反馈,受此影响,Nexus Mods已经
-
邱淑贞再无复出可能,女儿沈月回应妈妈演戏据新浪娱乐报道,近日,沈月受访谈及自己最近创作了一个关于AI的剧本,她说目前还在找投资,记者:“会不会找几个叔叔张智霖、郭富城他们一起拍?”沈月说:“希望的话那也不错啊!”记者:“不如找你妈妈?”沈月
-
虚幻5类魂新游《地狱即我们》撞车《空洞骑士:丝之歌》 玩家峰值不足后者1%使用虚幻5开发的类魂动作冒险新游《地狱即我们》于9月4日发售,和《空洞骑士:丝之歌》是同一天。然而,可能是因为撞车的原因,本作的首发表现较为惨淡。本站数据显示,本作在Steam平台的在线峰值仅有442