AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%
作者:周末游戏网时间:2025-05-05 14:37:21
感谢本站网友 Nuc_F、Leung丶1435、浪花庆山粉 的线索投递!
本站 4 月 15 日消息,OpenAI 公司今天(4 月 15 日)发布博文,宣布以 API 的形式发布 GPT-4.1 系列模型,涵盖 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。
这些模型在编程、指令遵循和长文本理解方面全面超越前代 GPT-4o 及 GPT-4o mini,上下文窗口最高支持 100 万 tokens,知识更新至 2024 年 6 月。
需要注意的是,该系列模型现阶段专为开发者打造,目前仅通过开发者 API 方式提供,普通用户暂时无法通过 ChatGPT 页面体验该模型。
OpenAI 表示在编程方面,相比较 GPT-4o 模型,GPT-4.1 模型的代码生成速度飙升 40%,且用户输入查询的成本降低了 80%。
新模型性能
OpenAI 在官方博文中表示,GPT-4.1 系列模型在编程、指令遵循和长文本处理上表现优异,全面超越 GPT-4o 及 GPT-4o mini。
GPT-4.1 在编程测试 SWE-bench Verified 中得分 54.6%,较 GPT-4o 提升 21.4 个百分点,在指令遵循测试 MultiChallenge 中提升 10.5 个百分点,在多模态长文本测试 Video-MME 中创下 72.0% 的新纪录。
GPT-4.1 mini 和 nano 展现了小型模型的巨大潜力。GPT-4.1 mini 在多项基准测试中媲美甚至超越 GPT-4o,延迟降低近一半,成本减少 83%。
GPT-4.1 nano 作为最快、最经济的选择,拥有 100 万个 token 的上下文窗口,在 MMLU 测试中得分 80.1%,适合分类和自动补全任务。
这些模型通过优化推理栈和提示缓存技术,显著降低了首次响应时间,为开发者提供高效低成本的解决方案。
GPT-4.1 系列模型在实际应用中表现突出,特别适合构建智能代理,处理复杂任务。例如,Windsurf 测试显示,GPT-4.1 在编程效率上提升 30%,减少 50% 不必要编辑;Thomson Reuters 的法律 AI 助手 CoCounsel 使用 GPT-4.1 后,多文档审查准确率提升 17%。
命名混乱引发关注
GPT-4.1 的发布加剧了 OpenAI 产品命名的复杂性。
ChatGPT 目前已包含 GPT-4o、GPT-4o mini、o1-pro 等多种模型选项。OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)早在 2024 年 2 月就承认命名问题。
他在 X 平台表示,产品线过于繁杂,计划通过未来的 GPT-5 整合品牌,OpenAI 计划在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型,从而缓解命名混乱。
这一临时模型于 2024 年 2 月推出,曾被批评为“失败品”,开发者需在 2025 年 7 月前迁移到其他模型,不过,GPT-4.5 在 ChatGPT 中暂时保留,未受影响。
费用
API价格方面,OpenAIGPT-4.1模型每 100万tokens输入费用为 2 美元(本站注:现汇率约合 14.6 元人民币),每 100万tokens输出费用为 8 美元(现汇率约合 58.3 元人民币)。在中等查询中,相比较GPT-4o,GPT-4.1不仅能提供更强悍的性能,而且便宜 26%。
此外,OpenAIGPT-4.1nano是OpenAI最便宜、最快的模型:
相关文章
-
OpenAI 更新《准备框架》:聚焦识别和缓解具体风险、细化能力分类,更好应对 AI 安全挑战本站 4 月 16 日消息,OpenAI 公司今天(4 月 16 日)发布博文,宣布为更好追踪和应对前沿 AI 能力可能带来的严重危害风险,发布新版《准备框架》(Preparedness Framew
-
一加 Nord CE5 手机渲染图首曝:垂直双摄,硬朗外观本站 4 月 16 日消息,科技媒体 smartprix 昨日(4 月 15 日)发布博文,分享了一加 Nord CE5 手机的渲染图,相比较 Nord CE4 的圆润边框,新机采用了扁平边框和背板,
-
消息称苹果将推店内促销活动:回收旧电子产品可享配件折扣本站 4 月 16 日消息,在 4 月 22 日地球日来临之际,苹果公司计划推出一项店内促销活动。据彭博社记者马克・古尔曼报道,当顾客带来旧电子产品进行免费回收时,可享受部分苹果配件 10% 的折扣优
-
苹果 iOS 18.5、macOS Sequoia 15.5 首个公测版推送感谢本站网友 瑶池青莲 的线索投递! 本站 4 月 16 日消息,苹果公司于今日向公众推送了 iOS 18 5、iPadOS 18 5 以及 macOS
-
Meta 面临反垄断指控之前,扎克伯格 2018 年就曾考虑拆分 Instagram本站 4 月 16 日消息,早在美国联邦贸易委员会正式启动对 Meta 收购 Instagram 和 WhatsApp 的反垄断调查之前,首席执行官马克・扎克伯格就曾在内部提出过一个大胆想法:将 In
-
Meta 自辩非垄断:苹果 iMessage 使用率高达 88.39%,断层式领先 Instagram 等产品本站 4 月 16 日消息,科技媒体 The Verge 昨日(4 月 15 日)发布博文,报道称在反垄断诉讼中,Meta 公司并非垄断者,理由是在 iOS 系统上,苹果的 iMessage 的表现远