地表最强编程 AI:Claude 4 系列登场,自动写代码 7 小时刷新世界纪录
作者:周末游戏网时间:2025-07-10 14:57:29
本站 5 月 23 日消息,Anthropic 公司在北京时间今天(5 月 23 日) 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。
Claude Opus 4:复杂推理与软件开发的巅峰之作
本站援引博文介绍,Claude Opus 4 被定位为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。
测试数据显示,该模型在 SWE-bench 基准测试(评估模型解决真实 GitHub 问题的能力)中准确率达到 72.5%;在 TerminalBench 测试(在多步骤终端代码生成任务中验证模型表现)中准确率为 43.2%。
更令人瞩目的是,Opus 4 在软件环境中展现出强大的自主行为,得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,据 Rakuten 测试数据,可连续进行近 7 小时的代码生成和任务执行,刷新AI世界纪录,远超前代 Claude 3 Opus(不到 1 小时)。
Anthropic 声称,其 AI 模型不是为了消除工作岗位,而是一种将日常工作自动化的工具。不过 marktechpost媒体认为,Claude 4系列问世后,将改变AI的使用方式,让AI从完成单一任务的辅助工具,转换为具备更强、更广泛功能的“AI同事”,可以自动工作几乎一个完整的工作班次。
Claude Sonnet 4:平衡性能与成本的通用选择
Claude Sonnet 4 取代了前代 Claude 3.5 Sonnet,以更稳定的架构提升速度与质量,同时未显著增加计算成本。该模型针对中规模部署优化,适合需要在成本与性能间权衡的场景。
尽管推理能力不及 Opus 4,但 Sonnet 4 继承了许多架构升级,支持多文件代码导航、中间工具使用和结构化文本处理,延迟表现更佳。它成为 Claude.ai 免费用户的默认模型,并通过 API 提供服务,适用于轻量开发工具、用户助手和分析流程。
技术亮点与部署方式
两款模型均具备混合推理能力,提供“快速模式”(Fast Mode)用于低延迟的简短对话任务,以及“扩展思考模式”(Extended Thinking Mode)用于需要深度推理和多轮代理行为的复杂任务。
这种双模式策略让用户能根据任务复杂度灵活分配计算资源。此外,Claude Opus 4 和 Sonnet 4 可通过 Anthropic 的 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 等多个云平台访问,支持从自主代理到代码分析等多种企业应用场景。
相关文章
-
鸿蒙智行:2025 款问界 M9 上市 64 天大定突破 6 万台,拿下 50 万级销冠本站 5 月 23 日消息,鸿蒙智行今晚宣布:2025 款问界 M9 上市 64 天,大定突破 6 万台。该车3 月 20 日上市,售价 46 98 万元起,5 月 2 日大定突破 5 万台。本站附鸿
-
一汽奔腾小马纯电小车上市一年零售销量突破 10 万辆,将推两款新配色本站 5 月 23 日消息,中国一汽今日官宣,奔腾小马微型纯电车自 2024 年 5 月上市以来,至今累计销量已突破 10 万辆。一汽奔腾小马采用胶囊造型设计,推出了多个配置版本,还曾与小马宝莉IP跨
-
小米 15 周年产品答网友问:15S Pro 相比 15 Pro 影像、屏幕、散热系统等均有升级感谢本站网友 Anon_Tokyo 的线索投递! 本站 5 月 23 日消息,小米手机官微今晚发布“小米 15 周年产品答网友问”,主要包括“小米 15S
-
UU 跑腿被曝要求高管午休集体跑腿接单,官方回应称情况确实存在本站 5 月 23 日消息,有网友日前发布视频称,UU 跑腿的管理层被要求在午休时间参与跑腿业务。一高管在高温下接三单便中暑晕倒,有管理层员工不愿意去接单,却被公司建议离职。据经视直播报道,一位 UU
-
Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低本站 5 月 23 日消息,据外媒 TechCrunch 今日报道,在 Anthropic 于旧金山举办的首场开发者活动“Code with Claude”上,CEO 达里奥・阿莫代伊表示,现在的 A
-
Framework 迷你主机亮相 2025 台北国际电脑展:4.5 升体积,可组成 AI 集群本站 5 月 23 日消息,Framework 于 2025 台北国际电脑展上展示了 Desktop mini PC 迷你主机,该机配备 AMD 锐龙 AI Max+ 395 处理器,可组成 AI 集