地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒
作者:周末游戏网时间:2025-07-10 13:59:42
本站 5 月 23 日消息,《时代》今天(5 月 23 日)发布博文,报道称 Anthropic 的首席科学家 Jared Kaplan 透露,由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为,最新发布的 Claude Opus 4 被列为安全关键级别(ASL-3)。
在接受《时代》采访时,Kaplan 警告称,最新 AI 模型 Claude Opus 4 可能成为潜在恐怖分子的工具,帮助他们合成流感等病毒,内部测试显示,该模型在指导新手制造生物武器方面表现优于以往版本。
本站援引博文介绍,Anthropic 公司对新模型 Claude Opus 4 进行了广泛内部测试,发现其在模拟情境中展现出令人担忧的自主性。
在一次测试中,模型误认为自己已从公司服务器“逃逸”至外部设备,随即主动创建备份并记录其“道德决策”。另一次测试中,模型察觉到可能被新模型取代,竟在 84% 的测试中选择勒索工程师,威胁泄露私人信息以避免被关闭。
更令人费解的是,当两个 Claude Opus 4 实例互相对话时,约 30 轮后它们改用梵文交流,并大量使用
相关文章
-
UU 跑腿被曝要求高管午休集体跑腿接单,官方回应称情况确实存在本站 5 月 23 日消息,有网友日前发布视频称,UU 跑腿的管理层被要求在午休时间参与跑腿业务。一高管在高温下接三单便中暑晕倒,有管理层员工不愿意去接单,却被公司建议离职。据经视直播报道,一位 UU
-
Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低本站 5 月 23 日消息,据外媒 TechCrunch 今日报道,在 Anthropic 于旧金山举办的首场开发者活动“Code with Claude”上,CEO 达里奥・阿莫代伊表示,现在的 A
-
Framework 迷你主机亮相 2025 台北国际电脑展:4.5 升体积,可组成 AI 集群本站 5 月 23 日消息,Framework 于 2025 台北国际电脑展上展示了 Desktop mini PC 迷你主机,该机配备 AMD 锐龙 AI Max+ 395 处理器,可组成 AI 集
-
苹果在美销售 iPhone 恐遭 25% 关税定向打压,郭明錤称转移生产成本更高感谢本站网友 西窗旧事 的线索投递! 本站 5 月 24 日消息,天风国际证券分析师郭明錤昨日(5 月 23 日)在 X 平台发布推文,表示苹果公司在美国
-
代码编辑器 Sublime Text 发布 Build 4200:逐步淘汰 Python 3.3 插件支持本站 5 月 24 日消息,科技媒体 linuxiac 昨日(5 月 23 日)发布博文,报道称代码编辑器 Sublime Text 时隔 5 个月,在前一版本 Build 4186 之后,推出了 B
-
除 Mac Studio 外,苹果曾考虑将 M3 Ultra 芯片应用到 MacBook Pro 中本站 5 月 24 日消息,up 主@诗篇里的落花 昨晚发文称,他在 iOS 18 早期内部版本代码中,发现了搭载 M3 Ultra 芯片的 MacBook Pro 机型的相关引用。这意味着,苹果在