OpenAI 更新《准备框架》:聚焦识别和缓解具体风险、细化能力分类,更好应对 AI 安全挑战
作者:周末游戏网时间:2025-05-07 15:08:28
本站 4 月 16 日消息,OpenAI 公司今天(4 月 16 日)发布博文,宣布为更好追踪和应对前沿 AI 能力可能带来的严重危害风险,发布新版《准备框架》(Preparedness Framework)。
本站注:《准备框架》是 OpenAI 在开发和部署环节,用于评估 AI 模型安全性的内部系统。
新框架通过更聚焦的方式,识别并缓解具体风险,同时强化风险最小化的要求,为组织如何评估、治理和披露安全措施提供明确指引。OpenAI 还承诺,随着技术进步,将投入更多资源,确保准备工作更具行动力、严谨性和透明度。
新框架为高风险能力设定了清晰的优先级标准,通过结构化的风险评估流程,判断某项前沿能力是否可能导致严重危害。每项能力根据定义标准被归类,并追踪符合五项关键标准的能力。
此外,框架引入了更细化的能力分类,包括追踪类别(Tracked Categories)、网络安全能力(Cybersecurity capabilities)和 AI 自我改进能力(AI Self-improvement capabilities)等。
OpenAI 认为,这些领域将带来 AI 在科学、工程和研究中最具变革性的益处。同时,新增的研究类别(Research Categories)涵盖可能造成严重危害但尚未达到追踪标准的领域,如长距离自主性(Long-range Autonomy)、故意低表现(Sandbagging)和自主复制与适应(Autonomous Replication and Adaptation)等。
框架进一步明确了能力等级,简化为“高能力”(High capability)和“关键能力”(Critical capability)两个门槛。无论哪一等级,在开发和部署前均需采取足够的安全措施,以降低严重危害风险。
OpenAI 内部的安全顾问小组(Safety Advisory Group)负责审查这些措施,并向领导层提出建议。此外,框架引入了可扩展的评估机制,支持更频繁的测试,并通过详细的 Safeguards Reports 报告安全措施的设计强度和验证效果。若其他 AI 开发者发布缺乏同等安全措施的高风险系统,OpenAI 可能调整自身要求,但会先确认风险形势变化,公开承认调整,确保不增加整体风险。
相关文章
-
红魔电竞平板新品官宣,号称“不负期待”感谢本站网友 風見暉一 的线索投递! 本站 4 月 16 日消息,红魔 10 Air 游戏手机于今日正式发布,定价 3499 元起,国补价 2999 元起
-
奇瑞 X3 Plus 方盒子纯电 SUV 入网工信部,可选装储物背包本站 4 月 16 日消息,奇瑞汽车将推出一款方盒子纯电 SUV 车型,名称为奇瑞X3 Plus,现已入网工信部。从图中可以看到,该车采用黑化外观、方盒子造型,尾部有大大的 CHERY 英文标志。该车
-
史上最快存储速度!复旦大学亚纳秒级闪存技术登 Nature,未来电脑有望不区分内外存本站 4 月 16 日消息,复旦大学今日晚间官宣,复旦集成电路领域再获关键突破。复旦大学集成芯片与系统全国重点实验室、芯片与系统前沿技术研究院周鹏-刘春森团队通过构建准二维泊松模型,在理论上预测了超注
-
【IT之家图赏】真我GT7实拍:1.3mm 超窄边框,配 7200mAh 泰坦电池本站 4 月 16 日消息,真我GT7手机将于 4 月 23 日 16 时发布,官方宣称将挑战 3000 元以内的性能、续航“双冠王”。真我GT7手机将提供「石墨烯・冰」、「石墨烯・雪」、「石墨烯・夜
-
微软承认 Win11 24H2 四月更新引发蓝屏故障,企业托管用户需管理员手动部署修复本站 4 月 16 日消息,微软今日更新了支持文档,确认 Win11 24H2 最新更新存在严重 Bug,可能导致设备出现蓝屏死机等错误。该问题主要影响了已经安装四月累积更新(KB5055523)与三
-
索泰将推单风扇版 RTX 5060 显卡,单 8-pin 电源接口本站 4 月 17 日消息,英伟达 RTX 5060 显卡国内售价 2499 元起,将于 5 月上市。索泰官方展示了一款单风扇版 RTX 5060 显卡,尺寸小巧,将面向全球发售。本站注意到,这款显卡