Claude AI现在会阻止用户请教如何制造核武器由美国能源部核安全局提供支持

#人工智能 Claude AI 现在会阻止用户请教如何制造核武器，美国能源部国家核安全局与 Anthropic 合作训练分类器用于阻止用户询问如何制造核武器。分类器用途主要是区分良性咨询还是滥用，例如询问核武器技术原理是可以的，但想要获得制造蓝图那就是滥用。查看全文：https://ourl.co/110363

如果你在 Claude AI 中询问核武器的技术原理或者铀 - 235 等核燃料的技术原理那可以获得人工智能生成的回答，但如果你想详细了解如何制造核武器的话则可能会被阻止。

日前 Anthropic 已经在 Claude AI 中部署新的分类器用来检测用户询问核武器相关的询问，如果检测到涉及如何制造核武器的话则可能会被标记和终止对话。

这项分类器由正规机构提供：美国能源部国家核安全局 (NNSA)，通过分类器识别用户询问核武器工作原理还是在寻找制造蓝图，测试显示其准确率高达 96%。

尽管听起来有些夸张，但人工智能确实可以在制造核武器方面提供帮助，强大的人工智能模型可能会接触到敏感技术文档并泄露如何制造核武器，这让美国能源部感到担忧。

分类器的工作原理主要是区分良性核内容，例如询问有关核推进的技术原理和前景，主要识别可能会被利用的部分例如铀浓缩方面的技术原理，人类管理器可能难以跟上人工智能的脚步，但经过适当训练则人工智能可以实现自我监管。

Anthropic 计划将新的分类器与前沿模型论坛 (Frontier Model Forum) 人工智能安全联盟分享，未来可能其他人工智能模型例如 ChatGPT 也会部署该分类器用来提高安全性。

这个精心设计的分类器旨在确保用户能够了解核科学核相关主题的情况下识别危险意图，不过人工智能模型也是可以绕过安全边界的，所以这类分类器是否能提供真正作用还是个未知数。

AI(1281)Anthropic(62)Claude(65)人工智能(1401)核武器(1)

版权声明：
感谢您的阅读，除非文中已经注明来源网站，否则均为 5L科技原创内容，转载时请务必以超链接(而非纯文本链接)标注来源于5L科技及本文完整链接，感谢！内容来源：5L科技 - Claude AI现在会阻止用户请教如何制造核武器由美国能源部核安全局提供支持

{{userData.name}}

Claude AI现在会阻止用户请教如何制造核武器由美国能源部核安全局提供支持

苹果翻车：M3 MacBook Pro 14英寸版预装macOS 13.5且无法升级14

邮件传输代理软件Exim存在严重安全漏洞影响全球约150万台邮件服务器

OpenAI宣布ChatGPT群组聊天功能向全球所有用户推出可以创建共享对话空间

淘宝网网页版新增多种主题皮肤最搞笑的还是Excel版和VSCode版

英国消费者权益组织起诉苹果利用iCloud垄断并寻求30亿英镑赔偿

微软宣布弃用Microsoft Office中的WDAG虚拟化沙箱隔离功能

ChatGPT推出轻量版深度研究工具现在免费用户亦可使用深度研究

过河拆桥？博通撤销VMware所有经销商授权月销售50万美元可重新签协议

果然又是零日漏洞！苹果已经公布iOS 17.0.1等版本修复的安全漏洞细节

国家顶级域名.CV目前正在开放注册中甚至还有单字母域名可以注册就是非常贵

[教程] 腾讯云推出OpenClaw海外服务器可快速对接TG/企业微信/钉钉/飞书等

<抢购中> 99元CN2境外免备案高速服务器硅谷/新加坡附测试IP

[超低价] RackNerd VPS洛杉矶DC03机房补货每月2TB流量每年仅需11美元

[限时销促] Microsoft 365个人版低至198元支持新开或续费

[正版软件] Win11专业版团购低至349元数字权利永久授权

俄罗斯打击VPN行为导致银行系统大范围瘫痪调整防火墙策略导致过滤系统出问题

Windows 11 24H2版即将结束支持微软将强制用户升级到最新版以获得继续支持

NASA经过审查后允许宇航员携带iPhone 17 Pro Max进入太空但禁止联网和蓝牙

频繁涨价引起不满：意大利法院认定奈飞擅自涨价违法可能要向用户退款

微软测试将Microsoft Edge设置为默认启动用户需主动禁用开机启动

***退钱！苹果失误凌晨向中国用户推送AI功能随后苹果将其紧急撤回

[配置指南] 从封号到开放！QQ正式推出OpenClaw AI官方连接 1分钟即可启动

[龙虾教程] 自建Sub2API中转站管理多个AI账号方便集中管理/好友共享/快速切换

重大安全播报！Apifox遭遇投毒请使用该平台的开发者立即轮换所有密钥

有开发者逆向腾讯QClaw机器人网关让其他AI机器人也可以通过微信控制

[下载] 开源多媒体处理框架FFmpeg v8.1正式版发布现已支持处理ProRes和空间音频

[下载] 开源免费的跨平台密码管理器KeePassXC 2.7.12版发布 (重要更新)

[在线工具] 301check.com 检测域名/网址重定向和多次跳转显示每次跳转链路

[下载] U盘装机神器Rufus v4.12版发布改进对Windows 11开发驱动器的支持

[下载] 开源激活脚本MAS新版发布(v3.10) 支持更多ESU扩展许可证激活附离线版下载

{{userData.name}}

相关文章

苹果翻车：M3 MacBook Pro 14英寸版预装macOS 13.5且无法升级14

邮件传输代理软件Exim存在严重安全漏洞 影响全球约150万台邮件服务器

OpenAI宣布ChatGPT群组聊天功能向全球所有用户推出 可以创建共享对话空间

淘宝网网页版新增多种主题皮肤 最搞笑的还是Excel版和VSCode版

英国消费者权益组织起诉苹果利用iCloud垄断并寻求30亿英镑赔偿

微软宣布弃用Microsoft Office中的WDAG虚拟化沙箱隔离功能

ChatGPT推出轻量版深度研究工具 现在免费用户亦可使用深度研究

过河拆桥？博通撤销VMware所有经销商授权 月销售50万美元可重新签协议

果然又是零日漏洞！苹果已经公布iOS 17.0.1等版本修复的安全漏洞细节

国家顶级域名.CV目前正在开放注册中 甚至还有单字母域名可以注册就是非常贵

[教程] 腾讯云推出OpenClaw海外服务器 可快速对接TG/企业微信/钉钉/飞书等

<抢购中> 99元CN2境外免备案高速服务器 硅谷/新加坡 附测试IP

[超低价] RackNerd VPS洛杉矶DC03机房补货 每月2TB流量每年仅需11美元

[限时销促] Microsoft 365个人版低至198元支持新开或续费

[正版软件] Win11专业版团购 低至349元数字权利永久授权

俄罗斯打击VPN行为导致银行系统大范围瘫痪 调整防火墙策略导致过滤系统出问题

Windows 11 24H2版即将结束支持 微软将强制用户升级到最新版以获得继续支持

NASA经过审查后允许宇航员携带iPhone 17 Pro Max进入太空 但禁止联网和蓝牙

频繁涨价引起不满：意大利法院认定奈飞擅自涨价违法 可能要向用户退款

微软测试将Microsoft Edge设置为默认启动 用户需主动禁用开机启动

***退钱！苹果失误凌晨向中国用户推送AI功能 随后苹果将其紧急撤回