Claude AI现在将在遇到极端持续辱骂等互动情况时主动结束对话以保护AI模型本身

#人工智能 Claude AI现在将在遇到极端持续辱骂等互动情况时主动结束对话以保护AI模型本身，这项政策适用于Claude Opus 4和4.1版。Anthropic将主动结束对话视作实验，当用户请求某些极端情况的内容例如要求提供涉及未成年人的性内容时都可能会被主动结束对话。查看全文：https://ourl.co/110260

目前人工智能模型普遍存在幻觉以及有时候越过模型提供商设置的安全边界，例如模型通常都被要求避免伤害人类，但有时候模型会越过边界刺激甚至引导人类自杀。

还有种可能稍微常见的情况就是人工智能模型与用户进行不友好的对话，例如持续性的辱骂用户，所以现在Claude AI就增加新功能用于在发现某些极端情况时自动结束对话。

Anthropic称当模型遇到罕见的、极端的、持续有害或辱骂性的用户互动情况时就可能会结束对话，不过该公司强调该政策并未保护人类用户，而是为了保护AI模型本身。

这项变更仅适用于Claude Opus 4和4.1版，并且Anthropic也再次强调仅在极端情况下Claude模型才会结束对话，例如当用户请求涉及未成年人的性内容，或者试图索取可能引起大范围暴力或恐怖行为的信息。

至于新的对话结束功能，Anthropic称在所有情况下Claude只会在尝试多次重定向且失败、对有效互动的希望已经耗尽，或者当用户明确要求Claude结束聊天时，才会使用对话结束功能作为最后的手段。

为了防止意外情况Claude还被要求在用户面临伤害自己或伤害他人等紧急的情况时不要使用AI能力继续提供内容，而在对话被结束后用户仍然可以发起新会话并重新开始对话。

最后Anthropic将此功能视作实验并收集数据改进方法，所以未来有可能Claude其他模型也会设置类似功能，避免在极端情况下AI模型伤害人类或者帮助用户伤害其他人。

AI(1281)Anthropic(62)Claude(65)Claude AI(1)人工智能(1401)模型(148)

版权声明：
感谢您的阅读，除非文中已经注明来源网站，否则均为 5L科技原创内容，转载时请务必以超链接(而非纯文本链接)标注来源于5L科技及本文完整链接，感谢！内容来源：5L科技 - Claude AI现在将在遇到极端持续辱骂等互动情况时主动结束对话以保护AI模型本身

{{userData.name}}

Claude AI现在将在遇到极端持续辱骂等互动情况时主动结束对话以保护AI模型本身

美国财政部宣布豁免俄罗斯互联网服务的制裁避免民众无法上网查询内容

微软正在招聘核能技术专家希望建造小型核裂变工厂为AI数据中心供电

云端客服平台Zendesk被黑泄露客户资料加密货币投资者谨防钓鱼和诈骗

谷歌证实开启广告拦截后YouTube视频无法统计观看次数科技领域创作者受影响最大

炒币炒到跑路：三箭资本欠债破产后创始人消失清算委员会都找不到人

加密货币交易所Crypto.com遭到攻击损失约3000万美元的比特币和以太坊

又是思路清奇！研究人员生成长度达250万字符的文件名用来绕过谷歌的通知系统

亚马逊逐渐国内视频网站化？不额外付费不给使用杜比视界和全景声

美国司法部修订计算机欺诈和滥用法不再对白帽黑客出于研究目的追究责任

内存条提供商芝奇(G.SKILL)发布官方声明：我们也不想涨价但采购成本实在太高

[教程] 腾讯云推出OpenClaw海外服务器可快速对接TG/企业微信/钉钉/飞书等

<抢购中> 99元CN2境外免备案高速服务器硅谷/新加坡附测试IP

[超低价] RackNerd VPS洛杉矶DC03机房补货每月2TB流量每年仅需11美元

[限时销促] Microsoft 365个人版低至198元支持新开或续费

[正版软件] Win11专业版团购低至349元数字权利永久授权

俄罗斯打击VPN行为导致银行系统大范围瘫痪调整防火墙策略导致过滤系统出问题

Windows 11 24H2版即将结束支持微软将强制用户升级到最新版以获得继续支持

NASA经过审查后允许宇航员携带iPhone 17 Pro Max进入太空但禁止联网和蓝牙

频繁涨价引起不满：意大利法院认定奈飞擅自涨价违法可能要向用户退款

微软测试将Microsoft Edge设置为默认启动用户需主动禁用开机启动

***退钱！苹果失误凌晨向中国用户推送AI功能随后苹果将其紧急撤回

[配置指南] 从封号到开放！QQ正式推出OpenClaw AI官方连接 1分钟即可启动

[龙虾教程] 自建Sub2API中转站管理多个AI账号方便集中管理/好友共享/快速切换

重大安全播报！Apifox遭遇投毒请使用该平台的开发者立即轮换所有密钥

有开发者逆向腾讯QClaw机器人网关让其他AI机器人也可以通过微信控制

[下载] 开源多媒体处理框架FFmpeg v8.1正式版发布现已支持处理ProRes和空间音频

[下载] 开源免费的跨平台密码管理器KeePassXC 2.7.12版发布 (重要更新)

[在线工具] 301check.com 检测域名/网址重定向和多次跳转显示每次跳转链路

[下载] U盘装机神器Rufus v4.12版发布改进对Windows 11开发驱动器的支持

[下载] 开源激活脚本MAS新版发布(v3.10) 支持更多ESU扩展许可证激活附离线版下载

{{userData.name}}

相关文章

美国财政部宣布豁免俄罗斯互联网服务的制裁 避免民众无法上网查询内容

微软正在招聘核能技术专家 希望建造小型核裂变工厂为AI数据中心供电

云端客服平台Zendesk被黑泄露客户资料 加密货币投资者谨防钓鱼和诈骗

谷歌证实开启广告拦截后YouTube视频无法统计观看次数 科技领域创作者受影响最大

炒币炒到跑路：三箭资本欠债破产后创始人消失 清算委员会都找不到人

加密货币交易所Crypto.com遭到攻击 损失约3000万美元的比特币和以太坊

又是思路清奇！研究人员生成长度达250万字符的文件名用来绕过谷歌的通知系统

亚马逊逐渐国内视频网站化？不额外付费不给使用杜比视界和全景声

美国司法部修订计算机欺诈和滥用法 不再对白帽黑客出于研究目的追究责任

内存条提供商芝奇(G.SKILL)发布官方声明：我们也不想涨价 但采购成本实在太高

[教程] 腾讯云推出OpenClaw海外服务器 可快速对接TG/企业微信/钉钉/飞书等

<抢购中> 99元CN2境外免备案高速服务器 硅谷/新加坡 附测试IP

[超低价] RackNerd VPS洛杉矶DC03机房补货 每月2TB流量每年仅需11美元

[限时销促] Microsoft 365个人版低至198元支持新开或续费

[正版软件] Win11专业版团购 低至349元数字权利永久授权

俄罗斯打击VPN行为导致银行系统大范围瘫痪 调整防火墙策略导致过滤系统出问题

Windows 11 24H2版即将结束支持 微软将强制用户升级到最新版以获得继续支持

NASA经过审查后允许宇航员携带iPhone 17 Pro Max进入太空 但禁止联网和蓝牙

频繁涨价引起不满：意大利法院认定奈飞擅自涨价违法 可能要向用户退款

微软测试将Microsoft Edge设置为默认启动 用户需主动禁用开机启动

***退钱！苹果失误凌晨向中国用户推送AI功能 随后苹果将其紧急撤回