您现在的位置是:网络安全 >>正文
Grok-4 AI 上线 48 小时即遭新型组合越狱攻击攻破
网络安全76人已围观
简介大型语言模型Grok-4在推出仅两天后,就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,暴露出AI安全机制存在重大缺陷。组合越狱技术突破 ...
大型语言模型Grok-4在推出仅两天后 ,上线就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,小时新型暴露出AI安全机制存在重大缺陷 。即遭

NeuralTrust研究团队在博客中披露,组合他们通过多轮对话诱导Grok-4降低了安全限制,越狱成功获取了制作武器的攻击攻破详细指导,全程未使用任何明显恶意输入 。亿华云上线研究员Ahmad Alobaid表示 :"大型语言模型(LLM)越狱攻击不仅各自进化 ,小时新型还能组合使用以增强效果 。即遭"
这两种技术均属于多轮越狱手段:
回声室技术 :利用模型对跨对话一致性的组合信任 ,通过重复"回响"相同恶意概念来塑造模型内部语境渐强技术:由微软发现并命名,越狱通过从无害提示逐步升级到恶意输出的攻击攻破对话策略绕过安全过滤器
攻击过程首先使用回声室技术建立信任基础,建站模板当对话进展停滞时切换至渐强技术完成突破 。上线实验显示,小时新型仅需额外两轮对话 ,即遭这种组合攻击就能成功诱导目标响应 。
该攻击利用Grok-4的上下文记忆特性,通过回馈模型自身先前的高防服务器陈述,逐步引导其达成攻击目标而不触发警报。测试数据显示 :
制作武器的指导成功率高达67%毒素相关话题的成功率分别为50%和30%
由于攻击全程不依赖关键词触发或直接恶意提示 ,传统基于黑名单和显式恶意检测的防御机制完全失效。云计算Alobaid指出:"这暴露出关键漏洞——攻击可以通过利用更广泛的对话上下文来绕过基于意图或关键词的过滤系统。"
随着AI助手和云端LLM在关键场景的应用普及,这类多轮"低语式"攻击暴露出严重的安全护栏缺陷。香港云服务器此前微软的"骨架密钥(Skeleton Key)"越狱 、"数学提示(MathPrompt)"绕过等技术也证实了类似风险 ,凸显出需要开发针对性的AI感知防火墙解决方案 。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“商站动力”。http://www.noorid.com/news/288b499707.html
相关文章
全球最大白银生产商Fresnillo遭遇网络攻击
网络安全全球最大白银生产商之一、黄金、铜和锌的重要生产商Fresnillo PLC近日披露,该公司遭遇了一次网络攻击,导致部分IT系统和数据被非法访问。Fresnillo在周二的一份公告中表示,公司成为了一起 ...
【网络安全】
阅读更多使用U盘重装系统XP的步骤及注意事项(详细教程带您轻松完成系统重装,快速提升电脑性能)
网络安全随着时间的推移,电脑系统可能会变得缓慢而不稳定。在这种情况下,重装系统是提高电脑性能和稳定性的有效方法。本文将为您详细介绍使用U盘重装系统XP的步骤及注意事项。准备工作:检查系统要求和备份重要数据1. ...
【网络安全】
阅读更多探索TCLL48A7148英寸电视的功能与性能(一款适合家庭娱乐的高清电视解决方案)
网络安全现代人们对于电视的需求越来越高,尤其是在家庭娱乐方面。如何选择一款功能强大、画质优秀的电视成为了很多人的关注焦点。本文将详细介绍TCLL48A7148英寸电视的功能与性能,以帮助消费者做出明智的购买决 ...
【网络安全】
阅读更多