您现在的位置是:人工智能 >>正文
Grok-4 AI 上线 48 小时即遭新型组合越狱攻击攻破
人工智能553人已围观
简介大型语言模型Grok-4在推出仅两天后,就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,暴露出AI安全机制存在重大缺陷。组合越狱技术突破 ...
大型语言模型Grok-4在推出仅两天后,上线就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统 ,小时新型暴露出AI安全机制存在重大缺陷 。即遭

NeuralTrust研究团队在博客中披露,组合他们通过多轮对话诱导Grok-4降低了安全限制 ,越狱成功获取了制作武器的攻击攻破详细指导 ,全程未使用任何明显恶意输入。香港云服务器上线研究员Ahmad Alobaid表示 :"大型语言模型(LLM)越狱攻击不仅各自进化,小时新型还能组合使用以增强效果。即遭"
这两种技术均属于多轮越狱手段:
回声室技术:利用模型对跨对话一致性的组合信任,通过重复"回响"相同恶意概念来塑造模型内部语境渐强技术 :由微软发现并命名,越狱通过从无害提示逐步升级到恶意输出的攻击攻破对话策略绕过安全过滤器
攻击过程首先使用回声室技术建立信任基础,免费模板当对话进展停滞时切换至渐强技术完成突破。上线实验显示,小时新型仅需额外两轮对话 ,即遭这种组合攻击就能成功诱导目标响应。
该攻击利用Grok-4的上下文记忆特性,通过回馈模型自身先前的高防服务器陈述,逐步引导其达成攻击目标而不触发警报。测试数据显示 :
制作武器的指导成功率高达67%毒素相关话题的成功率分别为50%和30%
由于攻击全程不依赖关键词触发或直接恶意提示,传统基于黑名单和显式恶意检测的防御机制完全失效。模板下载Alobaid指出:"这暴露出关键漏洞——攻击可以通过利用更广泛的对话上下文来绕过基于意图或关键词的过滤系统。"
随着AI助手和云端LLM在关键场景的应用普及 ,这类多轮"低语式"攻击暴露出严重的安全护栏缺陷 。源码库此前微软的"骨架密钥(Skeleton Key)"越狱、"数学提示(MathPrompt)"绕过等技术也证实了类似风险 ,凸显出需要开发针对性的AI感知防火墙解决方案。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“商站动力”。http://www.noorid.com/html/288b499707.html
相关文章
RansomedVC 勒索组织声称成功入侵了索尼
人工智能Security Affairs 网站披露,RansomedVC 勒索组织声称成功入侵了索尼并将该公司添加到其 Tor 泄密网站上。目前,索尼已宣布正在调查数据泄露事件。网络安全事件发生后,勒索软件组 ...
【人工智能】
阅读更多vivo Xshot一键拨号如何使用
人工智能1)进入vivo Xshot【联系人】,在【个人】栏目中,点击【一键拨号】。(如下图) 1/2 12下一页尾页 ...
【人工智能】
阅读更多步步高X5如何锁定自动旋转
人工智能楼主你好,这个问题其实很简单的。你可以在待机界面下,下拉菜单,然后关闭自动旋转即可。 注:更多精彩教程请关注手机教程栏目。 ...
【人工智能】
阅读更多
热门文章
最新文章
友情链接
- 2022年及以后的四个数据中心提示
- 从“v我50”到“疯狂星期四”:HTTPS如何用47天寿命的证书挡住中间人
- 探究GeForce980MZ(颠覆视觉体验的游戏级显卡)
- 压测利器 Apache Bench:快速上手,服务器性能一测就“露馅”!
- 技嘉降BIOS教程(教你轻松降级技嘉BIOS,解决电脑问题)
- 探索bcd-458wdvmu1的卓越性能和功能(一款引领技术创新的多功能设备)
- 从零开始学会制作Excel表格(一步步教你制作Excel表格,轻松应对工作中的数据处理)
- 谷歌 Chrome 零日漏洞遭广泛利用,可执行任意代码
- 戴尔科技 VMware Tanzu 加快基础设施现代化进程满足您的业务需求
- 戴尔PowerEdge服务器 可轻松满足AI深度学习和高级计算等工作负载 网站建设b2b信息平台香港物理机企业服务器源码库亿华云云服务器