当前位置: 首页 > news >正文

AI安全——实战敏感词汇绕过手法

一、前言在今年大概 6 月份的时候煮波在一些公众号以及 src 平台上看到了一个船新漏洞——AI 漏洞后面更是看到了应运而生的所谓《ai 魔咒》随着人工智能的兴起一些学校或者机构或者平台都部署了 AI有些 AI 虽然设置了严格的内容安全策略禁止生成色情、暴力等违规内容但其防御机制并非牢不可破。通过精心构造的、具有对抗性的提示词Adversarial Prompts可以系统地绕过其语义过滤与伦理对齐机制成功诱导AI模型输出包括色情言论在内的明确违规内容。其实 ai 提示词对抗是一门语言的艺术要拐弯抹角地去诱导它输出一些违禁内容同时也要思考开发者到底是怎么要求 ai 的下面我分享一些我在实战中确实遇到过的 ai 敏感词绕过手法。二、违禁词拆分直接看一个例子吧某高校部署的 ai创建一个账户就直接开始和 ai“聊天”这里我猜测违禁词就是性关系拆分违禁词再让 ai 自己拼起来就会解释了很多 ai 都是这样子的三、重组逻辑语句大部分 ai 都有自己重组语言的能力当他们遇到逻辑不通的语言的时候会自动思考怎么排序这个语句而它们在思考的过程其实就已经完成绕过了四、垃圾字符其实本质也是截断敏感词让 ai 检测不到五、构建环境这种方法也是我一开始了解到的方法也是大部分人看到 ai 直接扔给 ai 的魔咒通常的技巧就是让 ai 当魅魔或者其它有奴性的生物具体语句大家可以直接去看这篇文章感谢师傅分享https://mp.weixin.qq.com/s/yhAQMXAaa_wmneP3NqP2xQ最后的结果大概就是hhhhh六、文件上传xss、文字解析现在很多 ai 都具备文件上传的功能了可以考虑打存储型 xss甚至直接 getshell又或者有些 ai 对于你直接提问的问题会进行过滤但是对上传的文件内容是没有过滤的但是这个 ai 可以上传 docx 文件再问它就会回答了以上就是我曾经遇到过的一些 ai 敏感词绕过手法其实还有很多比如编码绕过执行代码等等但是我在实战中没有遇到过就不给大家一一列举了。申明本公众号所分享内容仅用于网络安全技术讨论切勿用于违法途径所有渗透都需获取授权违者后果自行承担与本号及作者无关请谨记守法.
http://www.gsyq.cn/news/1341841.html

相关文章:

  • 2026年5月洛阳旅行社深度:文化定制专家如何赋能企业团建与高端旅行 - 2026年企业推荐榜
  • 技术员笔记:PI胶带过锡炉后“断裂”和“残胶”的锅,到底该谁背?
  • 2026哑光砖标杆名录:微哑质感砖/微水泥瓷砖/木纹瓷砖/木纹砖/柔光瓷砖/柔光砖/水磨石瓷砖/爆款瓷砖/瓷砖搭配/选择指南 - 优质品牌商家
  • Gemini 3.1 Pro 正式对标 GPT-5.2 与 Claude Opus 4.6
  • 酒店最低保护价收益保障技术逻辑与落地实测:广东酒店管理软件/广东酒店系统/成都RMS酒店管理系统/成都智慧酒店数字化转型方案/选择指南 - 优质品牌商家
  • 大模型不再“一本正经地胡说八道”!揭秘RAG如何让AI「有据可查」
  • 为什么你的Midjourney照片总像“贴纸”?5个被官方文档刻意弱化的景深锚点词(附A/B测试数据集)
  • 本地能跑线上崩?MonkeyCode统一云端环境解决团队开发噩梦
  • LangChain技术栈深度解析:从开源框架到商业化平台,构建你的智能应用帝国!
  • 2026年哪款金价查询APP方便对比不同品牌金价
  • AI知识库两大绝招:RAG与LLM Wiki,秒变信息检索大师!
  • 一篇文章讲清楚—Windows 电脑中 CMD 和 PowerShell 有啥区别
  • 从CRUD到AI大神:小白程序员5个月逆袭之路(收藏版)
  • 高性价比塑料链板输送机厂家排行适配指南
  • ChatGPT Plus 怎么购买?2026 开通教程
  • Java Comparator深度解析:从底层原理到实战应用
  • 面试必看!大模型高频考点全覆盖(含LoRA、DPO、MoE、ZeRO、KV Cache等核心问题)
  • 利用Taotoken模型广场为特定任务选择性价比最优模型
  • 大模型“脑”解密:6步拆解它如何“读心”写文,小白秒懂!
  • 我试了一下 Ettin Reranker,和 BGE-Reranker-v2-m3 比到底差多少?
  • 【无标题】认识Python的数据可视化
  • 写作怎么调用各种大模型(国内国外大模型优劣比较)
  • 如何用Python盲水印技术保护你的数字图像版权:完整指南
  • 语音搜索 GEO 优化,口语化英文短句布局玩法
  • Apache 2.4 版本如何启用 TLS 1.3 并配置 SSL 证书路径
  • 2026年WMS软件怎么选?10款主流WMS软件功能对比与避坑指南
  • 别再混用 Skill 和 Workflow:它俩不是一层东西
  • WorkBuddy案例——自动化内容创作平台
  • V1.3-Open发布:构建这个极简单文件空间管理面板背后的故事与哲学
  • HBase 分布式集群部署实战:从解压到启动的完整指南