您现在的位置是:网络安全 >>正文
从“源头”保护数据安全:腾讯安全推出大模型隐私保护脱敏技术
网络安全1人已围观
简介大模型已经被广泛应用在各类场景,帮助人们进行报告摘要、文本翻译、数据分析、业务风控等各项工作,极大地提升了工作效率,但同时公众对于大模型带来的数据泄露的隐忧也从未停止。近日,腾讯安全玄武实验室披露了一 ...
大模型已经被广泛应用在各类场景,源头帮助人们进行报告摘要、从保出文本翻译 、护数数据分析、据安技术业务风控等各项工作,全腾全推极大地提升了工作效率,讯安但同时公众对于大模型带来的模型数据泄露的隐忧也从未停止。
近日,隐私腾讯安全玄武实验室披露了一项关于大模型隐私保护的保护安全脱敏与还原(Hide and Seek, HaS)技术 ,有望帮助大模型产品使用者从本地终端侧防范隐私数据泄露 。脱敏
HaS为业内首个支持信息还原的源头自由文本脱敏技术,通过对用户上传给大模型的从保出prompt(提示词)进行隐私信息脱敏 ,高防服务器并在大模型返回计算结果后进行恢复 ,护数该方案兼顾了隐私安全和计算资源消耗:脱敏与还原算法经过4bit量化后权重文件仅500MB ,据安技术可在手机、全腾全推 PC等终端上部署 。
这是业内首个公开发布的 、能被大模型用户部署于终端侧的隐私保护脱敏技术。借助这一技术,用户可以从“源头”免除使用云端大模型带来的数据泄露方面的担忧。
据悉,这个模型主要适用于典型的NLP任务场景 ,模板下载例如机器翻译 、文本摘要 ,文本润色、阅读理解 、文本分类 、情感分析等,其主要的技术难点在于如何解决实体识别与替换 、实体指代消解 、多义词识别 、自纠错鲁棒性还原、实体翻译等。此前,不少大模型提供方以及专业安全厂商均在积极进行相关的尝试,但目前尚未有理想的源码下载解决方案 。
“在大模型应用中提示词是一种自由文本 ,而针对自由文本的隐私保护问题,一种全密态的解决方案是通过安全多方计算(Multi-Party Computation, MPC)协议实现安全推理 。然而 ,MPC协议在计算成本和通信量上的高需求严重限制了其在大模型应用中的落地。”腾讯安全玄武实验室高级安全工程师陈昱表示,“实际上 ,多数场景下用户并不需要保护整句的信息不泄漏,服务器租用而仅需要保护其中的隐私实体不泄漏。”玄武实验室经过正则匹配 、近义词向量 、BERT NER+CR等方法的不断探索试错后 ,最终提出了这项技术 。
实验表明 ,HaS的数据脱敏处理并不会对任务造成影响 。在使用模型进行隐私保护与直接调用大模型相比“分类任务”与“翻译任务”两个场景的性能对比 ,在使用560M生成式方案下,文本分类任务的性能不仅没有下降,反而增加了0.14%;在1.7B标签式方案下,免费模板机器翻译任务性能仅下降了0.85%。
腾讯安全玄武实验室将上述研究发现以论文形式发布,更多技术细节可参考玄武官方博客(见文章最后)。
“一些企业或者个人用户开发者通过部署本地大模型来规避隐私数据泄露,但这要求一定的技术门槛,对于重度隐私需求的用户来说,通过本地安全模型/算法来实现数据保护,可能是更可行的办法 。”玄武实验室正在逐步丰富这一模型的应用覆盖面 ,并完善其部署和交付方式 ,以供企业用户和个人用户在未来能够便捷使用。亿华云
数据如今在社会生活生产中扮演越来越重要的角色,数据安全也始终是产业数字化进程的核心议题。腾讯安全持续致力于解决数据安全问题,护航各行各业产业升级 。
详细技术报告地址:
https://xlab.tencent.com/cn/2023/12/05/hide_and_seek/
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“商站动力”。http://www.noorid.com/news/39b799953.html
下一篇:简析网络安全中的足迹识别与防护
相关文章
网络安全裁员潮与企业安全新策略
网络安全根据Observe最新发布的全球调查报告,尽管各行业的网络安全事件数量持续增加,62%的企业每月报告的安全事件数量呈递增趋势,但接近半数47%)的受访企业计划减少安全人员数量。调查显示,计划缩减网络安 ...
【网络安全】
阅读更多软件开发人员用谷歌搜索突破现代汽车安全防线
网络安全一位开发人员近日表示,在发现这款汽车的制造商使用不仅公之于众,还从编程示例照搬的密钥来保护系统后,他能够在其汽车信息娱乐硬件上运行自己编写的软件。明尼苏达州明尼阿波利斯市的软件工程师Daniel Fe ...
【网络安全】
阅读更多BCS2022技术峰会:高对抗环境下网络新攻防
网络安全7月21日,2022北京网络安全大会BCS2022)技术日开启。作为本次大会的第二个主题日活动,2022北京网络安全大会技术峰会成功举办。来自全球多个国家、顶尖网络安全平台的信息安全专家、技术高管、专 ...
【网络安全】
阅读更多
热门文章
最新文章
友情链接
- 数据中心在冷却、成本和二氧化碳减排方面均未达到目标
- 从“v我50”到“疯狂星期四”:HTTPS如何用47天寿命的证书挡住中间人
- W7手动还原系统教程(一步步教您如何使用W7手动还原系统,保护和修复您的计算机)
- 苹果6s搭载iOS10.3.1
- 探究GeForce980MZ(颠覆视觉体验的游戏级显卡)
- 你的App每三分钟就会遭遇一次攻击
- 福布斯:如何确保客户的数据安全
- 深度研究 | 如何利用可信数据空间赋能企业数据流通安全
- 一键2009点了会有什么神奇的事情发生?(探索电脑神秘力量的奇妙之旅)
- 戴尔Latitude 5420商务笔记本 优质体验 胜任多种办公需求 源码库云服务器b2b信息平台亿华云香港物理机企业服务器网站建设