机器之心发布
作者:之江实验室
(相关资料图)
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签:
上一篇 : 世界信息:新洲四中好邻居 爱心送考十年不断
下一篇 : 最后一页
机器之心发布作者:之江实验室当前,生成式大模型已经为学术研究甚至是
06-07 16:31:19
新洲四中好邻居爱心送考十年不断---湖北日报讯(通讯员陶火应)6月6日
06-07 15:21:30
如何用CATIA给工业设计加上“创意的翅膀”?- 凯思软件企业研发创新体
06-07 14:47:19
金投网提供2023癸卯年1公斤金制纪念币价格(2023年06月07日),2023癸
06-07 14:36:44
长江全长有多长?长江全长6387千米。长江发源于世界屋脊——青藏高原
06-07 13:22:24
唯一药物即将退出中国罕见病患者遇到罕见时刻,
06-07 13:10:26
智通财经APP获悉,国有大行存款利率或即将全面进入“2时代”。据报道,
06-07 12:25:19
6月7日,中国消费者协会(以下简称“中消协”)发布培训班退费骗局警示
06-07 12:01:01
中国女排在圆满完成了世界女排联赛日本名古屋站的4场比赛之后,根据计
06-07 09:52:28
席间,让甄衍更觉不寻常的是,赵蝎儿一直热情地在给狗蛋劝酒,这狗蛋也
06-07 09:37:02
同花顺数据显示,2023年6月6日,创业慧康获外资卖出14 87万股,占流通
06-07 09:14:22
关于抖音平台上发布的“云南一导游暗讽游客不消费”视频的调查进展通报
06-07 08:28:42
想必现在有很多小伙伴对于炫狗是什么梗,炫神为什么叫炫狗方面的知识都
06-07 07:40:44
1、了字加一笔有孒、子、孑、孓。2、一、了的释义[le]用在动词或形容词
06-07 07:43:25
想必现在有很多小伙伴对于圣女果网络上是什么梗(圣女果网络意义)方面
06-07 07:23:31
1、解答:已知:超声波在海水中的传播速度是v=1500m s。2、超声波传到
06-07 06:40:09
1、散光是因为当我们的眼睛看一个物体时,物体的每一个像都会反射出一
06-07 06:20:05
美国《华盛顿邮报》网站6月2日刊登专栏作家法里德·扎卡里亚的文章,题
06-07 06:05:10
1、我们教室墙上贴了一张十要十不要“六要六不要”顺利过中考如果把中
06-07 05:40:42
1、半轴是差速器与驱动轮之间传递扭矩的实心轴,其内端一般通过花键与
06-07 05:33:51
在孩子的成长过程中,父亲的角色是至关重要的。父亲的用心关注和教育,
06-07 04:46:54
1、假的!当时世界上都不支持中国对越南动武,如果有这种事,中国还不
06-07 04:23:42
乌克兰官员称目前扎波罗热核电站辐射在正常范围内:据媒体,乌克兰国家
06-07 03:38:48
新北市长侯友宜接受国民党征召参选2024后,继日前南下与台中市长卢秀燕
06-07 03:40:59
1、我的世界钓鱼技巧攻略:我的世界里面,钓鱼是个不错的游戏方式,这
06-07 02:34:36
简介:高阳市是中国河北省的一个城市,同时也是一个行政区。作为一个城
06-07 01:30:54
智通财经APP讯,蒙牛乳业(02319)发布公告,该公司将于2023年6月21日派
06-07 00:52:38
1、1克=1000毫克。2、1毫克=1000微克所以一克等于1000毫克。3、又等于1
06-07 00:05:09
德国联邦统计局6日公布数据显示,经季节和工作日调整后,4月德国工业新
06-06 23:50:35
1、大学生村官待遇还是不错的。2、来到农村里帮助农村解决问题自然待遇
06-06 22:11:32
湖北高考考场首设“智能安检门”---6月6日,在武汉市第十七中学考点入
06-06 21:58:50
1、征夷大将军应该是指历史上的德川家康。2、银魂的里的将军叫做德川茂
06-06 21:18:13
1、很抱歉。2、回答者上传的附件已失效。本文到此分享完毕,希望对大家
06-06 20:28:54
OPPO于5月底推出了Reno系列第十代里程碑之作——OPPOReno10系列,该系
06-06 19:55:50
晶圆代工大厂联华电子6月6日公布5月合并营收为188亿元新台币,环比增长
06-06 19:39:10
记者从5日天津市召开的“十项行动·绿色低碳发展行动方案”新闻发布
06-06 19:13:27
欢迎观看本篇文章,小柴来为大家解答以上问题。歇后语水仙不开花,关于
06-06 17:49:51
葛兰素史克的癌症药物Jemperli获得美国FDA认可:葛兰素史克(GSK US)表
06-06 17:13:35
一、毛利坦尼亚国旗上的月亮和星星是什么意思?没什么意思,阿拉伯国家
06-06 14:43:46
格隆汇6月6日丨玉禾田(300825 SZ)跌超8%,报18 2元,总市值60亿元。玉
06-06 13:56:07
12年后网友再次转发这则视频还艾特了马斯克,而马斯克的态度也是一百八
06-06 12:54:39
人民网北京6月6日电(记者杨虞波罗)2023年全国高考即将到来,高考期间
06-06 11:59:21
随着越来越多的跨国公司进入中国,目前国内的财务人员大多数是基层核算
06-06 10:51:33
银行是我国金融体系中非常重要的构成部分,虽然现在随着经济的快速发展
06-06 09:45:40
企业诚信经营的重要性不言而喻,于去年敲钟上市的紫燕食品(行情603057,
06-06 09:24:02
今天小编岚岚来为大家解答以上的问题。洋的声母是零声母韵头是什么,零
06-06 08:27:14
因为运用了AI技术,这个虚拟人可能会显得更“真实”,比如会根据用户
06-06 07:34:23
图为媒体吹风会现场。张广权摄中新网南宁6月5日电(张广权)广西壮族自治
06-06 06:49:47
原标题:世界环境日|人为干扰环保自动监测结果环保公司及其负责人被追
06-06 05:17:46
上交所:杭州热电近期出现严重异常波动情形,上交所,股价,交易
06-06 04:19:44
机器之心发布作者:之江实验室当前,生成式大模型已经为学术研究甚至是
2023-06-07
新洲四中好邻居爱心送考十年不断---湖北日报讯(通讯员陶火应)6月6日
2023-06-07
如何用CATIA给工业设计加上“创意的翅膀”?- 凯思软件企业研发创新体
2023-06-07
金投网提供2023癸卯年1公斤金制纪念币价格(2023年06月07日),2023癸
2023-06-07
长江全长有多长?长江全长6387千米。长江发源于世界屋脊——青藏高原
2023-06-07
日前从邢台市新闻办举办的南宫专场新闻发布会获悉,今年以来,南宫市坚持外引内育,大力开展招商引资,...
近日,从海带中制造环保纱线的材料创新者AlgiKnit宣布获得1300万美元(8735 6万元)的A轮融资,以通过加...
概念特点1、 定义:纤维是天然或人工合成的细丝状物质,纺织纤维则是指用来纺织布的纤维。2、 纺织纤...
中新网西宁11月21日电 题:青海水润高原:从“大动脉”到“毛细血管”的精准管理 作者 谈林明...
中新网西宁11月21日电 (记者 张添福)青海省卫生健康委员会21日消息,该省第3例本土确诊病例经过20...
Copyright © 2015-2022 南极纤维网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com