机器之心报道
编辑:泽南、杜伟
识别 ChatGPT 生成的内容,OpenAI 亲自上阵了。
(资料图片)
很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。
在 ChatGPT 引发 AI 领域「是否要禁用」大讨论之后,OpenAI 的真假鉴别工具终于来了。
1 月 31 日,OpenAI 官宣了区分人类作品和 AI 生成文本的识别工具上线,该技术旨在识别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分类器目前看起来准确性堪忧:OpenAI 在博客里指出 AI 识别 AI 高置信度正确率约为 26%。但该机构认为,当它与其他方法结合使用时,可以有助于防止 AI 文本生成器被滥用。
「我们提出分类器的目的是帮助减少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,」OpenAI 发言人通过电子邮件对媒体介绍道。「我们正通过这个初始分类器获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。」
最近科技领域随着围绕生成式 AI,尤其是文本生成 AI 的热情正在不断增长,但相对的是人们对于滥用的担忧,批评者呼吁这些工具的创造者应该采取措施减轻其潜在的有害影响。
面对海量的 AI 生成内容,一些行业立刻作出了限制,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。包括 Stack Overflow 在内的网站也已禁止用户共享 ChatGPT 生成的内容,称人工智能会让用户在正常的讨论中被无用内容淹没。
这些情况突出了 AI 识别工具的必要性。虽然效果不尽如人意,但 OpenAI AI 文本分类器(OpenAI AI Text Classifier)在架构上实现了和 GPT 系列的对标。它和 ChatGPT 一样是一种语言模型,是根据来自网络的许多公开文本示例进行训练的。与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性 —— 不仅来自 ChatGPT,也包括来自任何文本生成 AI 模型的内容。
具体来说,OpenAI 在来自五个不同组织(包括 OpenAI 自己)的 34 个文本生成系统的文本上训练了 AI 文本分类器。这些内容与维基百科中相似(但不完全相同)的人工文本、从 Reddit 上共享的链接中提取的网站以及为 OpenAI 文本生成系统收集的一组「人类演示」配对。
需要注意的是,OpenAI 文本分类器不适用于所有类型的文本。被检测的内容至少需要 1000 个字符,或大约 150 到 250 个单词。它没有论文检测平台那样的查重能力 —— 考虑到文本生成人工智能已被证明会照抄训练集里的「正确答案」,这是一个非常难受的限制。OpenAI 表示,由于其英语前向数据集,它更有可能在儿童或非英语语言书写的文本上出错。
在评估一段给定的文本是否由 AI 生成时,检测器不会正面回答是或否。根据其置信度,它会将文本标记为「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之间的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的机会)、「可能」由 AI 生成(90% 到 98% 的机会)或「很有可能」由 AI 生成(超过 98% 的机会)。
看起来和图像识别的 AI 很像,除了准确程度。根据 OpenAI 的说法,分类器错误地将人类编写的文本标记为 AI 编写的文本的概率为 9%。
一番试用之后,效果的确不大行
OpenAI 宣称其 AI 文本分类器的成功率约为 26%,一些网友上手试用之后,发现识别效果果然不行。
知名 ML 和 AI 研究人员 Sebastian Raschka 试用之后,给出了「It does not work」的评价。他使用其 2015 年初版的 Python ML 书籍作为输入文本,结果显示如下。
Randy Olson 的 foreword 部分被识别为 不清楚是否由 AI 生成(unclear) 他自己的 preface 部分被识别为 可能由 AI 生成(possibly AI) 第一章的段落部分被识别为 很可能由 AI 生成(likely AI)Sebastian Raschka 对此表示,这是一个有趣的例子,但自己已经为将来可能因离谱的论文识别结果而受到惩罚的学生感到难过了。
因此他提议,如果要部署这样的模型,请共享一个混淆矩阵。不然如果教育者采用这一模型进行评分,则可能会对现实世界造成伤害。此外还应该增加一些有关误报和漏报的透明度。
此外,Sebastian Raschka 输入了莎士比亚《麦克白》第一页的内容,OpenAI AI 文本分类器给出的结果竟然是很可能由 AI 生成。简直离谱!
还有人上传了 AI 写作工具 Easy-Peasy.AI 创作的内容,结果 OpenAI AI 文本分类器判定为由 AI 生成的可能性非常小。
最后,有人用上了反复翻译大法,把文本让 GPT3 重写一遍,也能骗过识别器。
总结一下的话就是正向识别不准,反向识别出错,也无法识破一些改论文的技巧。看来,起码在 AI 文本内容识别这一领域,OpenAI 还需努力。
参考内容:
https://techcrunch.com/2023/01/31/openai-releases-tool-to-detect-ai-generated-text-including-from-chatgpt/
https://openai.com/blog/chatgpt/
上一篇 : 焦点快报!米兰19岁女大学生在学校厕所自缢身亡 大学宣布停课一天以示哀悼
下一篇 : 接的组词是什么的组词
对于这点相信很多观众都有所察觉,毕竟前两代蜘蛛侠只度过一部电影就
06-14 13:56:01
摘要:2023年06月14日国茂股份(603915)股价大幅拉升7 33%,该股报18
06-14 13:03:45
榆中县气象台2023年06月14日10时49分发布大风蓝色预警信号:预计24小时
06-14 12:05:08
新华社柏林6月12日电北大西洋公约组织12日在德国等地启动成立以来规模
06-14 11:40:56
6月14日上午,2023中考语文考试结束。在合肥八中考点,多位考生告诉记
06-14 11:15:28
6月13日凌晨,江苏苏州的李女士在社交平台发布视频,称自己在苏州市的
06-14 10:14:14
袁女士(左一)和家人一起给崔磊(左二)送锦旗6月11日,阜城胜利北路
06-14 10:05:03
新债交易时间是几点到几点?9:15—15:00,新债的交易时间跟股票的交
06-14 09:30:26
秸秆建筑起源秸秆建筑的墙体,是将堆叠起来的秸秆作为类似于砖或砌块一
06-14 08:52:32
特约作者| 胡世鑫 编辑| 陈弗也出品 | 棱镜·腾讯小满工作室
06-14 08:33:37
当代先锋网从2021年第一次临时股东大会“五线发展观”的提出,外界对茅
06-14 07:36:27
近年来,电子产品快速普及、使用频率越来越高,引发了普遍的近视问题,
06-14 06:43:01
1、苹果手机短信怎么备份到另个手机上。相信通过苹果手机短信怎么备份
06-14 05:51:23
2022年,新能源汽车迎来大爆发,根据中国汽车工业协会统计,2022年新能
06-14 02:17:34
1、可以的,但是不是很推荐的,个人推荐如下:1 钟馗像;2 门神(好多
06-13 23:06:22
被称为真理之环、绿色地狱的纽博格林赛道近年来已经成为很多厂家验证自
06-13 21:56:46
人民网石家庄6月12日电(赵明妍)6月11日,2023(第四届)河北省体育消
06-13 20:54:45
*ST泛海(行情000046,诊股)在互动平台回复投资者提问称,公司不存在退市
06-13 20:21:20
IT之家6月13日消息,松鼠模拟器《拿枪的松鼠(SquirrelwithaGun)》发
06-13 19:07:37
24小时财经资讯平台,依托新锐财经日报《每日经济新闻》(NationalBusin
06-13 18:33:05
齐鲁网·闪电新闻6月13日讯自2023年5月起,青岛市卫生健康委、青岛市委
06-13 18:05:58
在日常生活和工作中,我们可以接触到制度的地方越来越多,制度一般指要
06-13 17:17:16
1、做你的男人不需要理由。2、空白也是一种美。。3、哼一首小情歌4、干
06-13 17:06:21
按照主题教育工作安排和大兴调查研究部署要求,6月12日下午,市经济信
06-13 16:38:28
妖狐x仆ss结局,该片讲述了什么故事很多人还不知道,现在让我们一起来
06-13 16:02:55
黑色持仓日报:期螺涨1 88%,国泰君安增持近2 1万手多单
06-13 15:41:05
根据《公务员录用规定(试行)》和《广东省2023年度选调大学毕业生公告》
06-13 15:08:40
海口网6月13日消息(记者吴怡辉)海口市气象台于6月13日14时许发布雷雨
06-13 14:18:01
IT之家6月13日消息,消息源TarunVats反馈称,三星GalaxyS21系列手机在
06-13 13:55:54
1、大部分无毒。2、涉及xoxo的可能有毒。本文到此分享完毕,希望对大家
06-13 13:11:29
天津北方网讯:记者从市儿童医院获悉,该院成为中国出生缺陷救助基金会
06-13 12:18:50
“游泳健身了解一下”的浪潮已经远去,健身房这片沙滩上留下套路、圈钱
06-13 12:01:49
6月12日,品渥食品(300892)融资买入291 3万元,融资偿还337 85万元,
06-13 11:31:18
以下是金太阳在北京时间6月13日11:05分盘口异动快照:6月13日,金太阳
06-13 10:53:11
XM集团简介: XM集团自2009年成立至今,服务超过10,000,000名和
06-13 10:41:38
一、合同解除能否主张违约责任赔偿合同解除能主张违约责任赔偿,合同解
06-13 10:03:35
1、现在,我们的腾讯体验中心是在电脑上打开的。2、我们在里面搜索我们
06-13 09:52:07
在端午节假期将至、高考后毕业出行等多因素共振下,旅游业市场持续火爆
06-13 09:18:33
1、《valderfields》百度网盘最新全集下载链接:提取码:a495 作品
06-13 08:49:03
百度极速版真的能赚钱吗百度极速版怎么赚钱,
06-13 08:09:19
近日,作为我国北煤南运主要枢纽的秦皇岛港,与煤、电上下游企业、铁路
06-13 07:05:33
uploads allimg 220422 1650601018r jpg " >洗洁精:先用清水揉搓衣服,然后在衣服
06-13 06:19:39
如何测试手机的各项性能?首先,我们可以从外观和手感上来评估手机的质
06-13 01:03:21
6月12日,最高检发布消息:安徽省宣城市人大常委会原党组书记、主任杨
06-12 23:11:33
1700多亿千瓦时电量、90多亿立方米天然气,代表了上海这座超大型城市一
06-12 21:55:29
中国日报6月12日电6月11日,伴随着最后一场篮球赛的顺利收官,2023年中
06-12 20:57:58
祥鑫科技:第四届董事会第十五次会议决议公告
06-12 20:23:15
2023全国全民体能大赛深圳站比赛落幕---中新网深圳6月12日电2023全国全
06-12 19:56:49
令人向往的兴趣课!武科大香涛学院开设花样课程---6月11日,武汉科技大
06-12 18:38:46
淄博新闻网讯2023年5月,俄罗斯各地都举行了斯拉夫文字诞生1160周年庆
06-12 18:14:48
对于这点相信很多观众都有所察觉,毕竟前两代蜘蛛侠只度过一部电影就
2023-06-14
摘要:2023年06月14日国茂股份(603915)股价大幅拉升7 33%,该股报18
2023-06-14
榆中县气象台2023年06月14日10时49分发布大风蓝色预警信号:预计24小时
2023-06-14
新华社柏林6月12日电北大西洋公约组织12日在德国等地启动成立以来规模
2023-06-14
6月14日上午,2023中考语文考试结束。在合肥八中考点,多位考生告诉记
2023-06-14
日前从邢台市新闻办举办的南宫专场新闻发布会获悉,今年以来,南宫市坚持外引内育,大力开展招商引资,...
近日,从海带中制造环保纱线的材料创新者AlgiKnit宣布获得1300万美元(8735 6万元)的A轮融资,以通过加...
概念特点1、 定义:纤维是天然或人工合成的细丝状物质,纺织纤维则是指用来纺织布的纤维。2、 纺织纤...
中新网西宁11月21日电 题:青海水润高原:从“大动脉”到“毛细血管”的精准管理 作者 谈林明...
中新网西宁11月21日电 (记者 张添福)青海省卫生健康委员会21日消息,该省第3例本土确诊病例经过20...
Copyright © 2015-2022 南极纤维网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com