分享好友 最新动态首页 最新动态分类 切换频道
ChatGPT作弊难逃!99%命中检测,堪萨斯大学全新算法,研究登Cell子刊
2024-12-01 00:08
ChatGPT作弊难逃!99%命中检测,堪萨斯大学全新算法,研究登Cell子刊 堪萨斯

新智元报道

编辑:桃子

【新智元导读】AI检测器有谱了,新算法实现99%的准确率。

此前,曾有不少人研发ChatGPT检测器,但没有一个能够真正有效鉴别。

来自堪萨斯大学的研究人员介绍了一种全新的算法,能够检测是否用ChatGPT作弊,准确率超99% 。

最新研究已在6月7日,发表在Cell Reports Physical Science期刊上。

该论文的作者之一、堪萨斯大学化学教授Heather Desaire表示,

「我们努力创建一种易于使用的方法,这样,即便是高中生,只需很少的指导,也可以为不同类型的写作构建一个人工智能检测器。」

四大特征,99%识别率

就像研究者所称,90%准确性往往是不够的。但要获得更高准确性,取舍往往是普遍性。

这项研究中,研究人员选取了人类作者撰写的64篇「科学」杂志上的研究文章,涵盖从生物学到物理学的各个学科。

然后,将这些数据喂给ChatGPT,并用这些数据生成了一个128篇人工智能文章的数据集。

这组训练数据,包含1276段聊天机器人示例段落。

研究者利用这些数据构建了ChatGPT检测算法。

在模型完全开发和优化后,他们还生成了两个测试集。每个测试集有30篇真实文章和60篇ChatGPT撰写的文章(总计1210段)组成了一个新的数据集,来测试最新算法。

实验结果显示,最新算法能够100%检测到ChatGPT写的整篇文章。

在段落层面上,其准确性较低,但仍令人印象深刻:该算法发现了92%的由人工智能生成的段落。

值得一提的是,论文称,从一些细节中就能发现,哪些内容是ChatGPT创作的。

通过对训练集中许多示例的手动比较,研究者确定了4类特征。这些特征有助于区分人类写作和聊天机器人。

(1)段落复杂性,(2)句子长度多样性,(3)标点符号,以及(4)流行词或数字

总的来说,人类作家写的段落更长、使用词汇量更大,包含更多的标点符号。

而且,还倾向于用「然而」、「但是」和「尽管」这样的词来修饰他们的陈述。而ChatGPT在引用数字,提及其他科学家方面没有那么具体。

在如下表分类中,人类擅长的内容要比ChatGPT多得多。

在这四类特征中,有两类(1和3)是ChatGPT产生的内容不如人类复杂的方式。最大的区别特征是每段句子的数量和每段总单词的数量。

在这两种情况下,ChatGPT的平均值都明显低于人类。

研究者还发现,人类更喜欢改变句子结构。人类改变句子长度的次数超过ChatGPT。人类也更频繁地使用较长的句子(35个单词或更多)和较短的句子(10个单词或更少)。

剩下的两类区分特征可以更多地描述为「文体」选择。

一方面,人类科学家更频繁地使用问号、破折号、括号、分号和冒号,而ChatGPT使用更多的单引号。

人类还使用更多的专有名词和/或首字母缩略词,还有数字。

这个由Desaire公司建立的这个模型,对于那些希望惩罚作弊的高中生的老师来说,是行不通的。

该算法是为学术写作而建立的,特别是人们在科学期刊上读到的那种学术写作。

这家公司表示,理论上你可以使用同样的技术来建立一个模型,来检测其他类型的写作。

不过,不得不考虑的一个事实是,一个人可以很容易地对一个聊天机器人的写作进行一些小调整,并让其更难被发现是作弊,事情就更复杂了。

当你考虑到这样一个事实,一个作者可以很容易地对一个聊天机器人的写作进行一些小的调整,并使它更难被发现时,事情就崩溃了。

尽管如此,研究人员将这项研究描述为「概念证明」,并表示未来可以开发一个更加稳定,准确的工具与更大的数据集。

如果人工智能继续以极快速度发展下去,谁也无法保证这样的检测方法,能否依然有效。

因为大型语言模型越接近复制人类语言文字的能力,识别机器人语言的痕迹就越困难。

AI检测为何如此困难

自ChatGPT面世以来,已经被许多高校的学生和老师用在日常的作业和教学中。

然而,如果不加以限制,ChatGPT将会变成史上最强大的作弊工具,可以帮助学生们写作业,甚至是完成考试论文。

为了反侦察,一款简单易用的检测器成为老师期盼的东西。一位22岁普林斯顿大学的学生Edward Tian,就自行开发了一款检测器——GPTZero。

甚至,OpenAI官宣推出一个新工具,名为AI Text Classifier的文件检测器。

但是,这些检测器的表现并不如人意。

检测出AI创作的内容听起来很简单。但当给你一封手写邮件和ChatGPT生成的邮件后,我们几乎无法辨别。

Turnitin的人工智能副总裁Eric Wang称,用软件检测人工智能写作涉及统计学。从统计学的角度来看,人工智能与人类的区别在于它极其稳定地处于平均水平。

直白点讲,AI水平很稳定。然而,实际上并非这样一个道理。

「像ChatGPT这样的系统就像是自动补全的高级版本,寻找下一个最可能要写的单词。这实际上就是它为什么读起来如此自然的原因。AI写作是人类写作中最可能的子集。」

参考资料:

http://today.ku.edu/2023/05/19/digital-tool-spots-academic-text-spawned-chatgpt-99-percent-accuracy

最新文章
谷歌推广该选择SEO还是Ads?谷歌技巧分享及实战
众所周知,谷歌是全球最大线上搜索引擎,已经成为消费者在进行线上购物时不可或缺的重要搜索工具,全球用户每天在谷歌上有着几十亿次的搜索行为。 所以现在越来越多的跨境丝氨酸选择在Google上投放广告,这也给卖
百度蜘蛛池教程,打造高效网站流量与排名,百度蜘蛛池教程视频
百度蜘蛛池是一种通过集中多个网站链接,吸引百度蜘蛛(搜索引擎爬虫)访问,从而提升网站流量和排名的策略。该教程视频详细介绍了如何创建和管理百度蜘蛛池,包括选择合适的网站、优化链接结构、定期更新内容等关键步骤。通过实施该教程,
揭秘SEO快排技巧,高效提升网站排名秘籍
SEO快排技术通过优化网站结构、关键词布局、外链建设等手段,实现快速提升网站排名。通过掌握快排技术,网站可在短时间内获得良好的搜索引擎排名,提高网站曝光度和流量。本文将深入解析SEO快排技术,助您快速提升网站排名。随着互联网的飞
廊坊核心词SEO策略,精准引流与网站排名提升之道
廊坊核心词SEO渠道策略主要聚焦于精准关键词优化,通过分析市场及用户需求,合理布局关键词,结合内容营销、外部链接建设等手段,实现高效引流。通过优化网站结构、提升用户体验,助力网站在搜索引擎中取得更佳排名。随着互联网的快速发展
百度蜘蛛池收录:小旋风蜘蛛池使用指南,轻松实现高效SEO优化
小旋风蜘蛛池使用指南助力高效SEO优化,轻松提升网站收录。通过本指南,掌握蜘蛛池操作技巧,优化网站排名,实现快速提升网站流量。本文目录导读:小旋风蜘蛛池简介小旋风蜘蛛池安装与配置小旋风蜘蛛池使用方法注意事项随着互联网的快速发
大厂出品!百度大字版的适老化设计实战复盘
当前,我们正面临老龄化问题的严峻挑战。统计表明,中国的老龄化人口已达到 2.64 亿,且这一数据仍在持续增长,而老年人在生活、情感上都面临诸多问题。首先,老年人在视觉、听觉、肢体、认知方面都出现了不同程度的退化,无法平等地获取信
网站优化(SEO)的10大误区
前段时间大前端也有关于SEO的文章贡献给广大读者,今日,再发一文,网站优化(SEO)的10大误区。很多新手站长初次接触SEO,感受到SEO 的无穷魅力,想要做一位优秀的SEOer,然而新手朋友在
视频搬运,自媒体批量下载短视频,伪原创生成工具
初学者做二剪,首先要了解这些难题,抖音原创视频如何一次性全部下载无水印,视频剪辑如何避免搬运导致的伪原创?如何将视频画面进行批量翻转,那么用什么工具好?快手类搞笑短片我可以使用哪些软件收集,搬运短片怎么做成原创?西瓜视频如
对temu的产品联盟链接数据进行采集和分析
在电商领域,数据采集与分析的重要性 在如今竞争激烈的电商环境中,精准的数据采集与分析已经成为企业成功的关键之一。通过有效的数据处理,企业可以深入了解市场需求、优化产品展示,甚至预测消费者行为。本文将
chat ai智能聊天助手 chat ai万能助手与chat gpt区别?
Chat AI万能助手和Chat GPT都是聊天机器人的类型。它们的主要区别在于以下几个方面:1. 技术原理:Chat AI万能助手主要采用人工智能技术,通过规则系统、语义理解等方法进行问答交互。而Chat GPT则采用了深度学习技术,使用海量的文本语料
相关文章
推荐文章
发表评论
0评