如何发现 AI 生成的内容
已发表: 2023-01-17好吧,机器人接管终于来了。
今天的机器人不仅仅是制造汽车或烹饪意大利面; 他们进行了全面的对话和撰写文章(与这篇文章不同)。
这是正确的。 由于人工智能 (AI) 领域的一些重大突破,我们现在拥有能够生成类似人类文本的复杂工具。
但也有 AI 内容检测工具。
你们中的一些人对此并不感到惊讶。 毕竟,人工智能撰写的文章已经在主流媒体上发表多年了。 您甚至可能在不知不觉中阅读了其中一篇由 AI 撰写的文章。
不同之处在于目前的复杂程度。 以前,AI 内容生成工具基本上仅限于生成易于理解的主题的文章,例如股票报告或体育更新。
但如今,机器生成的内容无处不在,涵盖了一切。
而且它与人类编写的内容几乎没有区别......
或者是吗?
让我们找出来。
目录
什么是人工智能生成的内容?

人工智能生成的内容是由机器学习算法生成的任何文本、消息、文章或其他类型的内容。 通常情况下,用户可以输入提示,引导 AI 写下某个主题,问你一个问题,或者让它报道一些特定的事件。
作为对提示的回应,AI 开始活跃起来并产生一些可读、可理解且有望有效的内容。
AI 内容创建也因其能够为一些最大的在线网站扩展内容速度而受到吹捧。
OpenAI 的最新项目 ChatGPT 就是一个例子。 用该组织自己的话来说,“我们已经训练了一个名为 ChatGPT 的模型,它以对话方式进行交互。 对话形式使 ChatGPT 可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。”
它是如何工作的?
ChatGPT 语言模型同时使用监督学习和强化学习,但它更多地使用强化学习,依靠人类反馈来微调自身。 基本上,它在几乎无限数量的上下文中观察并尝试模仿人类语言的例子; 然后,它与人类“互动”,人类可以引导它获得更可接受和更理想的语言输出。 数以百万计的微小反馈循环帮助 AI 模型“理解”语言,它掌握语言的使用只是时间问题。
正如我们将看到的,这不是“真正的”精通。
在这种情况下,AI 对主题没有大脑理解,尽管在局外人看来可能是这样。 人工智能并没有真正思考它所说的内容,也没有在处理主题时执行任何高级认知功能。
相反,AI 只是简单地观察和模仿它看到的模式,这些模式在整个网络以及与之交互的用户的提示和响应中都被复制。
在数十亿个例子之后,人工智能模仿传统的英语句子结构变得轻而易举,完全恰当地使用名词、动词和形容词。
在数十亿个例子和一些特定上下文的信息之后,它可以写出几段关于工业革命发生的原因和方式的简短段落。
当然,ChatGPT 只是人工智能生成内容应用的一个例子。 事实上,随着企业家和颠覆性创新者竞相看谁能为这项新技术提出最有利可图的应用,我们将在未来几年看到 AI 内容生成工具的爆炸式增长。
我们可能会看到专门针对个别用例的工具,例如在特定类别中生成新闻报道、为 SEO 撰写文章、撰写大学论文,甚至生成商业电子邮件。
多么适合成为人类作家的时代。 或读者。
为什么人工智能生成的内容是个问题

抛开一些关于我自己工作不安全的开玩笑,可以公平地说,人工智能生成的内容有可能存在问题,而且不止一个领域。
考虑这一小部分可能性。
- 学术不端。 学术界已经对学生使用 AI 生成论文、回答家庭作业等的可能性感到震惊。 如果不可能,甚至很难区分学生撰写的论文和机器生成的论文之间的区别,我们如何确定我们对学生进行了适当的评分和奖励? 你现在可以仅仅因为知道如何有效地使用 ChatGPT 就获得英语等领域的学位吗?
- 内容垃圾邮件。 内容垃圾邮件是另一个潜在问题。 多年来,搜索引擎优化 (SEO) 行业一直严重依赖人类作家的工作。 编写站内内容、站外内容和建立反向链接可以建立网站的权威性,并使其在搜索引擎中排名更高。 即使有能干的人来写作,网络也因激进的内容生产而超载。 到处都是蓬松的文章和宣传片,它们提供的信息很少,但服务于 SEO。 当营销人员可以在几秒钟内生成整篇文章时,问题只会变得更糟。
- 不准确和假新闻。 ChatGPT 是专门开发的,带有保护措施,以防止其受到偏见或报告不准确信息的影响。 但这些保障措施的可靠性如何? 它们能否适用于所有 AI 内容生成工具? 无论如何,不准确和假新闻是一个合理的问题。
如何发现 AI 生成的内容:高级
那么,如何发现 AI 生成的内容呢?
它与人类书面文本有何不同?
我们将从高级方法开始。
您可以尝试使用工具或手动方法检测 AI 生成的内容。 使用基于工具的方法,您将需要一个特定的应用程序,该应用程序经过设计和编程以识别和测量一段内容已由机器编写的潜在信号。 在手动方法中,您将使用自己的尽职调查和常识来完成工作。
在这两种情况下,您的成功都取决于您检测模式的能力。 请记住,AI 内容生成工具可能看起来像人类一样富有创造力和深思熟虑,但它们的方法非常数学化并且基于现有模式。 因此,仔细检查他们制作的内容会揭示他们研究的模式。
注意到 AI 生成内容的一个怪癖或特征不足以明确证明一段内容是由机器编写的。 但是,如果你开始注意到多个特征,并且这些信号在整篇文章中都是一致的,你就可以得出结论,这篇文章可能是由 AI 撰写的——或者至少,它是由一位无能的人类作者撰写的。
如何发现 AI 生成的内容:具体策略
现在让我们深入了解更多细节。

当然,您可以使用工具或您自己的良好判断来识别和检测 AI 生成的内容。 但是,您在这些机器中具体寻找什么?
这些是您可以用来区分机器编写的内容和人类编写的内容之间的区别的策略:
寻找重复的词汇。
人工智能写作工具的所有输出都基于数百万个不同条目的模式和平均值。 他们希望尽可能遵循最常见、最普通的规则,因此他们通常只关注英语中最常见的单词。 在任何一篇文章中,无论它是由 AI 还是人类生成的,你都会发现特定的词一遍又一遍地重复,比如“the”、“and”或“but”。
但在 AI 生成的内容中,重复更为明显,并且它也适用于更高级别的词汇。 在人类撰写的餐厅评论中,您可能会看到诸如“美味”、“美味”、“美味”、“令人愉快”、“美味”、“可口”甚至“性高潮”之类的词。 AI 可能只使用其中的 1-2 个。 这些描述性词语越丰富多彩,内容就越有可能是由人类编写的。 词汇越静态和重复,内容就越有可能是由人工智能编写的。
标记罕见且非常具体的词。
同样,如果你能找到大量罕见或非常具体的词,你就可以排除一段内容是由 AI 编写的可能性。 大多数 AI 生成机器都不会冒险使用他们在数百万爬取的文档中只遇到过一次或两次的词。 他们只会坚持使用英语中最常用的单词,除非绝对有必要偏离。
将我的业务描述为定制的或我自己是博学的,这对我来说是自命不凡的,尽管我的 kakorrhaphiophobia 阻止了我这样做。 你可能会争辩说这些话是完全不合情理的。 但无论如何,——你永远不会在 AI 撰写的文章中看到这样一段文字。
注意措辞。
普林斯顿大学 22 岁的大四学生 Edward Tian 发明了一种内容检测工具或应用程序,可以检测一段文本是否由 AI 编写。 其主要评价标准之一是“突发性”。
简单来说,突发性是以句子结构变化为标志的文本特征,是一种检测AI内容的工具。
当人类写东西时,他们倾向于使用非常多样化的句子长度和模式组合。 有短句。 有长句。 两者之间有句子。 作为对此的演示,您可以看一下这一段; 最短的句子只有 4 个单词,而最长的句子有 26 个。你可能不会在 AI 编写的内容中发现这种多样性。
相反,句子往往是相似和重复的,遵循块状和(适当的)机器人模式。
评估语言的流畅性。
语言的流畅性是一个很难描述的概念,因为它有些主观。 但我们大多数人都能分辨出以英语为母语的人和第一次学习英语的人之间的区别,即使他们说话干净利落,没有任何明显的口音。 为什么? 我们一生都在用这种语言说、听、读、写,所以我们对它非常熟悉。 我们了解语言的力量以及如何最好地使用它,因此我们能够随意利用它的力量。 AI 工具可以识别语言中的模式并重复这些模式,但由于它不理解这些模式背后的含义,因此目前无法准确复制流动性。
你如何评估这一点,并区分人工智能和人类所写的作品之间的区别? 试着想象一段内容正在被一个人大声朗读。 阅读它的人看起来舒服、热情、亲切吗? 或者他们说话的方式似乎有些“不对劲”? 显然,书面文字比对话文字更平淡,我们中的一些人天生就有点机械化。 但结合其他一些迹象,缺乏流动性可能表明机器来源。
考虑复杂性。
这段内容是否让你思考? 它是否挑战了您现有的任何观念? 它是否引入了任何难以理解的概念? 如果其中任何一个是真的,那么这篇文章很可能是人写的。
目前,内容生成机器在重复事实和重新组合整个网络上的文本片段方面表现出色。 但他们不善于提出新奇的想法。 人工智能内容生成器几乎没有能力挑战现状、偏离主流观点、质疑主要假设或进行创造性思考。 只有人类才能做到这一点。
当您阅读有关您真正理解的主题或您被认为是专家的主题的文章时,最容易观察到这种差异。 您几乎可以立即分辨出真正精通主题材料的人和从教科书中反省基本事实的人之间的区别。 一件作品越复杂,它就越有可能来自人类。
搜寻俚语、成语和隐喻。

就目前而言,能够非常随意和说明性地使用语言是人类独有的品质。 我们当前的 AI 内容生成工具要么不够复杂,要么不愿意冒险使用俚语、成语或隐喻。
我不会以 Z 世代俚语为例来让自己难堪。 但是回想一下我的例子,人类或机器评论员将如何描述餐厅的食物; 这是一个说明性的例子,也是一个简单的例子,但它可能仍然太复杂,无法出现在人工智能编写的一段内容的正文中。
数错别字。
具有讽刺意味的是,当人们看到拼写错误和错误时,他们更有可能认为这是人工智能生成的。 那是因为我们有一种奇怪的偏见,即认为人类在各个方面都优于机器。 但事实上,恰恰相反。
AI 算法在复制文本方面功能完美,因此如果您发现拼写错误或对词汇的严重误用,您几乎可以保证它是由人类编写的。
在某些方面,这是可以告诉您一段内容是否由人编写的最可靠信号。 正如计算器永远不会出现数字错误一样,AI 内容生成器也永远不会出现令人痛苦的简单拼写错误。
我想正因为如此,下一代 AI 内容生成引擎将包含允许您控制缺陷的功能; 只需单击一个按钮,您就可以保证您的 AI 内容生成器生成的每篇文章至少包含一个拼写错误,以人为地增加其真实性。
我们生活在奇怪而讽刺的时代。
如果您正在寻找底线摘要,那就是:AI 生成的内容是机械重复的、非艺术性的,并且不会犯简单的错误。 俚语、不同的词汇、好的隐喻、不同的句子结构、复杂的想法和错别字都是你正在阅读真人所写内容的明确标志。
这有多重要?
在电影《银翼杀手》 (以及大量受启发的类似作品,如《西部世界》)中,中心主题之一是辨别什么才是人格。 如果一个复制人(银翼杀手世界中的人造人)看起来像人,像人一样说话,像人一样思考,甚至感觉像人——将其标记为非人类真的那么重要吗?
我同意这样的观点,即如果 AI 可以产生与人类产生的内容在功能上相同的内容,那么它应该受到同样的对待。 它同样有价值,也同样具有说明性。 所以实际上,如果您很难立即分辨出这两种生成内容之间的区别,那么您就没有理由跳过障碍或扮演夏洛克·福尔摩斯来解开您从这里读到的每段内容的作者之谜。
但与此同时,我认为宣传和内化这样一篇文章很重要,主要有两个原因:
- 如果您知道要寻找什么,就很容易分辨出差异。 在Blade Runner中,很难区分人和复制人。 但这种困难与人类生成和人工智能生成的文本的现代比较不相匹配。 事实上,作为一名拥有多年经验的专业传播者,我很容易指出源自 AI 的材料。 那不是吹牛; 它说明了这些看似复杂的工具目前是多么简陋。
这样想; 如果您是国际象棋的新手,您可能无法区分由一个正在做实验的少年拼凑而成的初级 AI 和击败国际象棋大师加里·卡斯帕罗夫 (Gary Kasparov) 的具有里程碑意义的 IBM 超级计算机“深蓝”之间的区别。 但加里·卡斯帕罗夫 (Gary Kasparov) 可以毫不费力地击败初级人工智能。
这很重要,因为优秀的国际象棋棋手应该努力区分懒惰的人工智能和深蓝。 优秀的读者应该努力分辨 ChatGPT 和超越我们最好的人类作家能力的人工智能之间的区别(尽管公平地说,与我们示例中的懒惰人工智能相比,ChatGPT 更接近深蓝)。
- 人工智能内容生成工具有一席之地。 我在这篇文章中花了相当多的时间来贬低 AI 生成内容的实用性和性能,但事实是,这些 AI 工具确实有一席之地。 它们对于教导人们、提供帮助以及推动开发人们梦寐以求的新技术可能非常有帮助。 将来,他们可能会达到或超过托尔斯泰或莎士比亚的艺术性和插图能力。
但是,如果我们对我们目前拥有的工具持批判态度并加以关注,我们只会将它们推向一个新的水平。 指出 AI 内容生成的缺点将激励这些工具的开发人员在未来弥补这些缺点。
我们已经可以看到这方面的证据。 ChatGPT 被描述为能够“挑战 [ing] 不正确的前提,并拒绝 [ing] 不适当的请求。” 我不禁想知道这些元素的引入是否是因为微软推出的基于 Twitter 的人工智能聊天机器人 Tay 的灾难性失败,或类似的首次亮相技术。 据记录,Tay 被巨魔训练成为荒谬的种族主义者和冒犯者——在不到 24 小时的时间里,不少于此。
作为创新的支持者,我们的工作是指出当前技术的缺陷和弱点,以便我们努力开发出更好的产品。 可以真正改变世界的东西。
你注意到我在上一节中做了什么吗?
AI 不会在其写作中生成Blade Runner参考资料来说明一个观点。
它也不会做出那样的讽刺评论。 或者使用讽刺这个词。
我都是人类,宝贝。
虽然现在和未来肯定有一些 AI 写作的迷人应用,但如果你想对你的内容营销和 SEO 策略产生最大的影响,你需要人类作家来完成繁重的工作。
人类作家可以是专家、思想领袖和有说服力的、巧妙的沟通者。
而现在,人工智能作家无法与之匹敌。
如果您需要帮助提升您的搜索引擎优化,创建真正吸引读者的内容或与人类专家一起制定其他数字营销策略,那么您来对地方了(双关语使用 - 另一项 AI 不可能完成的任务)。 立即联系我们进行免费咨询!