如何發現 AI 生成的內容

已發表: 2023-01-17

好吧，機器人接管終於來了。

今天的機器人不僅僅是製造汽車或烹飪意大利面；他們進行了全面的對話和撰寫文章（與這篇文章不同）。

這是正確的。由於人工智能 (AI) 領域的一些重大突破，我們現在擁有能夠生成類似人類文本的複雜工具。

但也有 AI 內容檢測工具。

你們中的一些人對此並不感到驚訝。畢竟，人工智能撰寫的文章已經在主流媒體上發表多年了。您甚至可能在不知不覺中閱讀了其中一篇由 AI 撰寫的文章。

不同之處在於目前的複雜程度。以前，AI 內容生成工具基本上僅限於生成易於理解的主題的文章，例如股票報告或體育更新。

但如今，機器生成的內容無處不在，涵蓋了一切。

而且它與人類編寫的內容幾乎沒有區別......

或者是嗎？

讓我們找出來。

什麼是人工智能生成的內容？

人工智能生成的內容是由機器學習算法生成的任何文本、消息、文章或其他類型的內容。通常情況下，用戶可以輸入提示，引導 AI 寫下某個主題，問你一個問題，或者讓它報導一些特定的事件。

作為對提示的回應，AI 開始活躍起來並產生一些可讀、可理解且有望有效的東西。

AI 內容創建也因其能夠為一些最大的在線網站擴展內容速度而受到吹捧。

OpenAI 的最新項目 ChatGPT 就是一個例子。用該組織自己的話來說，“我們已經訓練了一個名為 ChatGPT 的模型，它以對話方式進行交互。對話形式使 ChatGPT 可以回答後續問題、承認錯誤、挑戰不正確的前提並拒絕不適當的請求。”

它是如何工作的？

ChatGPT 語言模型同時使用監督學習和強化學習，但它更多地使用強化學習，依靠人類反饋來微調自身。基本上，它在幾乎無限數量的上下文中觀察並嘗試模仿人類語言的例子；然後，它與人類“互動”，人類可以引導它獲得更可接受和更理想的語言輸出。數以百萬計的微小反饋循環幫助 AI 模型“理解”語言，它掌握語言的使用只是時間問題。

正如我們將看到的，這不是“真正的”精通。

在這種情況下，AI 對主題沒有大腦理解，儘管在局外人看來可能是這樣。人工智能並沒有真正思考它所說的內容，也沒有在處理主題時執行任何高級認知功能。

相反，AI 只是簡單地觀察和模仿它看到的模式，這些模式在整個網絡以及與之交互的用戶的提示和響應中都被複製。

在數十億個例子之後，人工智能模仿傳統的英語句子結構變得輕而易舉，完全恰當地使用名詞、動詞和形容詞。

在數十億個例子和一些特定上下文的信息之後，它可以寫出幾段關於工業革命發生的原因和方式的簡短段落。

當然，ChatGPT 只是人工智能生成內容應用的一個例子。事實上，隨著企業家和顛覆性創新者競相看誰能為這項新技術提出最有利可圖的應用，我們將在未來幾年看到 AI 內容生成工具的爆炸式增長。

我們可能會看到專門針對個別用例的工具，例如在特定類別中生成新聞報導、為 SEO 撰寫文章、撰寫大學論文，甚至生成商業電子郵件。

多麼適合成為人類作家的時代。或讀者。

為什麼人工智能生成的內容是個問題

拋開一些關於我自己工作不安全的開玩笑，可以公平地說，人工智能生成的內容有可能存在問題，而且不止一個領域。

考慮這一小部分可能性。

學術不端。 學術界已經對學生使用 AI 生成論文、回答家庭作業等的可能性感到震驚。如果不可能，甚至很難區分學生撰寫的論文和機器生成的論文之間的區別，我們如何確定我們對學生進行了適當的評分和獎勵？你現在可以僅僅因為知道如何有效地使用 ChatGPT 就獲得英語等領域的學位嗎？
內容垃圾郵件。 內容垃圾郵件是另一個潛在問題。多年來，搜索引擎優化 (SEO) 行業一直嚴重依賴人類作家的工作。編寫站內內容、站外內容和建立反向鏈接可以建立網站的權威性，並使其在搜索引擎中排名更高。即使有能幹的人來寫作，網絡也因激進的內容生產而超載。到處都是蓬鬆的文章和宣傳片，它們提供的信息很少，但服務於 SEO。當營銷人員可以在幾秒鐘內生成整篇文章時，問題只會變得更糟。
不准確和假新聞。 ChatGPT 是專門開發的，帶有保護措施，以防止其受到偏見或報告不准確信息的影響。但這些保障措施的可靠性如何？它們能否適用於所有 AI 內容生成工具？無論如何，不准確和假新聞是一個合理的問題。

如何發現 AI 生成的內容：高級

那麼，如何發現 AI 生成的內容呢？

它與人類書面文本有何不同？

我們將從高級方法開始。

您可以嘗試使用工具或手動方法檢測 AI 生成的內容。使用基於工具的方法，您將需要一個特定的應用程序，該應用程序經過設計和編程以識別和測量一段內容已由機器編寫的潛在信號。在手動方法中，您將使用自己的盡職調查和常識來完成工作。

在這兩種情況下，您的成功都取決於您檢測模式的能力。請記住，AI 內容生成工具可能看起來像人類一樣富有創造力和深思熟慮，但它們的方法非常數學化並且基於現有模式。因此，仔細檢查他們製作的內容會揭示他們研究的模式。

注意到 AI 生成內容的一個怪癖或特徵不足以明確證明一段內容是由機器編寫的。但是，如果你開始注意到多個特徵，並且這些信號在整篇文章中都是一致的，你就可以得出結論，這篇文章可能是由 AI 撰寫的——或者至少，它是由一位無能的人類作者撰寫的。

如何發現 AI 生成的內容：具體策略

現在讓我們深入了解更多細節。

當然，您可以使用工具或您自己的良好判斷來識別和檢測 AI 生成的內容。但是，您在這些機器中具體尋找什麼？

這些是您可以用來區分機器編寫的內容和人類編寫的內容之間的區別的策略：

尋找重複的詞彙。

人工智能寫作工具的所有輸出都基於數百萬個不同條目的模式和平均值。他們希望盡可能遵循最常見、最普通的規則，因此他們通常只關注英語中最常見的單詞。在任何一篇文章中，無論它是由 AI 還是人類生成的，你都會發現特定的詞一遍又一遍地重複，比如“the”、“and”或“but”。

但在 AI 生成的內容中，重複更為明顯，並且它也適用於更高級別的詞彙。在人類撰寫的餐廳評論中，您可能會看到諸如“美味”、“美味”、“美味”、“令人愉快”、“美味”、“可口”甚至“性高潮”之類的詞。 AI 可能只使用其中的 1-2 個。這些描述性詞語越豐富多彩，內容就越有可能是由人類編寫的。詞彙越靜態和重複，內容就越有可能是由人工智能編寫的。

標記罕見且非常具體的詞。

同樣，如果你能找到大量罕見或非常具體的詞，你就可以排除一段內容是由 AI 編寫的可能性。大多數 AI 生成機器都不會冒險使用他們在數百萬爬取的文檔中只遇到過一次或兩次的詞。他們只會堅持使用英語中最常用的單詞，除非絕對有必要偏離。

將我的業務描述為定制的或我自己是博學的，這對我來說是自命不凡的，儘管我的 kakorrhaphiophobia 阻止了我這樣做。你可能會爭辯說這些話是完全不合情理的。但無論如何，——你永遠不會在 AI 撰寫的文章中看到這樣一段文字。

注意措辭。

普林斯頓大學 22 歲的大四學生 Edward Tian 發明了一種內容檢測工具或應用程序，可以檢測一段文本是否由 AI 編寫。其主要評價標準之一是“突發性”。

簡單來說，突發性是以句子結構變化為標誌的文本特徵，是一種檢測AI內容的工具。

當人類寫東西時，他們傾向於使用非常多樣化的句子長度和模式組合。有短句。有長句。兩者之間有句子。作為對此的演示，您可以看一下這一段；最短的句子只有 4 個單詞，而最長的句子有 26 個。你可能不會在 AI 編寫的內容中發現這種多樣性。

相反，句子往往是相似和重複的，遵循塊狀和（適當的）機器人模式。

評估語言的流暢性。

語言的流暢性是一個很難描述的概念，因為它有些主觀。但我們大多數人都能分辨出以英語為母語的人和第一次學習英語的人之間的區別，即使他們說話乾淨利落，沒有任何明顯的口音。為什麼？我們一生都在用這種語言說、聽、讀、寫，所以我們對它非常熟悉。我們了解語言的力量以及如何最好地使用它，因此我們能夠隨意利用它的力量。 AI 工具可以識別語言中的模式並重複這些模式，但由於它不理解這些模式背後的含義，因此目前無法準確複製流動性。

你如何評估這一點，並區分人工智能和人類所寫的作品之間的區別？試著想像一段內容正在被一個人大聲朗讀。閱讀它的人看起來舒服、熱情、親切嗎？或者他們說話的方式似乎有些“不對勁”？顯然，書面文字比對話文字更平淡，我們中的一些人天生就有點機械化。但結合其他一些跡象，缺乏流動性可能表明機器來源。

考慮複雜性。

這段內容是否讓你思考？它是否挑戰了您現有的任何觀念？它是否引入了任何難以理解的概念？如果其中任何一個是真的，那麼這篇文章很可能是人寫的。

目前，內容生成機器在重複事實和重新組合整個網絡上的文本片段方面表現出色。但他們不善於提出新奇的想法。人工智能內容生成器幾乎沒有能力挑戰現狀、偏離主流觀點、質疑主要假設或進行創造性思考。只有人類才能做到這一點。

當您閱讀有關您真正理解的主題或您被認為是專家的主題的文章時，最容易觀察到這種差異。您幾乎可以立即分辨出真正精通主題材料的人和從教科書中反省基本事實的人之間的區別。一件作品越複雜，它就越有可能來自人類。

搜尋俚語、成語和隱喻。

就目前而言，能夠非常隨意和說明性地使用語言是人類獨有的品質。我們當前的 AI 內容生成工具要么不夠複雜，要么不願意冒險使用俚語、成語或隱喻。

我不會以 Z 世代俚語為例來讓自己難堪。但是回想一下我的例子，人類或機器評論員將如何描述餐廳的食物；這是一個說明性的例子，也是一個簡單的例子，但它可能仍然太複雜，無法出現在人工智能編寫的一段內容的正文中。

數錯別字。

具有諷刺意味的是，當人們看到拼寫錯誤和錯誤時，他們更有可能認為這是人工智能生成的。那是因為我們有一種奇怪的偏見，即認為人類在各個方面都優於機器。但事實上，恰恰相反。

AI 算法在復製文本方面功能完美，因此如果您發現拼寫錯誤或對詞彙的嚴重誤用，您幾乎可以保證它是由人類編寫的。

在某些方面，這是可以告訴您一段內容是否由人編寫的最可靠信號。正如計算器永遠不會出現數字錯誤一樣，AI 內容生成器也永遠不會出現令人痛苦的簡單拼寫錯誤。

我想正因為如此，下一代 AI 內容生成引擎將包含允許您控制缺陷的功能；只需單擊一個按鈕，您就可以保證您的 AI 內容生成器生成的每篇文章至少包含一個拼寫錯誤，以人為地增加其真實性。

我們生活在奇怪而諷刺的時代。

如果您正在尋找底線摘要，那就是：AI 生成的內容是機械重複的、非藝術性的，並且不會犯簡單的錯誤。俚語、不同的詞彙、好的隱喻、不同的句子結構、複雜的想法和錯別字都是你正在閱讀真人所寫內容的明確標誌。

這有多重要？

在電影《銀翼殺手》 （以及大量受啟發的類似作品，如《西部世界》）中，中心主題之一是辨別什麼才是人格。如果一個複制人（銀翼殺手世界中的人造人）看起來像人，像人一樣說話，像人一樣思考，甚至感覺像人——將其標記為非人類真的那麼重要嗎？

我同意這樣的觀點，即如果 AI 可以產生與人類產生的內容在功能上相同的內容，那麼它應該受到同樣的對待。它同樣有價值，也同樣具有說明性。所以實際上，如果您很難立即分辨出這兩種生成內容之間的區別，那麼您就沒有理由跳過障礙或扮演夏洛克·福爾摩斯來解開您從這裡讀到的每段內容的作者之謎。

但與此同時，我認為宣傳和內化這樣一篇文章很重要，主要有兩個原因：

如果您知道要尋找什麼，就很容易分辨出差異。 在Blade Runner中，很難區分人和復制人。但這種困難與人類生成和人工智能生成的文本的現代比較不相匹配。事實上，作為一名擁有多年經驗的專業傳播者，我很容易指出源自 AI 的材料。那不是吹牛；它說明了這些看似複雜的工具目前是多麼簡陋。

這樣想；如果您是國際象棋的新手，您可能無法區分由一個正在做實驗的少年拼湊而成的初級 AI 和擊敗國際象棋大師加里·卡斯帕羅夫 (Gary Kasparov) 的具有里程碑意義的 IBM 超級計算機“深藍”之間的區別。但加里·卡斯帕羅夫 (Gary Kasparov) 可以毫不費力地擊敗初級人工智能。

這很重要，因為優秀的國際象棋棋手應該努力區分懶惰的人工智能和深藍。優秀的讀者應該努力分辨 ChatGPT 和超越我們最好的人類作家能力的人工智能之間的區別（儘管公平地說，與我們示例中的懶惰人工智能相比，ChatGPT 更接近深藍）。

人工智能內容生成工具有一席之地。 我在這篇文章中花了相當多的時間來貶低 AI 生成內容的實用性和性能，但事實是，這些 AI 工具確實有一席之地。它們對於教導人們、提供幫助以及推動開發人們夢寐以求的新技術可能非常有幫助。將來，他們可能會達到或超過托爾斯泰或莎士比亞的藝術性和插圖能力。

但是，如果我們對我們目前擁有的工具持批判態度並加以關注，我們只會將它們推向一個新的水平。指出 AI 內容生成的缺點將激勵這些工具的開發人員在未來彌補這些缺點。

我們已經可以看到這方面的證據。 ChatGPT 被描述為能夠“挑戰 [ing] 不正確的前提，並拒絕 [ing] 不適當的請求。” 我不禁想知道這些元素的引入是否是因為微軟推出的基於 Twitter 的人工智能聊天機器人 Tay 的災難性失敗，或類似的首次亮相技術。據記錄，Tay 被巨魔訓練成為荒謬的種族主義者和冒犯者——在不到 24 小時的時間裡，不少於此。

作為創新的支持者，我們的工作是指出當前技術的缺陷和弱點，以便我們努力開發出更好的東西。可以真正改變世界的東西。

你注意到我在上一節中做了什麼嗎？

AI 不會在其寫作中生成Blade Runner參考資料來說明一個觀點。

它也不會做出那樣的諷刺評論。或者使用諷刺這個詞。

我都是人類，寶貝。

雖然現在和未來肯定有一些 AI 寫作的迷人應用，但如果你想對你的內容營銷和 SEO 策略產生最大的影響，你需要人類作家來完成繁重的工作。

人類作家可以是專家、思想領袖和有說服力的、巧妙的溝通者。

而現在，人工智能作家無法與之匹敵。

如果您需要幫助提升您的搜索引擎優化，創建真正吸引讀者的內容或與人類專家一起制定其他數字營銷策略，那麼您來對地方了（雙關語使用 - 另一項 AI 不可能完成的任務）。立即聯繫我們進行免費諮詢！