Come individuare i contenuti generati dall'IA
Pubblicato: 2023-01-17Bene, l'acquisizione del robot è finalmente arrivata.
I robot di oggi non costruiscono solo automobili o cucinano la pasta; hanno conversazioni in piena regola e scrivono articoli (non diversamente da questo).
Giusto. Grazie ad alcune importanti scoperte nel mondo dell'intelligenza artificiale (AI), ora disponiamo di strumenti sofisticati in grado di generare testo simile a quello umano.
Ma ci sono anche strumenti di rilevamento dei contenuti AI.
Alcuni di voi non ne sono sorpresi. Dopotutto, gli articoli scritti dall'intelligenza artificiale sono stati pubblicati nelle principali fonti dei media ormai da molti anni. Probabilmente hai persino letto uno di questi articoli scritti dall'intelligenza artificiale senza nemmeno rendertene conto.
La differenza è il livello di raffinatezza presente. In precedenza, gli strumenti di generazione di contenuti AI erano fondamentalmente limitati alla produzione di articoli su argomenti facilmente digeribili, come rapporti di borsa o aggiornamenti sportivi.
Ma in questi giorni, i contenuti generati dalla macchina sono ovunque e coprono tutto.
Ed è praticamente indistinguibile dal contenuto scritto dall'uomo...
O è?
Scopriamolo.
Sommario
Che cos'è il contenuto generato dall'intelligenza artificiale?
Il contenuto generato dall'intelligenza artificiale è qualsiasi testo, messaggio, articolo o altro tipo di contenuto prodotto da un algoritmo di apprendimento automatico. In genere, un utente può inserire un prompt, guidando l'intelligenza artificiale a scrivere su un determinato argomento, ponendoti una domanda o indirizzandola a coprire un evento specifico.
In risposta alla richiesta, l'intelligenza artificiale prende vita e produce qualcosa di leggibile, comprensibile e, si spera, efficace.
La creazione di contenuti AI è stata anche pubblicizzata per la sua capacità di ridimensionare la velocità dei contenuti per alcuni dei più grandi siti Web online.
L'ultimo progetto di OpenAI, ChatGPT, ne è un esempio. Nelle stesse parole dell'organizzazione, “Abbiamo addestrato un modello chiamato ChatGPT che interagisce in modo conversazionale. Il formato del dialogo consente a ChatGPT di rispondere a domande di follow-up, ammettere i propri errori, contestare premesse errate e rifiutare richieste inappropriate.
Come funziona?
Il modello linguistico ChatGPT utilizza sia l'apprendimento supervisionato che l'apprendimento per rinforzo, sebbene utilizzi l'apprendimento per rinforzo in modo più pesante, basandosi sul feedback umano per perfezionarsi. Fondamentalmente, osserva e tenta di imitare esempi di linguaggio umano in un numero praticamente infinito di contesti; poi, “interagisce” con gli esseri umani, che possono guidarlo verso risultati linguistici più accettabili e desiderabili. Con milioni di minuscoli cicli di feedback che aiutano il modello AI a "capire" il linguaggio, è solo una questione di tempo prima che impari a padroneggiare l'uso del linguaggio.
Come vedremo, questa non è la “vera” maestria.
L'intelligenza artificiale in questo contesto non ha una comprensione cerebrale dell'argomento, anche se potrebbe sembrare così a un estraneo. L'intelligenza artificiale non sta veramente pensando a ciò che dice, né sta eseguendo alcuna funzionalità cognitiva avanzata nell'elaborazione dell'argomento.
Invece, l'intelligenza artificiale sta semplicemente osservando e imitando i modelli che vede replicati in tutto il Web e nei prompt e nelle risposte degli utenti con cui interagisce.
Dopo qualche miliardo di esempi, diventa banalmente facile per l'IA imitare le strutture delle frasi inglesi convenzionali, usando nomi, verbi e aggettivi in modo del tutto appropriato.
Dopo qualche miliardo di esempi in più e alcune informazioni specifiche sul contesto, può scrivere un breve paio di paragrafi sul perché e come è avvenuta la rivoluzione industriale.
Naturalmente, ChatGPT è solo un esempio di un'applicazione di contenuti generati dall'intelligenza artificiale. In effetti, siamo pronti a vedere un'esplosione di strumenti di generazione di contenuti AI nei prossimi anni mentre imprenditori e innovatori dirompenti gareggiano per vedere chi può trovare l'applicazione più redditizia per questa nuova tecnologia.
Probabilmente vedremo strumenti specifici per casi d'uso individuali, come la generazione di notizie all'interno di una categoria specifica, la scrittura per SEO, la scrittura di saggi universitari e persino la generazione di e-mail aziendali.
Che momento per essere uno scrittore umano. O lettore.
Perché i contenuti generati dall'intelligenza artificiale sono un problema
Lasciando da parte alcune battute ironiche che potrei fare sulla mia insicurezza lavorativa, è giusto dire che i contenuti generati dall'intelligenza artificiale hanno il potenziale per essere problematici e in più di un'area.
Considera questa piccola selezione di possibilità.
- Maleducazione accademica. Il mondo degli accademici sta già impazzendo per la possibilità che gli studenti utilizzino l'intelligenza artificiale per generare saggi, risposte per compiti a casa e altro ancora. Se è impossibile, o addirittura difficile, distinguere tra un saggio scritto da uno studente e uno generato da una macchina, come possiamo essere sicuri di valutare e premiare gli studenti in modo appropriato? Ora puoi ottenere una laurea in un campo come l'inglese solo perché sai come usare ChatGPT in modo piuttosto efficace?
- Contenuti spam. Lo spam dei contenuti è un altro potenziale problema. Per anni, l'industria dell'ottimizzazione dei motori di ricerca (SEO) ha fatto molto affidamento sul lavoro di scrittori umani. La scrittura di contenuti in loco, contenuti esterni e la creazione di backlink stabilisce l'autorità di un sito Web e gli consente di posizionarsi più in alto nei motori di ricerca. E anche con persone competenti che scrivono, il web è stato sovraccaricato di una produzione di contenuti aggressivi. Ovunque guardi, ci sono articoli soffici e pezzi promozionali che forniscono informazioni minime ma servono a uno scopo per il SEO. Il problema non farà che peggiorare quando i marketer possono generare interi articoli in pochi secondi.
- Inesattezze e fake news. ChatGPT è specificamente sviluppato con misure di sicurezza per evitare che venga influenzato da parzialità o riporti informazioni imprecise. Ma quanto saranno affidabili queste tutele? E potrebbero plausibilmente applicarsi a tutti gli strumenti di generazione di contenuti AI? In ogni caso, imprecisioni e notizie false sono una preoccupazione legittima.
Come individuare i contenuti generati dall'intelligenza artificiale: l'alto livello
Quindi, come puoi individuare i contenuti generati dall'IA?
Cosa lo rende diverso dal testo scritto umano?
Inizieremo con l'approccio di alto livello.
Puoi tentare di rilevare i contenuti generati dall'intelligenza artificiale utilizzando strumenti o un approccio manuale. Con l'approccio basato su strumenti, avrai bisogno di un'applicazione specifica che sia stata progettata e programmata per identificare e misurare potenziali segnali che un contenuto è stato scritto da una macchina. Nell'approccio manuale, utilizzerai la tua due diligence e il tuo buon senso per svolgere il lavoro.
In entrambi i contesti, il tuo successo dipenderà dalla tua capacità di rilevare schemi. Ricorda, gli strumenti di generazione di contenuti AI possono sembrare creativi e riflessivi come gli esseri umani, ma il loro approccio è estremamente matematico e basato su modelli esistenti. Di conseguenza, il contenuto che producono, quando esaminato, rivela i modelli che hanno studiato.
Notare una singola stranezza o segno distintivo del contenuto generato dall'intelligenza artificiale non è sufficiente per dimostrare definitivamente che un contenuto è stato scritto da una macchina. Ma se inizi a notare più tratti distintivi e quei segnali sono coerenti in tutto il pezzo, puoi concludere che il pezzo è stato probabilmente scritto dall'intelligenza artificiale, o almeno che è stato scritto da un autore umano incompetente.
Come individuare i contenuti generati dall'IA: tattiche specifiche
Ora scaviamo in maggiori dettagli.
Certo, puoi utilizzare uno strumento o il tuo buon senso per identificare e rilevare i contenuti generati dall'intelligenza artificiale. Ma cosa stai cercando in queste macchine, nello specifico?
Queste sono le tattiche che puoi usare per discernere la differenza tra il contenuto scritto da una macchina e il contenuto scritto da un essere umano:
Cerca un vocabolario ripetitivo.
Gli strumenti di scrittura AI basano tutto il loro output su modelli e medie su milioni di voci diverse. Vogliono seguire le regole più comuni e medie che possono, quindi in genere si concentrano solo sulle parole più comuni in lingua inglese. In qualsiasi testo scritto, sia esso generato da un'intelligenza artificiale o da un essere umano, troverai parole specifiche ripetute più e più volte, come "il", "e" o "ma".
Ma nei contenuti generati dall'intelligenza artificiale, la ripetizione è molto più evidente e si applica anche a parole di vocabolario di livello superiore. In una recensione di un ristorante scritta da un essere umano, potresti vedere parole come "delizioso", "gustoso", "delizioso", "delizioso", "delizioso", "appetibile" o anche "orgasmo". Un'intelligenza artificiale può usarne solo 1-2. Più colorate e diverse sono queste parole descrittive, più è probabile che il contenuto sia stato scritto da un essere umano. Più il vocabolario è statico e ripetitivo, più è probabile che il contenuto sia stato scritto da un'intelligenza artificiale.
Segnala parole rare e molto specifiche.
Allo stesso modo, puoi escludere la possibilità che un contenuto sia stato scritto da AI se riesci a trovare un'ampia selezione di parole rare o molto specifiche. La maggior parte delle macchine di generazione di intelligenza artificiale non correrà rischi utilizzando una parola che hanno incontrato solo una o due volte nei loro milioni di documenti sottoposti a scansione. Si atterranno solo alle parole più comunemente usate in lingua inglese a meno che non sia assolutamente necessario deviare.
Sarebbe pretenzioso da parte mia descrivere la mia attività come su misura o me stesso come erudito, anche se la mia kakorrhaphiofobia mi trattiene dal farlo. Potresti obiettare che queste parole sono perfettamente cromulent. Ma in ogni caso, non vedrai mai un paragrafo di testo come questo in un articolo scritto da AI.
Fai attenzione al fraseggio.
Edward Tian, un anziano di 22 anni della Princeton University, ha ideato uno strumento o un'app di rilevamento dei contenuti che rileva se una parte di testo è stata scritta dall'intelligenza artificiale. Uno dei suoi principali criteri di valutazione è la "rottura".
In poche parole, la raffica è una caratteristica del testo contrassegnata dalla variazione nella struttura della frase ed è uno strumento utilizzato per rilevare il contenuto AI.
Quando gli esseri umani scrivono qualcosa, tendono a usare un mix molto vario di lunghezze e schemi delle frasi. Ci sono frasi brevi. Ci sono frasi lunghe. Ci sono frasi tra i due. A dimostrazione di ciò, puoi guardare proprio questo paragrafo; la frase più breve ha solo 4 parole, mentre la più lunga ne ha 26. Probabilmente non troverai questa diversità nei contenuti scritti da un'intelligenza artificiale.
Invece, le frasi tendono ad essere simili e ripetitive, seguendo uno schema a blocchi e (opportunamente) robotico.
Valutare la fluidità del linguaggio.
La fluidità del linguaggio è un concetto difficile da descrivere perché è in qualche modo soggettivo. Ma la maggior parte di noi può distinguere tra un madrelingua inglese e qualcuno che lo sta imparando per la prima volta, anche se parlano in modo pulito e senza alcun accento distinguibile. Come mai? Abbiamo passato tutta la nostra vita a parlare, ascoltare, leggere e scrivere in questa lingua, quindi la conosciamo intimamente. Comprendiamo il potere del linguaggio e come viene utilizzato al meglio, quindi siamo in grado di attingere al suo potere con disinvoltura. Gli strumenti di intelligenza artificiale possono identificare modelli nel linguaggio e ripetere tali modelli, ma poiché non comprendono il significato dietro tali modelli, al momento non sono in grado di replicare accuratamente la fluidità.
Come puoi valutarlo e capire la differenza tra un pezzo scritto da un'intelligenza artificiale e uno scritto da un essere umano? Prova a immaginare il contenuto letto ad alta voce da un essere umano. La persona che lo legge sembra a suo agio, calorosa e riconoscibile? O qualcosa sembra "strano" nel modo in cui parlano? Ovviamente, il testo scritto è più piatto del testo conversazionale, e alcuni di noi sono naturalmente un po' robotici. Ma in combinazione con alcuni di questi altri segni rivelatori, una mancanza di fluidità può essere un'indicazione dell'origine della macchina.
Considera la complessità.
Il pezzo di contenuto ti fa pensare? Sfida qualcuna delle tue nozioni esistenti? Introduce concetti difficili da comprendere? Se qualcuno di questi è vero, il pezzo è stato probabilmente scritto da un essere umano.
Attualmente, le macchine per la generazione di contenuti sono eccellenti nel ripetere fatti e riassemblare parti di testo trovate in tutto il web. Ma sono terribili nel trovare nuove idee. I generatori di contenuti AI non hanno praticamente alcuna capacità di sfidare lo status quo, deviare dall'opinione tradizionale, mettere in discussione i presupposti principali o pensare in modo creativo. Solo gli esseri umani possono farlo.
È più facile osservare questa differenza quando stai leggendo un pezzo su un argomento che capisci veramente o su un argomento in cui sei considerato un esperto. Puoi quasi immediatamente capire la differenza tra un vero maestro del materiale oggetto e qualcuno che rigurgita fatti di base dai libri di testo. Più un pezzo è complesso, più è probabile che provenga da un essere umano.
Cerca slang, modi di dire e metafore.
Per ora, è una qualità esclusivamente umana essere in grado di usare il linguaggio in modo molto disinvolto e illustrativo. I nostri attuali strumenti di generazione di contenuti di intelligenza artificiale non sono abbastanza sofisticati o non sono disposti a correre il rischio di utilizzare gergo, modi di dire o metafore.
Non mi metterò in imbarazzo usando il gergo della Generazione Z come esempio. Ma ripensa al mio esempio su come un recensore umano o meccanico si avvicinerebbe alla descrizione del cibo in un ristorante; questo è un esempio illustrativo e semplice, ma probabilmente è ancora troppo complesso per apparire nel corpo di un contenuto scritto da un'intelligenza artificiale.
Conta gli errori di battitura.
Ironia della sorte, quando le persone vedono refusi ed errori, è più probabile che pensino che sia stato generato dall'intelligenza artificiale. Questo perché abbiamo questo strano pregiudizio di presumere che gli umani siano migliori delle macchine in ogni modo. Ma in realtà, è vero il contrario.
Gli algoritmi di intelligenza artificiale sono funzionalmente perfetti per replicare il testo, quindi se trovi un errore di ortografia o un grave uso improprio di una parola del vocabolario, puoi quasi garantire che sia stato scritto da un essere umano.
In un certo senso, questo è il segnale più affidabile che può dirti se un contenuto è stato scritto da un essere umano. Proprio come i calcolatori non commettono mai errori numerici, i generatori di contenuti AI non fanno mai errori di battitura dolorosamente semplici.
Immagino che a causa di ciò, la prossima generazione di motori di generazione di contenuti AI includerà funzionalità che ti consentiranno di controllare le imperfezioni; con il clic di un pulsante, puoi garantire che ogni articolo prodotto dal tuo generatore di contenuti AI includa almeno un errore di ortografia per aumentarne artificialmente l'autenticità.
Viviamo in tempi strani e ironici.
Se stai cercando un riassunto di fondo, è questo: i contenuti generati dall'intelligenza artificiale sono roboticamente ripetitivi, non artistici e incapaci di commettere errori semplici. Slang, parole di vocabolario diverse, buone metafore, strutture di frasi diverse, idee complesse ed errori di battitura sono tutti segni sicuri che stai leggendo qualcosa scritto da una persona reale.
Quanto è importante questo?
Nel film Blade Runner (e tonnellate di opere ispirate simili come Westworld ), uno dei temi centrali è discernere ciò che conta come persona. Se un replicante (una persona artificiale nel mondo di Blade Runner ) sembra un essere umano, parla come un essere umano, pensa come un essere umano e si sente persino come un essere umano, è davvero così importante etichettarlo come non umano?
Sono d'accordo con l'idea che se un'intelligenza artificiale può produrre contenuti funzionalmente identici ai contenuti prodotti dagli esseri umani, dovrebbe essere trattata allo stesso modo. È altrettanto prezioso ed è altrettanto illustrativo. Quindi realisticamente, se fai fatica a capire immediatamente la differenza tra questi due tipi di contenuto generato, non c'è motivo per te di fare i salti mortali o giocare a Sherlock Holmes per risolvere il mistero di chi ha scritto ogni pezzo di contenuto che leggi da qui in avanti.
Ma allo stesso tempo, penso che sia importante pubblicizzare e interiorizzare un articolo come questo, e per due motivi principali:
- È facile capire la differenza se sai cosa cercare. In Blade Runner , è estremamente difficile distinguere tra una persona e un replicante. Ma questa difficoltà non è eguagliata dai confronti moderni tra testo generato dall'uomo e generato dall'intelligenza artificiale. In effetti, come comunicatore professionista con molti anni di esperienza, è banalmente facile per me indicare materiale originato dall'intelligenza artificiale. Non è un vanto; è un esempio di quanto rudimentali siano attualmente questi strumenti apparentemente sofisticati.
Pensare in questo modo; se sei relativamente nuovo nel gioco degli scacchi, probabilmente non saresti in grado di distinguere tra un'intelligenza artificiale rudimentale messa insieme da un adolescente sperimentatore e Deep Blue, il supercomputer IBM di riferimento che ha battuto il grande maestro Gary Kasparov. Ma Gary Kasparov non avrebbe problemi a sconfiggere l'intelligenza artificiale rudimentale.
Questo è importante perché i buoni giocatori di scacchi dovrebbero sforzarsi di capire la differenza tra un'intelligenza artificiale pigra e Deep Blue. E i bravi lettori dovrebbero sforzarsi di capire la differenza tra ChatGPT e un'intelligenza artificiale che supera le capacità dei nostri migliori scrittori umani (anche se, per essere onesti, ChatGPT è molto più vicino a Deep Blue rispetto alla pigra IA nel nostro esempio).
- Gli strumenti di generazione di contenuti AI hanno un posto. Ho trascorso una discreta quantità di tempo in questo articolo denigrando l'utilità e le prestazioni dei contenuti generati dall'intelligenza artificiale, ma la realtà è che questi strumenti di intelligenza artificiale hanno un posto. Potrebbero essere incredibilmente utili per insegnare alle persone, fornire aiuto e consentire lo sviluppo di nuove tecnologie che nessuno ha ancora sognato. In futuro, potrebbero essere in grado di eguagliare o superare l'abilità artistica e l'abilità illustrativa di Tolstoj o Shakespeare.
Ma li porteremo a quel livello successivo solo se saremo critici e attenti agli strumenti che abbiamo attualmente. Sottolineare le carenze della generazione di contenuti AI motiverà gli sviluppatori di questi strumenti a colmare tali carenze in futuro.
Possiamo già vederne le prove. ChatGPT è descritto come in grado di "sfidare [ing] premesse errate e rifiutare [ing] richieste inappropriate". E non posso fare a meno di chiedermi se questi elementi siano stati introdotti a causa del disastroso fallimento di Tay, un chatbot di intelligenza artificiale basato su Twitter lanciato da Microsoft, o simili tecnologie di debutto. Tay, per la cronaca, è stato addestrato dai troll a diventare assurdamente razzista e offensivo - in meno di 24 ore, nientemeno.
È nostro compito come sostenitori dell'innovazione sottolineare i difetti e le debolezze delle tecnologie attuali in modo da poterci sforzare di sviluppare qualcosa di ancora migliore. Qualcosa che potrebbe davvero cambiare il mondo.
Hai notato cosa ho fatto nella sezione precedente?
Un'intelligenza artificiale non genererà riferimenti a Blade Runner nella sua scrittura per illustrare un punto.
Inoltre, non farà commenti sardonici del genere. Oppure usa la parola sardonico.
Sono tutto umano, piccola.
E mentre ci sono certamente alcune applicazioni affascinanti per la scrittura di AI sia ora che in futuro, se vuoi avere il massimo impatto con la tua strategia di content marketing e SEO, hai bisogno di scrittori umani per fare il lavoro pesante.
Gli scrittori umani possono essere esperti, leader di pensiero e comunicatori persuasivi e abili.
E per ora, uno scrittore di intelligenza artificiale non può eguagliarlo.
Se hai bisogno di aiuto per elevare il tuo SEO, per creare contenuti che coinvolgano veramente i lettori o altre strategie di marketing digitale con esperti umani, sei arrivato nel posto di scrittura (uso del gioco di parole - ancora un altro compito impossibile per l'IA). Contattaci per una consulenza gratuita oggi stesso!