Come riconoscere se un testo è stato generato da un modello GPT3 o ChatGPT o da una IA?

Esistono diversi modi per determinare se un contenuto è stato generato utilizzando un modello linguistico come GPT3 o ChatGPT, o uno strumento come Jasper.ai, Writesonic o Copy.ai.

Alcuni metodi che potrebbero essere utilizzati sono:

  • Verifica di alcune caratteristiche comuni o modelli linguistici nel testo generato dalla macchina, ad esempio il testo generato dall’IA potrebbe avere livelli più elevati di ripetitività o mancare della complessità e della variabilità del testo scritto dall’uomo. Ricerca di modelli nel testo che sono specifici di un determinato modello, ad esempio i modelli GPT3 tendono a generare frasi più brevi rispetto al testo scritto da esseri umani. Verifica di caratteristiche o modelli linguistici nel testo generato dalla macchina.
  • Verifica della formattazione specifica o delle caratteristiche strutturali comuni nel testo generato dalla macchina, per esempio, il testo generato dall’IA potrebbe avere una struttura più uniforme o mancare della varietà di formattazione tipica del testo scritto dall’uomo. A volte sembrano “troppo belli per essere veri”. Anche se questo diventa eccessivamente difficile quando si tratta di un modello che genera testi con un livello di complessità estremamente elevato. In un articolo pubblicato su arXiv nel 2017, i ricercatori dell’Università di Stanford hanno dimostrato di poter generare recensioni false di film indistinguibili da quelle scritte da esseri umani. I recensori creati per questo progetto sono stati addestrati su oltre 10 milioni di recensioni di film IMDB e poi valutati rispetto alle valutazioni umane sullo stesso set di dati. I risultati hanno dimostrato che le recensioni generate dall’intelligenza artificiale hanno ottenuto un punteggio superiore a quelle scritte dagli esseri umani in termini di coinvolgimento e sentiment. Immaginiamo ora con l’avvento di AI cosí avanzate.
  • Confronto del contenuto con esempi noti di testo generato automaticamente. Questo può essere fatto manualmente o utilizzando tecniche di apprendimento automatico per analizzare il contenuto e determinare la sua probabilità di essere generato da una macchina. Rilevamento di indizi specifici che indicano che il contenuto è stato generato da una macchina. Tra questi, l’uso eccessivo di parole comuni, una sintassi e una punteggiatura insolite, una capitalizzazione e un’ortografia non corrette e una grammatica scadente.
  • Controllo di alcune parole o frasi chiave comunemente usate nel testo generato dall’IA. Esistono modelli statisticamente significativi, noti e rilevabili, delle combinazioni di parole scelte da un modello come il GPT3. Queste combinazioni di parole possono essere utilizzate per addestrare un classificatore in grado di rilevare se una recensione è scritta da un uomo o meno. Questo tipo di controllo è un modo efficace per ridurre il rischio di utilizzare l’intelligenza artificiale in settori sensibili come il giornalismo, dove i lettori hanno bisogno di garanzie che le loro opinioni non vengano manipolate dagli algoritmi.


Strumenti di mia conoscenza per l’individuazione di testi generati da una AI

  • GPTZero è uno strumento molto nuovo, molto pubblicizzato e sovraccarico con un approccio documentato, ma ancora basato su GPT-2.
  • Originality.ai si definisce “Un controllo antiplagio e un rilevatore di intelligenza artificiale creato per editori di contenuti seri”
  • GPT-3 AI Content Detector uno strumento di rilevamento dei contenuti AI aiuta a identificare se il contenuto è stato scritto da un essere umano o da GPT-3 o GPT-2 o da un altro modello di intelligenza artificiale.
  • Content at Scale un tool di individuazione di contenuto generato da AI fornito da una startup che fornirà a breve un tool generativo di contenuti che dicono essere a prova di “detector” (vedremo…)
  • Grover AI detector tool che si definisce “Una difesa all’avanguardia contro le fake news neurali”
  • AI Content Detector by Crossplag. Per il momento funziona solo in lingua inglese
  • ChatGPT. Si si, avete capito bene, anche la nostra chatbot preferita è in grado di riconoscere se un testo è stato generato da una intelligenza artificiale sopratutto se quella IA è la stessa con cui state interagendo. Provare per credere…
  • Writer. Offre questo ed altri tools. Come giá visto in precedenza, molti dei servizi di intelligenza artificiale generativa, offrono deo tools per individuare testi generati da IA…. individuerá anche quelli generati dai loro tools?? Ho dei dubbi su questo…..
  • Zerogpt Segnalatomi da Adamo Romano amministratore di Fatti di AI

Cosa penso io dei contenuti generati da una IA?

Come utilizzatore esperto di strumenti generativi intelligenza artificiale, posso affermare con certezza che è sempre più difficile distinguere il testo generato da una macchina da quello scritto dall’uomo. I modelli come GPT3 e ChatGPT sono diventati così sofisticati che producono output estremamente complessi e plausibili, rendendo difficile individuare la loro origine. Tenendo in conto poi che GPT4 è alle porte.

Personalmente, credo che in futuro potrebbe essere necessario stabilire una “filigrana” comune obbligatoria per tutte le AI generative che identifichi in modo univoco i testi generati dalle macchine, al fine di facilitare la loro rilevazione sopratutto in settori sensibili, salute, informazione giornalistica, etc.

Ciononostante, non credo che questi generatori di testi verranno penalizzati dai motori di ricerca, purché forniscano contenuti rilevanti ed utili agli intenti di ricerca degli utenti. In fondo, l’importante è che il contenuto sia di qualità e soddisfi le esigenze dell’utente, indipendentemente dal fatto che sia stato scritto da un essere umano o generato da una macchina anche se John Mueller, afferma chiaramente che i contenuti generati dall’intelligenza artificiale violano le linee guida di Google potete vedere il video qui

Voi che ne pensate? Aspetto i vostri commenti e al prossimo post!

Lascia un commento