Sviluppato da OpenAI, è stato addestrato a partire dai modelli Instruct GPT ed è in grado di generare testi di varia lunghezza e complessità in base alle richieste dell’utilizzatore. L’applicazione può essere utilizzata attualmente per diversi scopi: instaurare un modello di conversazione, scrivere email e messaggi commerciali, redigere descrizioni di prodotti, creare contenuti per i social e compilare script di codice con una certa affidabilità.
La qualità degli output prodotti è sorprendente, tanto da giustificare l’idea di utilizzarlo a fini SEO, ma ci sono diversi aspetti da comprendere prima di prendere in considerazione il suo utilizzo per queste attività.
A cosa serve ChatGPT
ChatGPT è utilizzato principalmente per generare testo in modo autonomo in base ai prompt forniti. Può essere utilizzato in molti ambiti diversi, tra cui:
Generazione di testo: ChatGPT può essere utilizzato per generare testo scritto in modo autonomo, come racconti, articoli, e-mail e molto altro.
Risposta alle domande: ChatGPT può essere utilizzato per rispondere alle domande degli utenti in modo autonomo, come in un assistente virtuale.
Traduzione automatica: ChatGPT può essere utilizzato per tradurre il testo da una lingua all’altra.
Generazione di codice: ChatGPT può essere utilizzato per generare codice in modo autonomo, semplificando il processo di sviluppo per gli sviluppatori.
Creazione di chatbot: ChatGPT può essere utilizzato per creare chatbot in grado di interagire con gli utenti in modo autonomo.
Creazione di assistenti vocali: ChatGPT può essere utilizzato per creare assistenti vocali in grado di comprendere e rispondere alle richieste degli utenti in modo autonomo.
Per generare testi con ChatGPT è necessario fornire un prompt al modello: il prompt è il testo di input che viene fornito per generare il testo in uscita e può essere qualsiasi cosa: una frase di partenza per scrivere un articolo o un racconto o una domanda per la quale si vuole ottenere una risposta.
Può quindi trattarsi di una singola frase o di un paragrafo intero, a seconda delle esigenze specifiche (per esempio, un prompt può essere la richiesta di revisionare un testo alla ricerca di errori).
Inoltre, il prompt può essere utilizzato per generare testo continuando una storia o un discorso già esistente, in modo da generare testi più coerenti e plausibili. In generale, più è preciso e specifico, più preciso e specifico sarà il testo generato da ChatGPT.
Source: openai.com
In che modo ChatGPT riesce a fare quello che fa
ChatGPT è un modello di apprendimento automatico chiamato Large Learning Model.
Un modello di apprendimento di grandi dimensioni è un’intelligenza artificiale addestrata su grandi quantità di dati in grado di prevedere la parola successiva in una frase.
Più dati sono disponibili per l’addestramento, migliore sarà il risultato: a volte i modelli linguistici di grandi dimensioni sviluppano capacità inaspettate.
L’Università di Stanford, infatti, ha documentato come un aumento dei dati di addestramento abbia permesso a GPT-3 di tradurre un testo dall’inglese al francese, anche se non era stato addestrato specificamente per questo compito.
I grandi modelli linguistici come GPT-3 (e GPT-3.5, che è alla base di ChatGPT) non sono infatti addestrati per svolgere compiti specifici, ma vengono addestrati con un’ampia gamma di conoscenze che possono poi applicare ad altri domini.
Il processo è molto simile al modo in cui impariamo noi esseri umani. Per esempio, impariamo i fondamenti della falegnameria, possiamo applicare quelle conoscenze per costruire un tavolo, anche se non ci è mai stato insegnato specificamente come farlo.
Il GPT-3 funziona dunque in modo simile al cervello umano, in quanto contiene conoscenze generali che possono essere applicate a più compiti.
ChatGPT incorpora un altro modello linguistico di grandi dimensioni, chiamato InstructGPT, che è stato addestrato ad accettare le indicazioni degli esseri umani e le risposte lunghe a domande complesse.
Questa capacità di seguire le istruzioni rende ChatGPT in grado di ricevere istruzioni per creare un output su praticamente qualsiasi argomento e di farlo in qualsiasi formato, rispettando i vincoli imposti, come il numero di parole e l’inclusione di punti specifici dell’argomento.
Appare ormai chiaro che ChatGPT sia in grado di scrivere contenuti testuali praticamente su qualsiasi argomento, perché è addestrato su un’ampia varietà di testi disponibili al pubblico.
Tuttavia, presenta delle limitazioni che è importante conoscere prima di decidere di utilizzarlo per un progetto SEO.
Il limite più grande è che ChatGPT non è affidabile al 100% sulle informazioni. Il motivo per cui è impreciso è che il modello si limita a prevedere quali parole dovrebbero venire dopo la parola precedente in una frase di un paragrafo su un determinato argomento. Non si preoccupa dell’accuratezza perché non è quello il suo compito specifico.
E fornire una giusta informazione dovrebbe essere la preoccupazione principale di chiunque sia interessato a creare contenuti di qualità.
#1. Quanto sono accurate le risposte di ChatGPT
La precisione delle risposte generate da ChatGPT dipende da diversi fattori, tra cui la qualità e la quantità dei dati di addestramento utilizzati per addestrare il modello, la qualità del prompt fornito e la configurazione dei parametri del modello.
In generale, quanto più grande è il dataset utilizzato per addestrare il modello, tanto più preciso sarà il modello nella generazione del testo. Inoltre, quanto più preciso e specifico è il prompt fornito, tanto più preciso sarà il testo generato. Tuttavia, alcuni ambiti possono essere più difficili da generare rispetto ad altri, come ad esempio quelli tecnici o scientifici.
In generale, si tratta uno strumento molto potente ma non è infallibile. Le risposte generate possono contenere errori o imprecisioni, quindi è importante rivedere e verificare il testo generato prima dell’utilizzo.
#2. Le limitazioni al contenuto
ChatGPT non può occuparsi e scrive di qualunque argomento: è specificamente programmato per non generare testo su argomenti violenti, sesso esplicito e contenuti dannosi (come, ad esempio, le istruzioni su come costruire un ordigno esplosivo).
#3. Non si aggiorna in tempo reale
Un’altra limitazione è che non è a conoscenza dei contenuti creati dopo il 2021. Quindi, a meno di non utilizzare ulteriori addon per integrarlo al motore di ricerca, se i contenuti che vogliamo produrre devono essere aggiornati e freschi, ChatGPT nella sua forma attuale potrebbe non essere poi così utile.
#4. Le risposte sono condizionate da bias e pregiudizi
Un limite importante da tenere presente è che è addestrato per essere utile, sincero e innocuo: sono pregiudizi intenzionali incorporati nella macchina per evitare i comportamenti negativi.
Si tratta certamente di un’impostazione con buone intenzioni, ma che non può fare a meno di modificare il risultato rispetto a quello che potrebbe idealmente essere, minando la neutralità della risposta: il bias cambia l’output producendo un testo “meno neutrale”.
#5. Richiede istruzioni dettagliate per fornire un risultato valido
ChatGPT richiede istruzioni dettagliate per produrre un contenuto di qualità: più istruzioni gli vengono fornite, più sofisticato sarà il risultato.
Questo è sia un punto di forza ma anche un limite di cui essere consapevoli: meno istruzioni ci sono nella richiesta di contenuto, più è probabile che l’output condivida un output simile con un’altra richiesta.
Il sistema è progettato per scegliere parole completamente casuali quando prevede quale dovrebbe essere la parola successiva in un articolo, quindi è logico che non si plagi da solo, ma se vogliamo ricevere in risposta un contenuto assolutamente originale e di qualità superiore, abbiamo bisogno di impiegare molto tempo nella compilazione del prompt da sottoporgli.
#6. I contenuti generati dall’AI potrebbero essere identificati dai motori di ricerca
Gli sviluppatori di Google e di altre organizzazioni hanno lavorato per molti anni su algoritmi in grado di individuare con successo i contenuti generati dall’intelligenza artificiale.
Hanno scoperto che alcune caratteristiche statistiche del testo generato dall’intelligenza artificiale, come i punteggi dell’indice di Gunning-Fog e dell’indice di Flesch, erano utili per prevedere se un testo fosse stato generato dal computer, anche se il programma aveva utilizzato un algoritmo progettato per eludere il rilevamento.
#7. Il watemark invisibile sui contenuti generati dall’AI
I testi generati con l’intelligenza artificiale includono una sorta di filigrana che li rende identificabili. I ricercatori OpenAI hanno sviluppato un watermarking crittografico che aiuterà a rilevare i contenuti creati attraverso un prodotto OpenAI come ChatGPT.
Questo watermark potrebbe consentire una differenziazione nelle operazioni di crawling e pregiudicare il posizionamento del contenuto in risposta alla query di un utente sui motori di ricerca.
Oppure, dare vita a una sorta di “crawling etico” e trasparente, evidenziando una differenza tra un contenuto generato da un algoritmo e un testo scritto da un essere umano.
È dannoso per la SEO pubblicare articoli generati dall’intelligenza artificiale?
Cosa si rischia utilizzando le AI per la generazione di testi da pubblicare sotto forma di articoli a fini SEO?
Partiamo col dire che è ormai abbastanza scontato che i contenuti AI generated siano rilevabili, sebbene molti sostengano che non ci sia modo per Google di sapere se un contenuto è stato generato o meno con l’Intelligenza Artificiale.
La questione è più o meno già risolta, tanto che persino i contenuti che utilizzano algoritmi anti-rilevamento possono essere rilevati: il rilevamento di contenuti generati dalle macchina è stato oggetto di ricerca per molti anni, compresa la ricerca su come rilevare i contenuti tradotti automaticamente da un’altra lingua.
I contenuti generati con ChatGPT violano le linee guida di Google
John Mueller, Senior Search Analyst / Search Relations team lead di Google, nell’aprile 2022 ha affermato che i contenuti generati dall’intelligenza artificiale violano le linee guida di Google.
“Per noi questi contenuti rientrano ancora nella categoria dei contenuti generati automaticamente, che rappresentano una violazione delle linee guida per i webmaster.
E le persone hanno generato automaticamente contenuti in molti modi diversi. Per noi, se si utilizzano strumenti di apprendimento automatico per generare i contenuti, è essenzialmente come se si mescolassero le parole, si cercassero i sinonimi o si facessero “trucchi di traduzione”, quindi lo consideriamo spam“.
Google ha anche recentemente aggiornato la sezione “contenuti generati automaticamente” della pagina per gli sviluppatori dedicata allo spam. Creata nell’ottobre 2022, è stata aggiornata alla fine di novembre 2022. che recita:
“Il contenuto generato automaticamente (o “autogenerato”) è un contenuto che è stato generato programmaticamente senza produrre nulla di originale o aggiungere sufficiente valore“.
Il semplice fatto di essere un contenuto generato automaticamente non lo rende “spammoso”. È la mancanza di tutti i valori aggiunti e delle qualità generali a rendere questi contenuti problematici.
I testi generati con l’AI potranno contenere watermark
Poche settimane prima del rilascio di ChatGPT, i ricercatore di OpenAI hanno dichiarato che il watermarking è “auspicabilmente” in arrivo nella prossima versione di GPT.
Come accennato in precedenza, questa scelta etica potrebbe fornire ai motori di ricerca (e ai lettori) chiare indicazioni sulla fonte di provenienza di un testo o un articolo, pregiudicandone il posizionamento o la percezione riguardo all’affidabilità.
Come utilizzare ChatGPT per la SEO
Affidare la creazione di contenuti a un’intelligenza artificiale e pubblicarli così come sono potrebbe non essere l’uso più efficace dell’intelligenza artificiale, se non viene prima verificata la qualità, l’accuratezza e l’utilità dei contenuti; attività che richiede tempo, lavoro e precisione assimilabili a una produzione originale.
Un uso attualmente accettabile di strumenti di intelligenza artificiale per la SEO come ChatGPT, potrebbe essere quello di impiegare l’algoritmo per riassumere lunghi testi da condensare in una metadescription (Google ha affermato espressamente che questa pratica non è contraria alle sue linee guida).
Oppure, fornire una bozza o un brief su un determinato argomento da sviluppare in modo autonomo, lasciando alla macchina il compito più noioso di ricerca e di analisi.