Come bloccare la scansione di ChatGPT e OpenAI su WordPress

Bloccare la scansione di ChatGPT e OpenAI su WordPress è diventata una richiesta sempre più frequente tra blogger, editori e proprietari di siti web che non desiderano che i propri contenuti vengano utilizzati per l’addestramento o la raccolta di dati da parte di sistemi di intelligenza artificiale.

Molti utenti cercano informazioni utilizzando frasi come:

  • bloccare ChatGPT dal mio sito
  • impedire a OpenAI di leggere il mio sito
  • escludere ChatGPT da WordPress
  • bloccare GPTBot
  • evitare la scansione AI del sito
  • impedire ai crawler AI di accedere ai contenuti
  • bloccare OpenAI robots.txt

La buona notizia è che WordPress permette di gestire gran parte di queste limitazioni tramite il file robots.txt.

Samsung Galaxy S26 Ultra S26 Ultra
VS
iPhone 17 Pro Max iPhone 17 Pro Max
Xiaomi 17 Pro Xiaomi 17 Pro
VS
Honor Magic 8 Honor Magic 8
iPhone 15 iPhone 15
VS
iPhone 17 iPhone 17
GRATIS · 380+ modelli

Confronta gli smartphone

Display, fotocamera, batteria e prestazioni a confronto in pochi secondi.

Confronta ora

Cos’è GPTBot

OpenAI utilizza un crawler chiamato:

GPTBot

Questo bot visita i siti web per raccogliere informazioni pubblicamente accessibili.

OpenAI ha dichiarato che i proprietari dei siti possono controllarne l’accesso utilizzando il file robots.txt.

In pratica funziona come:

  • Googlebot per Google
  • Bingbot per Bing
  • GPTBot per OpenAI

Il metodo più semplice: modificare robots.txt

Su WordPress puoi utilizzare il file:

robots.txt

presente nella directory principale del sito.

Se il file non esiste puoi crearlo manualmente.

Per bloccare GPTBot inserisci:

User-agent: GPTBot
Disallow: /

Questo comunica al crawler di OpenAI di non effettuare scansioni sul sito.

Migliore configurazione robots.txt WordPress: esempio ottimizzato per SEO

Bloccare anche altri crawler AI

Negli ultimi anni sono comparsi numerosi bot utilizzati da sistemi di intelligenza artificiale.

Puoi aggiungere anche:

User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Google-Extended
Disallow: /

Cosa significano

GPTBot

Bot utilizzato da OpenAI.

ChatGPT-User

Può essere utilizzato quando un utente chiede a ChatGPT di recuperare informazioni da un sito specifico.

CCBot

Crawler utilizzato da Common Crawl, una delle più grandi raccolte pubbliche di dati web.

Google-Extended

Consente di limitare l’utilizzo dei contenuti da parte dei modelli AI di Google senza influenzare l’indicizzazione tradizionale.

Non bloccare Google e Bing

Uno degli errori più comuni consiste nel modificare robots.txt in modo troppo aggressivo.

Ad esempio NON utilizzare:

User-agent: *
Disallow: /

Perché bloccherebbe:

  • Googlebot
  • Bingbot
  • DuckDuckBot
  • Yahoo
  • altri motori di ricerca

con effetti devastanti sulla SEO.

Se il tuo obiettivo è bloccare soltanto l’intelligenza artificiale, devi intervenire esclusivamente sui crawler specifici.

Esempio consigliato per WordPress

Per la maggior parte dei siti WordPress puoi utilizzare:

User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Google-Extended
Disallow: /

Questa configurazione lascia completamente funzionanti:

  • Google Search
  • Googlebot
  • Bing
  • Bingbot
  • Yahoo
  • DuckDuckGo

ma limita diversi sistemi utilizzati per la raccolta dati AI.

Migliore configurazione robots.txt WordPress: esempio ottimizzato per SEO

Come modificare robots.txt su WordPress

Se utilizzi Yoast SEO:

Vai su:

Yoast SEO → Strumenti → Editor file

Se il tuo hosting lo consente, potrai modificare direttamente robots.txt.

In alternativa utilizza:

File Manager → cartella principale del sito

e modifica il file manualmente.

Verificare che robots.txt sia accessibile

Dopo aver salvato le modifiche visita:

https://tuosito.it/robots.txt

Dovresti vedere il contenuto del file direttamente nel browser.

Questo conferma che il file è stato letto correttamente dal server.

robots.txt è una protezione assoluta?

No.

Questo è un punto molto importante.

Il file robots.txt è una richiesta volontaria rivolta ai crawler.

I bot legittimi generalmente rispettano queste direttive.

Tuttavia:

  • non è una protezione tecnica assoluta
  • non impedisce l’accesso tramite browser
  • non blocca utenti reali
  • non blocca bot malevoli

Per una protezione più rigida servono firewall, regole server o sistemi anti-bot avanzati.

È possibile bloccare OpenAI dal server?

Sì.

Su server Apache o Nginx è possibile bloccare direttamente il crawler tramite User-Agent.

Questa soluzione è più efficace del robots.txt perché il server rifiuta completamente la connessione.

Tuttavia richiede accesso alla configurazione del server ed è consigliata a utenti più esperti.

Come capire se GPTBot visita il sito

Se utilizzi:

puoi consultare i log degli accessi.

Nei log potresti trovare richieste con User-Agent:

GPTBot

oppure altri crawler AI.

Questo è il metodo più affidabile per verificare eventuali visite. Proteggere il proprio sito WordPress? Wordfence Security Firewall

Box rapido

Bloccare ChatGPT e OpenAI su WordPress

Puoi limitare la scansione dei contenuti da parte dei crawler AI utilizzando il file robots.txt senza compromettere Google, Bing e gli altri motori di ricerca tradizionali.

1. Apri il file robots.txt
2. Aggiungi la regola per GPTBot
3. Blocca anche ChatGPT-User e CCBot
4. Non utilizzare User-agent: *
5. Verifica il file visitando tuosito.it/robots.txt