Skip to content

Che cos’è contenuto duplicato

Il contenuto duplicato è uno dei problemi più diffusi della SEO e, cosa interessante, uno dei meno conosciuti.

Tanti cercano di ottimizzare il proprio sito per i motori di ricerca, come fare link building, ma non danno importanza ai contenuti.

Se creiamo un sito con articoli copiati da altre fonti sarà praticamente impossibile avere delle buoni posizioni nei motori di ricerca.

Questo perchè non stiamo dando valore ma abbiamo copiato. Google premia solo quei siti che creano articoli freschi e unici.

In questo post spiego TUTTO ciò che devi sapere sui contenuti duplicati:

Cos’è il contenuto duplicato

Il contenuto duplicato è un qualsiasi testo ripetuto in più di un URL, sia interno che esterno. Questo è ciò che succede quando il tuo sito crea diverse versioni della stessa pagina o quando qualcuno copia i nostri articoli.

Se pensi che il contenuto duplicato abbia poca importanza allora ti sbagli di grosso. Chi cerca su Google di aspetta di trovare dei risultati con contenuti diversi e non lo stesso ripetuto. Per questo motivo devi individuare i tuoi articoli copiati e riscriverli.

Creando contenuto duplicato perdi la possibilità di indicizzarti nei motori di ricerca.

Conseguenze del contenuto duplicato

Ora che sai perché è così importante evitare la duplicazione dei contenuti, dovresti conoscere i problemi che possono causare il tuo sito. Alcuni dei più importanti sono:

  • Visibilità peggiore : come risultato di quanto sopra, il motore di ricerca potrebbe finire per mostrare una copia di peso inferiore, e quindi posizionarlo in modo peggiore rispetto alla versione corretta.
  • Pagine sbagliate – Avere pagine diverse per lo stesso contenuto significa lasciare la scelta della pagina corretta nelle mani del motore di ricerca. Questa non è una buona idea dato che puoi scegliere una versione diversa da quella che desideri.
  • Spreco di link – Le pagine duplicate possono ricevere collegamenti e diluire la forza dei tuoi contenuti, dal momento che tutti questi link potrebbero (e dovrebbero) aggiungere forze su una singola pagina.
  • Scarsa indicizzazione : l’ indicizzazione delle pagine  può essere compromessa dal fatto che il motore di ricerca trascorre il proprio tempo a tracciare pagine duplicate. Se il contenuto duplicato assume una parte significativa del sito, il motore di ricerca visiterà le pagine importanti meno frequentemente.
  • Attribuzione errata : il motore di ricerca può decidere che i tuoi contenuti provengono da un altro dominio ed escludere le tue pagine nei risultati. È l’ultima goccia, ma succede.

Cause di contenuti duplicati

Quando le persone pensano a contenuti duplicati, la prima cosa che viene in mente è l’immagine di uno spammer che atterra sul suo sito, copia alcuni articoli e li incolla in un altro dominio. Succede raramente in questo modo. La più grande fonte di contenuti duplicati è solitamente il web stesso, indipendentemente da quanto sia ottimizzato.

Come stai per verificare ora, ci sono molte ragioni per cui potresti essere sommerso da copie senza saperlo:

  • Dominio non canonico : il tuo sito può operare con il dominio (secondario) che inizia con “www.” E con il dominio che non ha questo prefisso. La buona versione è quella canonica e non impostandola correttamente  causa la ripetizione del tuo sito in entrambe le varianti.
  • Pagine sicure  – Simile a ciò che accade con il dominio canonico, se il tuo sito Web utilizza la crittografia SSL, puoi finire con una copia esatta nella versione sicura (quella che inizia con HTTP S ).
  • ID sessione : molti siti gestiscono sessioni utente immettendo un codice alla fine dell’URL di ciascuna pagina. Questi parametri, diversi per ogni sessione utente, possono far credere al motore di ricerca che siano pagine separate, sebbene in realtà siano le stesse.
  • Contenuto dinamico : esistono siti che assegnano parametri agli URL per controllare il contenuto visualizzato all’utente. Come per gli ID di sessione , i motori di ricerca possono interpretare queste pagine come copie.
  • File : un tipico problema con i blog è che lo stesso contenuto viene visualizzato su pagine diverse, come nel caso dei file di categorie e etichette, ad esempio.
  • Cercapersone – Qualsiasi sito Web che utilizza il paging può avere questo problema, specialmente se le pagine della serie condividono lo stesso titolo e la stessa descrizione.
  • Versione mobile : se la versione smartphone delle tue pagine viene generata in un URL separato (ad esempio un sottodominio o una sottodirectory) e non è configurata correttamente, il motore di ricerca potrebbe avere difficoltà a sapere che si tratta di una versione parallela.

Cause quando sei fuori sede

In questo caso, i motivi più comuni sono:

  • Syndication : consiste nell’invio di contenuti ad altri siti per attirare traffico, ad esempio tramite RSS. Il problema può sorgere quando pubblicano una copia completa dei tuoi contenuti anziché uno snippet.
  • Posizione : per andare in diversi paesi potresti aver utilizzato lo stesso contenuto (o quasi) in più domini contemporaneamente, come in .es e .mx .
  • CDN – L’utilizzo di una rete di distribuzione dei contenuti o CDN implica la replica di parte del contenuto Web (principalmente file statici) nei server della rete. Questo può essere un problema se non vengono prese le misure appropriate.
  • Raschiatura  – Gli scartini  usano un robot software per copiare le tue pagine e pubblicarle in un altro dominio.
  • Plagio – Puntualmente, qualcuno può copiare un testo dal tuo sito e pubblicarlo nel loro. A volte capita intenzionalmente ma a volte no (la mentalità di tutto è gratuita su Internet e può essere utilizzata liberamente ).

Come rilevare il contenuto duplicato

Google identifica i contenuti duplicati quando incontra  titoli , descrizioni , intestazioni e sezioni identici o molto simili. Pertanto, per verificare il contenuto duplicato è necessario iniziare da lì.

Qui ti mostro i metodi più efficaci:

  • Strumenti per i webmaster di Google: se ti sei registrato con gli strumenti per i webmaster di Google, questo è indubbiamente il miglior punto di partenza. Accediall’aspetto Cerca> miglioramenti HTML e fai attenzione a duplicare i tag title e le meta descrizioni. Il report indica quante repliche esistono e quali pagine sono state trovate in modo da poterle correggere.
  • Comando “sito” – È un metodo molto efficace ma richiede molto lavoro. Consiste nel cercare all’interno del tuo sito determinate parole o frasi chiave, come i prodottinel caso di un negozio online ( sito: esempio.com “questo è un prodotto del negozio” ). Nel risultato puoi vedere se ci sono pagine con titoli e descrizioni duplicati. Questo metodo ti consente anche di sapere se alcune pagine sono state spostate all’indice secondario quando vedi un messaggio sull’ultima pagina di risultati (“ripeti la ricerca e includi i risultati che sono stati omessi”). Questo è un sintomo di contenuti duplicati.
  • Screaming Frog : questo potente strumento ti consente di tracciare il tuo sito alla ricerca di contenuti duplicati, tra le altre cose. Le schede che ti interessano sonoURI ,  titoli di pagina , Meta Description e H1 , usando il filtro Duplicate .
  • Google Analytics : puoi anche trovare pagine duplicate in Google Analytics utilizzando il rapporto Comportamento> Contenuto del sito> Pagine di destinazione . La chiave è cercare URL e pagine sospette che ricevono meno traffico organico di quanto dovrebbero.
  • strumenti di analisi web – Ci sono strumenti che possono identificare contenuti duplicati, come pure collegamenti interrotti, pagine non indicizzate e altri problemi difficili da rilevare con l’ occhio nudo, come ad esempio  Siteliner , SEMRush  o Moz .

Tool per verificare se il contenuto è duplicato

Se le copie si trovano all’esterno del Web, è possibile controllare il contenuto duplicato utilizzando i seguenti strumenti:

Come sbarazzarsi di contenuti duplicati

È chiaro che ai motori di ricerca non piace il contenuto duplicato perché porta a un’esperienza utente scadente. Quindi se hai contenuti duplicati sul tuo sito, dovresti fare tutto il possibile per eliminarlo.

Queste sono le opzioni principali per affrontare il problema:

  • Usa Rel Canonical  – Il tag “rel = canonical” è stato ideato proprio per risolvere questo inconveniente, rendendolo la soluzione migliore. Consiste in una riga di codice all’interno della sezione <head>  della pagina che indica al motore di ricerca quale versione è valida (canonica). Può anche essere incluso nell’intestazione HTTP della pagina.
  • Si crea redirezioni 301 – è consigliabile quando non è possibile utilizzare il tag canonica quando si sposta il contenuto da una pagina all’altra o quandoimposta il dominio canonico. Redirect 301 sono comandi inclusi nel file .htaccess in Apache.
  • Nega l’accesso ai robot – Per impedire ai motori di ricerca di trovare pagine duplicate, puoi utilizzare il tag meta robots o il file robots.txt .
  • Gestire parametri URL – Nel caso in cui il contenuto duplicato è causata da parametri, si può dire che cosa Google ignorare utilizzando lo strumento di monitoraggio> parametri URL  in Strumenti per i Webmaster .
  • Usa Schema.org  – Il motore di ricerca può utilizzare i dati strutturati per risolvere la confusione tra le pagine duplicate.
  • Unifica le pagine o riscrivi il contenuto : l’una e l’altra sono soluzioni sensate quando diverse pagine del tuo sito mostrano contenuti molto simili o uguali.

Liberati quando sei fuori sede

Se i tuoi  contenuti sono stati copiati da una terza parte , hai le seguenti opzioni:

  1. Richiesta di cancellazione – Invia un messaggio via email o modulo di contatto per richiedere gentilmente di essere cancellato. Se non c’è modo di comunicare, utilizzare l’e-mail di registrazione WHOIS , che è possibile ottenere utilizzando lo strumento Whois.net . Chiedi anche a loro, se non sono disposti a sbarazzarsi del contenuto, che almeno mettono un link alla pagina che ti hanno copiato. Ciò aiuterà il ricercatore a identificare la fonte originale.
  2. Richiedi la rimozione a Google – Se la comunicazione non funziona, puoi chiedere al motore di ricerca di rimuovere la pagina offendente dai suoi risultati. Per fare ciò,  presenta un’applicazione basata sul Digital Millennium Copyright Act (DMCA ) degli Stati Uniti .
  3. Aiuta a migliorare il rilevamento di plagio – Oltre a quanto sopra, puoi inviare il tuo caso a Google  per utilizzarlo come esempio nel miglioramento dei loro algoritmi. Ora, tieni presente che non verrà utilizzato come spam o rapporto sul copyright.

Consigli generali per evitare la comparsa di contenuti duplicati

  • Non usare mai lo stesso titolo / descrizione su più di una pagina
  • Il testo di ogni pagina deve essere unico per l’intero sito e per l’intero Web
  • Includi solo la versione canonica della pagina nelle tue Sitemap
  • Quando si copia un appuntamento da un altro sito, includere sempre un collegamento all’originale
  • Quando copi un’intera pagina, chiedi il permesso prima; include un collegamento all’origine e nega l’accesso del browser alla pagina tramite i robot (puoi anche utilizzare rel canical tra domini)