Quante volte duplicare un testo sul sito

I contenuti duplicati in un sito web possono causare una penalizzazione sui motori di ricerca.

Cos'è un contenuto duplicato

Si tratta di una stessa sequenza di frasi copiata su più pagine dentro lo stesso sito web.

Quando il motore di ricerca scansiona le pagine del sito, trova lo stesso testo su più documenti ( contenuto duplicato ) e non riesce a capire qual è il documento principale.

i contenuti simili del sito web

Perché i testi ricopiati sono un rischio?

La presenza del contenuto duplicato è una caratteristica delle spam page. Pertanto, un sito web che riproduce lo stesso testo ricopiato su più web page invia un cattivo segnale di qualità al search engine.

Contenuti duplicati e autorevolezza del sito. Se il sito è molto autorevole, il search engine è più clemente poiché il suo livello di trust compensa abbondantemente il cattivo segnale inviato tramite i contenuti duplicati. Se invece l'autorevolezza è normale o bassa, il sito rischia seriamente una penalizzazione o un declassamento.

Quando scatta la penalizzazione per contenuti duplicati

Non esiste una regola unica, valida per tutte le tipologie di siti web. E' necessario distinguere da caso a caso, perché un search engine avanzato come Google li gestisce in modo diverso.

la tipologia del sito web influisce sul rischio della penalizzazione per contenuto duplicato

Sito web e-commerce

Questa categoria di siti hanno una grande quantità di contenuti duplicati. Spesso si tratta di descrizioni dei prodotti ripetute su più pagina. Vanno distinti due casi.

1] Descrizioni ripetute dello stesso prodotto su diverse pagine

Si presenta quando il prodotto ha più schede e presenta una stessa descrizione iniziale, oppure nelle diverse pagine di ordinamento dei prodotti ( prezzo crescente, prezzo decrescente, ordine alfabetico, ecc. ).

In questo caso, il problema può essere risolto indicando la pagina principale nel rel canonical ( tecnica della canonizzazione ), oppure fissando un ordine di lettura con i metatag rel next e rel prev. In alternativa, si può decidere di deindicizzare le pagine secondarie e non rilevanti indicando nel meta robots il parametro noindex, follow.

esempio di canonizzazione tra due contenuti simili

2] Descrizioni ripetute su prodotti diversi in pagine differenti

Può capitare che prodotti diversi, molto simili tra loro, abbiano la stessa descrizione introduttiva e generica. In questo secondo caso, non c'è una soluzione tecnica ma editoriale.

Si può intervenire a livello editoriale con un'azione di copywriting, modificando le descrizioni, rendendole originali e uniche su ciascun prodotto. La tecnica della differenziazione dei testi è una soluzione abbastanza efficace.

Tuttavia, quando i prodotti sono tanti, anche la differenziazione diventa impraticabile. Inoltre, si rischia di generare dei contenuti simili e andare incontro ad altri problemi con il search engine.

Fortunatamente, i motori di ricerca sono a conoscenza di questa caratteristica dei siti e-commerce e danno meno importanza alla presenza dei contenuti duplicati al loro interno.

Quando non è possibile differenziare tutti i testi, è importante far capitare a Google che si tratta di un sito di commercio elettronico e non di un blog, portale magazine o news. Questa è la strategia migliore per evitare una penalizzazione da contenuti duplicati.

Siti web aziendali e news

Nei siti web aziendali e nei magazine online la presenza dei contenuti duplicati è più grave.

In passato, si utilizzava la tecnica dei contenuti ottimizzati nel title e nel testo introduttivo, semplicemente variando una parola chiave e lasciando immutato il resto del testo. Era utilizzata soprattutto per posizionarsi a livello geografico su alcune keyword.

Esempio. Per intercettare le ricerche locali di un servizio, fino al 2010 era abbastanza efficace la creazione di N pagine, una per ogni provincia italiana: [ nome servizio + Roma ], [ nome servizio + Milano ], ecc.

La tecnica dei contenuti duplicati ottimizzati è ormai poco efficace nelle query competitive ed espone il sito web al rischio di una penalizzazione da parte del search engine, in quanto i contenuti duplicati sono molto simili allo spam engine.

Si rischia anche un problema con l'esperienza utente. Se non si riesce a intercettare la query principale competitiva [ servizio + luogo ], la pagina duplicata potrebbe comparire nelle query correlate meno competitive, dove il bisogno dell'utente è però completamente diverso e il contenuto della pagina duplicata non è rilevante per l'utente finale. Questo penalizza la user experience e invia cattivi segnali al motore di ricerca.

la perdita di esperienza utente quando il contenuto duplicato è inutile

La migliore strategia per risolvere il problea consiste nel differenziare le informazioni testuali in ciascuna pagina duplicata, in modo tale da trasformarle in un contenuto originale. Vanno comunque evitati i contenuti simili.

Esempio. Nelle pagine geografiche è necessario indicare le sedi dell'azienda nella regione e pubblicare un testo attinente alla realtà geografica.

Quando non è possibile intervenire con la differenziazione del testo, si può optare per la canonizzazione delle pagine duplicate non rilevanti tramite rel=canonical e l'ordinamento sequenziale di lettura tramite rel=next e rel=prev.

i metatag rel next e prev tra due documenti successivi sullo stesso tema

In ultima istanza, se nessuna delle soluzioni precedenti è valida, si può sempre attuare la deindicizzazione della pagina duplicata inserendo noindex, nofollow nel meta robots.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. I contenuti duplicati in un sito web
  2. La canonizzazione degli indirizzi Url con Rel Canonical
  3. Come gestire la pagina web di un evento
  4. Come gestire i contenuti duplicati del sito