La questione dei contenuti duplicati è ormai diventata una sorta di mantra dei webmaster, ciò non ostante però ritengo che non sia ancora chiara a tutti. In particolare, sento ancora un sacco di webmaster preoccuparsi inutilmente di incappare in una penalizzazione per contenuti duplicati.
Mettiamo in chiaro una volta per tutte. Non esiste una cosa cosa come la penalizzazione per contenuti duplicati. Almeno, non nel modo in cui la maggioranza delle persone intende questo.
Ci sono alcune sanzioni che riguardano l’idea di avere lo stesso contenuto di un altro sito, ad esempio, se si copiano contenuti da altri siti e si ripubblicano tali e quali sul proprio, o senza aggiungere alcun valore aggiunto. Queste tattiche sono chiaramente delineate (e scoraggiate) nelle Linee Guida per Webmaster di Google:
- Non creare più pagine, sottodomini o domini dai contenuti sostanzialmente duplicati.
- Non creare pagine che installino virus, trojan o altro badware.
- Evita le “pagine doorway” create appositamente per i motori di ricerca o altri approcci mirati alla soppressione dei cookie, come i programmi affiliati con contenuto originale scarso o nullo.
- Se il tuo sito partecipa a un programma affiliato, accertati che vi apporti valore. Fornisci contenuti univoci e pertinenti, che diano agli utenti un motivo per visitare il tuo sito prima di altri.
(Si noti che mentre, copiare il contenuto da altri è scoraggiato, avere altri che copiano i vostri contenuti è una storia diversa).
Ma la maggior parte dei proprietari del sito (e purtroppo anche molti sedicenti esperti seo) che sento preoccuparsi di contenuti duplicati, non si riferiscono al copiare da altri siti, ma di cose come avere più URL sullo stesso dominio, che indicano lo stesso contenuto. Avere questo tipo di contenuto duplicato sul vostro sito può potenzialmente influire sulle prestazioni, ma non provoca sanzioni, come mostra chiaramente questo estratto da un articolo sul blog ufficiale di Google sui contenuti duplicati:
I contenuti duplicati su un sito non sono motivo di sanzione a meno che non sembri che l’intento del contenuto duplicato sia ingannevole e atto a manipolare i risultati del motore di ricerca.
Questo tipo di duplicazione non maligna è abbastanza comune, soprattutto perché molti CMS non li gestiscono bene di default. Così quando la gente dice che avere questo tipo di contenuti duplicati possono influenzare il vostro sito, non è perché è probabile che sia penalizzato; è semplicemente dovuto al modo in cui i siti web funzionano e al funzionamento dei motori di ricerca.
Molti motori di ricerca si sforzano di offrire un certo livello di varietà, vogliono mostrare dieci risultati diversi su una pagina di risultati, non dieci URL diversi che hanno tutti lo stesso contenuto. A tal fine, Google cerca di filtrare i documenti duplicati in modo che gli utenti abbiano meno esperienza di ridondanza. Potete trovare i dettagli in questo post del blog di Google, che recita:
- Quando rileviamo contenuti duplicati, ad esempio attraverso variazioni causate da parametri URL, mettiamo il gruppo di URL duplicati in un unico cluster.
- Selezioniamo ciò quello che pensiamo sia l’URL “migliore” per rappresentare il cluster nei risultati di ricerca.
- Per consolidare il risultato, analizziamo poi le proprietà degli URL del cluster, come la link popularity.
Ecco come questo potrebbe influenzare un webmaster:
- Al punto 2, l’idea di Google di URL “migliore” potrebbe non essere la stessa che pensate voi. Se si vuole avere il controllo su quello che viene mostrato nei risultati di ricerca, si consiglia di adottare misure per attenuare le proprie duplicazione. Un modo per far sapere a Google quali URL si preferisce è includere l’URL preferito nella vostra Sitemap.
- Al punto 3, se Google non è in grado di rilevare tutti i duplicati di una pagina particolare, non sarà neppure in grado di consolidare tutte le loro proprietà. Questo potrebbe diluire l’intensità del ranking del contenuto contenuto dividendolo in più URL.
Nella maggior parte dei casi, Google fa un buon lavoro nel trattare questo tipo di duplicazione. Le cose stanno molto diversamente quando si tratta di prendere in considerazione i contenuti duplicati tra domini. In particolare, decidere di costruire un sito il cui scopo implica di per sé contenuto duplicato è qualcosa che si dovrebbe pensare due volte, in particolare se il vostro modello di business sarà basato sul traffico di ricerca, a meno che non si possa aggiungere un sacco di valore aggiunto per gli utenti. Per esempio, abbiamo a volte sentito da affiliati di Amazon.com che non hanno un buon posizionamento sui motori di ricerca per il contenuto che proviene esclusivamente da Amazon. Questo perché Google vuole impedire loro di cercare di vendere? No, è perché come diavolo faranno ad avere una posizione più alta di Amazon se stanno fornendo un catalogo esattamente uguale? Amazon ha un sacco di autorità nel business online (molto probabilmente più di un tipico sito affiliato Amazon), e l’utente medio di ricerca di Google probabilmente vuole le informazioni originali su Amazon, a meno che il sito affiliato non abbia una quantità significativa di valore aggiunto.
Infine, occorre considerare l’effetto che la duplicazione può avere sulla larghezza di banda del vostro sito. Il contenuto duplicato può portare ad un funzionamento inefficiente degli spider: quando il Googlebot scopre dieci URL del tuo sito, deve analizzare ciascuno di questi URL, prima di sapere se contengono lo stesso contenuto (e quindi prima che possiamo raggrupparli come descritto sopra). Più tempo e risorse Googlebot passa per analizzare i contenuti duplicati su più URL, meno tempo ha per raggiungere il resto dei vostri contenuti.
In sintesi: avere dei contenuti duplicati può influenzare il vostro sito in una varietà di modi, ma se non è stata fatta deliberatamente una duplicazione da altri siti, è improbabile che uno di questi modi sarà oggetto di penalizzazione. Questo significa che:
- In genere, non è necessario presentare una richiesta di riconsiderazione, se il contenuto è duplicato in modo innocente.
- Non c’è bisogno di mettere troppa energia nel preoccuparsi di contenuti duplicati, dal momento che gran parte dei motori di ricerca hanno modo di gestirlo.
- Potete aiutare i vostri amici webmaster a non perpetuare il mito di sanzioni per contenuto duplicato! I rimedi per i contenuti duplicati sono interamente sotto il vostro controllo. Qui ci sono alcuni buoni punti di partenza.
Atricolo tratto dal corso di web marketing di Bologna di Studio Samo.
2 risposte
Jacopo, veramente un ottimo articolo che fa chiarezza su cosa si intende per duplicato “maligno” e non. Aggiungo che se si teme che ci siano duplicati di pagine dentro il nostro sito web possiamo usare i Google Webmaster Tools per cercare tag title e descrizioni duplicate.
Ciao e grazie per l’articolo che ho trovato molto interessante. Il caso particolare per cui mi sono messo alla ricerca di informazioni sui contenuti duplicati riguarda il mio sito (non sono un web master ovviamente). Gestisco un’attività di eventi e spesso le schede evento portano con se una quantità di elementi duplicati abbastanza costante. Tag title, ma non solo, le schede informative sopratutto si ripetono con il cambiamento di pochi dettagli. Da quello che ho letto nell’articolo sento di poter ascrivere questi contenuti al gruppo di quelli prodotti in buona fede, quindi non problematici. Ci sono secondo te invece delle cose a cui dovrei fare attenzione? Con Siteliner ottengo una percentuale di contenuti duplicati del 17%.