Contenuti automatici
I contenuti automatici sono documenti generati automaticamente tramite un programma informativo da fonti interne o esterne.
A cosa servono i contenuti automatici
Un sito web può creare migliaia di pagine web tramite le tecniche di creazione dei contenuti automatici, usando opportune tecniche di ottimizzazione SEO, per conquistare un buon posizionamento organico su molte chiavi di ricerca.
In questo modo, senza alcuna fatica, il sito web aumenta la sua visibilità sul search engine.
Si tratta però di contenuti di scarsa qualità, pensati per posizionarsi sui motori di ricerca e non per rispondere alle esigenze degli utenti.
Per questa ragione chi pratica queste tecniche si espone al rischio di subire una penalizzazione del search engine.
Nota. La creazione dei contenuti automatici era una tecnica Seo Black Hat del passato. E' sempre stata una pratica vietata dai search engine. Oggi non è più efficace. Al contrario è molto pericolosa poiché chi la pratica può subire una penalizzata per spam-engine da parte del motore di ricerca.
Le tecniche per creare i contenuti automatici
Esistono diversi tipi di contenuti autogenerati, a seconda del processo di creazione del testo e delle fonti utilizzate.
Le principali fonti per generare contenuti tramite un algoritmo sono i seguenti:
- Contenuti copiati online. La pagina automatica è composta da frasi, parole e termini copiati su internet da altre pagine web in altri website.
- Database di dati pubblici. La pagina automatica è autogenerata da un database di dati tramite uno schema di frasi in linguaggio naturale.
La creazione delle pagine automatiche con contenuti copiati online
Questo metodo utilizza come fonte altri documenti online ( pagine web ). E' uno degli algoritmi più usati dai software di spam.
Come funziona l'algoritmo
L'algoritmo seleziona delle pagine web sulla base di una o più parole chiave iniziali ( keyword ). In genere, si appoggia a un search engine per trovare un elenco di risorse a tema, via API o web, oppure legge i file RSS dei siti di news.
Una volta ottenuta la lista con N indirizzi URL da analizzare, l'algoritmo procede alla lettura dei documenti per copiare una parte del loro testo.
In genere l'algoritmo si limita a copiare le frasi, i paragrafi e i segmenti in cui si trovano le keyword.
Infine, i segmenti copiati dalle N pagine web sono aggregati dall'algoritmo in un unico documento ottimizzato dal lato SEO e pubblicato online sul sito web dello spammer.
In questo modo il sito web di spam ha generato senza alcuno sforzo un contenuto copiato parzialmente da altri, con molte parole chiave e termini pertinenti al suo interno, e sperare di conquistare un buon posizionamento organico sui motori di ricerca.
Contenuti senza senso. Spesso i contenuti copiati da altre fonti online sono contenuti privi di senso e senza alcuna utilità per l'utente finale.
L'autogenerazione dei documenti da un database
Un altro modo per generare documenti automatici si basa sull'utilizzo dei dati presenti in un database.
Come si crea un contenuto automatico
L'algoritmo legge i record di un database e utilizza le informazioni per creare delle frasi in linguaggio naturale.
Le frasi sono caratterizzate da uno schema, in cui alcuni elementi sono costanti mentre altri sono variabili.
L'algoritmo sostituisce le informazioni lette dal database alle variabili testuali, creando così delle frasi autogenerate abbastanza diverse tra loro.
Questa tecnica di generazione dei contenuti è detta text spinner.
Nota. Le pagine autogenerate con il text spinning hanno il vantaggio di avere un contenuto sensato e comprensibile. Tuttavia, in molti casi i contenuti spinnati sono thin content ( brevi ) o contenuti informativi con scarso valore aggiunto per l'utente finale. Spesso presentano anche errori grammaticali.
Le penalizzazioni dei search engine
Spesso i documenti automatici sono contenuti senza senso, creati per ingannare il motore di ricerca e senza alcuna utilità per l'utente finale. In questo caso la user experience è negativa poiché l'utente perde tempo.
Per questa ragione, i contenuti automatici sono classificati dai search engine tra i lowest quality ( contenuti di scarsa qualità ).
Nel corso del tempo i motori di ricerca hanno imparato a riconoscere e penalizzare le pagine di spam autogenerate da contenuti copiati online.
Pertanto, il posizionamento organico ottenuto con il text spinning è temporaneo.
Può funzionare in alcune Serp minori o secondarie ma l'effetto è comunque destinato ad esaurirsi nel giro di pochi mesi.
La visibilità artificiale sul search engine dei contenuti spinnati si perde rapidamente.
Nota. In alcuni casi la penalizzazione colpisce l'intero sito web ( spam-site ) e non soltanto la singola pagina ( spam-page ). Quindi, il danno è superiore al guadagno.
Come riconoscere le pagine create automaticamente
I search engine possono individuare i contenuti automatici in vari modi.
I contenuti che aggregano contenuti copiati online sono facilmente individuabili. Le loro frasi non sono originali poiché sono state copiate da altri documenti.
Si può risalire ai documenti originali tramite un semplice controllo di exact match phrase e calcolare un indicatore di originalità dei singoli segmenti di testo nel documento.
Nota. Per rendere più difficile l'individuazione tramite exact match phrase, gli algoritmi possono utilizzare delle tecniche ( gibberish text ) per variare casualmente l'ordine e le occorrenze delle parole nelle frasi o delle lettere nelle parole.
I contenuti autogenerati da un database, invece, sono caratterizzati da uno schema, da un cluster che si ripete su migliaia di pagine in uno website cambiando soltanto alcune parole al suo interno.
Nota. I contenuti generati dal database sono più difficili da individuare, soprattutto se utilizzano delle tecniche a schemi variabili. Tuttavia, non è impossibile individuare la loro natura.
Oltre agli algoritmi anti-spam, i contenuti automatici possono essere individuati anche dal controllo umano da parte dei quality rater del motore di ricerca.
Si può risalire alla natura della pagina anche analizzando l'esperienza utente sulle SERP. In genere, l'utente resta pochi istanti sulle pagine di scarsa qualità, il tasso di rimbalzo sui risultati del search engine è molto alto e il tempo di permanenza sulla pagina è minimo.
Domande / Risposte
- Quali software creano contenuti automatici? Un software del genere si chiama ScrapeBox. Nella Seo Black Hat è usato per creare articoli spam e commenti automatici con backlink. Altri software molto più evoluti sono in grado di redigere contenuti di senso compiuto a partire da una base dati, questi ultimi sono usati soprattutto nel giornalismo economico-finanziario per descrivere i trend di mercato.