Errore Soft 404

L'errore Soft 404 è un codice introdotto dai motori di ricerca per assegnare uno status code alle pagine web inesistenti ma prive di un corretto codice HTTP di segnalazione 404, 410 o 310. Questo errore 404 "interpretato" è conosciuto come Soft 404.

Quando si verifica l'errore Soft404

Un sito web dinamico elabora l'indirizzo Url digitato dall'utente per fornire delle informazioni. A volte può capitare che queste pagine dinamiche restituiscano dei documenti privi di informazioni ( pagine vuote ) o contenuti duplicati.

Spesso si trata di documenti creati automaticamente tramite i linguaggi PHP / ASP oppure di una cattiva configurazione del server.

Esempio. Un sito e-commerce visualizza i prodotti di una categoria merceologica in ordine alfabetico della marca oppure di prezzo ascendente o discendente. Le informazioni sono le stesse ma sono pubblicate in pagine web differenti.

Queste pagine non esistono sul server ma non restituiscono un errore Http ( file non trovato ) sul browser dell'utente, in quanto sono prive sia dell'header 404 che 410.

le pagine restituiscono un codice HTTP200 ( OK )

Al contrario, queste pagine restituiscono lo stesso status code HTTP 200 ( OK ) delle pagine web normali.

Perché i motori di ricerca hanno introdotto lo status code soft 404

Quando una pagina web restituisce il codice di stato Http 200 ( OK ), il motore di ricerca la considera una pagina reale e procede con le operazioni di indicizzazione.

Così facendo, però, lo spider inserisce nell'indice del search engine migliaia di pagine duplicate.

indicizzazione dei contenuti duplicati da parte del search engine

La presenza di contenuti duplicati nelle SERPs costituisce un problema grave sia per i motori di ricerca e sia anche per il proprietario del sito web che potrebbe subire una penalizzazione per spam-engine ( spamdexing ) oppure un declassamento sul posizionamento organico.

Per risolvere questo problema i motori di ricerca hanno introdotto negli algoritmi un programma per riconoscere i potenziali errori 404 anche laddove non ci sia un apposito header HTTP e marchiarli con lo status Soft404.

esempio di gestione dei contenuti duplicati tramite l'errore soft404

Nota. Il codice Soft 404 è stato introdotto per la prima volta nel 2007 da Yahoo! Successivamente è stato adottato anche da Google e da Bing.

Come trovare gli errori Soft 404 del sito

Gli strumenti per visualizzare gli errori soft sono messi a disposizione dei webmaster dagli stessi search engine. Il motore di ricerca Google ha questa funzione nel pannello Search Console ( ex. Strumenti Webmaster ).

Dalla dashboard del sito si apre il menù Scansione, situato sulla barra di sinistra, si seleziona la voce Errori di scansione e si clicca sulla voce Soft 404.

gli errori soft404 del sito web tramite la search console di Google

Il tool restituisce l'andamento grafico degli errori sul sito e l'elenco delle pagine in cui sono stati rilevati dallo spider e la data di rilevamento.

l'elenco degli errori soft del sito web

Cliccando su ogni singola pagina nell'elenco è possibile ottenere altre informazioni utili che possono aiutare a comprendere la causa e l'origine del problema.

altre informazioni aggiuntive sulla causa dell'errore

Nota. L'elenco degli errori soft 404 è suddiviso in desktop e smartphone. Per avere la lista completa degli errori del sito web occorre controllare entrambe le liste.

Come eliminare l'errore Soft 404

Quando si presenta un errore Soft è necessario analizzare le pagine in questione e trovare la causa del problema. Non esiste una tecnica valida per ogni caso.

  1. Contenuto inesistente e inutile. Se si tratta di una risorsa realmente inesistente e inutile, è opportuno associargli un header 404 o 410 oppure reindirizzare l'indirizzo verso una risorsa realmente esistente con un codice 301.
  2. Contenuto duplicato e inutile. In questo caso è preferibile rimuovere la risorsa e restituire un errore 404 o 410, oppure reindirizzara verso una pagina esistente con un header 301.
  3. Contenuto duplicato ma utile. Se si tratta di una pagina dinamica con contenuti duplicati che fornisce una funzione utile per l'utente ( es. lista dei prodotti e-commerce ordinati in modo diverso o tag page ) è consigliabile gestire la canonizzazione del documento attraverso il metatag rel canonical oppure deindicizzarla.
    esempio di pagina canonizzata

In questo modo i motori di ricerca possono attribuire il corretto status alla pagina web ed evitano di indicizzare migliaia di pagine duplicate. Il sito web elimina il rischio di subire una penalizzazione da parte del motore di ricerca.

La differenza tra HTTP 404 e Soft404

I codici di stato sono previsti nel protocollo HTTP ( Hyper Text Transfert Protocol ) come messaggi standard nelle comunicazioni tra computer client e computer server. Si tratta di codici tecnici utilizzati nei sistemi operativi dei server ( es. Apache, Microsoft ISS, ecc. ).

Uno di questi status code è il messaggio HTTP 404 che viene restituito dal server quando il client chiede di visualizzare un file non esistente sull'hardware della macchina.

esempio di file not found

L'errore Soft-404, invece, è un codice di stato interpretato dal search engine. Non esiste formalmente nell'elenco degli status code del protocollo HTTP.

le pagine restituiscono un codice HTTP200 ( OK )

In questo caso il server restituisce il messaggio HTTP 200 ( OK ) ma il motore di ricerca non gli crede, non lo considera come un file fisico realmente esistente e si rifiuta di indicizzare la risorsa. La situazione viene gestita dal search engine come un errore HTTP 404 ( File Not Found ).

Da questo deriva il nome Soft-404 ossia 404 dal lato software.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento

Search Engine Optimization

FAQ