La Sitemap del SitoWeb

Le sitemap sono uno mezzo per comunicare tutte le pagine di un sito web a un motore di ricerca, senza aspettare che il crawler le trovi da sé. Consistono in un elenco di indirizzi URL relativi alle pagine del sito.

A cosa serve la Sitemap

Il suo scopo è abbastanza intuitivo, la Sitemap dovrebbe accelerare l'indicizzazione del sito web sul motore di ricerca, ossia l'inserimento delle pagine web del sito dentro l'indice del search engine.

Lo spider del motore di ricerca non deve più trovarle seguendo i link, perché l'elenco completo dei documenti gli viene fornito in un solo colpo tramite una lista di indirizzi.

esempio di segnalazione di un file sitemap al search engine

L'indicizzazione del sito web è molto più veloce con la Sitemap rispetto ai tempi della scansione naturale da parte dei bot.

Inoltre, le sitemap permettono di inviare al search engine anche informazioni aggiuntive sui documenti, come la frequenza di aggiornamento, la data di pubblicazione e la priorità di scansione.

Come funziona una Sitemap

Una sitemap normalmente viene creata in formato XML. Al suo interno, sono poste in modo ordinato diverse informazioni:

  1. Indirizzo Url della pagina web ( LOC ). E' l'indirizzo Url dove si trova una singola pagina web del sito.

    <LOC>/seo/meta-robots/</LOC>

  2. Data di pubblicazione o modifica ( LASTMOD ). E' la data dell'ultima modifica apportata alla pagina da parte dell'autore o del proprietario del sito.

    <LASTMOD>2015-10-25</LASTMOD>

  3. Priorità di indicizzazione ( PRIORITY ). E' la priorità di scansione richiesta dal webmaster. Si tratta di un valore relativo variabile tra zero e uno ( max. priorità ). I documenti da indicizzare prima degli altri hanno un valore priority più alto.

    <PRIORITY>0.5</PRIORITY>

  4. Frequenza di scansione ( CHANGEFREQ ). E' la frequenza di scansione richiesta dal webmaster ossia il numero di volte che lo spider del search engine dovrebbe passare per verificare gli aggiornamenti sulla risorsa. Ad esempio, ogni giorno ( DAILY ), ogni settimana ( WEEKLY ), ecc.

    <CHANGEFREQ>weekly</CHANGEFREQ>

Come scrivere una sitemap

La prima riga è dedicata all'apertura del file XML e alla codifica dei caratteri. In genere, si utilizza la seguente riga di default:

<?xml version="1.0" encoding="UTF-8"?>

Tutte le informazioni contenute nel file Sitemap devono essere disposte tra il tag <URLSET> in apertura e </URLSET> in chiusura.

<URLSET>
...
</URLSET>

Nel tag occorre specificare anche il protocollo usato nella Sitemap e la relativa versione dello schema. Quello di default è normalmente il protocollo Sitemaps. Pertanto, è preferibile riscrivere il tag <URLSET> nel seguente modo

<URLSET xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
...
</URLSET>

Le informazioni relative a ogni singolo documento del sito-web sono indicate tra i tag <URL> e </URL>.

<URLSET>
<URL> .... </URL>
...
<URL> .... </URL>
</URLSET>

All'interno di ogni record <URL> si possono inserire le informazioni relative alla pagina, come l'indirizzo URL ove risiede ( <LOC> ), la data di aggiornamento ( <LASTMOD> ), la frequenza di scansione ( <CHANGEFREQ> ) e la priorità di scansione ( <PRIORITY> ).

<URL>
<LOC>/seo/meta-robots/</LOC>
<LASTMOD>2015-10-25</LASTMOD>
<CHANGEFREQ>weekly</CHANGEFREQ>
<PRIORITY>0.5</PRIORITY>
</URL>

Anche in questo caso si tratta di tag doppi, composti da un tag di apertura e un tag di chiusura. Ogni tag indica una particolare proprietà della pagina web mentre il valore informativo è contenuto al suo interno.

Un esempio di sitemap

Il seguente esempio mostra una semplice sitemap composta da due pagine web:

<?xml version="1.0" encoding="UTF-8" ?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>/</loc>
<lastmod>2015-10-26</lastmod>
<changefreq>daily</changefreq>
<priority>0.7</priority>
</url>
<url>
<loc>/seo/sitemap/</loc>
<lastmod>2015-10-26</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>

Come salvare il file della sitemap

Si può dare qualsiasi nome al file della Sitemap. In genere, è molto frequente dargli il nome sitemap.xml, Tuttavia, non è obbligatorio usare questo nome. Qualsiasi altro nome va bene.

E' preferibile usare un nome anonimo. E' consigliabile non usare il nome sitemap.xml o qualsiasi altro nome che faccia risalire gli utenti a scoprire la sua natura ( es. site-map.xml, sitemap-sito.xml, ecc. ) e non salvarlo in una cartella con nome /sitemap, tutto questo per evitare che malitenzionati possano trovare facilmente il file e lo utilizzino per praticare azioni di Seo negativa.

Esempio di Seo Negativa tramite la Sitemap. Chi conosce la Sitemap di un sito, può leggere il suo contenuto prima dei search engine, trovare gli indirizzi delle nuove pagine del sito o di tutte, copiare il loro contenuto su altri nomi di dominio e far indicizzare questi ultimi prima degli altri. Perché dovrebbe farlo? In questo modo si appropria di contenuti altrui spacciandoli per originali, essendo il primo ad essere indicizzato, e induce il search engine a infliggere una penalizzazione al legittimo autore degli articoli per contenuti duplicati o spam. Sembra paradossale ma è un rischio concreto.

In quale cartella del sito salvare il file Sitemap

Una volta pronto, il file XML della Sitemap deve essere caricato online in una zona del sito web dove i bot del search engine possono avere accesso.

Nota. Non deve trattarsi di una cartella inibita ai search engine tramite il file robots.txt. In quest'ultimo caso, i search engine bot non potrebbero leggerla.

La segnalazione della Sitemap al search engine

A questo punto, il webmaster deve comunicare al search engine di aver messo online una sitemap del sito. Ogni motore di ricerca ha le sue regole.

come inserire una sitemap sulla Search Console di Google

Ad esempio, su Google si può segnalare la Sitemap tramite una voce della Search Console. Su Bing esiste un procedimento simile nel pannello di controllo ( Webmaster Tools ) del webmaster.

La scansione della Sitemap da parte degli spider

A questo punto il webmaster non deve fare più nulla. Quando il motore di ricerca è a conoscenza della sitemap, un bot si reca in automatico a leggere tutte le URL e le inserisce nella coda degli indirizzi da visitare, scansionare e indicizzare.

Come controllare se il search engine indicizza le pagine

Il processo di avanzamento dell'indicizzazione può comunque essere seguito in tempo reale direttamente nel pannello di controllo della Sitemap sul search engine.

un esempio di sitemap su Google

Priority. L'ordine di inserimento nella coda delle pagine da scansionare dovrebbe seguire l'ordine dei valori attributi alle risorse dal webmaster tramite il campo priority della Sitemap. L'attributo priority è un valore numerico decimale compreso tra 0 e 1 ( massima priorità ).

Esiste una sola sitemap?

Generalmente ogni sito web ha una sitemap. Tuttavia, è anche possibile creare molte sitemap sullo stesso sito, ognuna con raggruppamenti differenti delle risorse.

esempio di doppia sitemap su un sito web

Esempio. Si può creare una sitemap per gli articoli, una per i tag, una per i prodotti e-commerce o per tipologia merceologica, ecc.

E' necessario segnalare la sitemap dopo ogni modifica?

E' sufficiente ricreare il file della Sitemap del sito con le url modificate, salvandolo sullo stesso indirizzo URL già segnalato al search engine.

Non è necessario segnalare nuovamente la sitemap nel pannello di controllo del motore di ricerca. Il search engine la legge periodicamente e prende in carico le eventuali modifiche che vi trova dentro.

Una sitemap per Google, Yahoo! e Microsoft

Qualche anno fa era necessario creare diverse sitemaps, una per ogni motore di ricerca. Ora non è più necessario. I search engine hanno uniformato le proprie regole adottando lo stesso protocollo standard, il protocollo Sitemaps ( http://www.sitemaps.org/it/ ).

il sito ufficiale del protocollo Sitemaps

E' quindi sufficiente creare un'unica Sitemap del sito, seguendo le regole del protocollo Sitemaps, e segnalare lo stesso file sui vari motori di ricerca.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. Cos'è l'indicizzazione
  2. La deindicizzazione
  3. Il metatag robots
  4. La SiteMap del sito
  5. Il file robots.txt

FAQ

  1. Come inserire un sito sui motori di ricerca
  2. Come segnalare un sito ( Submit )
  3. Come segnalare una pagina web su Google
  4. Come bloccare l'indicizzazione di una pagina
  5. Come indicizzare rapidamente una URL su Google
  6. Indicizzare o deindicizzare i tag e le categorie?