La credibilità del sito web

La credibilità di un sito web è probabilmente il principale fattore di ranking in qualsiasi algoritmo di ricerca o, perlomeno, in quelli meno evoluti. I search engine affrontano il problema della credibilità di una fonte utilizzando delle euristiche, ossia delle regole che permettono di stimare la reputazione di un sito web a partire dalla presenza o meno di alcune caratteristiche. Le euristiche non sono regole perfette e, spesso, sono facilmente aggirabili quando diventano note a tutti. Pur avendo questi limiti, le euristiche sono comunque preferibili al criterio soggettivo di selezione delle fonte. Quando a decidere sono gli esseri umani... il risultato è sempre peggiore poiché la corruzione dei giudizi umani non è un'eccezione... bensì è la regola.

autorevolezza, reputazione, aggiornamento, popolarità

Quali possono essere gli aspetti che un algoritmo di ricerca associa alla credibilità? Provo a stilare una lista, non completa, che dovrebbe rendere l'idea del funzionamento del trust rank ( indicatore di fiducia ) di un algoritmo di ricerca sul web.

  • L'estensione del dominio. Alcune estensioni di dominio sono autorevoli di per sé, basti pensare ai .gov o ai .edu che possono essere registrati per regolamento soltanto da enti governativi o da università. Sono una sorta di marchio di qualità e, quindi, di credibilità della fonte. Le estensioni liberamente registrabili da tutti sono, invece, meno importanti o del tutto ininfluenti sulla credibilità di una fonte. Se un sito risiede su un .com o su un .it fa ben poca differenza. Talvolta l'estensione .org beneficia di qualche punto in più di credibilità rispetto al .com, si tratta però di una semplice percezione umana che lega questa estensione alle organizzazioni umanitarie o no-profit. Nella realtà, un algoritmo non dovrebbe tenerne conto poiché chiunque può registrare un dominio .org e utilizzarlo per qualsiasi finalità.
    la credibilità online e la relazione con l'estensione del dominio di primo livello
  • Il numero dei link verso la fonte. Il numero dei collegamenti ipertestuali verso una fonte. Non è importante la quantità dei link bensì la varianza. Avere milioni di link provenienti da un numero circoscritto di siti web, magari situati sulla stessa famiglia IP, è una situazione ben poco credibile. È chiaro che si tratta di link artificiali, di spam o di uno schema di link building. Avere migliaia di siti web, ognuno dei quali proviene da una fonte diversa, è sicuramente una situazione migliore, significa che il sito linkato è considerato credibile da altre persone tramite link naturali. Ovviamente... non basta la presenza del link, è necessario che questo sia situato in pagine che trattano un argomento attinente. In caso contrario... è semplicemente spam.
    link naturali e spam
  • L'autorevolezza dell'autore. Negli ultimi anni il motore di ricerca Google ha lanciato il concetto di authorship, in pratica ogni autore può aprire un profilo sul social network Google Plus e associarlo agli articoli che pubblica in rete. In questo modo il search engine può comprendere meglio di cosa si occupa la persona, nonché quali e quante persone lo considerano autorevole ( follower, menzioni, condivisioni e altri indicatori sociali provenienti dai social network ). L'author rank ha senza dubbio una certa influenza sulle SERP di Google. L'autorevolezza di un autore è determinata anche dalla reputazione, ossia dalle scelte passate della persona. Quando un autore pubblica articoli originali (Q) nel corso del tempo, migliora la sua reputazione. Se ogni tanto l'autore pubblica anche qualche contenuto spammoso o di dubbio valore (Q=0 / Q<0), la peggiora o la azzera. La reputazione (R) si costruisce nel tempo, con costanza e dedizione, ma si può distruggere in un attimo.
    la reputazione di un autore e la qualità delle pubblicazioni nel tempo
  • Il numero degli autori di un sito web. Va specificato che l'autore di un articolo non necessariamente deve essere il proprietario del sito web, in quanto un autore affermato può scrivere su più fonti ( siti ). Quando un sito web pubblica gli articoli di molti autori ( firme ), è considerabile al pari di una redazione giornalistica, con un livello di credibilità superiore a quello di un blog dove scrive soltanto una persona. In questo caso la fonte è valutata come una collezione di autori. Il massimo si ottiene quando molti autori, firme autorevoli, scrivono su una stessa fonte.
    autorevolezza di una redazione gionalistica e di un blogger
  • I riferimenti e dati societari. Un sito web credibile pubblica sempre nel footer i propri riferimenti anagrafici o societari nelle proprie pagine ( partita iva, il telefono, il numero iscrizione alla camera di commercio REA, l'indirizzo, il fax, ecc. ). La presenza di questi dati potrebbe essere considerato un ulteriore segnale di credibilità o, per dirla meglio, in alcuni settori l'assenza di questi dati è un cattivo indicatore di qualità. Ad esempio, è molto strano navigare in un sito web e-commerce privo di informazioni societarie e di riferimenti di contatto. È altrettanto strano vedere il sito web di un giornale che non riporti la data e il numero di iscrizione della testata giornalistica.
  • L'originalità dei contenuti pubblicati. I contenuti di un sito web sono gli elementi che compongono la collezione delle informazioni e che determinano il valore di insieme della fonte. Ogni singolo pezzo della collezione ( articolo, foto, ecc. ) contribuisce a determinare la credibilità della fonte. Quando una collezione viene sporcata dalla presenza di pezzi di basso valore, articoli publiredazionali o poco originali, inevitabilmente l'intero insieme, la collezione, ne risente. Per questa ragione i testi copiati da altri siti, non originali, o le foto di repertorio ( stock photo ) già presenti su migliaia di altri siti web andrebbero evitate, in quanto sono i segnali di bassa originalità. Gli stessi argomenti dovrebbero essere affrontati in modo originale, evitando di ripetere le solite banalità già presenti in rete, senza aggiungere alcun valore. Ad esempio, la collezione A è composta da tre pezzi a media originalità e uno di scarsa qualità. La collezione B è, invece, composta da un pezzo ad elevata originalità e da quattro contenuti copiati o spam. Pur avendo all'interno un elemento di grande qualità/originalità, la collezione B è considerata meno credibile della collezione A.
    l'originalità dei contenuti pubblicati
  • L'aggiornamento dei contenuti. L'aggiornamento è un altro indicatore di qualità e di vitalità. La frequenza di produzione di nuovi contenuti, originali e di qualità, contribuisce ad aumentare la credibilità di una fonte. Non è però importante il volume, la quantità delle nuove pubblicazioni, bensì la qualità, la costanza e il tempismo. Le notizie fresche sono molto importanti, purché la fonte sia la prima a pubblicare una determinata notizia. La rielaborazione della notizia del giorno, quella già pubblicata su migliaia di altri siti, è ben poco rilevante. Essere i primi è un fattore di qualità. Agli occhi di un motore di ricerca potrebbe essere più credibile una fonte con un basso livello di aggiornamento e un elevato livello di originalità dei nuovi pezzi, piuttosto che un'altra fonte con un alto livello di aggiornamento dell'home page ma un livello medio-basso di originalità degli articoli ( es. aggregatore ). Il massimo si ottiene quando una fonte pubblica costantemente degli articoli originali nel corso del tempo. Ad esempio, la fonte A pubblica pochi articoli nel tempo ma tutti ad elevata qualità/originalità. La fonte B, invece, ha una frequenza di aggiornamento molto alta, pubblica tutti i giorni nuovi articoli, ma i pezzi sono poco originali o di scarsa qualità. Agli occhi di un algoritmo di ricerca la fonte A è più credibile della fonte B, pur avendo una frequenza di aggiornamento inferiore.
    la frequenza di aggiornamento e la qualità dei contenuti
  • La presenza dei link interrotti. La presenza di link interrotti nelle pagine è un indicatore negativo in termini di credibilità. Può significare che la pagina non è più aggiornata da molto tempo oppure, se la pagina è recente, l'autore non ha dedicato molta attenzione a curare tutti gli aspetti del documento. In qualsiasi caso, i link interrotti minano la credibilità online dell'autore, della pagina web e del sito web che la ospita.
  • Gli errori ortografici o grammaticali. La presenza degli errori ortografici è un altro indizio di scarsa credibilità. Il testo potrebbe essere stato tradotto automaticamente da qualche articolo straniero, utilizzando i tool di traduzione automatic online. Se, invece, gli errori ortografici e grammaticali sono naturali... indicano che l'autore ha una scarsa preparazione di base oppure l'autore non ha dedicato sufficiente attenzione e cura nel rileggere l'articolo ed eliminare i refusi. In tutti i casi, la fonte perde credibilità.
  • Elevata presenza di pubblicità nella pagina. La presenza dei messaggi pubblicitari riduce la credibilità di una fonte. Quando il rapporto tra pubblicità e contenuto è molto alto, il lettore non riesce più a distinguere tra le informazioni e l'advertising. Questa situazione può verificarsi a causa di una cattiva organizzazione editorale dei contenuti oppure può essere volutamente costruita per indurre il lettore a cliccare sulla pubblicità. È un segnale di scarsa rispetto nei confronti dell'utente e, quindi, di bassa credibilità della fonte. Il rapporto tra pubblicità e contenuto deve essere minimo. Inoltre, la pubblicità dovrebbe sempre essere separata dal contenuto informativo.

L'elenco non è completo, sicuramente vi aggiungerò altre considerazioni in futuro. Possono sembrare banalità ma ancora oggi i motori di ricerca posizionano nei loro risultati di ricerca le pagine degli aggregatori... un dato che lascia intendere quanto siano ancora lontani dall'aver individuato delle euristiche efficaci. Alcuni motori risolvono il problema affidando al personale autorizzato, i cosiddetti quality raters, il compito di giudicare una fonte. Quest'ultima soluzione è persino peggiore del male poiché il giudizio soggettivo di una persona è corruttibile e vanifica qualsiasi sforzo di costruire un criterio oggettivo di valutazione efficace. Del resto... basti guardare il livello di qualità ottenuto dalle directory online per rendersi conto dell'inefficacia, della parzialità e dello scarso livello di qualità del giudizio umano degli editori. In conclusione, a partire dalle ipotesi precedenti il fattore determinante che emerge in un algoritmo di ricerca è l'originalità del contenuto. La pubblicazione di un contenuto originale aggiorna una fonte e crea l'interesse nel pubblico che, indirettamente, determina in modo naturale la popolarità di un articolo sul web. Dall'originalità del contenuto deriva tutto il resto. 04 / 07 / 2014

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento

Autorevolezza del sito

  1. L'autorevolezza di un sito web
  2. E-A-T ( Expertise, Authoritative, Trustworthy )
  3. La reputazione del sito
  4. Cosa significa expertise?
  5. L'author rank