La differenza tra pertinenza e rilevanza

La pertinenza e la rilevanza sono due aspetti diversi del processo di Information Retrieval di un motore di ricerca.

  • La pertinenza indica il grado di vicinanza semantica di un testo a un particolare ambito. E' un indicatore oggettivo e spesso coincide con la conoscenza enciclopedica.
  • La rilevanza indica il grado di importanza dell'informazione per l'utente finale. E' un indicatore soggettivo e relativo che dipende essenzialmente dal bisogno e dall'intenzione di ricerca dell'utente.

Sono concetti alla base degli algoritmi di ricerca semantica nei search engine di oggi.

Come si usano in un motore di ricerca

Un motore di ricerca semantico estrapola gli argomenti ( topic ) da un testo e li considera come variabili casuali.

L'algoritmo analizza le combinazioni dei termini presenti in una pagina web per calcolare il suo grado di vicinanza ( campo di pertinenza ) con una materia o argomento. Ogni argomento viene visto come un insieme di termini pertinenti.

A sua volta il campo di pertinenza è composto da vari sottoinsiemi di rilevanza.

Per selezionare il campo di rilevanza corretto, il search engine analizza l'intenzione di ricerca dell'utente ( user intent ) che si nasconde nella query, nelle ricerche precedenti o nelle abitudini dell'utente.

Un esempio pratico

Ad esempio, digitiamo su Google la query "iscrizione a Facebook". L'algoritmo scandaglia l'insieme delle risorse pertinenti trovando quelli più pertinenti, in particolar modo i tutorial sulle procedure di iscrizione passo dopo passo.

Non tutti i documenti pertinenti si riferiscono però al social network di Mark Zuckerberg, alcuni potrebbero essere tutorial che aiutano l'utente a iscriversi su G+ oppure su Twitter. Queste ultime risorse sono pertinenti ma poco rilevanti.

Il compito del motore di ricerca è fornire una risposta alla query dell'utente che sia pertinente ma anche rilevante.

L'algoritmo di ricerca estrae le risorse più rilevanti tra quelle pertinenti, quei documenti in cui la procedura di iscrizione sia relativa a Facebook, e infine li ordina nella pagina dei risultati di ricerca in ordine di autorevolezza e/o di un indicatore qualitativo che stima la soddisfazione dell'utente ( soddisfazione attesa ).

ricerca semantica rilevanza pertinenza

Nel diagramma cartesiano possiamo individuare quattro tipi di risultati:

  1. Pertinenti e rilevanti ( A ). Sono i risultati migliori, quelli con una maggiore probabilità di soddisfare la richiesta dell'utente. Sono sia pertinenti all'argomento che rilevanti per l'utente finale.
  2. Pertinenti ma irrilevanti ( B ). Sono risorse pertinenti sul tema ma completamente inutili per l'utente finale. Queste risorse sono generalmente scartate. Può comunque capitare che il search engine le sperimenti all'interno della Serp ( vedi la tecnica del doppio significato ) per ragioni di infodiversità.
  3. Non pertinenti e irrilevanti ( C ). Sono le risorse peggiori perché off-topic ( fuori argomento ). Sono le prime a essere scartate nel processo di selezione.
  4. Rilevanti ma non pertinenti ( D ). Sono risorse completamente estranee al campo di pertinenza, pur essendo potenzialmente rilevanti per l'utente.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. La rilevanza