Information Retrieval ( IR )

L'Information Retrieval (IR) è la disciplina informatica che analizza le tecniche di interrogazione e organizzazione dei dati in un archivio ( database o base dati ). La traduzione letterale in italiano è sicuramente più chiara, Information Retrieval vuol dire reperimento delle informazioni.

Come funziona un processo IR

Il punto di partenza è sempre la domanda dell'utente che interroga il sistema informatico per cercare un'informazione. Questa richiesta è detta ASK ( Anomalous State of Knowledge ) e rappresenta l'esigenza informativa della persona.

La richiesta di informazioni ( ASK ) viene immessa in input dall'utente nel sistema informatico, digitata sulla tastiera o dettata in riconoscimento vocale. L'insieme dei termini scelti dall'utente per fare la richiesta è detto QUERY.

Differenza tra Ask e Query. La richiesta Ask identifica il bisogno dell'utente, ciò che sta cercando. La Query è una rappresentazione lessicale del bisogno. I due concetti non sempre sono facilmente collegabili tra loro.

A partire dalla Query il sistema informatico cerca di risalire all'esigenza dell'utente ( Ask ). Successivamente seleziona le risorse più attinenti ( Resource Finding ) che trova nel suo archivio e le ordina per rilevanza in una pagina dei risultati.

La pagina dei risultati rappresenta l'offerta informativa restituita in output dal sistema informatico in risposta alla query.

Nota. Nei motori di ricerca la pagina dei risultati è detta SERP ( Search Engine Results/Report Page ). I risultati sono composti da un breve abstract informativo ( snippet ) e da un collegamento ipertestuale ( link ) all'indirizzo URL ( Uniform Resource Locator ) che identifica in modo univoco la risorsa nella rete.

L'attinenza e la rilevanza

Il processo di selezione delle informazioni ( searching ) si basa essenzialmente su due obiettivi, l'attinenza ( o pertinenza ) e la rilevanza.

  1. Attinenza. Una risorsa è attinente con la query dell'utente quando condivide lo stesso argomento ( tema ). L'attinenza è anche conosciuta come pertinenza o aboutness. Trattandosi di un aspetto oggettivo, è spesso possibile misurare il grado di attinenza del sistema.
  2. Rilevanza. Una risorsa è rilevante se soddisfa il bisogno informativo dell'utente ( Ask ). Trattandosi di utilità, non può essere misurata ed è strettamente soggettiva. La rilevanza può essere dedotta analizzando il comportamento dell'utente sulla pagina dei risultati.

Un buon sistema IR dovrebbe restituire un elenco di risultati attinenti e rilevanti.

Nota. La qualità del sistema IR non può essere misurata soltanto in termini di attinenza, in quanto una risposta pertinente potrebbe anche essere inutile ( non rilevante ) per l'utente finale. Ad esempio, la query "rimedi contro il raffreddore" potrebbe restituire un risultato di rimedi pratici e un documento accademico, entrambi sono pertinenti ma soltanto il primo è rilevante per l'utente.


 
Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base
  1. Information Retrieval ( IR )
  2. I descrittori
  3. Stemming