Descrittori
I descrittori sono uno strumento per descrivere e rappresentare il contenuto informativo di un documento all'interno di una collezione di documenti. Sono utilizzati nei sistemi IR ( Information Retrieval ).
A cosa servono i descrittori
In una base dati composta esclusivamente da testi potrebbe diventare difficile trovare i documenti che affrontano uno stesso argomento.
Esempio. Due documenti parlano dello stesso argomento ma utilizzano parole differenti. Pertanto, non possono essere selezionati contemporaneamente poiché non hanno alcun termine in comune.
Un descrittore è un'etichetta informativa aggiuntiva ( meta-informazione ) da assegnare ai documenti che trattano uno stesso tema.
Esempio. Due documenti usano parole diverse ma trattano lo stesso argomento. Sono riconoscibili dalle co-occorrenze appartenenti allo stesso campo semantico. Il sistema IR può associargli il descrittore del campo semantico, in questo modo i due documenti hanno una chiave in comune e possono essere selezionati contemporaneamente nelle relative query tematiche.
In un sistema IRS può esserci uno o molti descrittori, a seconda delle esigenze della base di conoscenza. Sono uno strumento indispensabile per l'indicizzazione dei documenti all'interno di un motore di ricerca.
Nota. La scelta e l'assegnazione dei descrittori in un sistema IRS può avvenire in modo manuale, semiautomatico o automatico.
La differenza tra descrittori e keyword
Nei search engine online i descrittori sono conosciuti come parole chiave. Tuttavia, il concetto di descrittore è molto più ampio rispetto a quello della keyword.
Un descrittore potrebbe anche essere diverso dalle parole che rappresenta e a cui è associato. La keyword, invece, coincide sempre con un elemento testuale ( termine o segmento ) contenuto nel documento.
Inoltre, i descrittori consentono anche l'associazione delle informazioni testuali agli elementi multimediali che non contengono il testo ( es. video, foto, ecc. ).
Quali sono i vantaggi dei descrittori
Grazie all'indicizzazione dei descrittori è possibile velocizzare le operazioni di interrogazione, reperimento e ricerca delle informazioni contenute nella base dati. Migliora l'efficienza computazionale e si riducono i tempi di risposta, la complessità temporale e spaziale del sistema.
Esempio. Il concetto dei descrittori è simile a quello usato negli indici analitici dei libri cartacei, dove viene associato a ogni parola chiave l'elenco delle pagine in cui compare. Quando si cerca qualcosa in un libro, si trova più rapidamente guardando l'indice piuttosto che cercarla in tutte le pagine. Lo stesso principio vale anche per un database informatico.
Contemporaneamente, i descrittori rendono l'interrogazione più efficace, poiché selezionano un maggior numero di documenti rilevanti intorno a un tema, anche quelli che non usano esattamente la stessa keyword della query dell'utente.
Nota. Tutto però dipende dalla gestione dei descrittori. Se un documento non è indicizzato bene oppure è assegnato a un descrittore errato, non può essere reperito quando serve.
Le caratteristiche dei descrittori
Un sistema di Information Retrieval ( IR ) può dirsi ben organizzato quando presenta le seguenti caratteristiche:
- Esaustività. L'insieme dei descrittori permette una catalogazione completa ed esaustiva della conoscenza contenuta nella base dati.
- Specificità. L'assegnazione dei descrittori è efficace. A ciascun documento sono associati soltanto i descrittori più rilevanti, quelli che rappresentano l'argomento trattato al suo interno.
I descrittori devono consentire di valutare la qualità del sistema in termini di pertinenza e rilevanza dei risultati. Non basta fornire all'utente un elenco di risorse oggettivamente pertinenti alla sua richiesta, è anche necessario che queste siano soggettivamente rilevanti e utili per l'utente.
L'insieme dei decrittori della base dati fornisce anche una rappresentazione unica della collezione dei documenti presenti in archivio.