Come funziona la ricerca semantica

Conosci già il significato di ricerca semantica, questi algoritmi non utilizzano soltanto le parole chiave ma cercano soprattutto di comprendere il senso delle parole e delle frasi. Per riuscirci hanno bisogno di una libreria di ontologie, di un linguaggio ( es.RDF ) e di un insieme di risorse ( URI ).

gli elementi fondamentali della semantic serch: le risorse URI, il linguaggio RDF e le ontologie della base di conoscenza

Cos'è la libreria delle ontologie

Le basi di conoscenza ( knowledge base ) sono l'elemento più importante della semantic search. Se il database delle informazioni è completo e attendibile, anche i risultati del search engine lo saranno.

Nella base di conoscenza i dati sono catalogati in ontologie, secondo un'organizzazione logica e strutturata che facilita il reperimento delle conoscenza.

La libreria delle ontologie è pubblica poiché, per essere efficace, deve essere utilizzata sia dal search engine che dai produttori dei contenuti ( siti web ).

Cos'è il linguaggio RDF

La sigla RDF sta per Resource Description Framework. Questo linguaggio consente di comunicare le informazioni secondo una struttura standard ( framework ) riconosciuta da tutti.

Si tratta di un linguaggio informatico che semplifica l'organizzazione delle informazioni nelle risorse online.

Ad esempio, una pagina web descrive le caratteristiche di una località. Per comunicare meglio al motore di ricerca che si tratta di un luogo preciso, il webmaster inserisce nella pagina le coordinate della latitudine e della longitudine del posto.

Le coordinate non sono però pubblicate come semplice testo. Il webmaster le inserisce nel codice sorgente utilizzando il linguaggio RDF.

Le regole del linguaggio RDF sono conosciute anche dal search engine che, in questo modo, riesce a capire meglio il significato delle informazioni contenute nella pagina web.

Cosa sono le risorse URI

Sono semplicemente le risorse disponibili sul web, possono essere documenti, pagine web, immagini, ecc.

Il termine URI significa Universal Resource Identifier. Ogni risorsa online è identificata in modo universale da un indirizzo univoco.

Ad esempio, questa pagina ha un indirizzo http che consente a chiunque di raggiungerla. Non esistono altre risorse con lo stesso indirizzo.

Lo stesso vale per tutte le risorse online. Tutte sono univocamente identificate da un indirizzo URI. Per ogni pagina web c'è uno e un solo indirizzo.

In conclusione

Le risorse URI sono l'insieme dei documenti sul web. Oltre al contenuto informativo testuale o multimediale, nei documenti (risorse) è possibile inserire delle informazioni tratte da una base di conoscenza (ontologia) tramite un linguaggio informatico che permette al search engine di comprendere meglio il significato semantico dei contenuti della risorsa.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base