Il web semantico
Perché si parla di web semantico? Per capirlo è necessario conoscere il linguaggio HTML.
Per scrivere sul web utilizziamo un linguaggio di markup che aggiunge delle meta-informazioni al testo, permettendoci di organizzare la visualizzazione del testo sullo schermo ( ipertesto ).
Queste meta-informazioni possono influenzare la semantica ossia il significato del messaggio.
La nascita del web semantico
Il web semantico nasce con il linguaggio HTML agli inizi degli anni Novanta. E' ancora in forma grezza, presenta molti limiti, ma può essere considerato come il punto di partenza del semantic web. Grazie ai meta-tags del linguaggio HTML è possibile aggiungere a un documento delle meta-informazioni sul contenuto. Ad esempio, è possibile aggiungere un titolo ( title ), una descrizione ( meta-description ) e una lista di parole chiave ( meta-keywords ).
Oltre a questi meta-tags, il linguaggio HTML ci permette di inserire dei collegamenti ipertestuali ( link ) tra i documenti. Ogni link veicola altre meta-informazioni sul documento linkato. Ad esempio, la frase linkata ( anchor text ) ci fornisce ulteriori informazioni sul contenuto del documento linkato. E' molto importante poiché si tratta di un segnale esterno al documento stesso, non si trova al suo interno bensì su un altro documento, dove è inserito il collegamento ipertestuale.
Il linguaggio HTML fu una grande novità, forse la più importante novità informatica del XX secolo per l'impatto sociale che ha avuto, ma presenta dei limiti come strumento semantico. L'ipertesto è molto flessibile, migliora la comunicazione elettronica, ma lascia ampi spazi all'interpretazione e all'errore. Le meta-informazioni potrebbero non essere scritte in modo efficace dal mittente e, quindi, possono essere male interpretate dal destinatario.
L'introduzione del linguaggio XML
Nel corso degli anni Novanta si cercò di superare i limiti, creando un nuovo linguaggio di supporto in grado di potenziare e ampliare le possibilità di utilizzo del linguaggio HTML. Nacque così il linguaggio XML che consente di aggiungere meta-dati al documento, in grande quantità, organizzando le informazioni all'interno di una struttura.
Con il linguaggio XML è possibile comunicare una grande quantità di dati. Ogni dato è assegnato a un campo che descrive la natura stessa del dato. Ad esempio, se la parola Mosca è presente nel campo "città", è evidente che ci stiamo riferendo alla capitale russa e non all'insetto.
Il tentativo di far nascere l'XHTML
Negli anni duemila il W3C ha cercato di unire l'HTML e l'XML in un unico linguaggio di markup detto XHTML. I tentativi sono stati fallimentari poiché il nuovo linguaggio non era retrocompatibile con i precedenti. L'assenza della retrocompatibilità è un grande problema sul web, dove sono presenti miliardi di documenti scritti in modo diverso.
Inoltre, anche l'XML presenta dei limiti. Non esiste uno standard nell'assegnazione dei nomi dei campi. L'organizzazione della struttura dipende sempre dal singolo programmatore. Ad esempio, un italiano può chiamare il campo "città" mentre un inglese "city". Si tratta della stessa informazione su file diversi ma non è possibile dedurre il collegamento semantico tra i due meta-dati.
Gli schemi di dati e il linguaggio RDF
Per superare questi problemi, nella metà degli anni duemila venne abbandonato l'XHTML per seguire una nuova strada. Si pensò di utilizzare dei meta-linguaggi legati a una base di conoscenza comune. Si diffuse in questi anni l'uso del linguaggio RDF e degli schemi di dati. Questi linguaggi furono creati per la costruzione delle basi di conoscenza, oggi si cerca di applicarli al web.
Grazie al linguaggio RDF è possibile schematizzare una frase in un soggetto, un predicato e in un valore. E' inoltre possibile definire ogni oggetti creando un collegamento a una base di conoscenza, in modo tale da descrivere in modo inequivocabile la sua natura.
Ad esempio, il campo "città" e "city" possono essere collegati alla stessa entità in una base di conoscenza comune ( es. Wikipedia, dBPedia, ecc. ). In questo modo è molto più facile risalire al reale significato delle parole o, per meglio dire, al significato che il mittente di un messaggio vuole dare alle parole. L'uso dei microdati consente ai motori di ricerca di elaborare meglio i testi in modo automatico.
Il linguaggio HTML5
Un'altra novità importante del primo decennio degli anni duemila è la nascita del linguaggio HTML5. Si tratta della quinta edizione del linguaggio HTML. A differenza delle versioni precedenti, l'HTML suddivide il documento in sezioni funzionali. Ad esempio, il testo principale della pagina va inserito nella sezione <article>, la testata del sito web nella sezione <header>, il pié di pagina nella sezione <footer>, e così via. In questo modo è più facile comprendere il significato e l'importanza del testo, in base alla sezione in cui è inserito.
In conclusione il web semantico è il tentativo di schematizzare un testo sul web, al fine di rendere immediata la comprensione delle informazioni, del significato e del messaggio che veicola. E' un processo ancora in corso, nato agli inizi degli anni '90 insieme al web, che poterà in futuro a un web più comprensibile e orga
