Il campo semantico delle parole

Cos'è i campo semantico?

E' un concetto della linguistica. Ogni parola del vocabolario ha un suo campo semantico che consiste in un insieme di tutte le altre parole pertinenti.

Ad esempio, la parola "Panda" ha un campo semantico in cui sono inclusi altri termini legati alla zoologia, sempre in riferimento al simpatico animale bianco e nero.

La pertinenza è il legame di appartenenza della parola a un determinato sistema, in cui il termine svolge una funzione ben precisa.

un esempio di campo semantico di una parola

Tutto sarebbe molto semplice e logico se non ci fosse un problema, le parole possono avere accezioni e significati diversi a seconda del discorso, e questo genera molte ambiguità che ostacolano la comprensione del discorso.

Cos'è un'ambiguità semantica?

Si parla di ambiguità semantica quando un vocabolo ha diversi significati, tutti diversi tra loro, e non riusciamo a capire qual è quello giusto in una conversazione. Ogni accezione è pertinente ma nei confronti di un sistema differente. Qual è quello giusto?

Ad esempio, la parola "alimentazione" nel primo insieme indica la dieta alimentare dell'animale. Tuttavia, in un altro contesto potrebbe denotare la tipologia del carburante utilizzato da un'automobile, benzina o diesel, ecc. La parola ha un doppio significato e un doppio senso.

un esempio di ambiguità a causa di un doppio senso nel campo semantico

La cosa si può complicare ulteriormente. Le associazioni di ogni parola possono creare degli incroci molto più ambigui che possono causare l'impasse, una sorta di loop circolare nel processo di inferenza.

Ad esempio, nel campo semantico della parola "alimentazione" è inclusa la parola "automobile" e in quest'ultimo insieme si trova il termine "Panda", in riferimento al noto modello di utilitaria della casa automobilistica italiana FIAT.

A questo si aggiunge che un importante algoritmo anti-spam del motore di ricerca Google si chiama Panda. E proseguendo potremmo trovare diversi campi semantici intorno a questa parola.

un esempio di ambiguità circolare tra diversi campi semantic

Viene a crearsi un'ambiguità semantica molto complessa. Se digito la parola "Panda" a cosa mi sto riferendo? Sto parlando dell'animale, dell'automobile o dell'algoritmo? Il problema è diventato molto più complicato e di ardua soluzione.

il campo semantico di una parola e le associazioni con altri campi semantici con diversa pertinenza

La singola parola non ci permette di risalire al significato corretto. Per comprendere il senso del termine non è sufficiente studiarsi la singola parola, dobbiamo per forza analizzare anche le altre che la accompagnano nella frase o nel discorso, ossia il contesto in cui si trova.

Le difficoltà di un motore di ricerca semantico

Le ambiguità semantiche mettono in difficoltà gli esseri umani, generano fraintendimenti e spesso fanno fare brutte figure a chi li compie.

Se questo accade a un uomo, figuriamo cosa può accadere a un algoritmo di un search engine, il quale non ha ancora la capacità di interpretare i termini. Non riesce a interpretare il contesto, le situazioni o gli stati d'animo.

Come fa un search engine a comprendere i campi semantici?

Come abbiamo già visto in altre pagine, il motore di ricerca semantico cerca di superare questa situazione di impasse analizzando il contesto in cui si trova la parola, ossia le altre parole della frase o del discorso, dette co-occorrenze.

Se nella frase sono contenute molte parole di un particolare campo semantico, il search engine utilizza queste associazioni di termini per risalire all'accezione a cui sono collegate.

Ad esempio, se in un testo sono presenti le parole "Panda", "alimentazione" e "benzina", queste associazioni ci consentono di affermare con discreta sicurezza che si sta parlando dell'automobile.

il processo di inferenza per associazione delle co-occorrenze di una frase ai campi semantici

Questo ragionamento associativo permette al motore di ricerca semantico di superare le difficoltà interpretative e giungere comunque a delimitare l'argomento ( topic ) dell'informazione.

Non è detto però che ci riesca sempre. Alcune forme di comunicazione non sono facili da comprendere. Basti pensare al discorso ironico o alle metafore. Il search engine non riesce a capirle.

Un software informatico può solo contare le associazioni tra i termini e decidere qual è il campo semantico di pertinenza più probabile di una frase. Il campo semantico con più ricorrenze prevale sugli altri.

il campo semantico con maggior numero di ricorrenze determina il significato della parola

Si possono utilizzare anche altre informazioni. Le frasi non viaggiano mai da sole, fanno sempre parte di un discorso più ampio oppure di un testo contenente molte altre frasi. Se nella frase precedente si parla di "automobili" e in quella successiva citiamo il termine "Panda", è ovvio che ci riferiamo all'utilitaria.

esempio di inferenza in base alle co-occorrenze del discorso e non solo della frase che contiene il termine

D'altra parte, il search engine ha anche altri dati in suo possesso da analizzare. Ad esempio, il motore di ricerca conosce le query digitate precedentemente dall'utente e cosa naviga più di frequente quando è collegato alla rete internet.

Conosce abbastanza bene gli interessi del singolo utente e questo, indubbiamente, influenza anche la scelta del campo semantico più pertinente.

Quale campo semantico sceglie un search engine?

Un search engine non utilizza tutti i campi semantici di una parola. Lo scopo del motore di ricerca è essenzialmente quello di fornire delle risposte utili alle domande degli utenti.

Non è un database linguistico, né un'enciclopedia universale del sapere. Ciò che interessa al search engine è soprattutto il campo semantico che più interessa agli utenti. Quello che gli utenti digitano nelle query come parole chiave.

Ad esempio, se il 90% degli utenti considera la parola "Panda" come l'algoritmo antispam di Google, questo viene considerato il campo semantico principale o rilevante. Tutti gli altri campi semantici sono esclusi oppure diventano secondari.

Un campo semantico rilevante è un sottoinsieme del campo semantico della parola ed è composto esclusivamente dalle parole rilevanti, ossia dalle keywords più ricercate dagli utenti.

E' importante ricordare questo aspetto. Diverse accezioni delle parole potrebbero non essere prese in considerazione dai search engine, pur facendo parte del vocabolario linguistico di un paese.

In conclusione

Secondo te lo spider del motore di ricerca quando legge il contenuto di questa pagina riesce a capire il significato o, perlomeno, l'argomento principale di cui si parla? Forse si.

Tuttavia, prima di riuscirci potrebbe trovare qualche difficoltà a capire immediatamente se si sta parlando di motori di ricerca, di automobili oppure di animali.

la scelta del campo semantico non è facile per un algoritmo - gli errori sono molto frequenti

Nel testo di questa pagina ci sono troppi doppi sensi, quiproquo e campi semantici non pertinenti tra loro. E' logico supporre che questi possano generare degli equivoci o dei malintesi in un crawler.

Questo è un aspetto molto importante nella seo semantica. Uno degli scopi dell'ottimizzazione semantica è di evitare qualsiasi possibile travisamento delle informazioni, non indurre in confusione il search engine e agevolare la collocazione del documento nel giusto campo semantico.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. La ricerca semantica ( introduzione )
  2. La semantic search
  3. L'analisi automatica del testo