Co-occorrenze del testo e seo semantica

Le co-occorrenze sono le parole presenti in una frase, un paragrafo, un documento oppure un insieme di documenti. Si tratta di combinazioni di termini che, al netto delle parole comuni e delle stop word, consentono di comprendere di quale argomento si sta trattando.

Questo processo di comprensione è molto simile a quello di un search engine semantico, il quale non ha ancora la possibilità di leggere e interpretare il significato delle parole dalla lettura in sequenza delle stesse. Può però capirlo approssimativamente analizzando le associazioni delle parole.

Ad esempio, in questa pagina compaiono termini molto specifici come search engine, seo, semantica, ecc. Questi termini sono le co-occorrenze del documento. Altre parole, invece, sono di uso comune, come i verbi o gli articoli, e possiamo tranquillamente trascurarli ( cd stop word ).

Per comprendere l'argomento o il tema, il search engine confronta le co-occorrenze specifiche presenti nel testo con le combinazioni di termini nei vari campi della sua base di conoscenza.

Nel seguente esempio viene mostrato il caso di una frase contenente la parola pesca. Analizzando le altre parole, il motore di ricerca comprende il significato della parola e l'argomento del documento.

Quando la comparazione dei due insiemi di parole è esatta o molto simile, l'algoritmo può associare il testo al campo semantico ( argomento ).

Nel caso di questo documento, il campo semantico con parole specifiche simili è quello relativo alla seo semantica.

    La comprensione associativa del significato di un testo

    Le co-occorrenze sono alla base della comprensione associativa. L'algoritmo non interpreta il significato di ogni parola, si limita a risalire all'argomento generale analizzando le relazioni tra le parole di un testo e confrontando con quelle di un database di riferimento ( base di conoscenza ).

    Ad esempio, io potrei scrivere che la seo semantica non è parte della seo. Il motore di ricerca non legge la negazione "non", nella comprensione associativa la sua presenza è irrilevante, il search engine evidenzia nella frase soltanto le relazioni tra le parole specifiche, seo e semantica.

    un esempio di frase con associazioni corrette ma priva di significato

    Per questa ragione l'algoritmo di analisi delle co-occorrenze non può essere classificato tra gli algoritmi avanzati dell'intelligenza artificiale o della lettura semantica automatica di un testo.

    Al contrario, è soltanto una semplice euristica della linguistica, quasi meccanica, per risalire velocemente all'argomento del testo, senza approfondire il significato vero e proprio del testo.

    Alle parole della frase non viene attribuito un significato particolare. Il documento o la frase viene semplicemente diviso in gruppi di parole per valutare il significato complessivo o, perlomeno, l'argomento di cui si parla.

     


     

    Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

    FacebookTwitterLinkedinLinkedin
    knowledge base

    Libri di approfondimento
    1. La ricerca semantica ( introduzione )
    2. La semantic search
    3. L'analisi automatica del testo