Le co-occorrenze

Cos'è la co-occorrenza

La co-occorrenza ( co-occurrence ) è un termine che accompagna di frequente una parola chiave, quando si parla di un certo argomento. E' una coppia di occorrenze, un'associazione o combinazione di parole.

Ad esempio, se l'argomento trattato di un documento è la SEO, è molto probabile trovare al suo interno dei termini come "ottimizzazione", "search engine", "posizionamento", ecc.

Questi termini sono le co-occorrenze della keyword SEO, in quanto la accompagnano in un discorso o in un documento. Sono le combinazioni di parole che appaiono con maggiore frequenza questo tema.

Le parole chiave e le parole principali

Le co-occorrenze riguardano soltanto le parole principali, quelle che si presentano soltanto in alcuni discorsi e non in tutti. Questi termini sono facilmente individuabili ricorrendo ad algoritmi come il TF-IDF.

Sono invece escluse dalle co-occurrence tutte la parole comuni, eliminate dall'analisi del testo come stop-word.

Ad esempio, gli elementi grammaticali di un discorso ( articoli, avverbi, verbi, aggettivi, ecc. ) sono esclusi dal computo, perché non veicolano un'informazione importante.

Un esempio pratico di co-occorrenze

Prendiamo due testi, in entrambi si trova la parola chiave "Panda". Nel primo documento è utilizzato per indicare uno degli algoritmi di Google. Nel secondo documento, invece, il termine è usato per riferirsi a un software antivirus. Si tratta di due contesti e argomenti diversi. E' evidente.

esempio di co-occorrenze in due testi

Come fa Google a capire il significato dietro la parola chiave? Quando una parola ha diversi significati, il motore di ricerca analizza le altre parole chiave nel documento e le confronta con una base di conoscenza che prende come riferimento.

In questo caso, nella sua knowledge base il termine "Panda" è associato a quattro significati differenti ( vettori semantici ). Ogni insieme o vettore rappresenta un particolare spazio o campo semantico ( wordspace ).

un esempio di base di conoscenza

Nel primo documento le altre parole chiave sono "algoritmo", "ranking", "motore di ricerca", "Google". Nella base di conoscenza questi termini compaiono dentro l'insieme "Web". Quindi, Google capisce che nel primo documento si parla dell'algoritmo Panda ed esclude gli altri significati possibili.

Nel secondo documento, invece, le altre parole chiave sono "sicurezza informatica", "software antivirus", "Avira", "Avast". Sono tutti termini inclusi nell'insieme "antivirus". Anche in questo, Google comprende che si sta parlando del software ed esclude gli altri significati.

In conclusione, analizzando la combinazione delle parole che accompagnano una parola chiave, ossia delle co-occorrenze, si può risalire all'origine semantica della keyword.

A cosa servono?

Nella Seo semantica le co-occurrence sono le parole chiave semantiche, quelle che definiscono una seo entity. Sono particolarmente importanti perché da queste un search engine riesce a comprendere il significato del testo.

Un motore di ricerca non interpreta il significato delle frasi ( comprensione per interpretazione ), bensì si limita ad approssimarlo tramite un'euristica linguistica, analizzando le alle associazioni tra le parole utilizzate all'interno del testo ( comprensione associativa ).

I search engine utilizzano le co-occorrenze per alimentare delle basi di conoscenza linguistiche in cui ciascun termine viene messo in relazione con tutti gli altri. Dai cluster il search engine risale ai concetti e alle entità semantiche.

Analizzando il database relazionale dei termini, il motore di ricerca riesce a calcolare quali termini sono utilizzati su un particolare argomento, ragionamento o bisogno, con quale frequenza e prossimità dei termini.

In questi casi non è importante la frequenza di un singolo termine all'interno del documento, come avveniva nella vecchia keyword density, ma la presenza nel documento dei termini appartenenti alla stessa entità.

Le co-occorrenze del documento e del sito web

Le co-occorrenze possono essere calcolate in riferimento a:

  • a un singolo documento ( on-page )
  • ai documenti in una cartella o sottodominio
  • ai documenti in un sito web ( on-site ).

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

Domande / Risposte

  1. Ciao Andrea, bellissimo e chiarissimo articolo! Ma quindi scrivere un testo ad esempio un articolo di un blog inserendo le co-occorrenze è utile in ottica seo, e in che modo? Cioè il motore, capendo meglio il significato del testo ti fa salire di più nelle serp? O servono per non creare confusione al motore, e quindi a indicizzare correttamente il testo? cioè se parlo di panda e non metto le co occorrenze potrebbe non capire se sto parlando della macchina o dell'animale e quindi non restituire il mio articolo agli utenti in seguito alle loro ricerche? ( 8 gennaio 2018 )

    Risposta. In ottica SEO le co-occorrenze ci aiutano a far indicizzare una pagina soltanto sulle SERP giuste del motore di ricerca, quelle in cui forniamo una risposta utile agli utenti. Non su tutte le altre ( off-topic, ambigue, ecc. ). In questo modo, la pagina beneficia prevalentemente di segnali di good user experience e dovrebbe migliorare il proprio ranking nel corso del tempo sul search engine. Ad esempio, è inutile e anche dannoso parlare di panda (animale) a chi cerca informazioni sull'automobile. Quando Google elabora i segnali di bad ux, toglie visibilità alla pagina su tutte le ricerche, in particolar modo se non comprende bene a quale bisogno specifico sta rispondendo. Inoltre, da un punto di vista più marketing-informatico, con una buona ottimizzazione semantica del contenuto si sprecano meno risorse ( es. banda internet del server, customer care, ecc. ) e migliora il tasso di conversione in lead/clienti della comunicazione.

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. Le co-occorrenze
  2. Come trovare le co-occorrenze di una parola
  3. L'analisi delle co-occorrenze con Word Tree
  4. Le menzioni della chiave di brand
  5. Le co-citazioni