L'analisi delle co-occorrenze nel testo

L'analisi delle co-occorrenze consente di trovare i termini e le frasi più importanti intorno a un significato.

Come analizzare le co-occorrenze

Un testo è composto da un insieme di termini combinati tra loro nelle singole frasi. Ogni frase o periodo è un sottoinsieme del corpus.

Uno strumento utile e gratuito è Word Tree. Si tratta di una risorsa online che permette di scansionare le parole ( word ) di un testo e costruire una rappresentazione grafica ad albero ( tree ) logico.

un esempio di rappresentazione del testo con WordTree

A cosa serve WordTree?

La rappresentazione grafica mostra la struttura del testo mettendo in evidenza le parti che si ripetono più volte nel lessico e i termini più vicini, la parola che precede e quella che segue.

Le parole che si ripetono nel testo sono evidenziate con caratteri più grandi.

Oltre ad essere uno strumento di analisi per la comunicazione, il tool è di aiuto anche nell'ottimizzazione semantica di una pagina web ( seo semantica ).

Come funziona Word Tree

WordTree si trova sul sito web ufficiale del suo creatore Jason Davies, è una risorsa pubblica e può essere utilizzata da tutti. L'indirizzo Url è il seguente:

https://www.jasondavies.com/wordtree/

Copio e incollo il testo che voglio analizzare nel modulo Paste Text della form, poi clicco sul pulsante Generate WordTree!.

incollare il testo nel campo Paste Text

Nella pagina seguente il tool mostra la rappresentazione ad albero del testo.

analisi delle co-occorrenze

Già da questa prima visione posso capire a colpo d'occhio se il testo segue uno schema logico e quali sono le parole chiave semantiche ( semantic keyword ) sulle quali è ottimizzato.

Analizzo le singole parole chiave del testo

Una volta individuate le parole di interesse, quelle da approfondire, procedo all'analisi su ciascuna di esse. Digito la singola parola nella barra di ricerca in alto, quella vicino alla scritta Word Tree, e premo sul pulsante invio.

le co-occorrenze che seguono la parola chiave

Il tool mette in evidenza la chiave e mi mostra le co-occorrenze più vicine che seguono la parola. In questo modo, riesco a capire quali sono le co-occorrenze più ripetute.

Nota. Il grado di importanza di ciascuna co-occorrenza è tanto maggiore, quanto più alta è la frequenza della combinazione del testo. Per dirla in modo più semplice, le frasi scritte con carattere più grande su Word Tree, sono quelle che si ripetono di più nel testo e, quindi, sono le più importanti.

Per analizzare anche le co-occorrenze che precedono la parola, spunto la funzione Reverse sulla barra in alto a destra.

l'analisi delle parole che precedono il termine

Quest'ultima visualizzazione mi fornisce altre informazioni sulle parole più ricorrenti che anticipano la parola chiave.

Quali documenti analizzare per trovare le co-occorrenze

In un processo di significazione i testi di analizzare sono ovviamente quelli che hanno lo stesso significato del testo da ottimizzare.

In genere analizzo i documenti dei competitor, quelli ben posizionati sulla chiave di interesse con un tool di check occurrence e aggiungo i documenti enciclopedici che ritengo pertinenti e completi sull'argomento.

Nota. I motori di ricerca forniscono un elenco di risorse rilevanti e pertinenti su ogni argomento e topic, ma non sempre sono anche completi. Per questo motivo integro la lista con altri documenti autorevoli e più esaustivi. Spesso questi ultimi documenti non sono ben posizionati sulle SERP perché poco rilevanti per gli utenti... quindi Google non è d'aiuto. Vanno trovati e scelti con buon senso.

Analizzo i singoli documenti

Una volta individuati i documenti, li esamino singolarmente con Word Tree. In questo modo trovo le co-occorrenze dentro i singoli testi ( TF ).

Analizzo i documenti come un unico corpus

In una seconda fase unisco i documenti in un unico corpus di testo e lo analizzo per scovare quali sono le co-occorrenze orizzontali, quelle che si ripetono in diversi documenti ( IDF ).

L'analisi TF-IDF

Dopo aver ottenuto l'elenco delle co-occorrenze dei documenti e le relative frequenze, elaboro per ciascuna keyword l'indice TF-IDF.

In genere, le parole con il valore più alto di TF-IDF sono quelle più vicine al significato principale.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. Le co-occorrenze
  2. Come trovare le co-occorrenze di una parola
  3. L'analisi delle co-occorrenze con Word Tree
  4. Le menzioni della chiave di brand
  5. Le co-citazioni