Indice di significatività

L'indice di significativa ( IS ) misura il grado di rilevanza di un segmento lessicale all'interno di un corpus. E' uno degli indicatori dell'analisi lessicometrica e dell'analisi dei segmenti. L'indice varia da 0 a 1. Consente di misurare la saturazione del segmento nel testo.

La formula dell'indice di significatività

L'indice può essere calcolato in termini assoluti o percentuali, a seconda se viene messo in rapporto al numero delle parole complessive (A) ossia dell'ampiezza del segmento.

indice di significatività lessicale

La formula dell'IS assoluto si calcola sommando il rapporto tra la frequenza del segmento nel corpus ( Fseg ) e la frequenza di ogni singola parola del segmento ( Fwi ) per tutta l'ampiezza del segmento ( A ) ossia per tutte le parole che compongono il segmento. La somma si moltiplica per il numero delle parole piene ( K ) del segmento.

Per calcolare l'indice IS relativo è sufficiente dividere l'IS assoluto per il numero delle forme grafiche del segmento ( A ) al quadrato, ossia l'ampiezza del segmento al quadrato ( A2 ).

Un esempio di calcolo dell'indice

Quello che segue è un esempio di calcolo dell'indice di significatività assoluto e relativo.

un esempi di calcolo

A cosa serve e come funziona

L'indice IS fornisce una misura quantitativa della rilevanza del segmento all'interno del corpus ( frase, pagina, paragrafo o capitolo ). Consente di misurare il grado di saturazione del segmento rispetto alle parole che lo compongono.

Misura il grado di rilevanza di ogni singola forma grafica ( termine o parola ) del segmento per capire se la sua presenza è rilevante nel segmento oppure no. Il significato dell'indice è il seguente:

il significato dell'indice di significatività

Quando le parole del segmento occorrono molte volte nel corpus, al di fuori del segmento in analisi, il segmento diventa meno rilevante. In questo caso l'indicatore IS' tende a zero.

Viceversa, se le parole del segmento si presentano soltanto all'interno del segmento, non in altre occasioni nel testo, allora il segmento diventa molto rilevante. Aumenta il grado di saturazione e l'indicatore IS' tende a uno.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base
  1. L'analisi automatica del testo
  2. La disambiguazione delle forme grafiche
  3. La riduzione delle parole con iniziale maiuscola
  4. L'analisi lessicometrica
  5. L'analisi lessicale del testo
  6. L'analisi grammaticale
  7. L'analisi dei segmenti
  8. La lessicazione
  9. L'analisi delle specificità
  10. L'indice di significatività del segmento
  11. Le occorrenze
  12. L'ampiezza lessicale
  13. La dimensione del testo
  14. Gli hapax