L'ampiezza lessicale

L'ampiezza lessicale è il numero delle forme grafiche differenti ( vocaboli o word types ) all'interno di un documento. E' anche detta ampiezza del vocabolario oppure lessico.

Ad esempio, se associamo una lettera a ogni vocabolo della seguente frase, possiamo notare che alcune lettere si ripetono più volte ( B e C ) mentre altre no ( hapax ).

esempio di occorrenze

Sommando il numero dei vocaboli, senza considerare la loro frequenza di apparizione nel testo, otteniamo la quantità di parole diverse utilizzate nel testo ( vocaboli ) ossia la sua ampiezza lessicale o ampiezza del vocabolario ( V ).

La formula dell'ampiezza lessicale è la seguente:

la formula dell'ampiezza del testo

Nell'esempio precedente sono presenti soltanto otto forme grafiche. L'ampiezza lessicale della frase, quindi, è pari a otto.

il numero delle occorrenze e delle forme grafiche



Nel testo sono presenti due classi di vocaboli, la prima con frequenza unitaria (V1 o hapax) e la seconda con frequenza massima pari a due (V2). Sommando le classi otteniamo V1+V2=6+2=8.

L'ampiezza lessicale è uno degli indicatori principali dell'analisi lessicometrica.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base
  1. L'analisi automatica del testo
  2. La disambiguazione delle forme grafiche
  3. La riduzione delle parole con iniziale maiuscola
  4. L'analisi lessicometrica
  5. L'analisi lessicale del testo
  6. L'analisi grammaticale
  7. L'analisi dei segmenti
  8. La lessicazione
  9. L'analisi delle specificità
  10. L'indice di significatività del segmento
  11. Le occorrenze
  12. L'ampiezza lessicale
  13. La dimensione del testo
  14. Gli hapax