Analisi delle specificitÃ
L'analisi delle specificità è la fase dell'analisi del testo in cui si evidenziano le forme grafiche specifiche di un testo o di una parte del testo ( es. sezione, paragrafo, ecc. ).
In questo caso non vi è un confronto tra i termini del testo con un vocabolario esterno, la comparazione viene effettuata intra-corpus tra ogni forma grafica di una sezione e l'intero corpus del testo oppure tra i termini di due sezioni diverse del corpus.
Un indice di specificità si può calcolare tramite il chi-quadrato. Si calcola lo scarto standard tra la frequenza di una forma grafica Fi all'interno di una sezione del testo e quella della stessa parola F*i nel resto del testo o in un'altra sezione.
In questo modo, si individuano i termini specifici in ogni singola sezione o paragrafo del testo.
Nota: l'analisi delle specificità è molto simile alla lessicazione peculiare ( o lessicazione di frequenza ). La differenza è nella base di riferimento. Nell'analisi delle specificità si confronta il termine restando dentro i confini del documento ( intra-corpus ). Nella lessicazione di frequenza, invece, il termine viene confrontato con un vocabolario esterno.