Database lessicali
Per confrontare il lessico usato in un corpus di testo con quello di riferimento della lingua italiana, si possono utilizzare i seguenti database:
Lessico di poliformi
Il lessico di poliformi è un lessico di riferimento della lingua italiana. E' composto da 121.786 forme grafiche basate sull'italiano scritto e parlato nella lingua italiana contemporanea.
Linguaggio comune
Il Linguaggio comune è un lessico di riferimento della lingua italiana. E' composto da 270 milioni di occorrenze raccolte dal giornale LaRepubblica nel decennio dal 1990 al 1999.
