Come selezionare le parole del testo
Per trovare le parole di un testo tramite un'espressione regolare ( regex ) è molto utile combinare i terminatori W e B.
Il terminatore W individua i caratteri dentro una parola.
Il terminatore B, invece, individua i bordi della parola.
Nota. I terminatori W e B sono ancoraggi complementari. Usandoli insieme posso trovare le parole nel testo.
Ecco qualche esempio pratico
Come trovare le parole di tre caratteri
Nel seguente esempio voglio trovare tutte le parole nel testo composte da tre caratteri.
I tre terminatori w individuano tutti i caratteri alfanumerici.
Nota. Se avessi usato il jolly (.) al posto del terminatore w, l'espressione regolare avrebbe selezionato anche i gruppi di tre caratteri composti da separatori. Non solo le parole di tre lettere. Quindi, in questo caso l'uso del terminatore w è stato indispensabile per raggiungere l'obiettivo perché individua soltanto i caratteri dentro una parola.
Come trovare tutte le parole del testo
Per selezionare tutte le parole di un testo è sufficiente usare i terminatori b e w con l'operatore +.
L'operatore + individua tutti i gruppi di caratteri dentro un termine (w), indipendentemente dalla lunghezza della parola.
Come trovare i separatori del testo, spazi, punti e virgole
Per selezionare i caratteri separatori del testo, quelli che separano le parole, si utilizza il terminatore W maiuscolo.
In questo caso, l'espressione regolare seleziona tutti i separatori del testo, gli spazi e i punti di ortografia.
Quali caratteri seleziona il terminatore W? Il terminatore W seleziona tutti i caratteri tranne le lettere, i numeri e la sottolineatura.