Come selezionare le righe di un testo nel regex
Per selezionare soltanto alcune righe di un testo che soddisfano alcune condizioni particolari, posso scrivere un'espressione regolare con gli ancoraggi di inizio riga e di fine riga, rispettivamente l'accento circonflesso ^ e il simbolo del dollaro $.
Un esempio pratico
Esempio 1
Ho un file di testo composto da numerose righe e voglio selezionare soltanto le righe che iniziano con la parola "via".
Con l'ancoraggio ^ posso scrivere la seguente espressione regolare.
In questo caso l'accento circonflesso (^) impone la condizione che la stringa si trovi all'inizio della riga.
Per questa ragione la regex ha selezionato soltanto la stringa via alla terza riga. Non ha invece selezionato la stringa "via" nella prima riga perché non si trova all'inizio della riga.
Nota. Va comunque detto che la regex funziona soltanto se il corpus di testo è suddiviso in più righe tramite i caratteri del ritorno a capo ( multi riga ). Se si trattasse di un unico corpus, l'intero testo verrebbe considerato come un'unica riga. Per simulare un corpus multiriga, nel regex coach ho attivato l'opzione m.
Esempio 2
Con un'espressione simile posso trovare le righe che finiscono con un numero.
Nell'espressione regolare utilizzo il simbolo d ( numero ) seguito dall'ancoraggio di fine riga $.
Grazie all'ancoraggio di fine riga $, l'espressione regolare ha selezionato soltanto la quarta riga. Non ha invece selezionato la seconda riga.
Esempio 3
Ora se volessi individuare le righe che contengono soltanto la parola "ciao", potrei combinare insieme i due ancoraggi ^ e $.
La precedente espressione regolare seleziona l'ultima riga perché è l'unica che risponde a queste caratteristiche. Non seleziona la prima riga.