Ingegneria del testo
L'ingegneria del testo ( Text Engineering ) è una disciplina tecnica dell'informatica che si occupa di studiare e realizzare i processi di scrittura automatica delle informazioni da parte di un software.
Il testo come prodotto
Qualsiasi testo può essere visto come il risultato di un processo di lavorazione, in cui i fattori produttivi sono combinati secondo un particolare modo e ordine sequenziale.
Un documento è organizzato in una struttura portante. un telaio in cui sono riposti i componenti, le frasi e le parole. Può essere consumato da terzi e raggiungere uno scopo.
In conclusione, il testo è un prodotto da costruire al pari di qualsiasi altro oggetto artefatto umano
A cosa serve l'ingegneria del testo
Le principali applicazioni della disciplina sono le seguenti.
- Text Mining. Si tratta di una tecnica per reperire informazioni utili nascoste nei documenti di una base dati o di una base di conoscenza. E' una tecnica utilizzata attualmente nell'Information Retrieval ( es. motori di ricerca, search engine, sistemi esperti, ecc. ) e nel settore marketing nei sistemi di Data Mining. Si basa sull'analisi lessicometrica del testo.
Nota. Le informazioni contenute nei testi non sono interpretate dal software ma soltanto stimate per associazione ( es. co-occorrenze ).
- Comunicazione. Un testo ottimizzato secondo un modello ingegneristico potrebbe aiutare a comunicare meglio un messaggio e raggiungere un determinato obiettivo di business. E' sempre l'uomo a scrivere il testo. Il software elabora il manoscritto per fornire dei suggerimenti pratici all'autore.
Nota. Questi software sono in grado di interpretare l'informazione scritta in linguaggio naturale nel testo. Sono, quindi, più avanzati rispetto agli algoritmi di text mining. Utilizzano delle basi di conoscenza ( knowledge base ) e, almeno in parte, anche degli algoritmi di intelligenza artificiale per comprendere il significato dei testi.
- Intelligenza artificiale. Le informazioni testuali possono essere prodotte anche da un programma informatico intelligente. Questi software sono interfacciati con una base dati da cui prendono le informazioni. Sono in grado di comporre una sequenza di parole di senso compiuto per trasmettere l'informazione tramite il linguaggio naturale degli uomini.
Nota. Non si tratta di semplice riproduzione meccanica del testo tramite la combinazione di frasi ( spinning ) ma di un prodotto elaborato dall'intelligenza artificiale. In quest'ultimo caso l'autore del testo non è l'uomo ma la macchina. All'uomo potrebbe spettare soltanto il compito di supervisionare e confermare il documento scritto dal computer.