Recensione del 25 novembre 1997
Petrarca
di Marco Zela
La linguistica è una delle discipline umanistiche che ha fatto grande uso di alcuni
strumenti di ricerca propriamente informatici. L'incontro della speculazione linguistica
tradizionale ed il computer ha dato vita alla Linguistica Computazionale. Oggi con il
prezioso tramite di alcuni CD ROM esploreremo alcuni degli strumenti che il computer ha
messo in mano agli studiosi di linguistica.
Una delle principali funzioni nell'utilizzo del
computer per le scienze umane è quello di riuscire a quantificare con precisione e
velocemente alcuni "fenomeni testuali".
Mi spiego: per esempio è possibile, dopo aver trascritto il testo in formato
elettronico, ottenere gli indici delle parole contenute nel documento esaminato. Se ne
può sapere la loro frequenza, cioè quante volte ricorrono. Oppure è possibile ottenere
un elenco delle situazioni in cui appare una determinata parola.
Uno dei primissimi studiosi che si è reso conto delle potenzialità dei calcolatori
nello studio statistico di un testo è Padre Roberto Busa, che a partire dal 1946 ha
iniziato una celebre ricerca sull'Opera omnia di San Tommaso d'Aquino.
Le operazioni, che una volta compivano a mano i frati chiusi nei monasteri
scartabellando i testi sacri o gli scrivani al servizio di qualche dotto, sono riemerse da
un dimenticatoio etichettato come "pedanteria medioevale" ed ora sono alla base
di una disciplina che sta avendo una notevole evoluzione in questi anni: la linguistica
computazionale, che grazie all'ausilio del computer porta a termine ricerche che nel
passato si potevano compiere solo con secolari sforzi di generazioni di studiosi.
Condizione
fondamentale per la riuscita dei calcoli statistici computerizzati su un'opera letteraria
è che il testo venga digitalizzato correttamente, rispettando rigorosi criteri filologici
- che vanno dalla scelta accurata dell'edizione cartacea di riferimento fino all'esatta
codifica elettronica.
Un secondo problema che si pone ai linguisti è la scelta di un software di analisi
testuale che sia in grado di analizzare i documenti oggetto di studio con precisione ed
attendibilità.
Nei CD della collana l'"Archivio Italiano" editi da Lexis questi problemi
sembrano essere brillantemente risolti. La scelta dei testi per ogni CD della collana è
curata sia dal punto di vista filologico da uno studioso di calibro; ed il software
"Dbt", (sviluppato dall'Istituto di Linguistica Computazionale del Cnr di Pisa)
è garanzia di attendibilità scientifica per tutte le operazioni di analisi sui testi.
Vediamo nel dettaglio uno dei CD della Collana: L'Opera Omnia di Francesco Petrarca a
cura del professor Pasquale Stoppelli. L'uso più elementare che si può fare dell'Opera
Omnia di Francesco Petrarca è ricercare una parola od una frase all'interno dei lavori
del poeta aretino ed ottenere immediatamente un riscontro preciso con riferimento ad
edizioni critiche affidabili.
Ovviamente
però ad uno strumento di ricerca così sofisticato possiamo chiedere molto di più. Con
una elaborazione così impostata possiamo, per esempio, dare il via ad una ricerca
selettiva della parola "amore" nei testi di Petrarca, e mettere così in luce se
la parola "amore" sia più frequente nelle liriche del grande poeta piuttosto
che nella prosa.
Posso poi compiere operazioni di "lemmatizzazione", cioè per esempio,
impostare una ricerca con la chiave amor + asterisco, ed a questo punto otterremo un
elenco allargato di termini sempre riferibili al concetto "amore" come
"amor, amoroso, amorevole" etc.
Sarà possibile compilare indici di frequenze di parole, indici di
"incipitari" (cioè elenchi di tutte le frasi o i versi posti all'inizio di un
opera) ed un'infinità di calcoli statistici sul testo. Ovviamente si tratta soprattutto
di strumenti di ricerca utili in mano a degli addetti ai lavori, a persone cioè che si
dedicano professionalmente allo studio della linguistica o, più in generale, della
letteratura. |