Dino Buzzetti

Roma, (Univ. La Sapienza) 24/11/95

"Linguistics and information science"

SUMMARY:

There are so-called "fluid" texts, where each manuscript is different from the others and thus cannot be compared by traditional techniques. Computer technology allows the text to be represented in the form of a data-base, solving some of the problems of traditional text criticism, but creating new ones (1).
Data bases have been produced of traditional university texts, such as texts on logic. Once the theoretical problems have been solved, the development of these programmes depends on technological developments (2).
This material can be distributed in various ways: CD-ROM, Internet etc. That gives rise to problems of the citation of sources as well as of the transfer of hypertexts to incompatible systems (3).

INTERVIEW:

Domanda 1
Quali possono essere le funzioni degli strumenti informatici nel lavoro di edizione di testi?

Risposta
Lo strumento informatico non è tanto uno strumento pratico per aiutare nel modo tradizionale in cui si preparano le edizioni, per esempio, per produrre un testo stampato con diversi livelli di note di apparato dell'edizione critica. Non è in questo senso. Esistono sistemi molto sviluppati, per fare questo tipo di lavoro. Invece ci si è presentata la necessità di usare l'informatica di fronte ad un problema filologico del testo, che non poteva essere risolto con altri mezzi. Avevamo dei testi a tradizione, cosiddetta "fluida", ciascuna copia manoscritta diversa dall'altra e quindi non confrontabile, non collazionabile con le tecniche classiche. La risposta ovvia è stata creare un database contenente sia le trascrizioni, sia le immagini digitali delle fonti manoscritte. L'informatica consente una forma di rappresentazione del testo di tipo diverso, sotto forma di database, fornendoci la soluzione più ovvia per le difficoltà critiche del tipo di tradizione testuale che avevamo. Questo database è una rappresentazione della tradizione testuale. Il problema che si pone, è: può questo tipo di rappresentazione essere considerato come una edizione, come qualche cosa di diverso da quella che è la forma di rappresentazione resa canonica dall'introduzione della stampa? Il problema contiene due aspetti: da un lato questa forma di rappresentazione è adeguata, per forme di testualità che sono diverse da quella canonizzata dal libro a stampa. Per esempio la traduzione medievale delle "Chansons de geste". Quale è il testo? All'Università di Princeton hanno fatto un database per lo studio della tradizione medievale di Chevalier de la Charrette di Chrétien de Troyes. Muovendo proprio dall'idea che era impossibile congelare in un'unica versione, nella versione di un unico scriba la ricchezza di questo testo, con problemi anche teorici che nascevano. L'edizione critica risulta, rispetto a questo tipo di testualità, un'invenzione dell'editore, un editore ottocentesco o attuale. Come fare ricerche lessicali sull'uso delle espressioni dialettali, sul rapporto tra diversi usi linguistici, lavorando su di un materiale costruito artificialmente e non rifacendoci alle fonti originali? Quindi il database può essere una forma di rappresentazione adeguata di forme di testualità diverse da quella canonizzata dal libro a stampa. Altre forme di questo tipo sono, per esempio, i manoscritti d'autore lasciati incompiuti. Qual è il testo? Le varianti sostitutive dell'autore? Non è un testo che deve ancora arrivare a compimento. E' un testo compiuto, costituito di posizioni funzionali, ha più valori, perché l'autore non ha ancora scelto tra le diverse varianti. Quindi lo studio di documenti di questo genere pone le varianti tutte sullo stesso piano. Il concetto di edizione critica scarta le lezioni discordanti dal testo, per definizione, come le lezioni di secondo piano, come lezioni che possono avere qualche interesse. Ma la rappresentazione come database è un'edizione? Secondo noi può essere un'edizione solo con determinati requisiti. Un archivio di tutta la tradizione testuale, non è un'edizione. Allora quali requisiti deve avere questa forma di rappresentazione, per potere essere considerata una edizione? Secondo noi, introdurre procedure computazionali, che svolgano su questo materiale la stessa funzione che in una edizione critica svolge l'apparato, un filtro per potere filtrare l'informazione e presentare un'opzione possibile, ma un'opzione sempre rivedibile, perché consente il confronto diretto con la fonte. Le fonti sepolte negli apparati che nessuno riesce a decifrare o a leggere. Già ricostruire la situazione testuale a partire da un apparato di un'edizione scritta è un'operazione che, anche a persone molto addestrate, crea notevoli difficoltà, in secondo luogo non c'è possibilità di rivedere la scelta che ha fatto l'editore in quel particolare punto. Queste erano le linee che ispiravano il nostro lavoro e quindi il problema a questo punto diventa un problema di informatica. Qual è il modello computazionale adeguato a risolvere questo tipo di problema? Allora ci si rende conto che il tipo di dati, il modello di dati, attraverso cui si rappresenta in forma elettronica il testo, diventano importanti per potere prevedere procedure di elaborazione richieste. Il problema informatico diventa quello di trovare un modello computazionale adeguato.

Domanda 2
Che esperimenti concreti avete fatto, con quali testi avete provato e che risultati si sono raggiunti?

Risposta
I testi concreti, con quali abbiamo lavorato, sono testi di tradizione, di produzione universitaria, testi di insegnamento, in particolare testi per l'insegnamento della Logica. Abbiamo preso in esame un Commento di Gentile da Cingoli, che era Maestro di Arti a Bologna, a cavallo fra il XIII e il XIV secolo, un commento sull' "Isagoge" di Porfirio", che era il primo testo che lo studente leggeva per lo studio della Logica. Da questo testo abbiamo creato un prototipo, quindi combinando le trascrizioni dai manoscritti esistenti con le immagini digitali ottenute da riproduzioni microfilmate dei manoscritti. Abbiamo avuto qualche problema tecnico, perché gli scanner disponibili o funzionano come se fossero una macchina fotocopiatrice, i cosiddetti scanner piatti, oppure funzionano per diapositive, ma predisposti per lavorare con le bobine di microfilm non ce ne sono molti, e quindi costano. C'è un problema di risorse e c'è spesso anche un problema tecnologico. Una volta risolto un problema a livello teorico, con la definizione di un certo modello computazionale, lo sviluppo della tecnologia condiziona la realizzazione di questo programma, sia per quanto riguarda il hardware, sia per quanto riguarda il software. Noi abbiamo già impostato un prototipo e stiamo aspettando proprio le nuove implementazioni, lo sviluppo del sistema, che ci consentirà le operazioni adeguate, per esempio, allo studio delle varianti. Nel momento attuale, per quanto riguarda le varianti, possiamo richiamare contemporaneamente sullo schermo porzioni di testo che le contengono, insieme con le rispettive tradizioni, ma non possiamo, a partire da questo, costruire una rappresentazione congruente di tutte queste possibili alternative, cioè ridurre ad una rappresentazione unitaria le diverse rappresentazioni dei singoli documenti. Per fare questo è necessario introdurre nel sistema un meccanismo di manipolazione delle stringhe di caratteri, che costituiscono il testo, un motore testuale, come lo chiamano gli informatici, che consenta appunto il trattamento delle varianti, per riportarle ad una rappresentazione unica e coerente delle diverse alternative.

Domanda 3
Naturalmente cambiano anche gli strumenti di distribuzione di questo materiale, delle edizioni realizzate in questo modo: CD ROM, Internet.

Risposta
Anche questo è un problema teorico. Detto in altro modo è il problema della citazione di un testo elettronico. La citazione dovrebbe contenere il riferimento adeguato alla fonte e a chi ha svolto la trascrizione, con quali criteri l'ha svolta. Questo è un aspetto della questione. L'altro aspetto della questione, è venuto, per esempio, attraverso la rappresentazione di un ipertesto, realizzato sul "Tractatus" di Wittgenstein. Il problema, che veniva posto, era quello dello standard. In altri termini, l'ipertesto sul "Tractatus" è riutilizzabile, solo da chi possiede lo stesso strumento di gestione dell'ipertesto, lo stesso sistema ipertestuale. Quindi posso trasferire i dati elaborati, l'organizzazione dei dati che ho fatto, la posso comunicare solo a chi ha un sistema identico. Quindi occorre prevedere dei meccanismi di esportazione o importazione tra diversi sistemi, in modo da potere utilizzare i dati con la forma strutturata, che è stata loro attribuita da chi li ha elaborati. Scambiare le trascrizioni, in quanto tali, o scambiare le immagini, è relativamente semplice. Quello che non si riesce allo stato attuale a scambiare è il modo in cui noi le abbiamo organizzate. Questo comporta lo sviluppo di un certo formato del file, che consente il travaso, per esempio, di un'immagine, insieme con tutta la descrizione logica del suo contenuto, un'immagine insieme con la trascrizione. Solo il risultato dell'edizione può essere pubblico, nel senso di riessere riutilizzabile da qualcun altro nella forma in cui l'editore lo ha posto.