Scheda di approfondimento

Le tecnologie di digitalizzazione

Immagini | Testi | Suoni | Video

Immagini

Lo strumento utilizzato più spesso per trasformare in formato digitale delle immagini statiche è lo scanner. Ne esistono di vari tipi; il più diffuso è lo scanner piano, che dall'esterno assomiglia molto a una fotocopiatrice. L'immagine da digitalizzare (che sarà in genere una fotografia stampata, ma potrà anche essere, attraverso l'uso di particolari dispositivi, un negativo fotografico o una diapositiva) si appoggia sul piano di vetro dello scanner, e viene progressivamente illuminata e 'letta' da una testina scorrevole. In sostanza, lo scanner sovrappone idealmente all'immagine una griglia (la cui risoluzione dipenderà dalla risoluzione di cui è capace lo scanner, o da quella per la quale l'abbiamo impostato) e 'legge' il colore che si trova in ogni singola celletta (pixel) della griglia, sulla base della palette di colori da lui riconosciuta (così, uno scanner a 16 bit potrà distinguere 65.536 colori diversi, e uno scanner a 24 bit potrà distinguere oltre 16 milioni di colori diversi). È anche possibile acquisire un'immagine, anziché a colori, in tonalità di grigio: in questo caso il singolo pixel sarà codificato sulla base della sua intensità luminosa o luminanza. Il familiare apparecchio fax può essere pensato come uno scanner che lavora su una (ristretta) scala di grigi, e che trasmette l'informazione in formato digitale risultato della scansione (convertita in segnali sonori), anziché al computer, all'apparecchio gemello che si trova all’altro capo della linea telefonica. Man mano che acquisisce l'immagine, lo scanner - collegato al computer di norma attraverso la porta parallela (la stessa attraverso la quale il computer dialoga in genere con la stampante) o attraverso una più veloce porta SCSI - trasmette al computer la lunga catena di '0' e '1' che è il risultato del processo di digitalizzazione. Il computer potrà poi, attraverso appositi programmi, elaborare ulteriormente l'immagine, applicandovi ad esempio filtri ed effetti particolari. Nella videocassetta che accompagna questa dispensa, potete vedere un esempio di utilizzazione dello scanner.

Figura 9 - Uno scanner piano

Figura 9 - Uno scanner piano

Sempre più diffusa è ormai la tendenza ad acquisire le immagini direttamente in formato digitale, senza bisogno di passare attraverso lo stadio 'analogico' rappresentato dalla tradizionale fotografia stampata, dal negativo fotografico o dalla diapositiva. In questo caso, si utilizza di norma una macchina fotografica digitale, che salva direttamente l'immagine su un supporto che potrà essere una scheda di memoria interna (fissa o - più spesso - rimovibile) o un dischetto. L'immagine è poi trasferita su computer, in genere collegandovi direttamente la macchina fotografica tramite un cavo di trasmissione dati (nel caso di macchine che memorizzano l'immagine su dischetti, basterà estrarre il dischetto dalla macchina e inserirlo nel lettore del computer).

Figura 10 - Una macchina fotografica digitale

Figura 10 - Una macchina fotografica digitale

Testi

Il sistema più semplice per digitalizzare un testo è sicuramente quello di... scriverlo alla tastiera di un computer. Come sappiamo, infatti, i testi che immettiamo attraverso un normale programma di videoscrittura sono gestiti e conservati dal computer in formato digitale.

Quando si parte da un testo su supporto tradizionale (ad esempio da un libro), l'idea di digitalizzarlo copiandolo tutto, parola per parola, può naturalmente risultare assai poco attraente. In questi casi, se la qualità di stampa dell'originale è buona, si utilizza spesso uno scanner associato a un programma di riconoscimento ottico dei caratteri (OCR - Optical Character Recognition). Sappiamo che lo scanner, infatti, acquisisce un documento - sia esso una pagina scritta o una fotografia - come una immagine composta di minuscoli pixel (dei quali, come abbiamo visto, viene di norma codificato il colore): non ha alcun modo per capire che invece quella particolare immagine contiene del testo scritto, e che ci interessa rappresentare in formato digitale non già il colore (o la tonalità di grigio) dei suoi singoli pixel, ma i caratteri scritti che vi compaiono. Il programma di riconoscimento ottico dei caratteri ha proprio il compito di trasformare lo scanner in uno strumento adatto a questo secondo lavoro: gli richiede innanzitutto di trascurare, nella codifica, colori e tonalità di grigio, e analizza poi l'immagine restituita dallo scanner cercandovi le 'forme' delle familiari lettere dell'alfabeto, e ricostruendo, carattere per carattere, il testo di partenza. Può sembrare un compito semplice, ma in realtà non lo è affatto: testi a stampa diversi possono infatti utilizzare tipi di carattere diversi, e anche in uno stesso testo le procedure di stampa possono portare a variazioni anche notevoli nell'aspetto di uno stesso carattere. Un programma OCR deve imparare a trascurare questi fattori: deve in sostanza imparare a leggere, anche se naturalmente non capisce quello che legge.

Proprio perché il compito è difficile, un OCR si aiuta in genere confrontando le parole che legge con un dizionario (naturalmente in formato digitale...) della lingua nella quale è scritto il documento; anche così, comunque, gli errori di riconoscimento non mancano, e - almeno nell'attuale situazione della tecnologia - se vogliamo una digitalizzazione pienamente affidabile il testo 'letto' da un OCR dovrà sempre essere controllato da un revisore umano.

Una terza possibilità per acquisire un testo in formato digitale è quella di... leggerlo ad alta voce al computer. Per farlo, serviranno una scheda sonora con un buon microfono (vedi oltre) e un programma di riconoscimento vocale, che dovrà fare col suono della nostra voce un po' quello che un OCR fa con l'immagine della pagina stampata: analizzarlo per riconoscere le singole lettere (in questo caso, i singoli fonemi) e le singole parole. Compito tutt'altro che facile - anche perché le tonalità e le inflessioni di pronuncia variano non solo da persona a persona, ma anche, per una stessa persona, di momento in momento. Il programma di riconoscimento vocale dovrà quindi innanzitutto essere 'addestrato' alla pronuncia del suo utente, al quale sarà richiesto di leggere ad alta voce una serie di frasi prestabilite. La percentuale di errori introdotta da un programma di riconoscimento vocale è ancora molto alta, ma si tratta di un campo in cui l'evoluzione è continua, ed è prevedibile che in futuro la 'dettatura' di testi al computer potrà rivelarsi assai più semplice e sicura di quanto non sia attualmente.


Suoni

Per quanto riguarda i suoni, la conversione in formato digitale avviene in genere attraverso una scheda di acquisizione sonora: ve ne sono di molti tipi, dalle economiche schede sonore montate sui normali personal computer a vere e proprie stazioni dedicate usate in studi di registrazione professionali. La scheda sonora di un normale computer multimediale è comunque quasi sempre in grado di digitalizzare in tempo reale il suono, anche stereofonico, proveniente da un microfono o da un apparato analogico (radio, giradischi, registratore a cassette) ad essa collegato, permettendo di scegliere fra diverse frequenze di campionatura e fra diversi standard di codifica sonora. La qualità del risultato naturalmente dipende, dando per scontata una sufficiente velocità del computer e la buona qualità della scheda sonora, anche da fattori che esulano dall'ambito strettamente informatico, come la qualità dei dispositivi e dei supporti analogici di partenza (nel caso di registrazione in diretta, ad esempio, dalla qualità del microfono) e dei collegamenti. Anche nel caso dei suoni, comunque, l'acquisizione in formato digitale può ormai avvenire attraverso apparati dedicati piuttosto lontani dal computer tradizionale, come i registratori digitali, che utilizzano spesso la tecnologia DAT (Digital Audio Tape) o sono direttamente in grado di 'masterizzare' supporti digitali ottici o magnetico-ottici come i dischetti MD.

Figura 11 - Un registratore DAT

Figura 11 - Un registratore DAT

Video

Anche nel caso del video, potremo trasformare in formato digitale una sorgente video analogica attraverso una scheda di acquisizione video alla quale collegare un apparato video tradizionale (un televisore, un registratore, una cinepresa). Dato che il video digitalizzato richiede, come abbiamo visto, un notevole impiego di memoria, per la sua acquisizione ed elaborazione sarà essenziale disporre di risorse informatiche sufficientemente potenti: in altre parole, computer piuttosto veloci, dotati di parecchia memoria e di dischi rigidi molto capienti. È anche possibile acquisire brani video direttamente in formato digitale, attraverso una videocamera digitale. Per la loro maggiore flessibilità (ad esempio, la possibilità di inserire automaticamente complessi effetti di ripresa o di montaggio), le telecamere digitali e il relativo standard rappresentato al momento dal formato DV (digital video) hanno conosciuto negli ultimi anni un notevolissimo successo: pur essendo per ora più care di quelle analogiche, si avviano probabilmente a sostituirle.