Approfondimento del 10 marzo 1998
Motori di ricerca
Siete appassionati di musica dodecafonica? O di antiche porcellane cinesi
della dinastia Ming? O forse delle saghe celtiche?
Qualunque siano i vostri interessi, di sicuro qualcun altro, da qualche parte nel
mondo, li condivide con voi. E su Internet potreste trovare molto materiale e molte
informazioni che farebbero al caso vostro. Già, ma come scovarle?
Molto spesso ci pensano i cosiddetti motori di ricerca. Siti a cui ci si può collegare
e in cui computer super potenti e super veloci tengono una specie di archivio, un indice
delle cose disponibili sul Web.
E che esplorano di continuo tutti i meandri della rete come nessun navigatore umano,
nemmeno il più assiduo, potrebbe mai fare. Voi inserite alcune parole chiave, e il
calcolatore trova nel suo archivio gli indirizzi dei siti che vi interessano.
I server, cioè i computer collegati in permanenza alla rete, sono ormai centinaia di
migliaia. Ognuno ospita decine o centinaia di siti che a loro volta hanno decine o
centinaia di pagine. Insomma sul Web si trovano ormai centinaia di milioni di documenti.
Che in più costituiscono un'enorme biblioteca digitale in evoluzione permanente: alcuni
documenti spariscono, altri nuovi se ne aggiungono ogni giorno.
Come riescono i motori di ricerca a mantenersi aggiornati di continuo? Oggi parleremo
un po' di come sono nati e di come funzionano questi preziosi strumenti, queste bussole
che, almeno in parte, orientano la nostra navigazione nel mare digitale.
Primavera del 1995. Sono passati meno di tre anni da quella data, ma per un mondo che
cambia così velocemente come quello di Internet, equivalgono a qualche decennio. Era
dunque in quel periodo che alcuni ricercatori della Digital, una delle società leader
nella produzione di super computer, chiacchierando durante la pausa per il pranzo,
gettarono le basi di un progetto che di lì a poco sarebbe entrato nella storia di
Internet: AltaVista.
Ecco, alle
mie spalle vedete la pagina di AltaVista. Secondo molti esperti è il motore di ricerca
più potente, più aggiornato e più completo. Uno dei suoi slogan è: "Se non è su
AltaVista, non è su Internet".
Con AltaVista si possono fare richerche a diversi livelli di approfondimento,
selezionando per esempio alcune aree geografiche o alcune lingue per restringere il campo.
Ma torniamo alla primavera del '95. Paul Flaherty, uno dei partecipanti al famoso
pranzo, si lamentava che cercare informazioni sul Web diventava sempre più difficile e
più lungo. D'altra parte pensava che la gestione di un archivio per Internet sarebbe
stato un ottimo terreno per dimostrare la potenza dell'ultimo super computer della
Digital, un calcolatore cento volte più veloce dei suoi concorrenti nel gestire un
data-base.
Tra una portata e l'altra, il suo
collega Louis Monier propose un'idea ancora più visionaria: un archivio che contenesse
non solo alcune parole o un riassunto dei documenti, ma l'intero testo.
Così la ricerca avrebbe potuto basarsi non solo su alcune parole chiave, ma anche su
intere frasi contenute in un documento particolare.
Ma le memorie dei computer sarebbero state abbastanza grandi da contenere quella
spaventosa quantità di informazioni? La maggior parte della memoria viene occupata dalle
immagini, dai suoni o dai filmati.
In termini di spazio sul disco, i testi sono invece molto più leggeri. I ricercatori
stimarono che tutti i testi, e solo i testi, presenti sul Web occupassero circa un
tera-byte, cioè più o meno lo spazio di 1000 dischi rigidi come quello del vostro
computer. E' molto, ma è una quantità di dati ancora gestibile.
Il secondo problema era riempire e poi mantenere
aggiornato l'archivio. Un compito che naturalmente poteva essere svolto solo da un
computer. Ma bisognava sviluppare il software adatto. Così naquero gli spider, i ragni,
chiamati anche robot o crawler.
Sono piccoli programmi che funzionano, diciamo così, come navigatori automatici. Ogni
motore di ricerca ne lancia a migliaia a esplorare di continuo la rete e questi fedeli
ragnetti vanno, leggono, copiano e riportano al computer-madre i preziosi testi.
Oggi, quasi tutti i motori di ricerca, permettono a chi costruisce una nuova pagina Web
e la vuole segnalare di inviare una specie di invito allo spider: spedite l'indirizzo
esatto della vostra pagina ed entro poche ore uno spider verrà a farvi visita inserendo
il vostro materiale nel suo archivio.
Da allora AltaVista ha fatto scuola e i
motori di ricerca si sono moltiplicati. Alle mie spalle state vedendo le pagine di alcuni
dei più famosi come Lycos, Excite, o Hot Bot.
Alcuni si sono specializzati in ricerche particolari. Come Infoseek, che permette di
cercare immagini fornendovene un'anteprima. Insomma, volete sapere tutto sulla musica
dodecafonica? Collegatevi a un motore di ricerca e via
|