Tutti i segreti di Google
di Michele Alberico
Chiunque abbia un'esperienza anche non
approfondita della Rete, dovrebbe avere un'idea abbastanza chiara di
quanto frustrante possa essere un tentativo di ricerca sul Web.
Anche se la selezione delle parole chiave è accurata, anche se il
campo di ricerca è molto ristretto, anche se la pazienza è
forgiata, il risultato è spesso desolante. Da un punto di vista
squisitamente tecnico un motore di ricerca va valutato secondo tre
fattori: le dimensioni dell'archivio date dal numero di pagine
indicizzate, la frequenza di aggiornamento ed il sistema di
"ranking", cioè il sistema automatico attraverso il quale
il software stabilisce quanto un certo documento sia conforme alla
ricerca che stiamo facendo. Sui primi due aspetti Google non è
diverso dai suoi diretti concorrenti. Il suo punto di forza è il
sistema di "ranking". Ciascuna delle pagine indicizzate da
Google viene catalogata secondo due aspetti. Da un lato sulla base
del numero di occorrenze di un certo termine (e fin qui nessuna
differenza da un sistema tradizionale), da un lato da un punto di
vista squisitamente "topografico". Ogni pagina Web,
infatti, è raggiungibile perché esistono altre pagine Web che la
"linkano", da un punto di vista topografico una pagina
può quindi essere osservata come una struttura con un certo numero
di entrate (le pagine che la "linkano") e di uscite (le
pagine "linkate"). Maggiore è il numero di link entranti
più alta sarà l'autorevolezza di quella pagina; allo stesso tempo
maggiore sarà il numero di link uscenti da una pagina autorevole
maggiore sarà la possibilità che i siti che questa "linka"
siano anch'essi in qualche modo autorevoli. Naturalmente più la
pagina è "linkata" maggiori saranno le possibilità che
essa venga toccata in visita e, contemporaneamente, più una pagina
viene visitata maggiori saranno le possibilità che le pagine da lei
"linkate" siano a loro volta visitate. Da un punto di
vista matematico questa visita è una catena di Markov. Si dà
un'insieme di stati e ad ogni istante di tempo ciascuno di questi ha
una certa probabilità di transitare ad un altro stato. Questa
probabilità è il "ranking" effettuato da Google. Google
effettua quindi due tipi di ricerca incrociati. Il primo, più
tradizionale gli serve ad individuare un certo numero di pagine che
contengono la parola ricercata, il secondo ad individuare, tra
queste, quale sia più utile al navigatore.
www.google.com
|