Clicca su oggi in TV



Tutti i segreti di Google

di Michele Alberico

Chiunque abbia un'esperienza anche non approfondita della Rete, dovrebbe avere un'idea abbastanza chiara di quanto frustrante possa essere un tentativo di ricerca sul Web. Anche se la selezione delle parole chiave è accurata, anche se il campo di ricerca è molto ristretto, anche se la pazienza è forgiata, il risultato è spesso desolante. Da un punto di vista squisitamente tecnico un motore di ricerca va valutato secondo tre fattori: le dimensioni dell'archivio date dal numero di pagine indicizzate, la frequenza di aggiornamento ed il sistema di "ranking", cioè il sistema automatico attraverso il quale il software stabilisce quanto un certo documento sia conforme alla ricerca che stiamo facendo. Sui primi due aspetti Google non è diverso dai suoi diretti concorrenti. Il suo punto di forza è il sistema di "ranking". Ciascuna delle pagine indicizzate da Google viene catalogata secondo due aspetti. Da un lato sulla base del numero di occorrenze di un certo termine (e fin qui nessuna differenza da un sistema tradizionale), da un lato da un punto di vista squisitamente "topografico". Ogni pagina Web, infatti, è raggiungibile perché esistono altre pagine Web che la "linkano", da un punto di vista topografico una pagina può quindi essere osservata come una struttura con un certo numero di entrate (le pagine che la "linkano") e di uscite (le pagine "linkate"). Maggiore è il numero di link entranti più alta sarà l'autorevolezza di quella pagina; allo stesso tempo maggiore sarà il numero di link uscenti da una pagina autorevole maggiore sarà la possibilità che i siti che questa "linka" siano anch'essi in qualche modo autorevoli. Naturalmente più la pagina è "linkata" maggiori saranno le possibilità che essa venga toccata in visita e, contemporaneamente, più una pagina viene visitata maggiori saranno le possibilità che le pagine da lei "linkate" siano a loro volta visitate. Da un punto di vista matematico questa visita è una catena di Markov. Si dà un'insieme di stati e ad ogni istante di tempo ciascuno di questi ha una certa probabilità di transitare ad un altro stato. Questa probabilità è il "ranking" effettuato da Google. Google effettua quindi due tipi di ricerca incrociati. Il primo, più tradizionale gli serve ad individuare un certo numero di pagine che contengono la parola ricercata, il secondo ad individuare, tra queste, quale sia più utile al navigatore.

www.google.com