Scheda di approfondimento Chiudi

Come funziona World Wide Web

Il funzionamento di World Wide Web non differisce molto da quello delle altre applicazioni Internet. Anche in questo caso il sistema si basa su una interazione tra due moduli software: un client ed un server. Il protocollo di comunicazione che i due moduli utilizzano per interagire si chiama HyperText Transfer Protocol (HTTP). Il server Web, o più precisamente server HTTP, per contro si occupa della gestione, del reperimento e del recapito dei singoli documenti richiesti dai client. Naturalmente esso è in grado di servire più richieste contemporaneamente.

L'unica - ma importante - differenza specifica è la presenza di un formato speciale in cui debbono essere memorizzati i documenti inseriti su Web, denominato HyperText Markup Language (HTML). Si tratta di un linguaggio di marcatura (markup language), orientato alla descrizione di documenti testuali. Ma cosa vuol dire "linguaggio di marcatura"? L'idea di "markup" in un documento elettronico si ricollega alla simbologia che scrittori e correttori di bozze utilizzano nella stampa tradizionale per indicare al compositore ed al tipografo come trattare graficamente le parti di testo che svolgono funzioni particolari: ad esempio, la sottolineatura per indicare il corsivo. In modo simile, i linguaggi di marcatura sono costituiti da un insieme di istruzioni, detti tag (marcatori), che servono a descrivere la struttura, la composizione e l'impaginazione del documento. I marcatori sono sequenze di normali caratteri ASCII delimitati dai simboli "<" ("minore") e ">" ("maggiore"). Essi vengono introdotti, all'interno del documento, accanto alla porzione di testo cui si riferiscono, in questo modo:

<h1>Titolo della pagina</h1>

<p>Testo del primo paragrafo… </p>

<p>Testo del secondo paragrafo, contenente un <a href="http://www.mediamente.rai.it">link</a></p>

Un documento HTML è dunque un file in formato testo che contiene, insieme al contenuto testuale vero e proprio, i marcatori che ne descrivono la struttura. Ad esempio è possibile indicare i diversi livelli di titoli di un documento, lo stile dei caratteri (corsivo, grassetto...), i capoversi, la presenza di liste (numerate o no). Volendo realizzare un documento ipermediale, avremo a disposizione anche marcatori specifici per la definizione dei link ipertestuali e per l'inserimento di immagini. Naturalmente le immagini non sono parte integrante del file HTML, che in quanto tale è un semplice file di testo. I file grafici vengono inviati come oggetti autonomi dal server, ed inseriti in una pagina Web solo durante l'operazione di visualizzazione effettuata dal browser. Attraverso i comandi HTML è possibile anche specificare alcune strutture interattive come moduli di immissione attraverso cui l'utente può inviare comandi e informazioni al server ed attivare speciali procedure (ricerche su database, invio di posta elettronica ed anche pagamenti attraverso carta di credito!).

Un utente di Internet che desiderasse solo ricercare e non produrre informazione in rete potrebbe fare a meno di preoccuparsi del funzionamento di HTML. Attenzione, però: una delle caratteristiche fondamentali di Internet è proprio l'estrema facilità con la quale è possibile diventare protagonisti attivi dello scambio informativo. Se si vuole compiere questo salto decisivo, un minimo di familiarità con HTML è necessaria. Non occorre avere timori reverenziali: HTML non è un linguaggio di programmazione, e le sue istruzioni di base sono semplicissime: imparare i primi rudimenti di HTML non è più complicato che imparare a usare e a interpretare le principali sigle ed abbreviazioni usate dai correttori di bozze.

Un aspetto particolare del funzionamento di World Wide Web è la tecnica di indirizzamento dei documenti, ovvero il modo in cui è possibile far riferimento ad un determinato documento tra tutti quelli che sono pubblicati sulla rete.

La soluzione che è stata adottata per far fronte a questa importante esigenza si chiama Uniform Resource Locator (URL). La 'URL' di un documento corrisponde in sostanza al suo indirizzo in rete; ogni risorsa informativa (computer o file) presente su Internet viene rintracciata e raggiunta dai nostri programmi client attraverso la sua URL. Prima della introduzione di questa tecnica non esisteva alcun modo per indicare formalmente dove fosse una certa risorsa informativa su Internet.

Una URL ha una sintassi molto semplice, che nella sua forma normale si compone di tre parti:

tipo-server://nome-host/percorso-file

La prima parte indica con una parola chiave il tipo di server cui si punta (può trattarsi di un server http, di un server FTP, e così via); la seconda indica il nome simbolico dell'host su cui si trova il file indirizzato; al posto del nome può essere fornito l'indirizzo numerico; la terza indica nome e posizione (path) del singolo documento o file cui ci si riferisce. Tra la prima e la seconda parte vanno inseriti i caratteri '://'. Un esempio di URL è il seguente:

http://www.mediamente.rai.it/index.html

La parola chiave 'http' segnala che ci si riferisce ad un server Web, che si trova sul computer denominato 'www.mediamente.rai.it', dal quale vogliamo che ci venga inviato il file in formato HTML il cui nome è 'index.html'. Occorre notare che questa sintassi può essere utilizzata sia nelle istruzioni ipertestuali dei file HTML, sia con i comandi che i singoli client, ciascuno a suo modo, mettono a disposizione per raggiungere un particolare server o documento.

Chiudi