Un URL può essere costituito da un gruppo di parti differenti. C'è un nome host che si associa a un indirizzo IP di una risorsa specifica su Internet e una serie di informazioni aggiuntive che indicano al browser e al server come gestire le cose. Puoi pensare a un indirizzo IP come qualcosa come un numero di telefono. Un nome host è come il nome di una persona di cui si desidera cercare il numero di telefono. E uno standard chiamato Domain Name System (DNS) funziona in background come una rubrica telefonica, traducendo gli hostname più umani negli indirizzi IP che le reti usano per instradare il traffico.
Tenendo presente questa analogia, diamo un'occhiata alla struttura di un URL e a come funziona per portarti dove vuoi andare.
Come è strutturato un URL
La struttura di un URL è stata inizialmente definita da Sir Tim Berners-Lee, il ragazzo che ha creato il Web e il primo browser Web nel 1994. Gli URL essenzialmente combinano l'idea dei nomi di dominio con l'idea di utilizzare un percorso file per identificare uno specifico cartella e struttura del file. Quindi, è simile all'utilizzo di un percorso come C: Documents Personal myfile.txt in Windows, ma con alcune cose in più all'inizio per aiutare a trovare il server giusto su Internet in cui quel percorso esiste e il protocollo utilizzato per accedere al informazione.
Un URL è composto da diverse parti. Prendi, ad esempio, un URL di base come quello mostrato nell'immagine qui sotto.
schema
Molte persone pensano che un URL sia solo un indirizzo web, ma non è così semplice. Un indirizzo web è un URL, ma tutti gli URL non sono indirizzi web. Anche altri servizi a cui è possibile accedere tramite FTP, o anche localmente come MAILTO, sono URL. La porzione di schema di un URL (quelle lettere seguite da due punti) indica il protocollo con cui un'app (come il browser Web) e il server devono comunicare.
Gli indirizzi Web sono l'URL più comune, ma ce ne sono altri. Quindi, potresti vedere schemi come:
- HyperText Transfer Protocol (HTTP): questo è il protocollo sottostante del web e determina le azioni che i server Web e i browser devono intraprendere in risposta a determinati comandi.
- HTTP Secure (HTTPS): questa è una forma di HTTP che funziona su un livello crittografato e sicuro per un trasporto più sicuro delle informazioni.
- File Transfer Protocol (FTP): questo protocollo viene spesso utilizzato per il trasferimento di file su Internet.
Nei browser moderni, lo schema non è tecnicamente richiesto come parte dell'URL. Se si accede a un sito Web come "www.howtogeek.com", il browser determinerà automaticamente il protocollo corretto da utilizzare. Tuttavia, alcune altre app (e protocolli) richiedono l'uso di uno schema.
Autorità
La porzione di autorità di un URL (che è preceduta da due barre) è a sua volta suddivisa in un gruppo di parti. Iniziamo con un URL molto semplice, il tipo che ti porta alla home page di un sito web.
Ma quando si analizza l'hostname è utile leggerlo all'indietro per capire cosa sta succedendo, quindi ecco i componenti:
- Dominio di primo livello: Nell'esempio qui, "com" è il dominio di primo livello. Questi sono il livello più alto nella gerarchia DNS (Domain Name System) utilizzata per tradurre gli indirizzi IP in indirizzi di linguaggio semplici che sono più facili da ricordare per noi umani. Questi domini di primo livello sono creati e gestiti da Internet Corporation per nomi e numeri assegnati (ICANN). I tre domini di primo livello più comuni sono.com,.net e.gov. La maggior parte dei paesi ha anche il proprio dominio di primo livello a due lettere, quindi vedrai domini come.us (Stati Uniti),.uk (Regno Unito),.ca (Canada) e molti altri. Esistono anche altri domini di primo livello (come.museum) che sono sponsorizzati e gestiti da organizzazioni private. Oltre a questi, ci sono anche alcuni domini generici di primo livello (come.club,.life e.news).
- sottodominio: Poiché il DNS è un sistema gerarchico, sia le parti "www" che quelle "esempio" del nostro URL di esempio sono considerate sottodomini. La parte "www" è un sottodominio del dominio di primo livello "com" e la parte "www" è un sottodominio del dominio "example". Ecco perché spesso vedi un'azienda con un nome registrato come "google.com" suddiviso in sottodomini separati come "www.google.com", "news.google.com", "mail.google.com" e presto.
Questo è l'esempio più semplice della sezione di autorità di un URL, ma le cose possono diventare più complicate. Esistono altri due componenti che la sezione dell'autorità può contenere:
- Informazioni utente: La sezione autorità può contenere anche un nome utente e una password per il sito a cui accedi. È raro vedere questa struttura negli URL oggi, ma può succedere. Se presente, la porzione di informazioni utente viene prima del nome host ed è seguita da un segno @.Pertanto, potresti visualizzare qualcosa come "//nomeutente:[email protected]" se include le informazioni dell'utente.
- Numero di porta: I dispositivi di rete utilizzano gli indirizzi IP per ottenere informazioni sul computer corretto su una rete. Quando arriva quel traffico, un numero di porta dice al computer l'applicazione per la quale quel traffico è destinato. Il numero di porta è un altro elemento che non vedrai spesso durante la navigazione sul Web, ma potresti vederlo in app di rete (come i giochi) che richiedono l'immissione di un URL. Se l'URL include un numero di porta, viene dopo il nome host ed è preceduto da due punti. Sarebbe simile a questa: "//www.esempio.com:8080".
Quindi, questo è lo schema e le porzioni di autorità di un URL, ma come puoi aver indovinato dopo aver guardato un sacco di URL mentre navighi sul web, possono includere ancora più cose.
Percorsi, query e frammenti
Ci sono tre parti aggiuntive di un URL che potresti vedere dopo la porzione di autorizzazione: percorsi, query e frammenti. Ecco come funzionano.
Sentiero
La sezione autorità di un URL porta il tuo browser (o qualsiasi altra app) al server giusto su una rete. Il percorso che segue, che funziona proprio come un percorso in Windows, macOS o Linux, ti porta alla cartella o al file giusto su quel server. Il percorso è preceduto da una barra e c'è una barra tra ogni directory e sottodirectory, in questo modo:
www.example.com/folder/subfolder/filename.html
L'ultimo pezzo è il nome del file che viene aperto quando accedi al sito web. Anche se potresti non vederlo nella barra degli indirizzi, ciò non significa che non sia presente. Alcune lingue utilizzate per creare pagine Web nascondono il nome e l'estensione del file che stai visualizzando. Ciò rende l'URL più facile da ricordare e da digitare, dandogli un aspetto più pulito.
domanda
La porzione di query di un URL viene utilizzata per identificare elementi che non fanno parte di una struttura di percorso rigorosa. Molto spesso le vedrai utilizzate quando esegui una ricerca o quando una pagina web consegna dati attraverso un modulo. La parte della query è preceduta da un punto interrogativo e arriva dopo il percorso (o dopo il nome host se un percorso non è incluso).
Ad esempio, prendi questo URL presentato quando abbiamo cercato su Amazon le parole chiave "wi-fi extender":
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Il modulo di ricerca ha trasmesso informazioni al motore di ricerca di Amazon. Seguendo il punto interrogativo, puoi vedere che ci sono due parti nella query: un URL per la ricerca (cioè la parte "url = search-alias% 3Daps &field") e le parole chiave che abbiamo digitato (è "keywords = wi-fi + extender "parte).
Questo è un esempio abbastanza semplice, e vedrai spesso URL con variabili aggiuntive (e più complicate). Ad esempio, ecco l'URL quando abbiamo cercato su Google la parola chiave "howtogeek":
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Come puoi vedere, ci sono alcune informazioni diverse lì. In questo caso, puoi vedere che ci sono ulteriori informazioni che indicano la lingua di ricerca, il browser che abbiamo utilizzato (Chrome) e persino il numero di versione del browser.
Frammento
Il componente finale di un URL che potresti vedere è chiamato frammento. Il frammento è preceduto da un cancelletto (#) e viene usato per indicare una posizione specifica su una pagina web. Quando si codifica una pagina Web, i progettisti possono creare ancore per testi specifici come intestazioni. Quando viene utilizzato il frammento corretto alla fine di un URL, il browser carica la pagina e poi salta a quell'ancora. Ancoraggi e URL con frammenti vengono spesso utilizzati per creare tabelle di contenuti nelle pagine Web per semplificare la navigazione.
Ecco un esempio. La pagina di Wikipedia sul Rinascimento è un documento piuttosto lungo ed è suddivisa in circa 11 sezioni, ognuna delle quali ha più sottosezioni. Ma ogni voce sulla pagina ha un'ancora inclusa, e una tabella dei contenuti nella parte superiore dell'articolo include collegamenti che consentono di passare alle diverse sezioni. Questi collegamenti funzionano includendo i frammenti.
Puoi anche utilizzare questi frammenti direttamente nella barra degli indirizzi o come link condivisibili. Ad esempio, per esempio, hai voluto mostrare a qualcuno la sezione di quella pagina che copre la Russia. Potresti semplicemente inviare loro questo link:
https://en.wikipedia.org/wiki/Renaissance#Russia
Quella parte "#Russia" alla fine dell'URL li salta direttamente a quella sezione dopo aver caricato la pagina.
Così ce l'hai, più di quanto tu probabilmente vorresti sapere su come funzionano gli URL.