Qu’est-ce qu’une URL (Uniform Resource Locator)?


Lorsque vous saisissez une adresse dans votre navigateur Web, de nombreuses choses se produisent dans les coulisses. Et la plupart de cela est déterminé par les différentes parties de l’URL que vous avez tapées. Regardons de plus près.

Une URL peut être constituée d’un ensemble de parties différentes. Il y a un nom d’hôte qui correspond à une adresse IP d’une ressource spécifique sur Internet et un tas d’informations supplémentaires qui indiquent à votre navigateur et au serveur comment gérer les choses. Vous pouvez considérer une adresse IP comme étant quelque chose comme un numéro de téléphone. Un nom d’hôte est comme le nom d’une personne dont vous souhaitez rechercher le numéro de téléphone. Et une norme appelée DNS (Domain Name System) fonctionne en arrière-plan comme un annuaire téléphonique, traduisant les noms d’hôte les plus conviviaux en adresses IP que les réseaux utilisent pour acheminer le trafic.

En gardant cette analogie à l’esprit, examinons la structure d’une URL et comment elle fonctionne pour vous amener là où vous voulez aller.

Comment une URL est structurée

La structure d’une URL a été définie pour la première fois par Sir Tim Berners-Lee – le type qui a créé le Web et le premier navigateur Web – en 1994. Les URL combinent essentiellement l’idée de noms de domaine avec l’idée d’utiliser un chemin de fichier pour identifier un structure des dossiers et des fichiers. Donc, c’est similaire à l’utilisation d’un chemin comme C: Documents Personal myfile.txt dans Windows, mais avec quelques éléments supplémentaires au début pour aider à trouver le bon serveur sur Internet où ce chemin existe et le protocole utilisé pour accéder au informations.

Une URL se compose de plusieurs parties différentes. Prenez, par exemple, une URL de base comme celle montrée dans l’image ci-dessous.

Cette URL simple est divisée en deux composants principaux: le schéma et l’autorité.

Schème

Beaucoup de gens considèrent une URL comme une simple adresse Web, mais ce n’est pas aussi simple que cela. Une adresse Web est une URL, mais toutes les URL ne sont pas des adresses Web. D’autres services auxquels vous pouvez accéder sur Internet – comme FTP – ou même localement – comme MAILTO – sont également des URL. La partie schéma d’une URL (ces lettres suivies de deux points) indique le protocole avec lequel une application (comme votre navigateur Web) et le serveur doivent communiquer.

Les adresses Web sont l’URL la plus courante, mais il en existe d’autres. Ainsi, vous pourriez voir des schémas comme:

  • HyperText Transfer Protocol (HTTP): Il s’agit du protocole sous-jacent du Web et détermine les actions que les serveurs Web et les navigateurs doivent entreprendre en réponse à certaines commandes.
  • HTTP Secure (HTTPS): Il s’agit d’une forme de HTTP qui fonctionne sur une couche sécurisée et cryptée pour un transport plus sûr des informations.
  • Protocole de transfert de fichiers (FTP): ce protocole est souvent encore utilisé pour transférer des fichiers sur Internet.

Dans les navigateurs modernes, le schéma n’est pas techniquement requis dans le cadre de l’URL. Si vous entrez sur un site Web tel que «www.howtogeek.com», votre navigateur déterminera automatiquement le bon protocole à utiliser. Pourtant, certaines autres applications (et protocoles) nécessitent l’utilisation d’un schéma.

Autorité

La partie autorité d’une URL (qui est précédée de deux barres obliques) est elle-même décomposée en plusieurs parties. Commençons par une URL très simple, celle qui vous mènerait à la page d’accueil d’un site Web.

Dans cet exemple simple, toute la partie «www.example.com» est appelée un nom d’hôte et se résout en une adresse IP. Vous pouvez également saisir une adresse IP dans la barre d’adresse de votre navigateur au lieu du nom d’hôte si vous la connaissez.

En relation :  Qu'est-ce que Foreshadow? Comment cette vulnérabilité de processeur Intel pourrait vous affecter

Mais, lors de l’analyse du nom d’hôte, il est utile de le lire à l’envers pour comprendre ce qui se passe, alors voici ces composants:

  • Domaine de premier niveau: Dans l’exemple ici, «com» ​​est le domaine de premier niveau. Il s’agit du niveau le plus élevé de la hiérarchie DNS (Domain Name System) utilisé pour traduire les adresses IP en adresses de langage simples qui sont plus faciles à retenir pour nous, les humains. Ces domaines de premier niveau sont créés et gérés par Internet Corporation for Assigned Names and Numbers (ICANN). Les trois domaines de premier niveau les plus courants sont .com, .net et .gov. La plupart des pays ont également leur propre domaine de premier niveau à deux lettres, vous verrez donc des domaines tels que .us (États-Unis), .uk (Royaume-Uni), .ca (Canada) et bien d’autres. Il existe également des domaines de premier niveau supplémentaires (comme .museum) qui sont sponsorisés et gérés par des organisations privées. En plus de ceux-ci, il existe également des domaines génériques de premier niveau (comme .club, .life et .news).
  • Sous-domaine: Puisque DNS est un système hiérarchique, les parties «www» et «exemple» de notre exemple d’URL sont considérées comme des sous-domaines. La partie «www» est un sous-domaine du domaine de premier niveau «com» ​​et la partie «www» est un sous-domaine du domaine «exemple». C’est pourquoi vous verrez souvent une entreprise avec un nom enregistré comme « google.com » divisé en sous-domaines distincts tels que « www.google.com », « news.google.com », « mail.google.com » et bientôt.

C’est l’exemple le plus basique de la section d’autorité d’une URL, mais les choses peuvent devenir plus compliquées. La section d’autorité peut contenir deux autres composants:

  • Informations de l’utilisateur: La section d’autorité peut également contenir un nom d’utilisateur et un mot de passe pour le site auquel vous accédez. Il est rare de voir cette structure dans les URL aujourd’hui, mais cela peut arriver. Si elle est présente, la partie d’informations utilisateur précède le nom d’hôte et est suivie d’un signe @. Ainsi, vous pouvez voir quelque chose comme « // nom d’utilisateur: mot de [email protected] » s’il inclut les informations sur l’utilisateur.
  • Numéro de port: Les périphériques réseau utilisent des adresses IP pour transmettre des informations au bon ordinateur sur un réseau. Lorsque ce trafic arrive, un numéro de port indique à l’ordinateur l’application à laquelle ce trafic est destiné. Le numéro de port est un autre élément que vous ne verrez pas souvent lorsque vous naviguez sur le Web, mais vous pouvez le voir dans les applications réseau (comme les jeux) qui vous obligent à saisir une URL. Si l’URL comprend un numéro de port, il vient après le nom d’hôte et est précédé de deux points. Cela ressemblerait à ceci: « //www.example.com:8080. »

Donc, c’est le schéma et les parties d’autorité d’une URL, mais comme vous l’avez peut-être deviné après avoir examiné de nombreuses URL tout en naviguant sur le Web, elles peuvent inclure encore plus de choses.

Chemins, requêtes et fragments

Il y a trois parties supplémentaires d’une URL que vous pouvez voir après la partie d’autorité: les chemins, les requêtes et les fragments. Voici comment cela fonctionne.

Chemin

La section d’autorité d’une URL dirige votre navigateur (ou n’importe quelle application) vers le bon serveur sur un réseau. Le chemin qui suit – qui fonctionne comme un chemin dans Windows, macOS ou Linux – vous amène au bon dossier ou fichier sur ce serveur. Le chemin est précédé d’une barre oblique, et il y a une barre oblique entre chaque répertoire et sous-répertoire, comme ceci:

www.example.com/folder/subfolder/filename.html

Le dernier élément est le nom du fichier qui est ouvert lorsque vous accédez au site Web. Bien que vous ne puissiez pas le voir dans la barre d’adresse, cela ne signifie pas qu’il n’y est pas. Certaines langues utilisées pour créer des pages Web masquent le nom du fichier et l’extension que vous visualisez. Cela rend l’URL plus facile à mémoriser et à taper, et lui donne un aspect plus net.

En relation :  Que se passe-t-il exactement lorsque vous fermez ou vous déconnectez de Windows?

Mettre en doute

La partie requête d’une URL est utilisée pour identifier les éléments qui ne font pas partie d’une structure de chemin stricte. Le plus souvent, vous les verrez utilisés lorsque vous effectuez une recherche ou lorsqu’une page Web fournit des données via un formulaire. La partie requête est précédée d’un point d’interrogation et vient après le chemin (ou après le nom d’hôte si un chemin n’est pas inclus).

À titre d’exemple, prenez cette URL présentée lorsque nous avons recherché sur Amazon les mots-clés «extension wi-fi»:

https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender

Le formulaire de recherche transmettait des informations au moteur de recherche d’Amazon. Après le point d’interrogation, vous pouvez voir qu’il y a deux parties dans la requête: une URL pour la recherche (c’est la partie « url = search-alias% 3Daps & field ») et les mots-clés que nous avons tapés (c’est le « keywords = wi-fi + prolongateur »).

C’est un exemple assez simple, et vous verrez souvent des URL avec des variables supplémentaires (et plus compliquées). Par exemple, voici l’URL lorsque nous avons recherché sur Google le mot clé « howtogeek »:

https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8

Comme vous pouvez le voir, il y a des informations différentes ici. Dans ce cas, vous pouvez voir qu’il existe des informations supplémentaires indiquant la langue de recherche, le navigateur que nous avons utilisé (Chrome) et même le numéro de version du navigateur.

Fragment

Le dernier composant d’une URL que vous pourriez voir est appelé un fragment. Le fragment est précédé d’un signe dièse (#) et est utilisé pour indiquer un emplacement spécifique sur une page Web. Lors du codage d’une page Web, les concepteurs peuvent créer des ancres pour un texte spécifique comme des en-têtes. Lorsque le fragment approprié est utilisé à la fin d’une URL, votre navigateur charge la page, puis passe à cette ancre. Les ancres et les URL avec des fragments sont souvent utilisés pour créer des tables de contenu sur les pages Web afin de faciliter la navigation.

Voici un exemple. La page de Wikipédia sur le Renaissance est un document assez long, divisé en environ 11 sections, chacune comportant plusieurs sous-sections. Mais chaque titre de la page a une ancre incluse, et une table des matières en haut de l’article comprend des liens qui vous permettent d’accéder aux différentes sections. Ces liens fonctionnent en incluant des fragments.

Vous pouvez également utiliser ces fragments directement dans votre barre d’adresse ou en tant que liens partageables. Disons, par exemple, que vous vouliez montrer à quelqu’un la section de cette page qui couvre la Russie. Vous pouvez simplement leur envoyer ce lien:

https://en.wikipedia.org/wiki/Renaissance#Russia

Cette partie «#Russia» à la fin de l’URL les renvoie directement à cette section après le chargement de la page.


Alors voilà, plus que vous ne l’auriez probablement jamais voulu savoir sur le fonctionnement des URL.

Crédit d’image: Pawel Horazy/ Shutterstock

Moyens Staff
Moyens I/O Staff vous a motivé, donner des conseils sur la technologie, le développement personnel, le style de vie et des stratégies qui vous aider.