URL : Différence entre versions

De Vulgum Techus
Aller à : Navigation, rechercher
(Articles Vulgum Techus)
 
Ligne 1 : Ligne 1 :
 +
<!-- Links checked 22/03/19 -->
 
[[Catégorie:Normes]]
 
[[Catégorie:Normes]]
  '''[[Lien court]]''' vers cette page : http://vt.cx/URL
+
[[Catégorie:Sites Internet]]
  '''[[QR code]]''' vers cette page : http://vt.cx/URL.qr
+
  '''[[Lien court]]''' vers cette page : https://vt.cx/URL
 +
  '''[[QR code]]''' vers cette page : https://vt.cx/URL.qr
 
<html>
 
<html>
<script type="text/javascript"><!--
+
<script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
google_ad_client = "ca-pub-3341840374417340";
+
<!-- VT2 -->
/* VT2 */
+
<ins class="adsbygoogle"
google_ad_slot = "6349432125";
+
    style="display:inline-block;width:468px;height:60px"
google_ad_width = 468;
+
    data-ad-client="ca-pub-3341840374417340"
google_ad_height = 60;
+
    data-ad-slot="6349432125"></ins>
//-->
+
<script>
</script>
+
(adsbygoogle = window.adsbygoogle || []).push({});
<script type="text/javascript"
+
src="//pagead2.googlesyndication.com/pagead/show_ads.js">
+
 
</script>
 
</script>
 
</html>
 
</html>
  
 
= Présentation =
 
= Présentation =
L''''URL''' pour '''Uniform Resource Locator''' désigne une chaîne de caractères qui suit un format décrit dans le document [http://abcdrfc.free.fr/rfc-vf/pdf/rfc3986.pdf RFC3986] et dont l'objet est de permettre d'accéder de manière certaine à des ressources précises accessibles sur le '''Word Wide Web''' ('''WWW'''). Tout objet accessible sur '''Internet''' que ce soit une '''page''', un '''son''', un '''fichier''', une '''vidéo''' est donc identifié par son chemin d'accès sous la forme  
+
L'URL pour Uniform Resource Locator désigne une chaîne de caractères qui suit un format décrit dans le document [https://abcdrfc.free.fr/rfc-vf/pdf/rfc3986.pdf RFC3986] et dont l'objet est de permettre d'accéder de manière certaine à des ressources précises accessibles sur le '''[[Word Wide Web]]''' (WWW). Tout objet accessible sur '''[[Internet]]''' que ce soit une page, un son, un fichier, une '''[[vidéo]]''' est donc identifié par son chemin d'accès sous la forme  
  http://www.vulgumtechus.com/Raccourcis_des_outils_d'administration
+
  https://www.vulgumtechus.com/Raccourcis_des_outils_d'administration
  http:// (identifie le protocole de communication à partir du [[Lexique#N|'''''navigateur''''']])
+
  https:// (identifie le protocole de communication à partir du [[Lexique#N|'''''navigateur''''']])
 
  www.vulgumtechus.com (identifie le site dans le '''réseau Internet''') ou www
 
  www.vulgumtechus.com (identifie le site dans le '''réseau Internet''') ou www
 
  /Raccourcis_des_outils_d'administration (identifie la page à afficher au niveau du '''serveur du site''')
 
  /Raccourcis_des_outils_d'administration (identifie la page à afficher au niveau du '''serveur du site''')
  
 
== HTTP & HTTPS ==
 
== HTTP & HTTPS ==
* Le protocole '''HTTP''' pour '''HyperText Transfer Protocol''' est la norme de communication entre le serveur et le navigateur. Une version sécurisée qui encrypte les données existe et son appellation est '''HTTPS''' pour '''HyperText Transfer Protocol Secure'''.
+
* Le protocole HTTP pour HyperText Transfer Protocol est la norme de communication entre le serveur et le navigateur. Une version sécurisée qui encrypte les données existe et son appellation est HTTPS pour HyperText Transfer Protocol Secure.
* Les spécifications d''''HTTP''' sont détaillées dans les documents suivants :
+
* Les spécifications d'HTTP sont détaillées dans les documents suivants :
** [http://abcdrfc.free.fr/rfc-vf/rfc1945.html RFC 1945] (1996)
+
** [https://abcdrfc.free.fr/rfc-vf/rfc1945.html RFC 1945] (1996)
** [http://www.ietf.org/rfc/rfc2068.txt RFC 2068] (1997)
+
** [https://www.ietf.org/rfc/rfc2068.txt RFC 2068] (1997)
** [http://abcdrfc.free.fr/rfc-vf/rfc2616.html RFC 2616] (1999)
+
** [https://abcdrfc.free.fr/rfc-vf/rfc2616.html RFC 2616] (1999)
* Les spécifications d''''HTTPS''' sont détaillées dans le document suivant :
+
* Les spécifications d'HTTPS sont détaillées dans le document suivant :
** [http://www.normes-internet.com/normes.php?rfc=rfc2818&lang=fr RFC 2818] (2000)
+
** [https://www.normes-internet.com/normes.php?rfc=rfc2818&lang=fr RFC 2818] (2000)
  
 
== Nom de domaine ==
 
== Nom de domaine ==
* Le nom de domaine est constitué de '''3''' parties :
+
* Le nom de domaine est constitué de 3 parties :
** '''sous-domaine''' (un nom libre correspondant à des sous-sites) qui peut être '''www'''
+
** '''sous-domaine''' (un nom libre correspondant à des sous-sites) qui peut être www
 
** '''domaine''' (un nom déposé auprès d'un '''[[registrar]]''')
 
** '''domaine''' (un nom déposé auprès d'un '''[[registrar]]''')
** '''TLD (Top Level Domain''', un suffixe qui identifie le territoire ou le type du '''domaine''')
+
** '''TLD (Top Level Domain''', un suffixe qui identifie le territoire ou le type du domaine)
 
  exemple : '''play.google.com''' ou '''play''' est le '''sous-domaine''', '''google''' le nom de domaine et '''com''' le '''TLD'''
 
  exemple : '''play.google.com''' ou '''play''' est le '''sous-domaine''', '''google''' le nom de domaine et '''com''' le '''TLD'''
  
Ligne 49 : Ligne 49 :
  
 
= Recherche sur URL =
 
= Recherche sur URL =
Dans '''[[Google]]''' c'est l'instruction '''inurl:''' qui permet de rechercher des occurrences se trouvant dans les '''URL'''.
+
Dans '''[[Google]]''' c'est l'instruction inurl: qui permet de rechercher des occurrences se trouvant dans les URL.
* Tout ce qui suit l'instruction '''inurl:''' est pris en compte.
+
* Tout ce qui suit l'instruction inurl: est pris en compte.
 
* La recherche ne tient pas compte de la casse
 
* La recherche ne tient pas compte de la casse
  exemple : '''site:vulgumtechus.com inurl:emule''' (cherche toutes les URL de page avec '''emule''' dans les URL du site '''vulgumtechus.com''')
+
  exemple : '''site:vulgumtechus.com inurl:Stadia''' (cherche toutes les URL de page avec '''Stadia''' dans les URL du site vulgumtechus.com)
 
Il est aussi possible d'exclure certaines occurrences de la recherche
 
Il est aussi possible d'exclure certaines occurrences de la recherche
  exemple : site:vulgumtechus.com inurl:emule -fichier (cherche toutes les URL de page avec '''emule''' mais pas celles avec '''fichier''' dans les URL du site '''vulgumtechus.com''')
+
  exemple : site:vulgumtechus.com inurl:stadia -fichier (cherche toutes les URL de page avec '''Stadia''' mais pas celles avec fichier dans les URL du site vulgumtechus.com)
  
 
= Tags d'URL =
 
= Tags d'URL =

Version actuelle en date du 22 mars 2019 à 13:31

Lien court vers cette page : https://vt.cx/URL
QR code vers cette page : https://vt.cx/URL.qr

Présentation

L'URL pour Uniform Resource Locator désigne une chaîne de caractères qui suit un format décrit dans le document RFC3986 et dont l'objet est de permettre d'accéder de manière certaine à des ressources précises accessibles sur le Word Wide Web (WWW). Tout objet accessible sur Internet que ce soit une page, un son, un fichier, une vidéo est donc identifié par son chemin d'accès sous la forme

https://www.vulgumtechus.com/Raccourcis_des_outils_d'administration
https:// (identifie le protocole de communication à partir du navigateur)
www.vulgumtechus.com (identifie le site dans le réseau Internet) ou www
/Raccourcis_des_outils_d'administration (identifie la page à afficher au niveau du serveur du site)

HTTP & HTTPS

  • Le protocole HTTP pour HyperText Transfer Protocol est la norme de communication entre le serveur et le navigateur. Une version sécurisée qui encrypte les données existe et son appellation est HTTPS pour HyperText Transfer Protocol Secure.
  • Les spécifications d'HTTP sont détaillées dans les documents suivants :
  • Les spécifications d'HTTPS sont détaillées dans le document suivant :

Nom de domaine

  • Le nom de domaine est constitué de 3 parties :
    • sous-domaine (un nom libre correspondant à des sous-sites) qui peut être www
    • domaine (un nom déposé auprès d'un registrar)
    • TLD (Top Level Domain, un suffixe qui identifie le territoire ou le type du domaine)
exemple : play.google.com ou play est le sous-domaine, google le nom de domaine et com le TLD

Identification de l'élément

L'identification de l'élément se fait au niveau du serveur. En fonction de la façon dont il est programmé, les instructions qui suivent les noms de domaines sont interprétées et traitées. De nombreuses particularités découlent de ces traitements et il est impossible de lister ici toutes les particularités tant elles sont nombreuses. Certaines d'entres elle offre des fonctionnalités intéressantes :

  • Affichage d'un numéro de page qui permet de tester d'autres numéro à l'aveugle ou d'utiliser une extension d'incrémentation/décrémentation de la valeur variable d'une adresse (voir Incrémentation d'une URL)
  • Affichage du chemin complet vers un élément permettant, sur certains serveurs mal protégé ou très ouverts, de remonter l'arborescence et d'accéder, par exemple, à l'ensemble des fichiers disponibles dans certains dossiers
  • Retrouver dans l'URL les catégories de classement des articles permettant de connaitre l'organisation interne d'un site
  • De changer certains paramètres directement dans l'URL comme la langue, le pays, l'utilisateur, etc.
  • De connaitre le type de langage utilisés par le site (PHP, Flash, ASP, CGI, JavaScript, etc.)
  • D'intervenir directement sur certains traitements en modifiant des directives dans l'URL (ex. edit, save, refresh, etc.)

Recherche sur URL

Dans Google c'est l'instruction inurl: qui permet de rechercher des occurrences se trouvant dans les URL.

  • Tout ce qui suit l'instruction inurl: est pris en compte.
  • La recherche ne tient pas compte de la casse
exemple : site:vulgumtechus.com inurl:Stadia (cherche toutes les URL de page avec Stadia dans les URL du site vulgumtechus.com)

Il est aussi possible d'exclure certaines occurrences de la recherche

exemple : site:vulgumtechus.com inurl:stadia -fichier (cherche toutes les URL de page avec Stadia mais pas celles avec fichier dans les URL du site vulgumtechus.com)

Tags d'URL

Les tags sont généralement placés à la suite des caractères # (dièse) ou ? (point d'interrogation) qui ne sont pas interprétés comme des éléments actifs d'une URL.

  • #xtor, &xtor ou ?xtor : Utilisé par de nombreux sites, ce tag ajouté à un lien envoyé par email par le site lui-même (dans une newsletter par exemple) permet d'identifier un référent très précisément. Il est possible de supprimer ce tag et tout ce qui suit pour éviter d'être tracé ou de remplacer la partie identifiant par n'importe quoi histoire de faire passer un message.
ex. ?xtor=pourquoi_chercher_a_savoir_qui_je_suis
  • ?utm_source  : Très commun, ce tag indique la source d'un lien à des fins statistiques
  • ?fb_action : indique que le lien est originaire de Facebook
  • ?ref : Indique la source d'un lien
  • #srWebsiteId : identification du site
  • &utm_campaign : identification de la campagne (exemple reseaux_sociaux)
  • &utm_medium : identification du support
  • &srWebsiteId : identification de la source
  • &srAuthUserId : identification de l'auteur de l'article
  • ?ns_campaign : identification de la campagne (exemple FB)
  • &ns_source : identification de la source
  • &ns_mchannel : identification du canal (exemple social)
  • &ns_linkname : identification du lien
  • &aef_campaign_ref : référence de la campagne (exemple ref=partage_aef)
  • &aef_campaign_date : date de la campagne (exemple 2016-02-11)
  • ?eaf-publisher : (exemple zanox)
  • &eaf-name : (exemple zanox_deeplink)
  • &eaf-creativetype
  • &eseg-name
  • &eaf-ZANOX : (exemple ZANOX)
  • &eurl : identifie l'URL de redirection

Extensions utiles

Chrome

  • Chrome Web Store Pure URL : débarrasse les URL des tags statistiques inutiles

Firefox

  • Mozilla Pure URL : débarrasse les URL des tags statistiques inutiles

Articles externes

Articles Vulgum Techus

Liens utiles

Commentaires

blog comments powered by Disqus