URL

De Vulgum Techus
Version du 22 mars 2019 à 14:31 par Admin2 (discuter | contributions)

(diff) ← Version précédente | Voir la version courante (diff) | Version suivante → (diff)
Aller à : Navigation, rechercher
Lien court vers cette page : https://vt.cx/URL
QR code vers cette page : https://vt.cx/URL.qr

Présentation

L'URL pour Uniform Resource Locator désigne une chaîne de caractères qui suit un format décrit dans le document RFC3986 et dont l'objet est de permettre d'accéder de manière certaine à des ressources précises accessibles sur le Word Wide Web (WWW). Tout objet accessible sur Internet que ce soit une page, un son, un fichier, une vidéo est donc identifié par son chemin d'accès sous la forme

https://www.vulgumtechus.com/Raccourcis_des_outils_d'administration
https:// (identifie le protocole de communication à partir du navigateur)
www.vulgumtechus.com (identifie le site dans le réseau Internet) ou www
/Raccourcis_des_outils_d'administration (identifie la page à afficher au niveau du serveur du site)

HTTP & HTTPS

  • Le protocole HTTP pour HyperText Transfer Protocol est la norme de communication entre le serveur et le navigateur. Une version sécurisée qui encrypte les données existe et son appellation est HTTPS pour HyperText Transfer Protocol Secure.
  • Les spécifications d'HTTP sont détaillées dans les documents suivants :
  • Les spécifications d'HTTPS sont détaillées dans le document suivant :

Nom de domaine

  • Le nom de domaine est constitué de 3 parties :
    • sous-domaine (un nom libre correspondant à des sous-sites) qui peut être www
    • domaine (un nom déposé auprès d'un registrar)
    • TLD (Top Level Domain, un suffixe qui identifie le territoire ou le type du domaine)
exemple : play.google.com ou play est le sous-domaine, google le nom de domaine et com le TLD

Identification de l'élément

L'identification de l'élément se fait au niveau du serveur. En fonction de la façon dont il est programmé, les instructions qui suivent les noms de domaines sont interprétées et traitées. De nombreuses particularités découlent de ces traitements et il est impossible de lister ici toutes les particularités tant elles sont nombreuses. Certaines d'entres elle offre des fonctionnalités intéressantes :

  • Affichage d'un numéro de page qui permet de tester d'autres numéro à l'aveugle ou d'utiliser une extension d'incrémentation/décrémentation de la valeur variable d'une adresse (voir Incrémentation d'une URL)
  • Affichage du chemin complet vers un élément permettant, sur certains serveurs mal protégé ou très ouverts, de remonter l'arborescence et d'accéder, par exemple, à l'ensemble des fichiers disponibles dans certains dossiers
  • Retrouver dans l'URL les catégories de classement des articles permettant de connaitre l'organisation interne d'un site
  • De changer certains paramètres directement dans l'URL comme la langue, le pays, l'utilisateur, etc.
  • De connaitre le type de langage utilisés par le site (PHP, Flash, ASP, CGI, JavaScript, etc.)
  • D'intervenir directement sur certains traitements en modifiant des directives dans l'URL (ex. edit, save, refresh, etc.)

Recherche sur URL

Dans Google c'est l'instruction inurl: qui permet de rechercher des occurrences se trouvant dans les URL.

  • Tout ce qui suit l'instruction inurl: est pris en compte.
  • La recherche ne tient pas compte de la casse
exemple : site:vulgumtechus.com inurl:Stadia (cherche toutes les URL de page avec Stadia dans les URL du site vulgumtechus.com)

Il est aussi possible d'exclure certaines occurrences de la recherche

exemple : site:vulgumtechus.com inurl:stadia -fichier (cherche toutes les URL de page avec Stadia mais pas celles avec fichier dans les URL du site vulgumtechus.com)

Tags d'URL

Les tags sont généralement placés à la suite des caractères # (dièse) ou ? (point d'interrogation) qui ne sont pas interprétés comme des éléments actifs d'une URL.

  • #xtor, &xtor ou ?xtor : Utilisé par de nombreux sites, ce tag ajouté à un lien envoyé par email par le site lui-même (dans une newsletter par exemple) permet d'identifier un référent très précisément. Il est possible de supprimer ce tag et tout ce qui suit pour éviter d'être tracé ou de remplacer la partie identifiant par n'importe quoi histoire de faire passer un message.
ex. ?xtor=pourquoi_chercher_a_savoir_qui_je_suis
  • ?utm_source  : Très commun, ce tag indique la source d'un lien à des fins statistiques
  • ?fb_action : indique que le lien est originaire de Facebook
  • ?ref : Indique la source d'un lien
  • #srWebsiteId : identification du site
  • &utm_campaign : identification de la campagne (exemple reseaux_sociaux)
  • &utm_medium : identification du support
  • &srWebsiteId : identification de la source
  • &srAuthUserId : identification de l'auteur de l'article
  • ?ns_campaign : identification de la campagne (exemple FB)
  • &ns_source : identification de la source
  • &ns_mchannel : identification du canal (exemple social)
  • &ns_linkname : identification du lien
  • &aef_campaign_ref : référence de la campagne (exemple ref=partage_aef)
  • &aef_campaign_date : date de la campagne (exemple 2016-02-11)
  • ?eaf-publisher : (exemple zanox)
  • &eaf-name : (exemple zanox_deeplink)
  • &eaf-creativetype
  • &eseg-name
  • &eaf-ZANOX : (exemple ZANOX)
  • &eurl : identifie l'URL de redirection

Extensions utiles

Chrome

  • Chrome Web Store Pure URL : débarrasse les URL des tags statistiques inutiles

Firefox

  • Mozilla Pure URL : débarrasse les URL des tags statistiques inutiles

Articles externes

Articles Vulgum Techus

Liens utiles

Commentaires

blog comments powered by Disqus