URL
Lien court vers cette page : https://vt.cx/URL QR code vers cette page : https://vt.cx/URL.qr
Sommaire
Présentation
L'URL pour Uniform Resource Locator désigne une chaîne de caractères qui suit un format décrit dans le document RFC3986 et dont l'objet est de permettre d'accéder de manière certaine à des ressources précises accessibles sur le Word Wide Web (WWW). Tout objet accessible sur Internet que ce soit une page, un son, un fichier, une vidéo est donc identifié par son chemin d'accès sous la forme
https://www.vulgumtechus.com/Raccourcis_des_outils_d'administration https:// (identifie le protocole de communication à partir du navigateur) www.vulgumtechus.com (identifie le site dans le réseau Internet) ou www /Raccourcis_des_outils_d'administration (identifie la page à afficher au niveau du serveur du site)
HTTP & HTTPS
- Le protocole HTTP pour HyperText Transfer Protocol est la norme de communication entre le serveur et le navigateur. Une version sécurisée qui encrypte les données existe et son appellation est HTTPS pour HyperText Transfer Protocol Secure.
- Les spécifications d'HTTP sont détaillées dans les documents suivants :
- Les spécifications d'HTTPS sont détaillées dans le document suivant :
- RFC 2818 (2000)
Nom de domaine
- Le nom de domaine est constitué de 3 parties :
- sous-domaine (un nom libre correspondant à des sous-sites) qui peut être www
- domaine (un nom déposé auprès d'un registrar)
- TLD (Top Level Domain, un suffixe qui identifie le territoire ou le type du domaine)
exemple : play.google.com ou play est le sous-domaine, google le nom de domaine et com le TLD
Identification de l'élément
L'identification de l'élément se fait au niveau du serveur. En fonction de la façon dont il est programmé, les instructions qui suivent les noms de domaines sont interprétées et traitées. De nombreuses particularités découlent de ces traitements et il est impossible de lister ici toutes les particularités tant elles sont nombreuses. Certaines d'entres elle offre des fonctionnalités intéressantes :
- Affichage d'un numéro de page qui permet de tester d'autres numéro à l'aveugle ou d'utiliser une extension d'incrémentation/décrémentation de la valeur variable d'une adresse (voir Incrémentation d'une URL)
- Affichage du chemin complet vers un élément permettant, sur certains serveurs mal protégé ou très ouverts, de remonter l'arborescence et d'accéder, par exemple, à l'ensemble des fichiers disponibles dans certains dossiers
- Retrouver dans l'URL les catégories de classement des articles permettant de connaitre l'organisation interne d'un site
- De changer certains paramètres directement dans l'URL comme la langue, le pays, l'utilisateur, etc.
- De connaitre le type de langage utilisés par le site (PHP, Flash, ASP, CGI, JavaScript, etc.)
- D'intervenir directement sur certains traitements en modifiant des directives dans l'URL (ex. edit, save, refresh, etc.)
Recherche sur URL
Dans Google c'est l'instruction inurl: qui permet de rechercher des occurrences se trouvant dans les URL.
- Tout ce qui suit l'instruction inurl: est pris en compte.
- La recherche ne tient pas compte de la casse
exemple : site:vulgumtechus.com inurl:Stadia (cherche toutes les URL de page avec Stadia dans les URL du site vulgumtechus.com)
Il est aussi possible d'exclure certaines occurrences de la recherche
exemple : site:vulgumtechus.com inurl:stadia -fichier (cherche toutes les URL de page avec Stadia mais pas celles avec fichier dans les URL du site vulgumtechus.com)
Tags d'URL
Les tags sont généralement placés à la suite des caractères # (dièse) ou ? (point d'interrogation) qui ne sont pas interprétés comme des éléments actifs d'une URL.
- #xtor, &xtor ou ?xtor : Utilisé par de nombreux sites, ce tag ajouté à un lien envoyé par email par le site lui-même (dans une newsletter par exemple) permet d'identifier un référent très précisément. Il est possible de supprimer ce tag et tout ce qui suit pour éviter d'être tracé ou de remplacer la partie identifiant par n'importe quoi histoire de faire passer un message.
ex. ?xtor=pourquoi_chercher_a_savoir_qui_je_suis
- ?utm_source : Très commun, ce tag indique la source d'un lien à des fins statistiques
- ?fb_action : indique que le lien est originaire de Facebook
- ?ref : Indique la source d'un lien
- #srWebsiteId : identification du site
- &utm_campaign : identification de la campagne (exemple reseaux_sociaux)
- &utm_medium : identification du support
- &srWebsiteId : identification de la source
- &srAuthUserId : identification de l'auteur de l'article
- ?ns_campaign : identification de la campagne (exemple FB)
- &ns_source : identification de la source
- &ns_mchannel : identification du canal (exemple social)
- &ns_linkname : identification du lien
- &aef_campaign_ref : référence de la campagne (exemple ref=partage_aef)
- &aef_campaign_date : date de la campagne (exemple 2016-02-11)
- ?eaf-publisher : (exemple zanox)
- &eaf-name : (exemple zanox_deeplink)
- &eaf-creativetype
- &eseg-name
- &eaf-ZANOX : (exemple ZANOX)
- &eurl : identifie l'URL de redirection
Extensions utiles
Chrome
- Chrome Web Store Pure URL : débarrasse les URL des tags statistiques inutiles
Firefox
- Mozilla Pure URL : débarrasse les URL des tags statistiques inutiles
Articles externes
- Legalis - 03/02/16 Contrefaçon de marque dans une url
Articles Vulgum Techus
- Incrémentation et décrémentation d'une URL
- Raccourcir les URL
- nom de domaine
- IP
- QR codes
- Chercher les sous-domaines d'un site avec Google
- Trouver des noms de domaine expirés
- Réécrire l'URL d'un MediaWiki
Liens utiles
- IANA Liste des TLD
- addthis Removing all hashtags/anchors/weird codes from your URLs
- Spyzie - 19/04/17 Top 5 URL Blockers to Block Any Websites on Phone and Computer