Comment définir l'encodage d'un document HTML ?

Par : TutorialsGrey, le 22 Janvier 2022

L'encodage utilisé dans un document HTML indique aux navigateurs quel jeu de caractères ils doivent utiliser pour le rendu des pages web.

Lorsque vous ne spécifiez pas le jeu de caractères à prendre en compte dans votre document HTML, les navigateurs essaieront d'abord de déterminer l'encodage à partir des en-têtes des réponses HTTP émises par votre serveur (en particulier, l'en-tête "Content-Type").

L'encodage défini dans les en-têtes de ces réponses HTTP est généralement préféré à l'encodage spécifié dans votre document HTML, et constitue donc la méthode privilégiée.

Toutefois, si vous ne pouvez pas contrôler les en-têtes envoyés par votre serveur, définir l'encodage dans votre document HTML reste la meilleure option.

Voici comment définir l'encodage dans un document HTML :

<meta charset="utf-8">

Si l'encodage n'est déclaré ni dans le document HTML ni dans les en-têtes des réponses HTTP, le navigateur peut en choisir un pour vous et il se peut qu'il ne corresponde pas aux besoins de votre site.

Cela peut non seulement causer des problèmes de rendu, mais aussi présenter un risque pour la sécurité de votre site web.

Dans les versions précédentes du HTML, l'encodage devait être déclaré avec des attributs et des valeurs supplémentaires :

<meta http-equiv="Content-Type" content="text/html ; charset=UTF-8" />

Mais, comme pour le DOCTYPE, HTML5 n'a besoin que de quelques informations minimales requises par les navigateurs. Cela favorise la rétrocompatibilité et facilite l'écriture du code pour les développeurs.

 

Caractères spéciaux

Dans cet article, nous avons spécifié l'encodage UTF-8 car il s'agit d'un encodage polyvalent qui couvre la plupart des besoins des développeurs de sites web. Parfois, cependant, il peut arriver que vous vouliez inclure un caractère qui ne fait pas partie de l'encodage.

Le site https://www.digitalmediaminute.com/reference/entity/index.php constitue une excellente base de données de caractères spéciaux, qui comprend la plupart des caractères les plus courants autorisés en HTML.

Pour chacun de ces caractères spéciaux, vous pouvez spécifier la référence numérique (Numeric Character Reference - NCR) ou le nom de l'entité représentant le caractère afin d'aider les navigateurs à les afficher correctement. Si vous voulez un symbole de Copyright, par exemple, vous pouvez l'inclure dans votre document HTML en tant que référence numérique :

&#169;

Ou vous pouvez l'inclure en tant qu'entité nommée :

&copy;