Découvrez comment bien faire un site internet comportant des caractères japonais et le codage HTML d’un texte japonais.
Comprendre l’encodage des caractères japonais, c’est bien, mais il y a beaucoup de problèmes lorsqu’il s’agit de construire des pages web qui utilisent des caractères autres qu’ASCII.
Globalement, tant que vous avez la marque de votre page web en tant qu’UTF-8, EUC-JP, ISO-2022-JP, soit dans les en-têtes http ou les balises meta, avoir des caractères dans vos pages web devraient être ok.
À lire aussi sur dondon.media : ✅⛩️ Liste des emoji (kaomoji et émoticones) japonais [GUIDE]
Si votre navigateur est capable d’afficher des caractères japonais, vous pouvez tenter cette petite expérience : lisez cette page en choisissant l’encodage EUC-JP. Certains caractères japonais devraient apparaître dans le texte. En y regardant de près, vous constaterez que chaque kanji occupe la place de deux caractères européens.
Divers systèmes ont été inventés pour stocker des textes japonais et sont encore plus ou moins utilisés. Chaque caractère est souvent stocké sous deux formes : en pleine largeur et en demi-largeur, selon la largeur à utiliser pour afficher le caractère. Tous les encodages japonais sont aussi capables de stocker des caractères européens non accentués (ceux qui sont utilisés en anglais).
🈵️ L’encodage des caractères japonais
Les textes japonais posent donc un problème inconnu avec les systèmes alphabétiques occidentaux. En effet, on ne peut donner que 256 valeurs différentes à un octet, donc un encodage du genre de ASCII ou ISO-2256-1 ne pourra noter que 256 caractères différents.
Les encodages japonais utilisent donc plusieurs octets. Des règles plus ou moins complexes diront que tel caractère est stocké non pas avec 1, mais avec plusieurs octets successifs prenant telle ou telle valeur. Avec deux octets, on peut coder 256 x 256 = 65536 caractères.
🈵️ Récap
Pour bien faire fonctionner les caractères japonais sur des contenus HTML, plusieurs choses sont à prendre en compte :
- Si vous faites un site : votre html contenant des caractères japonais soit encodé avec un charset supportant ces caractères comme EUC-JP, ISO-2022-JP ou UTF-8.
- Si vous lisez une page : vous devez avoir les caractères asiatiques supportés et donc au moins une typo contenant ces caractères installée sur sa machine.
🚨 Ne manquez pas les derniers articles dondon.media sur le Japon : sur Google Actualités, Twitter, E-mail ou via notre flux RSS.