🈵️ Lire et faire des sites internet comportant des caractères japonais

Découvrez comment bien faire un site internet comportant des caractères japonais et le codage HTML d’un texte japonais.

Lire et faire des sites internet caractères japonais

Comprendre l’encodage des caractères japonais, c’est bien, mais il y a beaucoup de problèmes lorsqu’il s’agit de construire des pages web qui utilisent des caractères autres qu’ASCII.

Globalement, tant que vous avez la marque de votre page web en tant qu’UTF-8, EUC-JP, ISO-2022-JP, soit dans les en-têtes http ou les balises meta, avoir des caractères dans vos pages web devraient être ok.

À lire aussi sur dondon.media : ✅⛩️ Liste des emoji (kaomoji et émoticones) japonais [GUIDE]

Si votre navigateur est capable d’afficher des caractères japonais, vous pouvez tenter cette petite expérience : lisez cette page en choisissant l’encodage EUC-JP. Certains caractères japonais devraient apparaître dans le texte. En y regardant de près, vous constaterez que chaque kanji occupe la place de deux caractères européens.

Divers systèmes ont été inventés pour stocker des textes japonais et sont encore plus ou moins utilisés. Chaque caractère est souvent stocké sous deux formes : en pleine largeur et en demi-largeur, selon la largeur à utiliser pour afficher le caractère. Tous les encodages japonais sont aussi capables de stocker des caractères européens non accentués (ceux qui sont utilisés en anglais).

🈵️ L’encodage des caractères japonais

Les textes japonais posent donc un problème inconnu avec les systèmes alphabétiques occidentaux. En effet, on ne peut donner que 256 valeurs différentes à un octet, donc un encodage du genre de ASCII ou ISO-2256-1 ne pourra noter que 256 caractères différents.

Les encodages japonais utilisent donc plusieurs octets. Des règles plus ou moins complexes diront que tel caractère est stocké non pas avec 1, mais avec plusieurs octets successifs prenant telle ou telle valeur. Avec deux octets, on peut coder 256 x 256 = 65536 caractères.

🈵️ Récap

Pour bien faire fonctionner les caractères japonais sur des contenus HTML, plusieurs choses sont à prendre en compte :

  • Si vous faites un site : votre html contenant des caractères japonais soit encodé avec un charset supportant ces caractères comme EUC-JP, ISO-2022-JP ou UTF-8.
  • Si vous lisez une page : vous devez avoir les caractères asiatiques supportés et donc au moins une typo contenant ces caractères installée sur sa machine.

🚨 Pour recevoir les derniers articles dondon.media, suivez-nous sur Google Actualités, Twitter, E-mail ou flux RSS.

💕 Faites un don (ETH / ERC20) : 0x4ce4ce4b3fd43e8c16ed3d08092a943ecc06028e

Auteur/autrice : Louis Japon

Auteur #Actus, #BonsPlans, #Guides, #Culture, #Insolite chez dondon media. Chaque jours de nouveaux contenus en direct du #Japon et en français ! 🇫🇷💕🇯🇵

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *