Le Japon cherche à résoudre le défi de l’IA en mettant en place son propre ChatGPT pour répondre aux besoins de la langue japonaise.
L’engouement pour l’intelligence artificielle ne montre aucun signe de ralentissement mais une lacune persiste : ces IA génératives excellent principalement dans la maîtrise de la langue anglaise.
À lire aussi sur dondon.media : 🤖 IA : liste de mots-clés et modificateurs pour les prompts mangas et illustrations d’anime
Et de nombreux chercheurs japonais estiment que les systèmes d’IA formés sur des langues étrangères ne peuvent pas saisir les subtilités de la langue et de la culture japonaises. Ainsi, le Japon est en train de développer sa propre version de ChatGPT.
🤖 Se débarrasser du penchant de ChatGPT pour l’anglais
Il est important de rappeler que le fonctionnement des chatbots, tels que ChatGPT d’OpenAI, repose sur de vastes modèles de langage appelés LLM (large language model).
Ces modèles sont des réseaux neuronaux profonds entraînés sur une énorme quantité de données. Sans cela, les chatbots ne pourraient pas maintenir une conversation fluide.
En général, les LLM utilisent des données de sources publiques pour apprendre les modèles de discours et de prose, ce qui leur permet de répondre de manière relativement naturelle.
Depuis sa création, ChatGPT s’est principalement appuyé sur des sources en anglais pour entraîner son IA générative, ce qui explique pourquoi l’anglais est la langue qu’elle maîtrise le mieux.
🤖 Comprendre les préoccupations nippones sur la préférence pour l’anglais
Les Japonais ont identifié que les IA formées sur des données dans d’autres langues ne soient pas capables de saisir les subtilités de la langue et de la culture japonaises. La structure des phrases en japonais est en effet très différente de celle de l’anglais.
À lire aussi sur dondon.media : 👨🏫 Apprendre le japonais gratuitement [GUIDE]
L’anglais ne compte que 26 lettres, tandis que le japonais utilise deux ensembles de base de 48 caractères, en plus de 2 136 kanji courants. De plus, la plupart des kanji ont deux prononciations ou plus, avec environ 50 000 autres kanji rarement utilisés !
Pour ChatGPT, cela signifie d’abord traduire la requête japonaise en anglais, puis rechercher une réponse, avant de la re-traduire en japonais. Étant donnée la complexité de la langue, il n’est pas surprenant que l’IA générative d’OpenAI éprouve des difficultés avec le japonais.
🤖 Comment le Japon développe son propre LLM basé sur le japonais
Le gouvernement japonais et de grandes entreprises nippones, dont NEC, Fujitsu et SoftBank, investissent des centaines de millions d’euros pour créer des LLM spécifiquement adaptés à la langue japonaise.
Ce projet ambitieux s’appuie sur le supercalculateur japonais Fugaku, l’un des ordinateurs les plus puissants au monde. Il implique également la participation des universités de technologie de Tokyo, du Tohoku, de Fujitsu et du centre de recherche gouvernemental RIKEN.
🚨 Ne manquez pas les derniers articles dondon.media sur le Japon : sur Google Actualités, Twitter, E-mail ou via notre flux RSS.