Les furigana et le langage HTML
Par Ejis le samedi, 21 novembre 2009, 12:21 - G33k autiste associal - Lien permanent
Édition du 28/03/10 : apparemment, il existe bel et bien une balise HTML dédiée aux furigana, mais elle est assez « confidentielle » : la balise <ruby>. Elle ne bénéficie cependant pas d'une prise en charge très étendue, ce qui rend tout de même la réfléxion ci-dessous utile d'un point de vue alternatif. Merci à Pikrass pour l'avoir indiquée via les commentaires.
Édition du 04/12/09 : OMG, je suis vraiment une tanche ! Il ne s'agit pas des okurigana, mais bien sûr des furigana ! Sur ce, je m'en vais me faire absoudre à coups de kanji.
Certains de mes fidèles lecteurs ont dû remarquer un petit détail sur ce blog : j'ai beau être étudiant en japonais, je ne parle jamais de cette langue. Cela est dû au fait qu'étant un élève médiocre, je préfère ne pas trop me risquer à faire de la linguistique de comptoir, et que je crois que Wikipédia sera plus apte que moi à vous initier à cette langue. Mais une fois n'est pas coutume, je m'en vais évoquer une réflexion que je me suis faite récemment : comment rendre les furigana compatibles avec le langage HTML ?
Avant de répondre à cette question, quelques explications
sommaires s'imposent.
Le langage HTML sert à élaborer des pages
Web à l'aide d'un système de balisage directement issu du langage
XML. Si XML n'impose
que des règles de syntaxe, l'HTML comporte en outre une certaine
liste de balises ayant une valeur sémantique. On peut trouver des
balises pour les paragraphes (<p>),
les titres (<h1>
à <h6>),
les listes à puces (<ul>
et <li>),
les emphases (<em>),
etc. Il est nécessaire de définir de tels standards afin de
permettre à tous les navigateurs de lire les pages Web sans différer
excessivement les uns des autres. Cette sémantique est primordiale
afin de favoriser l'accès à Internet aux personnes souffrant d'un
handicap, ces dernières utilisant des navigateurs interprétant le
langage HTML en s'adaptant aux limitations de leurs
utilisateurs.
Quant aux furigana, il s'agit, en langue
japonaise, de petits kana (signes sillabiques) généralement
disposés à droite des kanji
(caractères chinois ou idéogrammes) dans le cas d'une disposition
verticale, ou au dessus dans le cas d'une disposition horizontale.
Ils indiquent la lecture (ou prononciation) d'un ou plusieurs kanji.
Dans le cas d'un document imprimé, la façon d'insérer les furigana peut être ad libitum, l'important
étant le résultat visuel, mais on est en droit de se demander de
quelle manière on pourrait le faire avec un langage dont la
sémantique est vitale.
Si l'on voulait se contenter d'un
simple effet visuel, certains débutants pourraient grossièrement se
contenter de faire une sorte de tableau dont la première ligne
contiendrait les furigana, et la seconde les kanji.
Mais c'est tout aussi faux que de réaliser une page en tableaux,
puisque ces derniers ne sont pas destinés à cela, leur usage étant
destiné aux données strictement tabulaires (comme les statistiques,
par exemple).
Mais alors, existe-t-il une balise HTML
permettant une inclusion logique des furigana ?
Il est évident que ce langage n'a pas été élaboré en prenant en
compte les cas de figure liés au japonais (un programmeur natif aurait sûrement créé une balise <furigana>), mais il me semble
qu'une solution est envisageable : la balise <abbr>.
Depuis la version 5 du langage HTML, <abbr> est devenue la
balise exclusive des abréviations et des acronymes, la balise
<acronym>
ayant été évincée car elle créait trop de confusion. On
l'utilisera par exemple pour des sigles tel que l'OPEP
de la façon
suivante :
<abbr title="Organisation des Pays
Exportateurs de Pétrole">OPEP</abbr>
En arrêtant le pointeur de la souris dessus, on peut alors voir apparaître un cadre contenant le sens complet du mot abrégé. Cela permet d'économiser de l'espace, et de raccourcir le temps de lecture dans le cas où le lecteur saurait au préalable la signification du sigle.
On peut cependant émettre des doutes l'utilisation de cette balise, car en quelle mesure les kanji peuvent-ils être des abréviations ? À mon avis, on peut les envisager comme tels car ils condensent plusieurs kana dans des signes qui peuvent raccourcir le texte. De plus, si la simple occurence des syllabaires au sein d'une phrase peut parfois s'avérer compliquée pour en saisir le sens, on peut dire que l'utilisation des kanji permet d'abréger la réflexion lors de la lecture. Après tout, ce n'est pas pour rien que les japonais natifs lisent aussi vite : un kanji est plus qu'un mot, c'est une notion. La simple vue d'un kanji suffit à l'évocation d'une idée, tandis que chez nous, il nous faut d'abord assembler les lettres afin qu'un tout cohérent, à savoir le mot ou le groupe de mots, nous fasse saisir une idée, si bien sûr cette dernière ne se laisse pas piéger par l'homonymie.
Je crois donc que la balise <abbr> est tout à fait
logique et adaptée à l'insertion des furigana
au sein d'une page web en japonais. Cela dispenserait des
lectures mises entre parenthèses dans les articles de Wikipédia, et
permettrait au lecteur de retrouver rapidement la prononciation et le
sens d'un kanji qui lui échapperait.
Ainsi, pour 女の人 (« onna no hito » → femme), cela
donnerait :
<abbr title="おんな">女</abbr>の<abbr
title="ひと">人</abbr>
Il ne resterait plus qu'à trouver une mise en forme adéquate via le langage CSS, et le tour est joué !
Commentaires
Je m'étais déjà posé la question, et s'il est vrai que la balise <abbr> semble tout à fait convenir, elle n'en reste pas moins un simple moyen de contourner un problème.
Effectivement, les kanji peuvent être assimilés à des abréviations, mais là où la balise montre ses limites, c'est dans le cas d'un texte long et / ou complexe où il faudrait recourir régulièrement aux okurigana… c'est pas pour dire, mais devoir jouer sans cesse de la souris et de la seconde d'attente pour avoir la prononciation d'un kanji, alors qu'en théorie on devrait l'avoir directement à côté / au-dessus, ça peut vite saouler.
Faudrait que des développeurs japonais se penchent sur le problème… et ça m'étonne d'ailleurs que rien ne soit sorti depuis que le web existe.
Salut,
évidemment que la balise <abbr> est un moyen de compenser l'absence d'une balise très « locale ».
Quant à son utilisation, il est certain que cela peut s'avérer fatigant... tout comme pour plein de balises telles <a>, <ul>, <img />, etc. Cependant, il y aurait des moyens de simplifier la procédure via des formulaires type BBCode. Par exemple, Fire Soft Board propose le FSBCode, qui permet à un administrateur de créer ses porpres balises. Je me suis donc essayé à la création d'une balise [abbr] qui s'ajoute directement au champ après un clic. Je crois qu'avec un peu d'imagination, il est possible de créer les outils permettant de simplifier l'utilisation d'une telle balise.
Ensuite, pour le lecteur, s'il connaît déjà le kanji, il n'aura pas besoin de placer le pointeur dessus. En fait, j'ai pensé à cet article en jouant à ゼルダの伝説:夢幻の砂時計 (Legend of Zelda: Phantom Hourglass) sur DS. Les textes sont affichés en pleins kanjis, mais en plaçant le stylet sur les sinogrammes, on peut voir la lecture, et plus on s'habitue à voir certains mots revenir, moins on éprouve le besoin d'en rechercher le sens.
Pour finir, il me semble qu'en CSS, il est possible d'appliquer un style aux attributs d'une balise (à confirmer). Mais il est certain qu'une balise <okurigana> mise en forme automatiquement par le navigateur serait bien plus pratique.
Peut-être qu'il ne faudrait pas systématiser l'utilisation d'<abbr>, mais cela peut être utile dans le cas de mots rares ou à la prononciation « exotique » ou altérée (les ateji, par exemple).
Alors là, je me demande comment j'ai pu faire une erreur aussi grossière ! Il s'agissait des furigana, et non des okurigana ! Article corrigé.
Il existe officiellement, en
CSS2HTML, une balise dédiée aux annotations au-dessus, au-dessous ou à côté des mots : la balise ruby. Ruby est un terme linguistique pour désigner de telles annotations, et les furigana en font partie.Voir : http://fr.wikipedia.org/wiki/Ruby_(...)
A l'intérieur de la balise ruby, on utilise la balise rb pour le texte à annoter (ici, les kanji), la balise rt pour l'annotation (ici, les kana) et la balise rp pour afficher du texte seulement sous les navigateurs ne supportant pas ruby (par exemple, on peut entourer les kana de parenthèses dans des balises rt).
La spéc' est là : http://www.w3.org/TR/ruby/
Elle montre d'autres applications de ruby.
Malheureusement, cette balise est très peu supportée par les navigateurs (nottamment pas dans Firefox, du moins la 3.0).
Merci beaucoup, Pikrass, d'avoir apporté cette clarification. J'ai ajouté une édition au début de cet article, dont l'intérêt sera au moins de proposer une méthode alternative, vue la prise en compte limitée de cette balise pourtant si pratique à une époque comme la nôtre.