Édition du 28/03/10 : apparemment, il existe bel et bien une balise HTML dédiée aux furigana, mais elle est assez « confidentielle » : la balise <ruby>. Elle ne bénéficie cependant pas d'une prise en charge très étendue, ce qui rend tout de même la réfléxion ci-dessous utile d'un point de vue alternatif. Merci à Pikrass pour l'avoir indiquée via les commentaires.
Édition du 04/12/09 : OMG, je suis vraiment une tanche ! Il ne s'agit pas des okurigana, mais bien sûr des furigana ! Sur ce, je m'en vais me faire absoudre à coups de kanji.
Certains de mes fidèles lecteurs ont dû remarquer un petit
détail sur ce blog : j'ai beau être étudiant en japonais, je
ne parle jamais de cette langue. Cela est dû au fait qu'étant un
élève médiocre, je préfère ne pas trop me risquer à faire de la
linguistique de comptoir, et que je crois que Wikipédia
sera plus apte que moi à vous initier
à cette langue. Mais une fois n'est pas coutume, je m'en vais
évoquer une réflexion que je me suis faite récemment :
comment rendre les furigana
compatibles avec le langage HTML ?
Avant de répondre à cette question, quelques explications
sommaires s'imposent.
Le langage HTML sert à élaborer des pages
Web à l'aide d'un système de balisage directement issu du langage
XML. Si XML n'impose
que des règles de syntaxe, l'HTML comporte en outre une certaine
liste de balises ayant une valeur sémantique. On peut trouver des
balises pour les paragraphes (<p>),
les titres (<h1>
à <h6>),
les listes à puces (<ul>
et <li>),
les emphases (<em>),
etc. Il est nécessaire de définir de tels standards afin de
permettre à tous les navigateurs de lire les pages Web sans différer
excessivement les uns des autres. Cette sémantique est primordiale
afin de favoriser l'accès à Internet aux personnes souffrant d'un
handicap, ces dernières utilisant des navigateurs interprétant le
langage HTML en s'adaptant aux limitations de leurs
utilisateurs.
Quant aux furigana, il s'agit, en langue
japonaise, de petits kana (signes sillabiques) généralement
disposés à droite des kanji
(caractères chinois ou idéogrammes) dans le cas d'une disposition
verticale, ou au dessus dans le cas d'une disposition horizontale.
Ils indiquent la lecture (ou prononciation) d'un ou plusieurs kanji.
Dans le cas d'un document imprimé, la façon d'insérer les furigana peut être ad libitum, l'important
étant le résultat visuel, mais on est en droit de se demander de
quelle manière on pourrait le faire avec un langage dont la
sémantique est vitale.
Si l'on voulait se contenter d'un
simple effet visuel, certains débutants pourraient grossièrement se
contenter de faire une sorte de tableau dont la première ligne
contiendrait les furigana, et la seconde les kanji.
Mais c'est tout aussi faux que de réaliser une page en tableaux,
puisque ces derniers ne sont pas destinés à cela, leur usage étant
destiné aux données strictement tabulaires (comme les statistiques,
par exemple).
Mais alors, existe-t-il une balise HTML
permettant une inclusion logique des furigana ?
Il est évident que ce langage n'a pas été élaboré en prenant en
compte les cas de figure liés au japonais (un programmeur natif aurait sûrement créé une balise <furigana>), mais il me semble
qu'une solution est envisageable : la balise <abbr>.
Depuis la version 5 du langage HTML, <abbr> est devenue la
balise exclusive des abréviations et des acronymes, la balise
<acronym>
ayant été évincée car elle créait trop de confusion. On
l'utilisera par exemple pour des sigles tel que l'OPEP
de la façon
suivante :
<abbr title="Organisation des Pays
Exportateurs de Pétrole">OPEP</abbr>
En arrêtant le pointeur de la souris dessus, on peut alors voir apparaître un cadre contenant le sens complet du mot abrégé. Cela permet d'économiser de l'espace, et de raccourcir le temps de lecture dans le cas où le lecteur saurait au préalable la signification du sigle.
On peut cependant émettre des doutes l'utilisation de cette
balise, car en quelle mesure les kanji
peuvent-ils être des abréviations ? À mon avis, on peut les
envisager comme tels car ils condensent plusieurs kana
dans des signes qui peuvent raccourcir le texte. De plus, si la
simple occurence des syllabaires au sein d'une phrase peut parfois
s'avérer compliquée pour en saisir le sens, on peut dire que
l'utilisation des kanji
permet d'abréger la réflexion lors de la lecture. Après
tout, ce n'est pas pour rien que les japonais natifs lisent aussi
vite : un kanji est plus qu'un mot, c'est une notion. La
simple vue d'un kanji suffit à l'évocation
d'une idée, tandis que chez nous, il nous faut d'abord assembler
les lettres afin qu'un tout cohérent, à savoir le mot ou le groupe
de mots, nous fasse saisir une idée, si bien sûr cette dernière ne
se laisse pas piéger par l'homonymie.
Je crois donc que la balise <abbr> est tout à fait
logique et adaptée à l'insertion des furigana
au sein d'une page web en japonais. Cela dispenserait des
lectures mises entre parenthèses dans les articles de Wikipédia, et
permettrait au lecteur de retrouver rapidement la prononciation et le
sens d'un kanji qui lui échapperait.
Ainsi, pour 女の人 (« onna no hito » → femme), cela
donnerait :
<abbr title="おんな">女</abbr>の<abbr
title="ひと">人</abbr>
Il ne resterait plus qu'à trouver une mise en forme adéquate via le langage
CSS, et le tour est
joué !