CRDO —> SldrWiki —> SLDR_FR —> Projet CINES/IN2P3/TGE-Adonis

Encodage

M. Jacobson : Toutes nos ressources textuelles (metadonnées comme annotations) sont en XML/Unicode. Elles sont communiquées à la demande soit dans des flux XML en UTF-8 soit dans des flux XHTML eux aussi en UTF-8. On pourrait le faire en HTML, TEXT ou en PDF de la même manière. On pourrait aussi le faire dans d'autres encodages, mais tant que le langage que l'on vise (PDF, HTML, etc.) comprend Unicode et reconnaît l'encodage utilisé ou incorpore un mécanisme d'extension (les entités en XML/SGML) nos caractères accentués comme nos autres alphabets (devenagari, chinois, etc.) seront correctement codés.

N'importe quel parser XML devrait être capable de vérifier si l'encodage déclaré est correct. Mais attention il ne fait qu'une vérification syntaxique, pas sémantique : le caractère 'è' (e grave) est illégitime en ASCII alors qu'il l'est en ISO-8859-1. Il est aussi légitime en UTF-8 s'il est suivi d'un autre caractère d'un certain rang et mais en aucun cas il ne code un 'e grave'.

O. Rouchon : En ce qui concerne l'encodage, la bonne pratique est généralement l'utilisation d'un encodage UTF-8 - c'est ce que nous faisons à l'heure actuelle.

Valid XHTML 1.0! Valid CSS!
Page Execution took real: 0.691, user: 0.200, sys: 0.310 seconds