Home(Best Viewed With Any Browser)

Recherche de bonnes pratiques

Je suis à la recherche de règles de "bonnes pratiques" (guidelines), ou, s'il n'en existe pas, d'un groupe de travail susceptible d'en élaborer, concernant les formats de documents convenables pour l'échange d'information dans des contextes variés, comme ceux énumérés ci-dessous (et tant pour la composition de pages WWW que pour les annexes du courrier).


Il est aujourd'hui regrettablement courant de faire appel aux formats les plus perfectionnés pour enregister des documents banals: dernières versions de traitement de texte pour des documents ne nécessitant aucune mise en page particulière, "cahier" (workbook) pour des tableaux élémentaires, pages HTML avec fonctions en Javascript, animations, styles, et nombreux graphismes sans véritable information ajoutée, etc...

Or ces formats complexes ont au moins deux inconvénients:

- ils sont en général beaucoup plus volumineux que des formats plus simples, et constituent une charge inutile pour les réseaux lents;

- ils exigent souvent, non seulement des logiciels particuliers, mais leurs versions les plus récentes, lesquelles risquent de ne pouvoir être installées sur des machines simples, anciennes, ou pauvres en mémoire.


Mais la diffusion la plus large, que mérite toute information valable, doit tenir compte de nombreuses contraintes:

1° Le temps de chargement, tant du courrier que de pages web ou d'autres transferts de fichiers, dépend d'abord des télécommunications disponibles.

Non seulement les liaisons rapides (câble, ADSL, etc) sont loin d'être disponibles dans toutes les régions, même de pays tels que la France ou les Etats-unis, mais:

- la qualité des lignes téléphoniques de nombreux pays limite fréquemment la vitesse des modems et rend même la communication précaire;

- des utilisateurs isolés n'ont à leur disposition que des dispositifs mobiles lents et coûteux (GSM, PhoneSat,...);

- des circonstances locales qui ne sont pas toutes d'ordre technique peuvent leur interdire l'accès direct à l'Internet, les obligeant à se rabattre sur diverses méthodes de remplacement (packet radio, fidonet, voire uucp...).

2° La variété des systèmes d'exploitation ne s'arrête pas au trio Windows/MacOS/Linux; il faut aussi tenir compte d'un grand nombre de versions différentes de chaque système, conséquence forcée de la diversité des matériels.

Celle-ci peut se nourrir de causes très diverses suivant les circonstances:

- des utilisateurs isolés dans un environnement hostile peuvent avoir des difficultés d'approvisionnement et de remplacement de matériel, indépendemment de toute contrainte économique;

- des utilisateurs impliqués dans des projets de développement, pour lesquels le courrier et l'Internet peuvent être très précieux, rencontrent souvent des contraintes économiques très sévères;

- tandis que d'autres s'orienteront vers des systèmes miniaturisés pourvus de logiciels spéciaux.


Il serait impensable, par exemple, de décréter la mise au rebut de toute machine ne dépassant pas 32 MB de mémoire vive, et il est donc ridicule de ne distribuer de documents que dans le format le plus récent du logiciel le plus vendu.


Il faut aussi distinguer trois grandes classes d'application de l'Internet:


A) La distribution et l'échange d'information.

On a suffisemment dit que l'Internet était le réseau des réseaux. Une raison très importante de son succès a été que la pluspart de ses protocoles et de ses normes sont utilisés sur les systèmes informatiques les plus divers, et constituent de ce fait une solution efficace aux échanges entre systèmes et logiciels hétéroclites.
Une seconde raison est son extension universelle, qui couvre non seulement le monde, mais implique aussi des milieux culturels et professionnels très divers.

Ceci est une leçon de l'Histoire, que le monde de l'Information ne doit pas pardre de vue.


B) Les usages commerciaux.

Il s'agit encore de relations ouvertes, quoique dans une mesure moindre, car même le marketing implique souvent de cibler son public, au contraire de l'information non commerciale, qui vise le public le plus large, avec la diversité que cela peut impliquer.


C) Les usages internes ou particuliers.

Qu'il s'agisse de réseaux d'entreprise, ou d'Intranets, et même d'Extranets, ils ont comme caractéristique de concerner des ensembles clos ou limités, dans lesquels il est possible de faire l'inventaire des caractéristiques techniques des systèmes utilisés, même lorsqu'il n'y a pas de norme contraignante.
Ces réseaux sont en quelque sorte le contraire de l'Internet, même s'ils en utlisent tous les protocoles.


Si c'est essentiellement la première classe qui nous intéresse, nous devons bien remarquer que beaucoup de développements récents sont conçus essentiellement pour les besoins de la diffusion commerciale (B) ou pour les Intranets (C).

Et il est assez clair que la philosophie de travail de la firme qui domine aujourd'hui le marché pousse l'utilisateur davantage vers l'automatisation de bureau et l'uniformisation du marché que vers un traitement généralisé et universel de l'information.

C'est donc une tâche constante pour un informaticien conscient, et même pour toute autre personne responsable d'information, d'éviter les barrières artificielles dressées par les producteurs de certains logiciels.


Leurs pratiques peuvent réserver des surprises variées; relatons de petits exemples simples.

Après avoir vérifié qu'une page HTML se présente convenablement sur plusieurs machines, tant par Netscape sous MacOS que par Internet Explorer sous Windows, on découvre sur un autre PC que des symboles sont remplacées par des ÿ, etc..., alors que ce PC est sous Windows98, tout comme celui sur lequel la première version de la page avait été produite. La lecture du code apprend alors que le premier éditeur HTML avait spécifié, à l'insu du rédacteur, une police de caractères spéciale, que le Macintosh possédait bien, mais non le dernier PC car on n'y avait pas installé MS Office...

La spécification d'une police spéciale est évidemment une hérésie sur le web, mais certains programmes le font automatiquement, ou par défaut.

Que dire alors de la variété des fonctions incluses dans certains Javascripts...

Certains éditeurs HTML engendrent systématiquement des pages qui ne passent convenablement que dans les logiciels de la même firme.
Sur cet aspect, on peut s'inspirer des conseils de www.anybrowser.org.

Certains sites de publication électronique, face à la multiplicité des formats, cherghent à imposer des formats universels (RTF, SGML, TEI...), voire se rabattent sur le PDF, beaucoup trop lourd pour les cas qui nous occupent. Par contre le projet Gutenberg recommande le pur Ascii.


Malheureusement, le test systématique sous toutes les configurations possibles serait une tâche énorme, jamais achevée, et demanderait aussi une large panoplie hardware.

Lynx Friendly logoOn peut cependant remarquer que certains sites se montrent remarquablement souples et tous-terrains (celui du Monde Diplomatique, par exemple), au point de rester exploitables en texte pur, comme avec le vieux navigateur Lynx. Un autre bon conseil est de se contenter du code HTML 3.2 tant que d'autres perfectionnements ne sont pas indispensables.

[Remarquons en passant que le terme "Acessibilité" est aujourd'hui consacré à l'accès aux personnes handicapées. Un certains nombre de sites y sont consacrés, tels Braillenet, ou cetaines pages guides du site du Gouvernement Français pour la Société de l'Information. Le vieux navigateur Lynx y reste une référence, et plusieurs recommandations du W3C s'avèrent utiles dans des contextes variés].

Remarquons encore que ce terrible 11 septembre, pour remédier à la surcharge, CNN a jugé utile de remplacer sa page d'accueil par une page html plus simple (lire VNUnet, 12 septembre); un certains nombre d'autres sites sont aussi à ce moment revenus à l'usage de pages statiques (VNUnet, 19 septembre).


Les inconvénients des Frames (cadres) pour l'indexation des sites sont bien connus, et Javascript peut aussi perturber la présentation d'un site dans les moteurs de recherche; alors que la bonne indexation est fondamentale pour la recherche d'information, et donc aussi pour sa diffusion.


Je me suis un jour fait traiter d'imbécile par le webmaster d'un grand quotidien belge pour lui avoir écrit le dixième de ce qui précède. Il y a évidemment des gens qui ne sauraient prendre de leçons de la concurrence!

Pourrait-on rêver de portails, annuaires ou autres guides ou moteurs, qui catalogueraient les sites en fonction de leur poids, de leur caractère tous-terrains, de leur accessibilité, etc?

Pour le monde de l'Information, et contre le monde du paraître...

(--> Home Page)

Robert Goedertier

ci-devant administrateur de système et de réseau,
ci-devant Chargé de Cours à l'Université de Kinshasa,
etc...

Remarque: Les mêmes remarques valent pour les documents de toute sorte annexés au courrier électronique.
On voit des associations distribuer des tableaux de données mis sous le format de la dernière version d'Excel, alors qu'ils ne comportent aucune fonction, mais devenant donc inexploitables pour qui n'a pas installé la même version (on aurait pu se contenter du format 2.2, voire de formats encore plus rudimentaires).
Un même document de 2 pages (un C.V. mis en tableaux) pesait 78153 octets dans le format "normal" de Word 98; il n'en pesait plus que 12800 dans le format Word 5.1, sans avoir rien perdu de sa mise en page pourtant compliquée...
Et il ne manque pas d'internautes demandant explicitement que le courrier leur soit envoyé en texte pur (et non en HTML).
Il faut d'ailleurs penser aussi à ne pas saturer les boîtes aux lettres des voyageurs et des utilisateurs de "webmail".

Dans un autre domaine, n'oublions pas de citer en exemple le remarquable CD-ROM archive du Monde Diplomatique, dont les exigences techniques, en décembre 2001, restent ainsi libellées:
"Configuration minimale requise: Macintosh (à partir du système 7) ou PC (à partir de Windows 3.1), 4 Mo de mémoire vive"!

(Un commentaire plus ancien sur cette problématique: pour la simplicité ).

KISS: Keep It Simple Stupid (devise d'amateurs radio).