Pour les formats ouverts !

Aller au contenu | Aller au menu | Aller à la recherche

Le site Formats-Ouverts.org, (FOo), traite des formats, protocoles et standards ouverts, dans différents domaines (comme l'interopérabilité, l'archivage), depuis le 1er juillet 2004 (plus de 1400 jours) - Les formats se rencontrent presque partout - Il y a actuellement 1618 articles en ligne, dont 18 pour le mois en cours et les notules - Les 1000 articles : le communiqué de presse (inédit et exclusif) - Les statistiques mensuelles du site - Attention : vote électronique - Les conférences - Les 3 ans et demi ! - Le 1600e article - Un index du site - Où en est le patrimoine numérique ?


Notules express :


2008, les 10 ans de XMLXML10, les 10 ans de XML en 2008


La vie sous forme virtuelle

Second Life : le nouveau format de vie, en plein développement

Une ambassade d'un État, des interviews à Davos et des impôts à payer : le monde de Second Life se développe, avec le réel et le format virtuel qui se rejoignent...

Second Life (« seconde vie ») est le nom d'un nouveau monde [1]. Un monde en pleine création et en pleine évolution, presque illimité et habité. Créé par la société Linden Lab [2], Second Life est un monde virtuel, qui n'existe que via ordinateur. Ses habitants sont des personnages virtuels (les « avatars »), que les vraies personnes connectées font vivre (presque) comme dans la vie réelle et ses différents aspects, y compris le volet économique et ses achats (la monnaie « locale » est le Linden-Dollar).

Second Life est en pleine explosion : le nombre de ses « habitants » grossit de plus en plus, et cela est pris très au sérieux par certaines structures de notre monde réel : elles décident de « s'installer » dans cet univers virtuel. Ainsi, des marques de vêtements, de chaussures, d'ordinateurs, d'informatique ou même des biliothèques [3] sont désormais présentes pour proposer leurs informations et leurs produits à ces clients virtuels mais bien réels : un nouveau marché est né, au format numérique et « virtuel-réel ».

Voici 3 exemples significatifs de ce développement :

  • le journaliste avatar Adam Reuters de l'agence de presse Reuters, présente dans Second Life [4], a interviewé des personnalités réelles lors du sommet économique mondial de Davos en janvier 2007 [5] ;
  • la Suède a décidé fin janvier 2007 d'ouvrir une ambassade officielle de son pays dans l'univers virtuel, la première représentation diplomatique dans Second Life : il s'agira de fournir des informations sur le pays, et non pas y délivrer de visas et autres documents officiels [6] ;
  • ...et la même Suède envisage d'appliquer ses impôts bien réels aux transactions commerciales de ses ressortissants de Second Life (pas « les habitants classiques » mais ceux qui y gagnent de l'argent de manière importante) [7].

Pour ce qui est des logiciels libres, une représentation n'est à pas ouverte à ce jour. Et pour la promotion des standards ouverts, Formats-Ouverts.org n'a pas (pour l'instant ?) de présence dans Second Life : il y a ces lignes sur écran, ou imprimées sur papier, et les conférences. On peut ajouter qu'à la fin des années 90, un tel monde virtuel existait déjà, Le Deuxième Monde, lancé par Canal+, mais qui n'a pas rencontré de succès et n'a donc pas duré [8].

Enfin, Linden Lab a décidé début 2007 de mettre à disposition en logiciel libre une partie des logiciels qui permettent de créer des éléments du monde de Second Life [9] : on ouvre les formats pour que le plus grand nombre l'utilise, y contribue et l'améliore.

Sources et liens :
Et sur Formats-Ouverts.org :

Guerre des formats : quelle est la position de la France ?

L'AFNOR va voter au nom de la France à propos des formats bureautiques

Quelle est la position de l'AFNOR pour la France à propos de OOXML ? Il n'est pas aisé de répondre à cette question pourtant facile à poser et très importante.

OOXML est le format bureautique de Microsoft, Office OpenXML. Il a été reconnu comme un standard ECMA en décembre 2006 [1], après étude du dossier et vote des membres, dont la liste est connue. OOXML est désormais proposé à l'ISO pour l'établir comme standard ISO selon une procédure appelée fast track (elle est plus rapide que celle habituelle).

L'ISO va donc décider si elle retient OOXML sans étudier de manière approfondie ce format, faisant confiance au travail de l'ECMA. Pour prendre cette décision, l'ISO reçoit les avis de ses membres jusqu'au 5 février 2007.

L'AFNOR (Association française de normalisation [2]) qui représente la France, fait partie des membres de l'ISO et du groupe de travail consacré à la validation OOXML. L'AFNOR va donc donner la position française à propos de la procédure et du format Office OpenXML.

Quelle sera la position de la France au travers de l'AFNOR ? Et comment est décidée cette position AFNOR ? Ces 2 questions sont importantes et il n'est pas facile d'y répondre. D'une part le format ODF, concurrent de OOXML, est déjà utlisé en France (par exemple par toute la Gendarmerie nationale) et mis en avant au sein du projet de RGI (Référentiel Général d'Interopérabilité).

D'autre part, des information contradictoires circulent à propos de la prise de décision de l'AFNOR (plus précisément du groupe de travail qui s'en occupe) :

  • la liste précise des membres du groupe de travail concerné est confidentielle pour certains, et seulement non-publiée pour d'autres ;
  • les membres de ce groupe de travail AFNOR ne seraient pour certains que des entreprises privées (dont Microsoft, HP, IBM, France Télécom) sans représentant des services publics, et pour d'autres plus équilibrés entre secteur privé et public, voire avec seulement des représentants du secteur public et des consommateurs.

Toujours est-il que ces informations sur les membres et leurs voix respectives pour déterminer la position de la France ne sont pas vraiment connues : à ce stade rien n'a été trouvé sur les site de l'AFNOR ni de l'ISO.

Mise à jour du 31 janvier après-midi : mercredi matin se tenait au salon Solutions Linux une conférence sur l'administration électronique. L'information de la participation de Microsoft, HP, IBM et France Télécom a été confirmée. Et le groupe de travail concerné ne comporte aucun très peu de représentants du secteur public et aucun ni des consommateurs.

Mise à jour du 2 février matin : l'université de Paris X et l'Inspection générale de l'éducation nationale (IGEN, Ministère de l'éducation nationale) seraient aussi présentes dans le comité en charge du dossier, au titre donc de l'administration publique (mais personne de la DGME en charge du RGI)

Mise à jour du 2 février fin d'après-midi :

  • l'association AFUL a publié un communiqué de presse où elle « appelle l'AFNOR et les organisations de normalisation francophones à s'opposer à l'usage de la procédure accélérée dans l'examen d'une deuxième norme bureautique à l'ISO. », http://www.aful.org/presse/afnor-fasttrack-iso
Sources et liens :
  • La polémique lorsque Microsoft était accusé de bloquer l'adoption par l'ISO du format ODF, en avril 2006 : « "C'est mal connaître le fonctionnement de l'ISO", répond de son côté Bernard Ourghanlian, directeur technologique chez Microsoft France. "Au sein de l'ISO, seuls sont habilités à voter les Etats", explique-t-il à Vnunet.fr. Chaque pays est représenté par un organisme de certification local : l'Afnor pour la France » (article Microsoft vs Sun : la guerre des formats de documents se déplace à l'ISO, de Christophe Lagane, le 7 avril 2006, vnunet, http://www.vnunet.fr/fr/vnunet/news/2006/04/07/microsoft-vs-sun-formats-documents-deplace-liso)
  • Site du JTC 1/SC 34 - Document Description and Processing Languages, en anglais, http://www.jtc1sc34.org/
Et sur Formats-Ouverts.org :

«La langue ne ment pas»

Le format utilisé dans les langues : un documentaire télé sur un cas particulier

LTI : format abrégé. Lingua Tertii Imperii : format latin. La langue du Troisième Reich : format en français courant plus clair. Ces 3 désignations sont celles données par Victor Klemperer à propos de la langue allemande utilisée par les nazis entre 1933 et 1945. Durant cette période, Victor Klemperer [1], juif, professeur à l'université de Dresde, a relevé dans son journal les expressions qui ont été utilisées par le régime nazi pour désigner des actes que les auteurs ne souhaitaient pas vraiment dénommer clairement, dont la sinistre « solution finale ».

Un documentaire sur ce sujet, intitulé La langue ne ment pas [2], sera diffusé le mercredi 31 janvier 2007 à 20h40 sur Arte (rediffusion le samedi 3 février à 8h45 ; précédente diffusion le lundi 15 novembre 2004). Comme l'indique le résumé de la fiche descriptive d'Arte [3] :

L'imprégnation de l'idéologie nazie dans la langue allemande à travers le journal du linguiste juif Victor Klemperer. Une chronique de la violence quotidienne et un point de vue sur un aspect particulier de l'oppression nazie.

C'est ici un cas extrême d'une langue qui utilise des termes connus mais dont l'assemblage devient mystérieux et désigne des réalités terribles mais cachées : les régimes totalitaires se sont distingués dans ces pratiques. De manière moins dramatique, les formulations particulières, les jargons et autres expressions à la mode désignent souvent en termes spéciaux des choses pourtant simples. Cependant, des langues de la communication à la langue diplomatique, en passant par la langue courante, le format est plus ou moins clair et connu (donc plus ou moins ouvert) : il faut décrypter et décoder.

Sources et liens :
Et sur Formats-Ouverts.org :

Conférence record à Lille : une série de points

Avant la conférence du 1er février, voici celle du 11 janvier

Voilà le deuxième record : je ne veux pas parler des statistiques mensuelles de Formats-Ouverts.org, mais de la durée d'une conférence. En effet, les presque 3h30 d'intervention à Ouagadougou le 26 septembre 2005 (un lundi) sont désormais talonnées par les presque 3h de cours à Lille.

Ainsi, le 11 janvier 2007 (un jeudi), je suis intervenu toute l'après-midi à l'IUT A de l'université Lille I [1] devant des étudiants de licence professionnelle Systèmes Informatiques et Logiciels, option DA2I (Développement et Administration de sites Internet et Intranet) [2].

Le format de ma présentation était « tableau-feutre », sans diaporama avec liste à puces mais en écrivant comme les étudiants et en construisant ainsi l'intervention.

Voici donc ci-dessous les points dont il a été question, avec des liens vers des articles qui les développent :

Lire la suite

Les formats touchent les lecteurs du Monde

Microsoft, Wikipédia, Le Monde et les formats ouverts

C'est la guerre des formats ! Cette expression achetable mais non-déposée est une lapalissade et un leitmotiv sur Formats-Ouvert.org, car les formats sont la clé capitale qui se retouvent partout.

Or depuis quelques jours, l'information à propos de Microsoft qui a fait une proposition de recrutement pour contribuer à Wikipédia fait un peu la une du petit monde de l'informatique.

Mais de quoi s'agit-il ? Reprenons dans l'ordre les différents points : Wikipédia est une encyclopédie en ligne, libre et ouverte [1] ; elle existe en plusieurs langues ; tout internaute peut y contribuer ; il y a des articles sur énormément de sujets, même si beaucoup aussi n'existent pas encore ou sont à compléter ; il y a par exemple des articles qui traitent de chimie, de photographie, de la bataille de la crête de Vimy ou d'informatique [2].

Parmi les formats informatiques, 2 occupent un peu plus le devant de la scène : ODF (OpenDocument Format) et MS OOXML (Microsoft Office OpenXML). Ils s'affrontent sur le marché de la bureautique. La manière dont ils sont présentés dans les articles de l'encyclopédie Wikipédia est donc importante. Microsoft a contacté un spécialiste australien des formats, Rick Jelliffe, en lui proposant de contribuer à Wikipédia à propos des 2 formats, contre rémunération.

Cela est repris par de nombreux articles spécialisés [3]. Mais là n'est pas forcément le plus important. Car l'information déborde le cercle du secteur informatique et se trouve dans des journaux généralistes. Ainsi le journal Le Monde daté du 25 janvier traite du sujet en titrant Microsoft joue avec l'indépendance de Wikipédia (format un peu accrocheur). On lit surtout à la fin du deuxième paragraphe à propos des formats ODF et OOXML :

Ces deux formats de fichiers sont directement concurrents, l'un étant un format ouvert, l'autre développé par Microsoft. L'entreprise de Bill Gates estime que les définitions consultables sur l'encyclopédie libre sont erronées.

On pourrait dire que Office OpenXML, nom judicieusement choisi, est aussi considéré par Microsoft comme ouvert. C'est un problème de définition.

Et alors ? C'est bien la guerre à propos des formats, dont ODF-OOXML est une bataille. Et dans ce cas on en parle, qui plus est donc dans un journal comme Le Monde. Mais encore ? Si des personnes payées par une entreprise posent problème dans la charte de Wikipédia, la parade existe : des personnes sur leur temps libre (ce qui est le cas avec les bénévoles contibuteurs du projet), ou encore des personnes à la retraite (les seniors comme on dit dans un autre format) qui sont prêtes à contribuer.

En tout cas, la concurrence ODF-OOXML et le sujet des formats ouverts sont désormais potentiellement un peu plus connus que des seuls milieux informatiques. Pour ce qui est de se retrouver dans l'ensemble de la presse généraliste, en première page, dans le journal télé de 20h ou sur les ondes radio de 7h-8h, ce n'est pas (encore ?) le cas : il faut trouver et avoir le bon format (cela a été le cas à propos de l'interopérabilité avec l'exemple des baladeurs aux fichiers inutilisables selon l'achat effectué).

Sources et liens :
Et sur Formats-Ouverts.org :

Les RG, leurs fiches : et les formats ?

Des fiches, mais à quel format ?

Les Renseignements Généraux et leurs fiches : voilà un sujet mis en avant dans l'actualité de cette fin janvier 2007. Bien sûr, ce qui vient immédiatement à l'esprit pour Formats-Ouverts.org est la question ELF : Et Les Formats ? En effet, à quels formats sont ces fiches avec leurs informations :

  • est-ce au format papier, avec par exemple des notes manuscrites sur support Bristol dans un dossier cartonné ? (interopérabilité assurée) ;
  • est-ce au format numérique et alors dans quel format : ouvert, par exemple en ODF, comme utilisé par la Gendarmerie nationale ; ou fermé comme avec tous les logiciels qui sont les seuls à savoir utiliser les fichiers qu'ils produisent ?

Cela peut aussi être sur papier mais après une impression, donc au départ en numérique. On peut aussi se demander pour le format numérique si elles sont cryptées. En tout cas, on peut penser qu'elles sont mieux protégées que les données nominatives de 2 sites de partis politiques qui se sont illustrés récemment [1]. Pour la conservation et l'archivage de données sensibles comme celles sur les déchets radioactifs, c'est le papier qui a été retenu (certes pour une conservation de 300 ans).

Enfin, de manière humoristique, on peut trouver que le nom de Renseignements Généraux (ou Direction centrale des renseignements généraux, son nom exact [2]) est un peu inapproprié, car ils fournissent plutôt des Renseignements Particuliers. Pour ce qui est de l'homophonie avec Hergé, dont on fête le 100e anniversaire de la naissance en cette année 2007 [3], ce n'est valable qu'avec le format abrégé, RG.

Sources et liens :
Et sur Formats-Ouverts.org :

Bibliothèque numérique européenne : France Télécom avec la BnF

Signature d'un protocole d'accord

« France Télécom et la Bibliothèque nationale de France annoncent la signature d’un protocole d’accord pour le développement d’un partenariat stratégique » : tel est l'intitulé du communiqué de presse publié le 25 janvier [1].

L'information était en partie indiquée dans la dernière des 16 questions (et réponses) publiées sur le site de la BnF (Bibliothèque nationale de France) [2]:

Dans le domaine technologique, le projet de Bibliothèque numérique européenne fera-t-il appel à des partenariats avec des entreprises privées ?

Compte tenu du caractère à la fois ambitieux et novateur du projet de BnuE, la BnF a été sollicitée par plusieurs entreprises, désireuses d’apporter leur contribution. Les premières discussions ont abouti le 9 janvier 2007 à la signature d’un protocole d’accord avec France Télécom.

C'est donc chose faite le 9 et annoncée le 25. Après ces faits, quelques remarques :

  • « la BnF a été sollicitée par plusieurs entreprises » : qui d'autres outre France Télécom ? Ces sollicitations ne sont bien sûr pas publiques : cela est assez compréhensible. En terme d'image, la Bibliothèque numérique européenne (BnuE) est aussi très porteur et positif (un bon format !). On peut donc penser que d'autres annonces seront faites avec d'autres sociétés.
  • La question se pose à propos des formats : les partenaires du projet de la BnuE auront-ils une influence sur les formats utilisés ? Si oui et en faveur de plus de formats ouverts, très bien. Si oui mais pour des formats fermés, ce serait bien dommage par rapport à l'image et à la portée du projet de la BnuE.
  • Et pour France Télécom et la BnF, qu'en est-il à propos des formats ? France Télécom apporte « sa compétence technologique en matière d'organisation des documents, de recherche d'information et d'accès aux résultats, ou des techniques de traitement des langues naturelles appliquées au texte ». A priori on aurait plutôt penser aux télécommunications. Souhaitons que pour organiser et rechercher les informations, les formats ouverts des métadonnées (notamment avec TEI ou Dublin Core) ou des documents eux-mêmes seront utilisés. Avec le souci d'interopérabilité.

L'accord comporte aussi un volet lié à l'accès depuis les téléphones mobiles : là aussi des formats ouverts pour la version pour portables des informations ? Il faut le souhaiter. Donc un dossier à suivre, comme depuis janvier 2005.

Sources et liens :
Et sur Formats-Ouverts.org :

La baladodiffusion, le séminaire et la visite : oui, mais à quels formats ?

Quels formats audio utiliser ?

La Semaine du son 2007 est à peine terminée depuis le 20 janvier que l'audio était encore à l'honneur avec un séminaire éducation nationale... qui renvoyait aux visites de Versailles... avec les formats en arrière plan.

Séminaire : « La baladodiffusion de contenus de cours dans l'enseignement supérieur »

Ce séminaire était organisé par la SDTICE (la Sous-Direction des Technologies de l'Information et de la Communication pour l'Education) [1] du Ministère de l'éducation nationale, les 22, 23 et 24 janvier 2007 à Paris.

Ce séminaire réunit environ soixante dix participants, représentants des Universités Numériques Thématiques, des Universités Numériques Régionales et des établissements d’enseignement supérieur ayant un dispositif de diffusion opérationnel via des outils numériques nomades ou prévoyant d’en créer un très prochainement. Mais il s'adresse également aux néophytes qui désirent s'initier à la diffusion pour baladeur et aux enseignants du secondaire à la recherche de pistes pour enrichir leurs méthodes d'enseignement.

Podcaster, baladodiffuser et multiplier les contenus audio est très bien. Et voici la question ELF : Et Les Formats ? En effet quel format pour ces fichiers :

  • fermés et propres uniquement à un (ou des) appareils ? Il faut alors l'appareil pouvant seul lire le fichier numérique : sans lui, travail inexploitable...
  • ouverts ? Les contenus sont alors largement utilisables sans contrainte de matériel particulier.

Donc quelle interopérabilité, sans oublier le sujet de l'archivage de ces documents numériques pour réutilisation ou pour conservation.

La visite de Versailles : quel format audio pour quel audioguide numérique ?

Il est possible d'effectuer la visite du Petit Trianon du château de Versailles [2] avec un baladeur audio : on se promène et on a des explications dans les oreilles. Comme le dit la formule utilisée sur le site :

Le podcast de la Reine, sur le Roi des audioguides numériques. [3]

Mais quel est donc ce « Roi » ? Il s'agit de l'iPod : en effet, la visite en question se fait avec le baladeur d'Apple [4]. Et 2 choses sont fournies : le commentaire audio de la visite et l'Ipod pour l'écouter, car les 2 vont ensemble. Plus précisément, les 2 sont même inspéparables : en effet, le fichier un fichier audio d'Apple (format AAC) n'est a priori lisible qu'avec le baladeur d'Apple. Un format fermé et un appareil pour l'utiliser (et aussi un site pour acheter les contenus).

Si le projet de « Grand Versailles Numérique » [5] décide de changer de baladeur, il faudra avoir des fichiers à des formats autres que celui de l'iPod. Cela est peut-être possible par une simple transformation. Mais le format utilisé n'est pas ouvert. Avec toujours les mêmes sujets d'indépendance, de réutilisation et d'archivage.

Sources et liens :
Et sur Formats-Ouverts.org :

Premier Forum européen de l'accessibilité numérique

Les services en ligne accessibles, pour le bénéfice de tous

Commençons par une mauvaise nouvelle : les pages de la manifestation indiquent que les inscriptions (3 catégories de tarif) sont closes. Mais il est important de s'y pencher.

Il s'agit de donc du « Premier Forum européen de l'accessibilité numérique - Les services en ligne accessibles, pour le bénéfice de tous ». Il se déroulera à la Cité des sciences et de l'industrie, à Paris, le 29 janvier 2007, de 9h00 à 18h00 [1].

La manifestation est placée sous le « Haut Patronage de Monsieur Jacques CHIRAC Président de la République » et sous le « Patronage de Monsieur Philippe BAS Ministre délégué à la Sécurité sociale, aux Personnes âgées, aux Personnes handicapées et à la Famille ».

Elle est organisée par l'association Braillenet [2], la Cité des Sciences et de l'Industrie [3] et EDeAN (European Design for All e-Accessibility Network) France [4]. Elle donnera lieu à « des présentations de produits et services existants et analysant la place de l’accessibilité du Web dans un Web en pleine mutation (Web mobile, Web 2.0, Web 3.0, …). »

Il y a 8 partenaires (HiSoftware, Alcatel-Lucent, Groupama, Microsoft, Adobe, EUAIN, l'INSERM et l'Université Pierre et Marie Curie), ainsi qu'un sponsor (Humanware) [5].

Enfin le programme de la journée [6], découpée en 8 périodes, indique des interventions de responsables de sociétés, de structures comme la Commission européenne, d'associations et du W3C.

Cette journée, après celle des Nations Unies en décembre 2006, devrait donc souligner :

  • le besoin d'accessibilité dans la société de l'information ;
  • l'importance des différents standards ouverts dans ce domaine de l'accessibilité numérique.

Peut-être y aura-t-il aussi des informations à propos des décrets d'application de la loi sur l'égalité des chances de février 2005, exigeant que les sites Web publics soient conformes aux normes ouvertes d'accessibilté (une des prévisions positives de 2007).

Sources et liens :
Et sur Formats-Ouverts.org :

2 ans après « l'appel solennel » de Jean-Noël Jeanneney

La Bibliothèque numérique européenne (BnuE), 2 ans après le 22 janvier 2005

« Pour l'instant, la nouvelle n'a guère attiré l'attention que des bibliothécaires et des informaticiens. »

Ainsi commençait l'article Quand Google défie l'Europe publié dans le journal Le Monde daté du 22 janvier 2005 et signé Jean-Noël Jeanneney, président de la Bibliothèque nationale de France (BnF).

Ainsi commençait aussi l'article L'heure est donc à un appel solennel de Formats-Ouverts.org sur le sujet des formats utilisés dans cet appel qui allait devenir le projet de Bibliothèque numérique européenne (Bne puis BnuE).

C'était donc il y a 2 ans. Les articles de la rubrique Bibliothèques numériques et le dossier de synthèse permettent de se donner une idée de l'avancement depuis cette date, et les 2 derniers éléments publiés ici concernent la 11e bibliothèque partenaire de Google début 2007 et la BnF qui faisait le point sur le BNuE début décembre 2006.

Voici une série d'informations, dont celles annoncées le 7 décembre 2006, à partir des pages de la BnF [1] et d'articles spécialisés du monde des bibliothèques [2], à propos de la Bibliothèque numérique européenne... et des formats :

  • le nom : Europeana (un nom au format plutôt gréco-latin qu'anglo-saxon) ;
  • la maquette : elle a été présentée le 7 décembre 2006 par Catherine Lupovici de la BnF [3]. A priori des fonctionnalités de type Web 2.0 sont utilisées : espérons que cela sera sans navigateur dédié, mais en utilisant les standarsd ouverts du Web... et sans trop de Flash pour permettre l'indexation et assurer l'accessibilité.
  • le recrutement : « la BnF recrute » avec 8 fiches de postes publiées sur une page de son site [4] ; la mention de formats (ou standards) ouverts n'y fygure pas (mais il y a des formats ouverts cités) ;
  • le comité de pilotage : depuis le quatrième en janvier 2006 et la remise de son livre blanc [5], aucun ne s'est tenu (à ma connaissance), mais le projet n'en nécessite peut-être plus de ce type ;
  • le 9 janvier 2007, signature d'un protocole d'accord avec France Télécom ;
  • « océrisation » : c'est la technique consistant à passer du mode image d'une page au mode texte (notamment pour y faire des recherches) en utilisant un scanner et un logiciel de type OCR (Reconnaissance Optique de Caractère) [6]. Le format image semble être du TIFF ; quant au format texte, il devrait être du texte brut une fois le document océrisé, puis mis en page dans du HTML par exemple. (La numérisation [...] renvoie à des questions de politique documentaire, de droits, de standards techniques » [7]).

Le lancement public est annoncé pour le Salon du Livre de Paris, du 23 au 27 mars 2007 [8]. On verra encore plus ce qu'il en est des formats ouverts et de l'interopérabilité.

Sources et liens :
  • [5] Résumé du Livre blanc du Comité de pilotage pour une Bibliothèque numérique européenne, de Valérie Tesnière, Directrice du département de la coopération de la BnF, Secrétaire générale adjointe du Comité de pilotage, 17 pages, format PDF, http://www.bnf.fr/pages/dernmin/pdf/bnue.pdf
Et sur Formats-Ouverts.org :

Bibliothèque numérique Google : une université de plus

Avec le Texas, le total général est de 11

Le 19 janvier 2007, l'université du Texas à Austin a annoncé [1] rejoindre le projet de blibliothèque numérique de Google, Google Books Library Project [2].

Après les 4 bibliothèques en 2006, c'est la première nouvelle structure pour 2007, qui porte le total des partenaires à 11, dont 9 universités, avec la bibliothèque [3] :

  • de l'université du Texas à Austin (2007);
  • de l'université de Californie (août 2006) ;
  • de l'université de Complutense à Madrid (septembre 2006) ;
  • de l'université du Wisconsin à Madison (octobre 2006) ;
  • de l'université de Virginie (novembre 2006) ;
  • nationale de Catalogne ;
  • de l'université de Harvard (décembre 2004) ;
  • de l'université du Michigan (décembre 2004) ;
  • publique de New York (décembre 2004) ;
  • de l'université de d'Oxford (décembre 2004) ;
  • de l'université de Stanford (décembre 2004) ;

La question des formats (ouverts ou fermés) est très présente dans ce dossier : formats des fichiers de données, formats des licences juridiques utilisées et formats techniques des logiciels employés. Avec aussi l'interopérabilité et l'archivage numérique.

Sources et liens :
Et sur Formats-Ouverts.org :

La semaine du son et les formats

Les formats et les sons

Du 16 au 20 janvier 2007 se déroulait la quatrième édition de La semaine du son [1]. Déjà en 2006, elle figurait dans mes notules au format papier, mais hélas sans avoir pu la traiter : s'y trouvaient Pierre Schaeffer pour son Guide des objets sonores [2] et R. Murray Schafer pour son Le Paysage Sonore et son approche de « paysage sonore » (soundscape en anglais) [3].

L'éditorial du site de La semaine du son rappelle l'importance du son (gras ajouté) :

Nous vivons dans une société de l'image, dit-on. C'est oublier que celle-ci est rarement muette. Que retiendrait-on d'une émission télévisée privée de son ? D'un film sans musique ni dialogue ? De la ville sans ses clameurs, ses mille bruits et musiques qui caractérisent ses quartiers ? C'est oublier aussi que les moyens de reproduction sonore n'ont jamais été aussi divers, répandus et accessibles à tous. MP3, radios, technologie 5.1 jusque dans les voitures : grâce aux progrès technologiques, le son s'invite partout et à toute heure. Pourtant, il reste le parent pauvre de tous les budgets et son étude reste réservée aux seuls spécialistes.

Derrière les sons, il y a bien des formats et des technologies, comme le MP3, le Dolby 5.1 et bien d'autres. D'ailleurs des conférences traitaient de ce sujet des formats :

  • Avantages et inconvénients du MP3 avec cette citation : « Le format MP3, qui est loin d’être le meilleur techniquement, s’est imposé face à l’AAC, au WMA ou à l’Ogg Vorbis. »
  • Du son en mono au 5.1 : évolution du son à la télévision, avec « Satellite, câble, hertzien, portable, ADSL, TNT : Quelle différence entre les formats de diffusion ? » [4]

Problèmes de formats (ouverts ou fermés), d'interopérabilité : le monde du son est aussi un monde de technique où il y a donc des formats.

Sources et liens :
Et sur Formats-Ouverts.org :

Attention : un autolien autorisé mais un texte interdit ?

Pendant les congés, la parution de textes au JO ne s'arrête pas...

Du 23 décembre 2006 au 1er janvier 2007 : voilà 10 jours où les gens pensent à autres choses... le tunnel de fin d'année. Et pendant ce temps... des informations paraissent, un peu éclipsées par les fêtes de fin d'année.

Alors que s'est-il passé ? Du côté des industriels, ce fut le calme et la trêve des annonces. En revanche, pour ce qui est des publications de textes au Journal Officiel, cela ne fut pas négligeable.

Il y a des textes qui doivent être absolument publiés pour des raisons de calendrier (avant la fin de l'année civile). Et puis il y en a d'autres... dont le décret n° 2006-1763 du 23 décembre 2006 relatif à la répression pénale de certaines atteintes portées au droit d'auteur et aux droits voisins, du Ministère de la culture et de la communication, NOR: MCCA0600979D, publié dans le J.O n° 302 du 30 décembre 2006, page 20161 [1].

Et alors ? Le texte indique entre autres :

Est puni de l'amende prévue pour les contraventions de la quatrième classe le fait :

« 1° De détenir en vue d'un usage personnel ou d'utiliser une application technologique, un dispositif ou un composant conçus ou spécialement adaptés pour porter atteinte à une mesure technique efficace mentionnée à l'article L. 331-5 du présent code qui protège une œuvre, une interprétation, un phonogramme, un vidéogramme, un programme ou une base de données ;

« 2° De recourir à un service conçu ou spécialement adapté pour porter l'atteinte visée à l'alinéa précédent.

« Ces dispositions ne s'appliquent pas aux actes qui ne portent pas préjudice aux titulaires de droits et qui sont réalisés à des fins de sécurité informatique ou à des fins de recherche scientifique en crytographie.

Voilà donc le doute et l'incertitude juridique qui s'installent : suis-je coupable ou alors puis-je souffler car je ne porte pas atteinte aux titulaires de droits ?

Coupable à quel titre ? Car j'ai écrit fin avril 2006 que j'ai utilisé un système pour lire le format fermé de mon seul et unique coffret de DVD qui m'a été offert (acte légal avec achat prélable ; il s'agit de 24 heures chrono, saison 1). Le motif : je n'utilise pas de Mac OS X ni de Windows, mais Ubuntu Linux. Problème de format non-ouvert et d'interopérabilité.

Les vrais liens hypertextes sont autorisés et même encouragés sur Formats-Ouverts.org (comme cela devrait être le cas) : il y a donc ci-dessus un lien vers le texte en question. Mais le texte est-il désormais autorisé ?

Pour être sûr de ne pas avoir de problème pour lire des DVD, il n'y a qu'une seule solution certaine : ne pas avoir de DVD. Donc ne pas s'en faire prêter (« Désolé, ami(e), je ne peux lire ton DVD préféré que tu me vantes et veux me confier ») ni en louer, ni en acheter (« Désolé, caissier(ère), je ne peux acheter légalement, même si je le peux financièrement »). Et hors de question de télécharger ces contenus (d'ailleurs en RTC depuis presque 11 ans, c'est très difficile).

Mais cela veut dire non-consommation, non-achat, perte de chiffre d'affaires et manque à gagner pour la filière concernée ? Oui. Et je l'écris avec une interrogation : et si jamais il y avait un délit de refus d'achat ?... Recoupable !...

Sources et liens :
  • [1] Décret n° 2006-1763 du 23 décembre 2006 relatif à la répression pénale de certaines atteintes portées au droit d'auteur et aux droits voisins, du Ministère de la culture et de la communication
Et sur Formats-Ouverts.org :

«Flash est un obstacle à l'acceptation des standards du Web»

Le Web, Flash et les standards ouverts selon HWL

Håkon Wium Lie est un pionnier et expert d'Internet. Il a travaillé au W3C et dirige actuellement la société Opera qui propose le navigateur du même nom [1]. Il avait répondu en février 2005 à Bill Gates à propos d'interopérabilité.

Il a donné une interview le 8 janvier 2007 : il y parle des formats ouverts du Web (HTML comme CSS), d'interopérabilité, des 10 ans des CSS et de Flash.

Pour ce qui est du format Flash, la question posée est : Voyez-vous en Flash un obstacle pour l'acceptation des standards du Web ? Réponse : « Oui ».

Flash est le format propriétaire le plus populaire sur le Web aujourd'hui, et certaines personnes le préfèrent aux standards ouverts.

Les 2 usages du Flash :

en tant que format de graphisme vectoriel pour créer des applications. Pour cet usage, SVG et l'élément canvas pourront le remplacer dans de nombreux cas.

comme format vidéo et audio. A l'heure actuelle, il n'y a pas d'alternative ouverte. Je pense qu'il nous faut définir des balises video et audio pour le monde libre.

Conclusion : « Si Adobe venait à ouvrir la spécification de Flash, comme ils l'ont fait pour PDF, la situation pourrait être différente. ».

Rappel : en Flash, les sites n'existent pas (entre autres aux yeux des moteurs de recherche pour des requêtes fines), comme ce fut le cas de Ten Mobile et comme c'est le cas du Festival de photo d'Arles.

Sources et liens :
Et sur Formats-Ouverts.org :

Voici la nouvelle version d'un important standard ouvert

La version 1.1 de XSL-FO est publiée

Le W3C a publié un communiqué de presse le 12 décembre 2006, intitulé « Le W3C publie une nouvelle version de la spécification de mise en page XSL-FO» [1]. Il s'agit de la recommandation Extensible Stylesheet Language (XSL) Version 1.1, en date du 5 décembre 2006 [2], qui est un standard ouvert de formatage XML, pour l’impression et l’affichage de documents XML. « Cette nouvelle recommandation XSL-FO 1.1 accroît l’interopérabilité et ajoute des extensions qui n’étaient jusqu’alors disponibles que sous une forme propriétaire. ».

Vous n'avez pas (voire rien) compris ? Alors voici dans un format plus clair

Le World Wide Web Consortium (W3C), créé en octobre 1994, est la structure en charge de l'élaboration de nombreux standards ouverts : dans son vocabulaire, ses standards ouverts sont dénommés des recommandations. Une partie d'Internet repose sur les standards ouverts du W3C, dont le plus connu et le plus vu est le HTML des pages Web. Ces standards ouverts permettent l'interopérabilité

Le XML est un type de formats, que le W3C a défini en février 1998. Le XML, qui ne signifie pas forcément ouvert, peut être très puissant, notamment car il sépare le contenu (par exemple ici le texte) et la mise en forme (par exemple ici les gras, les italiques, les tailles de caractères,...).

Pour la mise en forme (on dit le formatage) des documents en vue de l'impression ou de l'écran, il faut transformer le fichier de la famille XML de départ dans le format souhaité. C'est ce que fait XSL-FO (et XSL et XSLT).

Finalement, grâce aux formats ouverts de type XML, à XSL, à XSLT et à XSL-FO, on a des formats ouverts tout au long de la chaîne de production : du départ à l'arrivée et pour passer de l'un à l'autre.

Sources et liens :
Sur Formats-Ouverts.org :

La Défense : défense (et illustrations) des formats (et protocoles) ouverts

Conférence à La Défense le 1/02/007

Le salon Solutions Linux 2007 se déroulera les 30, 31 janvier et 1er février [1]. En plus des stands des professionnels, il y a des stands des associations du logiciel libre. En plus des conférences dans les salles spéciales du CNIT, il y a des conférences sur l'espace des associations.

Dans ce dernier cadre, le jeudi 1er février 2007 après-midi, j'interviendrai pour le 3e fois depuis 2005, lors d'une conférence à propos... des formats ! Il y sera question des formats ouverts (ou pas), mais aussi des protocoles, des standards et de l'interopérabilité, à partir de l'actualité récente (ou pas), avec des exemples pour souligner et expliquer le rôle capital des formats :

Il y a des formats partout, cela concerne tout, y compris vous. Théories et pratiques du bon choix des formats.

En 2006, la conférence du 1er février (mais un mercredi) était intitulée Gare aux formats ! Ils sont partout... et verrouillent tout (ou pas). Quant à 2005, il y avait eu 2 conférences, l'une à l'espace des associations et l'autre au sein du programme de l'ADAE.

Donc rendez-vous le 1er février à 14h au CNIT à La Défense [3] (on utilise aussi la formulation Paris La Défense, même si ce n'est pas sur le territoire de la commune de Paris). Entrée libre, gratuite et ouverte à toutes et à tous.

Sources et liens :
Et sur Formats-Ouverts.org :

Attention aux métadonnées parfois bavardes...

Les métadonnées : un exemple de plus de petite mésaventure

Les métadonnées sont les données sur les données, les informations sur les informations. Exemples : l'auteur d'un fichier, la date de création d'un document, les mots clé d'une page Web,...

Ces métadonnées peuvent exister :

  • à des formats fermés propres uniquement aux logiciels qui ont servi à créer les documents, pas d'interopérabilité ;
  • à des formats ouverts comme Dublin Core et elles sont capitales.

Parfois, ces métadonnées sont « bavardes » et donnent des informations qui n'étaient pas forcément prévues... Il y eut ainsi Microsoft qui utilise Apple pour Windows et son bis.

Dernier exemple en date : le fichier réalisé avec le traitement de texte Word et au format Word (sans format héxadécimal), du discours de Nicolas Sarkozy prononcé le 14 janvier 2007 en tant que candidat de l'UMP. Les métadonnées du document sont originales, et les détails, captures d'écran à l'appui, sont développés dans l'article Sarko: Un discours de l'intérieur [1] de l'excellent site Technologies du langage [2] de Jean Véronis.

Une chose est sure : ce n'est ni le premier ni le dernier exemple dans le domaine politique qui illustrera le sujet des formats et des métadonnées. Cela pourrait même être encore plus fréquent à l'approche des échéances électorales de 2007 en avril/mai et en juin.

Sources et liens :
Et sur Formats-Ouverts.org :

La fin d'une Epok

Ou comment le format papier peut laminer le format numérique

Vendredi 5 janvier 2007 : habituellement, comme chaque vendredi, la FNAC propose dans ses magasins le nouveau numéro de Epok, « Le magazine de la FNAC. Gratuit. ».

Proposait, car c'est fini, Epok n'existe plus. Certes, il était gratuit, donc financé par la publicité et par les investissements de la FNAC [1]. Et il pouvait coûter trop cher. Outre les livres ou les spectacles, une partie du contenu d'Epok traitait de jeux video, de musique ou d'informatique, donc du numérique (qui se dit digital en anglais, mais qui ne se traduit pas par digitale en français, même si la FNAC Digitale a pris ce nom : on n'y traite pas d'empreintes ni d'une plante [2]).

Donc Epok a disparu. Existe-t-il en ligne ? Non [3]. Vous en avez fait des numérisations ? Et alors, cela n'a aucune valeur ! En effet, la valeur des numéros publiés réside dans leur format d'origine : donc au format papier, qui assure dans ce cas le maximum d'interopérabilité. Car le format numérique n'est pas rare : le copier/coller est intrinsèque au numérique et abolit la rareté.

La collection complète et en bon état des Epok est donc maintenant rare et pourrait être convoitée sur les salons des livres anciens et des vieux papiers ou magazines.

Articles de Formats-Ouverts.org avec Epok comme point de départ à propos des formats ouverts (ou fermés)
Sources et liens :
Et sur Formats-Ouverts.org :

Ce n'est peut-être pas le meilleur format pour le dire...

Quand les mots peuvent être à double sens...

Voici 5 petits exemples de formulations intéressantes (formulation et format ne sont pas très éloignés...) : elles ne sont peut-être pas au meilleur format pour dire les choses...

Lu sur le site d'Apple [1] et dans des magazines, le texte des publicités recommande de se tourner vers les « Apple Premium Reseller ». Reseller... en français ce mot anglais n'est pas forcément totalement connu, et peut-être aussi un peu trop proche d'un mot français que la loi condamne... Homophonie quand tu nous tiens !

Lu sur la couverture de l'extension The Burning Crusade du jeu de Blizzard World of Warcraft (WoW, format plus concis pour les intimes), qui sort mi-janvier [2] : en dessous de l'illustration, la dernière ligne de la jaquette indique qu'il y a « d'autres restrictions » à consulter aux dos. Restrictions... cela est honnête de le dire, mais cela est aussi peu incitatif à l'achat : généralement, dans leur habile utilisation du vocabulaire, les textes des produits parlent des « conditions d'utilisation » ou de « configuration minimum ».

Lu dans un article : le site Winamax [3]. Il s'agit d'un logiciel dénommé Amax en version Windows ? Non, perdu ! C'est un site de poker qui était signalé comme un de ceux lié au phénomène d'engouement pour ce jeu de cartes.

Vu à la télévision en fin d'année et aussi sur des affichettes en pharmacie : une campagne de publicité qui parle de « jours de retard » et d'un médicament pour remédier à ce problème. C'est à propos... de constipation (puisqu'il faut l'appeler par son nom), mot qui était habituellement utilisé auparavant dans les publicités : ne serait-il plus au bon format pour être ainsi remplacé ? En tout cas, rien à voir avec des tests de grossesse.

Lu sur des dépliants, des étiquettes et des affiches : les ordinateurs actuellemnt en vente peuvent être Microsoft Windows « Vista capable » [4]. Capable... Cela peut sembler limité et on aurait pu s'attendre à lire plutôt « Vista Interoperable » (sans é, en version anglaise), au vu de l'importance marketing accordée à l'interopérabilité.

Sources et liens :
Et sur Formats-Ouverts.org :

Fin du format ISBN 10, voici l'ISBN 13

ISBN 13 : année 0

Le 5 décembre 2004, un article de Formats-Ouverts.org traitait déjà de l'information : Le format des numéros des livres va changer (Le code ISBN va évoluer). Plus de 2 ans après et 850 articles plus loin, c'est désormais une réalité.

En effet, depuis le 1er janvier 2007, le code ISBN (International Standard Book Number) [1] utilise 13 chiffres au lieu de 10 auparavant : changement donc de format.

Mais le format de l'IBSN 10 ou 13 est ouvert : on sait comment il est établi, et chacun peut l'utiliser (du moins chaque ouvrage qui nécessite un ISBN).

Et pour les logiciels ? Le codage passant à 13 chiffres, les applications utilisant les ISBN doivent être (ou normalement, ont été) mises à jour, dans les bibliothèques, les centres de documentations et d'informations et les autres nombreuses structures concernées.

Une série de questions se pose alors : comment faire pour mettre à jour le logiciel fermé utilisé,

  • si l'éditeur du logiciel en a arrêté le développement ?
  • s'il a abandonné le logiciel et l'a retiré de son catalogue ?
  • si l'éditeur a été racheté, a fusionné, a disparu, sombrant avec les informations sur le fonctionnement du logiciel ?

Et les données, informations encore plus importantes, sont-elles dans un format connu voire ouvert pour être reprises par un autre logiciel ? L'interopérabilité est en jeu, comme la pérennité des données et donc l'archivage.

Des données dans des formats ouverts, des logiciels avec des formats ouverts et des licences d'utilisation ouvertes sont un trio permettant l'indépendance et la pérennité.

Sources et liens :
Et sur Formats-Ouverts.org :

Anniversaire du symbole de l'Euro (et de son format)

Le format du symbole Euro est ouvert, heureusement

Le 1er janvier 2007 (un lundi) était une date à relever pour la monnaie Euro : l'anniversaire des 5 ans. En effet, le 1er janvier 2002 (un mardi), l'Euro entrait en vigueur comme monnaie officielle : fin du Franc, du Deutsche Mark et d'autres monnaies. C'était donc il y a une demi-décennie (autre formulation possible : il y a 5 ans, ou il y a un lustre) [1].

Une nouvelle monnaie, cela signifie aussi un nouveau symbole, donc un nouveau caractère à ajouter à ceux des différentes polices... Il y a aussi le format des claviers qui doit changer : il faut avoir une touche spéciale (ou alors une combinaison de touches) pour obtenir le symbole, €.

Mais comment les typographes [2] peuvent-ils créer un symbole euro correct ? Tout simplement en utilisant « ses plans », c'est-à-dire les informations précises pour le tracé : elles sont connues, publiées, disponibles et utilisables, avec les angles, les proportions et autres données pour obtenir un symbole euro conforme à son tracé officiel. Les plans du symbole euro sont dans un format ouvert, ce qui permet de l'utiliser pour écrire correctement et communiquer largement.

Il peut tout de même y avoir un problème de format et donc d'interopérabilité: si le destinataire d'un document ne possède pas sur sa machine le symbole euro parmi les caractères disponibles, alors l'affichage de ce caractère inconnu sera remplacé par un autre, souvent sans aucun rapport et incongru. Plus généralement, ce problème technique se pose à propos de tous les caractères utilisés dans les documents et concerne le format des polices de caractères et de l'encodage utilisé.

Pour échanger et communiquer, il faut aussi penser aux polices utilisées, car si les destinataires ne les possèdent pas, problème...

Sources et liens :
Et sur Formats-Ouverts.org :

Normalisation en bibliothèques, en sciences de l'information et pour les archives

Le travail du TC 46 de l'ISO

TC 46 ISO : au sein de l'organisation internationnale ISO [1], c'est le Comité Technique 46, intitulé « Information et documentation ». Le TC 46 compte 35 pays participants, et son domaine de travaux concerne :

Normalisation des pratiques relatives aux bibliothèques, aux centres de documentation et d'informations, à l'édition, aux archives, au records management, à la documentation muséographique, aux services d'indexation et de résumés, et aux sciences de l'information. [2]

Dans ces pratiques, il y celles liées à l'utilisation de formats, protocoles, normes et standards, ouverts ou pas. Avec aussi le sujet de l'interopérabilité : ainsi le sous-comité 4 de ce TC 46 (soit le « TC 46/SC 4 ») est en charge de l'« Interopérabilité technique » [3] et des liens existent aussi avec des formats comme PDF/A.

Le TC 46 doit se réunir en Espagne du 7 au 10 mai 2007, à Santiago de Compostela. La direction de ce TC 46 touchant aux formats est constituée de 2 organismes français, représentés par 2 françaises : l'AFNOR [4] pour le Secrétariat avec Marie-Martine Guillabert, et la BnF [5] pour la Présidence, avec Catherine Dhérent (qui a notamment introduit en France le format EAD).

Sources et liens :
Et sur Formats-Ouverts.org :

Cet article daté du 10 janvier est le 1024e (petit clin d'œil... informatique...).

Les formats en 2007 : 12 prévisions (négatives)

Les prévisions négatives pour 2007

Après la version positive, voici les versions négatives des 12 prévisions des 12 mois de 2007 :

Archives : une partie des données numériques de l'administration est menacée ; la NASA indique avoir définitivement perdues les bandes originales d'Apollo 11.

Bibliothèque numérique européenne (BnuE) : un accord exclusif est passé entre la BnuE et un fournisseur dont les technologies, logiciels et formats utilisés sont fermés.

DVD Video Haute Définition (HD) : les DVD Video classiques sont retirés du marché par les éditeurs qui ne proposent plus que des HD-DVD ou des Blu-ray Disc pour lesquels l'achat de nouveaux matériel est obligatoire.

Décret accesssibilité : les experts impliqués travaillent sur le sujet mais l'année 2007 passe sans publication, comme si une malédiction...

Formats-Ouverts.org (FOo) : le site ferme (incompatibilité site/rédacteur suite à mariage du rédacteur ou à de nouvelles orientations bénévoles voire professionnelles ?).

Messagerie instantanée : impossible d'échanger avec un utilisateur du même logiciel de messagerie instantanée que le sien sans se signaler à l'Autorité de Régulation des Messageries Techniques (ARMT).

Musique numérique : les fichiers numériques deviennent tous chronodégradables, pour « permettre aux clients de s'acheter de la musique toujours d'excellente qualité ».

Référentiel Général d'Interopérabilité (RGI) : les experts impliqués travaillent sur le sujet mais l'année 2007 passe sans publication, comme si une malédiction...

Suite bureautique : le Massachussets abandonne le format ODF « suite à un accord historique » et « admet s'être égaré en envisageant un autre format que celui produit par le leader mondial du logiciel ».

Sites Web : le fait de mentionner l'interdiction de faire un lien est qualifié de « diffamation envers la propriété intellectuelle des créateurs de sites » lors d'un procès.

Union européenne : malgré sa condamnation dans le procès contre l'Europe, Microsoft remporte le marché pour équiper tout le système d'information des structures europénnes.

Utilisateurs et citoyens : comme avant, donc « cliquez, utilisez et vivez numérique », c'est tout et cela suffit, ne comprenez pas