Pour les formats ouverts !

Aller au contenu | Aller au menu | Aller à la recherche

Le site Formats-Ouverts.org, (FOo), traite des formats, protocoles et standards ouverts, dans différents domaines (comme l'interopérabilité, l'archivage), depuis le 1er juillet 2004 (plus de 1400 jours) - Les formats se rencontrent presque partout - Il y a actuellement 1582 articles en ligne, dont 14 pour le mois en cours et les notules - Les 1000 articles : le communiqué de presse (inédit et exclusif) - Les statistiques mensuelles du site - Attention : vote électronique - Les conférences - Les 3 ans et demi ! - Le 1500e article - Un index du site - Où en est le patrimoine numérique ? - Bientôt 4 ans, bientôt 1600 articles...


Notules express :


2008, les 10 ans de XMLXML10, les 10 ans de XML en 2008 RMLL, du 1er au 5 juillet 2008Du 1er au 5 juillet 2008, les neuvièmes Rencontres Mondiales du Logiciel Libre (RMLL), à Mont-de-Marsan


Les formats pour le n°100

GLMF numéro 100 et ses formats

Le magazine GNU/Linux Magazine France (GLMF au format abrégé, ou encore Linux Mag) [1] de décembre 2007 est paru : c'est le numéro 100. Pour ce numéro anniversaire, les formats sont là (comme pour les numéros 200 de SVM Mac et de Joystick).

La couverture montre un CD Rom avec l'indication « N°100 ». L'éditorial de Denis Bodor, rédacteur en chef, intitulé Et de 100 !, traite aussi du sujet, mais pas de page spéciale... au format papier, car elles sont elles sont bien présentes, nombreuses, mais au format numérique.

« Sur le CD plus de 550 articles de GNU/Linux Magazine », comme le titre la couverture. Et Les formats ? :

  • il s'agit du format PDF (version 1.4) pour les articles ;
  • ces PDF ont été générés par les outils TeX/LaTeX ;
  • et le CD Rom est au format ISO 9660 pour le système de fichiers [2].

Donc des formats ouverts qui au final permettent une interopérabilité maximale. Depuis le numéro 1 daté de septembre-décembre 1998, un beau chemin de parcouru et un beau encore à parcourir. Joyeux cent ! (le 100 au format décimal est aussi proposé dans 2 autres formats d'écriture dans l'éditorial en ligne : 0x64 et 1100100).

Sources et liens :
Et sur Formats-Ouverts.org :

2 publicités : «détails» et «gonflé»

Deux annonces publicitaires pour parler des formats...

De pleines pages de la presse papier proposent des publicités pour ordinateurs portables, dont les 2 suivantes sont intéressantes.

Pour Acer, l'intitulé de la page est « La performance s'exprime dans les détails ». Et en dessous des 2 photos d'ordinateurs, on voit le logo de... Microsoft Office, avec l'information que les matériels sont « Office Ready : Microdoft Office 2007 est préinstallé** ».

Les signes ** renvoient à un texte écrit très petit tout en bas de la page, qui indique « **Version démo de 60 jours ». Ah ces formats d'information, pour un logiciel qui n'est vraiment pas un détail de configuration et dont les formats de fichiers bureautique sont capitaux, et pas toujours aussi ouverts.

Pour Packard Bell (qui « recommande Windows Vista Edition Familiale Premium », en haut de page), avec Intel Centrino Core 2 Duo (en bas de page), l'écran noir du portable affiche (en milieu de page) un sobre : « Gonflé au Blu-Ray. »... avec des 10 seringues visibles, laissant couler un liquide bleu...

En période de lutte contre le dopage, voilà ce qu'on appelle un format décalé (c'est gonflé) au service du format de DVD haute définition Blu-Ray, concurrent du HD-DVD, sans oublier les 7 autres formats de DVD, qui ne sont pas ouverts.

Sources et liens :
Et sur Formats-Ouverts.org :

La Marine au format virtuel

Un recrutement et des informations réels dans un monde virtuel

Depuis le 22 novembre 2007 l'information est officielle : La Marine fait escale sur Second Life [1].

Que ce soit sur le stand de la Marine pendant le Salon de l'éducation (sur une feuille A5, format papier) ou en ligne sur les sites de la Marine nationale [2] et de recrutement [3] (format numérique), l'information est diffusée (et reprise sur de nombreux sites, y compris ici).

Pour utiliser un format de présentation un peu militaire, cela donne :

  • où : dans Second Life, sur un quai ;
  • quoi : escale d'une Frégate ;
  • quand : du jeudi 29 novembre 2007 à 19h, accostage, au mardi 4 décembre à 19h, appareillage ;
  • qui : des personnels virtuels (avatars) de la Marine nationale ;
  • pourquoi : recrutement et informations sur la Marine ;
  • particularités :
    • fidélité de la modélisation (personnages et bâtiment) ;
    • jamais aucune des 3 armes en France n'avait menée de campagne (de communication !) sur Second Life (ni y est présent) ;
    • la Marine nationale française est même l'une des premières Marines en Europe a y être ;
  • et pour les formats :
    • format numérique du monde virtuel de Second Life
    • date et heure sont au format français (et l'heure est celle de Paris, car 19h est totalement imprécis pour un militaire comme pour Second Life)
    • « Chez Linden Lab, nous avons toujours été de fervents défenseurs de l'utilisation des standards ouverts et des avantages d'utiliser des produits open source. » annonce l'éditeur du site Second Life [4].

Dans le monde réel, les curieux de la Marine pourront trouver devant l'Hôtel de la Marine à Paris, place de la Concorde, de très belles photos et des panneaux explicatifs grand format qui sont le long de la palissade du chantier de restauration du bâtiment (on y apprend par exemple que la seule corde sur un bateau est celle sous la cloche : sinon, il s'agit de bouts et de aussières).

Sources et liens :
Et sur Formats-Ouverts.org :

Une video qui montre du XML

Montrer les coulisses de l'information sur le Web et donc les formats

Questions : comment montrer l'information disponible et produite sur le Web ? Comment visualier les formats ouverts HTML ou XHTML (de la famille XML), ou encore les Tag (étiquettes) du Web 2.0 ? Comment expliquer la séparation du contenu et de mise en forme ou encore les fils RSS ?

Réponse (possible) : dans la video en ligne du professeur d'université Michael Wesch : The Machine is Us/ing Us. Cela dure 5 minutes (et 30 secondes) et c'est sur un rythme alerte : cela pique au minimum la curiosité, cela permet de visualiser voire de faire (presque) comprendre (et c'est aussi en anglais, dans le format fermé Flash).

Sources et liens :
Et sur Formats-Ouverts.org :

Les 200 couvertures de SVM Mac

De l'importance de l'archivage et encore plus des métadonnées

Dans la presse papier, après le n°3000 de Télérama en juillet, le mois de décembre est celui des deux cents, numéros à chiffre rond, un format symbolique (dans la numérotation décimale) :

  • n°200 pour Joystick [1], avec en couverture un texte parodiant le message « Erreur fatale Windows » et un supplément spécial, avec à son dos un dessin d'une Bellaminette de Bruno Bellamy [2] ;
  • n°200 pour SVM Mac [3], sans couverture spéciale, mais avec à l'intérieur un dossier spécial.

Dans ce dossier spécial, une double page, la 44 et 45, propose donc 10 rangées de 20 images soigneusement alignées depuis octobre 1988 : les 200 couvertures sous les yeux... une prouesse.

En effet :

  • soit les 200 exemplaires papier en bon état ont été sortis des archives et les couvertures ont été numérisées avec un scanner ;
  • soit les 200 images de couvertures étaient soigneusement conservées, sur un support (CD, DVD, disque dur) lisible et entretenu, avec un indispensable fichier de métadonnées qui indique le numéro et/ou la date pour les retrouver et les ranger.

Il y a aussi le cas où la couverture était réalisée avec un logiciel de PAO qui utilisait un format fermé qui a disparu (avec le logiciel ou avec la société éditrice) ou qui a changé de version (le logiciel existant encore)... L'archivage est alors perdu.

Sans les métadonnées, impossible de retrouver le sujet, la date ou l'auteur d'images (ou de musique ou de video). Des métadonnées dans des formats ouverts, (comme Dublin Core) au format texte et donc utilisables.

Sources et liens :


Et sur Formats-Ouverts.org :

« dans des formats universellement accessibles »

Déclaration de Barack Obama

Le sénateur des États Unis Barack Obama [1], candidat à l'investiture démocrate pour l'élection présidentielle de 2008, a visité les locaux de Google à Mountainview en Californie le 14 novembre 2007 (un point de passage obligé semble-t-il). Il y a prononcé un discours dans lequel il indique :

Je mettrai les données gouvernementales en ligne dans des formats universellement accessibles.

Toute la question étant de savoir ce que sont des formats « universellement accessibles » :

  • des formats répandus presque dans tout l'univers informatique, mais fermés ?
  • des formats ouverts ?

La seconde réponse est à privilégier, tant pour l'indépendance, l'accessibilité ou l'archivage. L'excellent site Standards Blog fait une analyse développée de l'information [2].

Sources et liens :
Et sur Formats-Ouverts.org :

Quel format prévaut ?

Seul le prononcé fait foi, mais l'écrit est aussi d'importance, et parfois il y a différence

Lors du salon Éduc@tice 2007 [1], le Ministre de l'éducation nationale a prononcé un discours le 21 novembre à propos des TIC dans l'éducation suite aux annonces de fin octobre. Son intervention est disponible en 2 formats :

  1. au format video (lui même au format fermé Windows Media Video, WMV) qui montre aussi l'intervention en langue des signes ;
  2. au format texte avec la page HTML, un format ouvert [2].

Pourtant, la question se pose de savoir quelle version retenir. En effet :

  • l'indication de début de page précise que « Seul le prononcé fait foi » ; mais l'écrit possède encore un caractère officiel important auquel on se fie, et qui est proposé par les sites Web ;
  • la version video comporte des passages que le texte ne propose pas, sans doute suite à un développement à l'oral par rapport à la version écrite initiale ; ainsi l'intervention du Ministre en video indique :
    • que la ville de Périgueux dont le Ministre est maire va équiper des écoles de tableaux numériques ;
    • qu'il y a débat entre faut-il « débrancher l'école » ou pas et un juste milieu à trouver ;
    • qu'un des personnages de Les caves du Vatican jette quelqu'un du train, violence et brutalité gratuites et totalement condamnables comme celle du happy slapping ;
    • ou à propos du débat entre morale et technologie/technique, que « la technique l'emporte toujours sur la morale, nous le savons au moins depuis l'excommunication des arbalètes. Et donc il y aura toujours un gain de la technologie sur tout discours, sur toute attitude théorique. » [3] ;

Cependant pour ce qui est de la video ou du son, sans transcription dans un format texte, ouvert de préférence, impossible de retrouver des informations et de faire des recherches car l'information n'existe pas pour les moteurs de recherche (actuels ?).

Sources et liens :
Et sur Formats-Ouverts.org :

Le nouveau site paraît

Le nouveau site de Télérama et les formats du Web

Depuis le mercredi 21 novembre 2007, le magazine Télérama a lancé son nouveau site Web : après le changement de la version papier fin septembre 2006, c'est au tour du site Web « qui fait aujourd'hui peau neuve » [1]. Ainsi la couverture du numéro paru le 21 novembre est consacré au sujet et plus largement au Web et à Internet :

Télérama lance son nouveau site - Numéro spécial Internet - Comment le Web change nos vies [2]

Le site propose une approche dite Web 2.0, notamment au travers de Wizzz, espace où Créez et enrichissez votre espace [3]

Et pour les standards ouverts du Web, qu'en est-il ? Une réponse possible est celle fournie par l'outil Validator du W3C [4] qui mesure la conformité d'une page avec le code HTML (ou XHML). Verdict : pas encore valide. Question : mais peut-on faire un site valide et riche et Web 2.0 ? La réponse semblait positive lors des conférences Paris Web 2007. Alors, un des prochains enrichissements du site pour encore plus d'accessibilité et d'interopérabilité ?

Sources et liens :
Et sur Formats-Ouverts.org :

« Vous pouvez le dire en français » pour les mots...

« long box » et « Creative Commons » en français

En informatique ou dans les technologies de l'information et de la communication, les termes anglo-saxons sont très présents, même en français : walkman, email ou podcast. Pourtant certains mots, comme justement ces 3 termes, ont une traduction française officielle : ici baladeur, courriel et baladodiffusion

Ainsi « Vous pouvez le dire en français » comme l'indique la Délégation générale à la langue française et aux langue de France (DGLF) [1]. Et cela notamment pour les 2 termes suivants liés aux formats, qui après le Journal officiel (JO) sont aussi parus au Bulletin officiel de l'éducation nationale (BOEN) :

  • long box, ce format (physique) qui devient coffret long format, depuis septembre 2006 [2] ; et la version Director's cut long box devient le coffret long format en version d'auteur ;
  • un document Creative Commons est une œuvre en partage (ou en usage partagé) sous Creative Commons, depuis septembre 2007 (« L’emploi de l’expression “Creative Commons”, dénomination sociale en anglais d’une organisation qui propose ce type de contrat, est déconseillé. ») [3].

Pour open formats (ou protocols ou standards), on a la traduction formats ouverts (ou protocoles ou standards) : il y a proximité des noms (pas de l'adjectif... même si open est assez connu... et même utilisé comme slogan d'une marque française de téléphonie). La situation n'est pas la même pour le mot normalisation en français.

Autres articles sur Formats-Ouverts.org à propos de traductions en français :
Sources et liens :
Et sur Formats-Ouverts.org :

Table ronde à Soissons

Journée de cérémonie des Trophées du Libre 2007

Le jeudi 29 novembre se déroule à Soissons la remise des Trophées du Libre 2007 [1], organisés par CETRIL (Centre Européen de Transfert et de Recherche en Informatique Libre [2]). Le programme de cette journée [3], outre la remise et la soirée, propose plusieurs tables rondes, dont une à propos d'interopérabilité à laquelle je participe : le sujet des standards ouverts s'y retrouvera, comme celui de la concurrence ou de l'indépendance.

La table ronde se déroulera au Chateau de Villeneuve St Germain à Soissons, de 17h30 à 18h30. Entrée libre et gratuite.

Sources et liens :
Et sur Formats-Ouverts.org :

Les 6 divertissements et les formats

Une publicité pour le divertissement, « besoin vital »

Dans les magazines et les journaux, la campagne de publicité montre en double page ou sur une seule page entière :

  • soit un jeune homme, barbu, a priori sur une plage et torse nu, penché en avant et attentif, appliquant un coquillage blanc sur chaque oreille ;
  • soit une jeune femme aux cheveux longs, a priori peu vêtue, avec à la main une feuille d'arbre qu'elle tient devant son visage, un seul œil visible derrière la feuille percée d'un trou.

Cela fait penser à un retour aux sources, dans un paysage sauvage (qui est flou sur les images). Parfois c'est la version homme, parfois la version femme (il serait intéressant d'en connaître les raisons précises : sans doute la cible des lecteurs, mais selon quels critères ?).

En plus de l'image, il y a aussi un titre, comme s'il était écrit à la main (forme de la police), sauf le nom de la société : « VIVENDI LE DIVERTISSEMENT EST UN BESOIN VITAL », texte qui est développé, avec comme première phrase : « Le divertissement est vital comme boire, manger, dormir. ». [1]

Mais quels sont ces divertissements ? Première constatation : l'ordre n'est pas le même selon la version homme ou la version femme, mais ils sont toujours 6 : « cinéma mobile internet télé musique jeux ». Et alors, où sont les formats ?

Deuxième constatation, il n'y a pas le format papier : le livre est ici hors jeu comme « divertissement ». Comme la photo, numérique ou argentique.

Point commun, les 6 domaines cités du divertissement utilisent des formats et des protocoles fermés pour les contenus (texte image son) et pour leur transmission et diffusion, ce qui peut freiner de nouveaux arrivants : une sorte de barrière à l'entrée et un contrôle du marché.

Tous ? Non, tous sauf un : Internet. En effet Internet utilise et repose sur des formats ouverts et des protocoles ouverts. Ainsi, via Internet, est-il possible de créer, de publier et de diffuser des contenus, sans verrouillage technique à franchir, qui peuvent concerner des films et de la video (format ouvert Theora), des discussions (protocoles ouverts XMPP et SIP), du son (format ouvert Vorbis), des jeux (formats ouverts disponibles) et du texte (formats ouverts HTML, PDF ou texte brut).

Internet est le centre de convergence télévision-cinéma-téléphone-musique-jeu, mais aussi celui qui prend des parts de marché aux autres (notamment à la télé) et aussi celui qui peut concurrencer les autres divertissements de par son ouverture... Finalement, la même situation que pour les 4 écrans.

Sources et liens :
Et sur Formats-Ouverts.org :

Les formats ouverts à La Villette

Lors de la Mandriva Party, conférence sur les formats

La fin de l'année est la saison des nouvelles versions des distributions logiciels libres : ainsi les dernières Fedora [1], Ubuntu [2], Mandriva [3] ou OpenBSD [4] sont apparues.

Des install party ont lieu à ces occasions : ce sera le cas samedi 24 novembre pour la nouvelle Mandriva Linux 2008, avec installation, ateliers et conférences.

Alors, après la conférence du 4/11 (Ubuntu), celle du 10/11 (Nice) et avant celle du 7/12 (Bourges), ce sera donc celle du samedi 24/11 de 17h à 18h, organisée par la dynamique association Parinux [5], le Carrefour Numérique de la Cité des sciences et la société Mandriva :

Les formats sont un sujet clé dans le monde numérique : en quoi, comment et quelles solutions pour ne pas en être victime.

Les formats ouverts ou fermés : approche pratique. Qu'est-ce qu'un format de fichier ? A quoi sert un format de fichier ? Où rencontre-t-on les formats de fichiers ? Et les formats autres que ceux des fichiers ? Comment ouvrir un document (à un format) d'un logiciel à un autre ? Si c'est impossible, pourquoi ? Comment conserver des documents sur plusieurs années et à quelles conditions ?

Lieu : Cité des sciences et de l'industrie de La Villette [6]. Si les yeux et les oreilles vous en disent, entrée libre et gratuite.

Sources et liens :
Et sur Formats-Ouverts.org :

TeX, LaTeX et le format tex : encore bien présents

Des format ouverts depuis presque 25 et 30 ans !

1978 : début du logiciel TeX [1] et de son format .tex. En 1984, c'est LaTeX [2], toujours avec le format .tex. Soit presque 30 ans pour l'un et près d'un quart de siècle pour l'autre, à propos de typographie et de mise en page professionnelles de documents.

Le format tex est ouvert (et les logiciels TeX et LaTeX sont des logiciels libres) : il est employé par de nombreux auteurs, dans plusieurs logiciels différents et par le monde professionnel de l'édition, de la publication, de l'imprimerie, notamment dans le domaine scientifique où il est devenu le format de fait, le standard. Mais LaTeX permet de réaliser des documents dans (presque) tous les domaines, y compris non-scientifiques comme en lettres, droit, musique ou langues.

Derrière ces logiciels et formats ouverts, on trouve principalement 2 personnes : Donald E. Knuth [3] pour TeX (avec METAFONT et la fonte CM), sans doute l'un des plus grands informaticiens, et Leslie Lamport [4] pour LaTeX, chercheur en informatique actuellement employé dans un des laboratoires de Microsoft.

Depuis le début des années 80, la communauté TeX-LaTeX est nombreuse, active et de plus en plus internationale, avec des associations comme TUG aux États-Unis dès 1980 [5] ou GUTenberg pour les pays francophones [6].

Des manifestations et des livres sur ce format ouvert

En France en cette année 2007, deux manifestations liées directement (ou pas) au format TeX se sont tenues :

  • le 8 octobre, la journée GUTenberg 2007 à propos de « Unicode et LaTeX » [7], à Paris : le format d'encodage est un élément capital pour la transcription des différentes langues.
  • les 29, 30 et 31 octobre furent les 3 jours des « Journées algorithmiques » [8] en l'honneur de Donald E. Knuth à qui l'université de Bordeaux a décerné le 30 un doctorat honoris causa.

Quant au monde de l'édition, ce sont 3 nouveaux titres qui ont été publiés au cours des 6 derniers mois : par ordre chronologique d'apparition,

  • en juin, LaTeX pour l'impatient, H & K, 160 pages [9] ;
  • en septembre, LaTeX à 200%, O'Reilly , 120 pages [10] ;
  • en octobre, Mémento LaTeX, Eyrolles, 14 pages [11].

Le format .tex est apparu alors que les traitements de texte n'étaient pas présents (Word de Microsoft a commencé en 1983) et il continue d'être utilisé, en évoluant et en restant ouvert.

Autres articles avec LaTeX sur Formats-Ouverts.org :
Sources et liens :
Et sur Formats-Ouverts.org :

La Bibliothèque nationale de France et ses chantiers numériques

Conférence de presse : bibliothèques numériques, conservation du patrimoine numérique, donc des formats et aussi...

Le 13 novembre 2007, Bruno Racine, président de la Bibliothèque nationale de France (BnF), a donné une conférence de presse intitulée Trois chantiers d'avenir [1] que sont « le numérique, le projet Richelieu, le développement durable ».

Le contexte : l'archivage et les bibliothèques numériques

L'une des missions de la BnF concerne le dépôt légal, qui touche maintenant le numérique. Cela signifie collecte puis archivage, conservation et aussi records management : la BnF a de grand(e)s expert(e)s en la matière.

La bibliothèque numérique de Google fut annoncée en décembre 2004 sous le nom de Google Print. Depuis, rebaptisée Google Book Search, 18 bibliothèques sont devenues partenaires [2]. Yahoo!, Microsoft, Amazon participent aussi à des projets de bibliothèque numérique.

La Bibliothèque nationale de France :

  • le président Jeanneney : le 22 janvier 2005, il publiait un article dans Le Monde, réagissant au projet de Google et lançant un « appel solennel » ;
  • une nouvelle équipe de direction : le 2 avril 2007, Jean-Noël Jeanneney [3] fêtait son 65e anniversaire et quittait ses fonctions de président de la BnF, atteint par la limite d'âge ; Bruno Racine [4], ancien président du Centre Georges-Pompidou, lui a succédé ; quant à Agnès Saal, directrice générale de la BnF (depuis 2001), autre poste clé, elle a été nommée directrice générale du Centre Georges-Pompidou le 23 août [5].

La BnuE, Bibliothèque numérique européenne a connu une accélération après la réaction de Jean-Noël Jeanneney qu'il a porté auprès des différents interlocuteurs et responsables en France et en Europe.

« La BnF à l'ère du numérique » et les formats

Pour le chantier du numérique, il y a 3 volets : « collecter-conserver ; organiser ; diffuser », avec notamment le projet SPAR (Système de Préservation et d'Archivage Réparti) pour « entreposer de manière sécurisée et pérenne les objets numériques ».

Pour ce « projet de grande ampleur » SPAR, « la BnF a lancé le 14 juin dernier un appel d'offres pour la réalisation de la partie logicielle et a adopté une orientation en faveur du logiciel libre afin de s'assurer une indépendance maximale. ». Donc des logiciels avec des formats ouverts. C'est à souligner, à saluer et à soutenir !

En ce qui concerne la préservation, la pérennisation et l'archivage électronique des données avec l'outil SPAR, « la diversité de leurs formats placent la BnF devant le défi de leur conservation. ». Pour SPAR, le problème des formats (notamment fermés) est indiqué et il faut composer avec :

Mais il permet également, grâce à une reconnaissance précise et complète des formats de données versées, de garantir la continuité d'accès en procédant aux transformations nécessaires en cas d'obsolescence technologique des outils informatiques de restitution. Ainsi, par exemple, lorsque le format d'image JPEG deviendra obsolète, SPAR sera en mesure de transformer les images concernées dans un nouveau format plus performant. Apporter cette garantie implique un travail permanent de veille technologique sur les formats, de prototypage et de tests des outils. L'ensemble de cet arsenal est intrinsèquement prévu dans la conception de SPAR. De plus, SPAR permet à tout moment de revenir en arrière pour restituer les objets dans leur format d'origine.

Enfin SPAR est un « véritable magasin numérique », dont la conception « s'appuie sur des normes internationales faisant autorité dans le monde de la pérennisation des informations numériques. » Les formats ouverts EAD (pour l'archivage) ou Dublin Core (pour les métadonnées) peuvent relever de cette approche. Il ne s'agit pas tant de recommander des formats en vue de l'archivage (comme dans le Manuel pratique Les archives électroniques de Catherine Dhérent) mais de prendre en compte l'existant.

Le records management, très présent à la BnF n'est pas cité mais concerne directement les sujets « d'indexation et d'accès aux archives » : les formats ouverts sont là aussi de mise.

Autre volet : « La BnF a aujourd’hui un rôle à jouer pour contribuer à organiser l’information à l’ère du numérique » et lance 3 « axes de recherche : OCR, traitement automatique des données et Web sémantique ». Si l'OCR peut poser un problème de format fermé des logiciels, le Web sémantique [6] repose sur des formats ouverts qui permet un traitement plus puissant des informations avec le format texte (plutôt que le format image).

Un point concerne les « choix de normalisation nécessaires pour l'inclusion des données concernant les livres sous droits (formalisme de transmission des contenus des documents, format des métadonnées, format de fourniture des données). » : formats et protocoles ouverts seraient bien plus efficaces que s'ils étaient fermés et utilisables avec un seul système d'exploitation.

Enfin pour le volet « Diffuser en ligne », la BnF agit dans le dossier des bibliothèques numériques « autour de trois cercles » :

  • sa propre bibliothèque numérique Gallica qui va évoluer et devenir Gallica 2 pour décembre 2008 [7] ;
  • la Bibliothèque numérique européenne (BnuE) avec le prototype Europeana qui continue son développement, et où Catherine Lupovici, ancienne directrice du département de la bibliothèque numérique de la BnF, est désormais très impliquée ;
  • le Réseau francophone des bibliothèques nationales numériques (RFBNN) qui présentera un prototype en août 2008.

Le « grand format » des cartes et des plans est aussi cité... mais cela s'applique aux dimensions physiques de ces documents !

Finalement, que ce soit pour le patrimoine numérique, pour l'archivage (après les exemples récents de la capsule Yahoo!, des bandes de la NASA, du DAFF de l'INA, de la British Library, de « l'informatique immortelle »,...) ou pour les bibliothèques numériques, la BnF continue d'être présente et active pour ces dossiers. Souhaitons vivement que ce sera avec toujours plus de standards ouverts et en faisant la promotion.

Sources et liens :
Et sur Formats-Ouverts.org :

Une conférence berruyère

Journée du logiciel libre à Bourges, et conférences

Le vendredi 7 décembre 2007 se déroule la journée Libres à Bourges [1], organisée par Berryx, Logiciels libres en Berry [2], association promouvant les logiciels libres dans le Cher depuis 1999. Il y aura des ateliers et un total de 6 conférences, dont « Les formats ouverts : fort importants, formidablement omniprésents, for tout le monde. Une information nécessaire ! », de ma part de 10h30 à 11h30 :

Le sujet des formats se retrouve dans tout le monde du numérique et concerne tous ses utilisateurs : ne pas en mesurer l'importante et les risques peut s'avérer problématique. Un tour d'horizon des différents domaines, outils et formats sera proposé.

Les collectivités Conseil régional Centre [3], Conseil général du Cher [4] et la ville de Bourges avec l'IMEP [5] sont partenaires de la manifestation qui se déroulera à la Faculté des sciences (rue Gaston Berger) [6] qui soutient la manifestation. Avec aussi les associations du libre APRIL [7] et AFUL [8] partenaires. Entré libre et gratuite : si les yeux et les oreilles vous en disent, n'hésitez pas (inscription souhaitée [9]).

Sources et liens :
Et sur Formats-Ouverts.org :
  • le mardi 16 novembre 2004 : 1 article (Linbox Converter : une moulinette pour passer de formats fermés à ouverts)
  • le mercredi 16 novembre 2005 : 1 article (Conférence au salon Educ@tice lors du salon de l'éducation : Les enjeux de l'interopérabilité)
  • le jeudi 16 novembre 2006 : 1 article (Interop Vendor Alliance, une alliance pour l'interopérabilité : et pour les standards ouverts ?)

Tim Berners-Lee et les standards ouverts pour le Web Mobile

Une conférence à propos des standards ouverts du Web

Le communiqué de presse du W3C à propos de l'outil de vérification Web Mobile indiquait que « Tim Berners-Lee expliquera comment mobileOK s'inscrit dans la vision du Web mobile du W3C dans son discours intitulé « Sortir du huis clos : développer le Web mobile avec des standards ouverts », lors de la manifestation Mobile Internet World (le 14 novembre à Boston, Massachusetts, États-Unis) ».

Le résumé en ligne [1] de cette conférence de Tim Berners-Lee (Directeur du W3C [2]), intitulée en anglais Escaping the Walled Garden: Growing the Mobile Web with Open Standards, indique qu'il exposera :

comment la caractéristique clé des technologies ouvertes peut amener une croissance du mobile encore plus élevée et avec de nouveaux potentiels. Il posera comme principe qu'une nouvelle approche, utilisant les standards ouverts, peut conduire le mobile d'un espace clos vers un environnement large et fertile pour connecter les sociétés, les personnes et les cultures.

Donc les standards ouverts encore plus présents pour un Web ouvert et interpopérable.

Sources et liens :
Et sur Formats-Ouverts.org :

3 jours sur le Web et ses formats

Manifestation Paris Web 2007

Du 15 au 17 novembre se tient à Paris la manifestation Paris Web 2007 [1] :

  • les 2 premiers jours sont axés principalement sur les professionnels et ouverts aux décideurs peu au fait de la technique, avec 12 conférences ou tables rondes ;
  • la dernière journée est réservé aux passionnés, développeurs, experts ou chefs de projet techniques.

Au cours de ces 3 jours, les formats, protocoles et langages utilisés sur le Web sont bien sûr omniprésents : ouverts ou pas, contenus accessibles ou pas, mutllinguisme et finalement interopérabilité et ouverture du Web.

Sources et liens :
Et sur Formats-Ouverts.org :

Le W3C lance un nouvel outil pour le Web Mobile

Le Web Mobile, le W3C et les standards ouverts

Le Web, comme Internet, repose sur des formats et protocoles ouverts, notamment ceux du W3C, avec principalement le format HTML des pages Web. Le Web va de plus en plus être utilisé depuis son téléphone mobile (ou autre appareil nomade).

Comment produire des contenus pour ce Web Mobile ? Comme pour le Web ! C'est-à-dire avec les standards ouverts du W3C. Et pour vérifier la conformité de ces pages Web Mobile, le W3C a annoncé le 13 novembre [1] le lancement d'un outil en ligne (en version alpha), W3C mobileOK Checker [2] :

Le W3C propose une nouvelle manière de créer et de rechercher du contenu Web mobile. Le W3C invite les concepteurs de sites Web à exécuter la version alpha du vérificateur W3C mobileOK pour que leurs contenus fonctionnent sur un large éventail de périphériques mobiles.

Comme le précise le communiqué de presse, des « chefs de file l’ont déjà mis en œuvre et sollicitent le retour d’informations des utilisateurs » : il y a donc un soutien actif des « organisations membres du W3C et les sponsors de l’initiative Web mobile, participant au groupe de travail Meilleures pratiques du Web mobile ».

Cet outil de vérification s'ajoute à ceux qui existent déjà, comme HTML Validator [3], Feed Validator [4] ou CSS Validator [5].

On a ainsi : un format ouvert (donc avec sa documentation disponible) et aussi la vérification en ligne de l'exactitude de ce format : une panoplie complète pour garantir l'ouverture du Web et son interopérabilité, quels que soient les outils utilisés.

Sources et liens :
Et sur Formats-Ouverts.org :
  • le samedi 13 novembre 2004 : 1 article (Comment évoluer ? Avec les standards ouverts : POP vient compléter GMail)
  • le dimanche 13 novembre 2005 : 1 article (Le défi est aussi technique, avec les formats et les protocoles : une intervention du président de la BnF sur la Bne)
  • le lundi 13 novembre 2006 : 1 article (Les coulisses du HTML : 2 articles à lire)

Intégré, intégrons et intégration

Quand toute la chaîne est identique, tout va

« Tout est parfaitement intégré » : tel est le slogan possible de la part de certains industriels, en parlant de leurs matériels et de l'approche d'intégration.

L'approche « Intégrons, intégrons » part d'une considération pragmatique : simplifier les choses et donc ne pas proposer aux utilisateurs des choses compliquées. C'est a priori louable et assez pertinent.

Cela signifie que 2 appareils censés échanger le feront parfaitement s'ils proviennent du même fabricant. Pour un ensemble d'éléments, à l'heure des appareils qui sont reliés les uns aux autres, le principe est d'avoir tout de la même marque.

Concrétement, on a par exemple les chaînes numériques suivantes :

  • téléviseur - videoprojecteur - caméscope - appareil photo - console - lecteur DVD - ordinateur - site Web de vente : Sony [1]
  • baladeur - téléphone portable - ordinateur - site Web de vente - logiciels système d'exploitation, navigateur, serveur, bureautique, video, photo, musique : Apple [2]
  • baladeur - console - périphérique - logiciel serveur - logiciel système d'exploitation - logiciel bureautique - logiciel multimedia - logiciel de programmation - logiciel de messagerie instantanée - site Web de vente et de recherche : Microsoft [3]

Pour que cela fonctionne au mieux, le mieux est de les utiliser ensemble. Et revoilà les formats. Et les données.

En effet, les données sont au centre du cercle des appareils : pour passer de l'un à l'autre, pour être synchronisées, pour être achetés ou pour être utilisées, qui mieux que celui qui fabrique un élément peut employer les données sur un autre de ses appareils, grâce à sa maîtrise des formats (ou des protocoles).

Le format est alors la clé qui ouvre (ou pas) les différents appareils, et les formats ouverts ne sont pas vraiment les plus utilisés : le principe d'intégration peut aussi être celui d'être enchaîné (avec à l'inverse la chute des dominos numériques). Quant à la diversité et à l'interopérabilité, elle est alors bien absente (remplacer un appareil par un autre de marque différente n'est pas impossible, mais cela ne fonctionnera pas aussi bien, et des fonctionnalités ou des informations liées aux appareils de la même marque ne seront plus présentes).

Sources et liens :
Et sur Formats-Ouverts.org :

Le 11-Novembre

Une date particulière et les formats

11 novembre 1918 : signature de l'armistice de la Première Guerre mondiale [1]. Pour commémorer cette date, des cérémonies officielles se déroulent partout en France et notamment à l'Arc de Triomphe. En cette année 2007, le 11-Novembre n'a pas connu à Paris le même format que les années précédentes, avec un discours (court) du Président de la République.

En 1918, le Cessez le Feu sonna sur tout le front le 11 novembre à 11 heures : autre format d'écriture de cette date célébrée, 11/11 11h.

La télé a diffusé à l'approche de la date, films, émissions ou reportages sur ce sujet vieux de 89 ans. Pour ce qui est de la journée du 11 novembre, France 3 proposa la cérémonie de Paris en direct. Le soir, encore le 11-Novembre sur France 2 avec La Tranchée des espoirs, mais pas pour TF1 avec Le Cœur des hommes (tiens, sa suite est sortie sur les écrans fin octobre... et pas d'affrontement de séries télé).

Quant à l'écriture du 11-Novembre (employé comme nom de places, de rues,...) c'est bien avec ce format d'écriture en tant que nom, avec majuscule et trait d'union.

Les 90 ans seront sans doute davantage célébrés, car cela sera un nombre plus rond (un meilleur format), mais avec encore combien des 2 derniers soldats encore vivants ? Cela laisse une impression étrange de constater que Formats-Ouverts.org a vu passer les célébrations (ou pas) des 90 ans 1914 (début du conflit en août, fraternisation de Noël 14), des 90 ans de 1915 (Notre-Dame-de-Lorette), des 90 ans de 1916 (bataille de Verdun) et de ces 90 ans de 1917 (attaque de la crête de Vimy).

Enfin et surtout, une pensée pour ces millions de morts de cette boucherie.

Sources et liens :
Et sur Formats-Ouverts.org :

Vous êtes un format et il nous intéresse...

Le réseau social Facebook et la publicité ciblée, dans Le Monde

Je suis, tu es, elle est, nous sommes... une cible, celle de la « publicité ciblée ». Et ces cibles des plans de communication et de marketing ont des formats, des profils, qui sont classés par âge, sexe, profession, ville, prénom, situation de famille, mais aussi ses amis, loisirs, achats, voyages,... Plus les informations sont fines (et exactes), plus le profil est précis, plus le ciblage peut atteindre... sa cible.

C'est ce qui est en passe d'arriver pour les inscrits du médiatique et valorisé site de réseau social Facebook [1] : « Le site Facebook vend le profil de ses internautes aux publicitaires » titrait en première page Le Monde daté du 11 novembre [2], avec ce premier paragraphe :

La publicité en ligne est en train de franchir un nouveau palier dans l'exploitation de l'intimité des individus. Grâce à l'efficacité des outils de collecte et de mise en relations du Web, des formats émergent qui sont capables d'exploiter l'énorme quantité de données que les internautes livrent sur leurs blogs, leurs pages personnelles..., souvent sans précautions. Ces formats entendent aussi infiltrer les liens toujours plus nombreux que les internautes tissent avec leurs "cyber-amis". (gras ajouté)

Les formats ci-dessus renvoient aux outils qui exploitent les données ou aux données proprement dites qui sont facilement exploitables si elles sont structurées (les champs âge, ville, sexe,...) dans un format connu (du site, au minimum) voire ouvert. Et pour interroger les données personnelles des différents sites de réseaux sociaux, un projet de protocole ouvert a été lancé le 1er novembre 2007 par Google et certains sites (mais pas Facebook), OpenSocial : plus de comptatibilité, voire de l'interopérabilité.

Le terme format est aussi employé dans l'article au sens de type : « Les premiers formats publicitaires apparus sur Internet étaient de simples "bannières" (statiques, puis animées, avec des vidéos). »

Toujours est-il que les données personnelles ainsi confiées en toute confiance peuvent perdre leur caractère privé en étant stockées, affichées et exploitées par ceux qui les détiennent et dont le modèle économique est d'en vivre.

Sources et liens :
Et sur Formats-Ouverts.org :

Voilà le livre connecté

Un nouveau format de livre... acheté ou faisable soi-même !

Voilà « le livre connecté » ! Après le livre papier, le livre audio, le livre interactif ou le livre électronique, c'est la nouvelle dénomination pour un nouveau format de livre... avec des formats numériques. Les différents éléments :

  • un livre papier ;
  • un petit objet communicant intelligent et sympathique ;
  • une étiquette ;
  • une connexion ;
  • un fichier audio.

Plus précisément les éditions Gallimard Jeunesse, après Harry Potter fin octobre, lance le 7 novembre [1] La belle lisse poire du prince de Motordu [2] en livre connecté avec :

  • l'histoire du prince de Motordu et de la princesse Dézécole, de Pef, un bijou ;
  • le lapin Nabaztag de la société Violet [3] ;
  • une étiquette RFID (identification par ondes radio) ;
  • une connexion sans fil Web ;
  • le fichier audio du livre.

Que se passe-t-il ? Le livre grâce à sa puce est reconnu par le lapin qui se connecte au Web et récupère le fichier audio qui est ensuite lu par l'animal (avec la voix de l'humain qui a enregistré l'histoire). On retrouve des formats pour le son, le Wifi, les ondes radio, un code d'identification et du papier (ce support demeure). Pour l'instant un seul livre est disponible. Pourtant quelles que soient les listes de littérature jeunesse [4], elles comportent de nombreux autres titres : comment faire pour les petites têtes blondes (ou brunes ou rousses) qui veulent plus d'histoires ?

Vous aussi, vous pouvez le faire, avec des formats ouverts

La mode est aux loisirs créatifs, au « Faites-le vous-même », aux objets (ou aux plats) que l'on fabrique : cette approche peut s'appliquer au livre connnecté.

Achetez le livre papier de votre choix, ou alors allez sur le site du projet Gutenberg.org [5] pour des livres libres de droit (et imprimiez-le). Achetez le livre audio correspondant, ou alors enregistrez-vous (format ouvert Ogg Vorbis). Adopter un pingouin électronique, Tux Droid de Kysoh [6], autre objet animalier communiquant. Créer un code barre du livre associé au fichier son de votre enregistrement. Et quand celui qui tient le livre le passe devant le pingouin, il est reconnu et l'animal lui lit l'histoire. Précision : les voix enregistrées peuvent être celles de papa, maman, grand-maman, grand-papa, tata, tonton...

Sans autant de technique ni de formats numériques, le classique format papier est un régal : bonne lecture éventuelle de ce format ouvert, à l'interopérabilité assurée.

Sources et liens :
Et sur Formats-Ouverts.org :

L'interopérabilité et le communiqué de presse

Microsoft et Novell : un texte parlant d'interopérabilité ; et les formats ouverts ?

Le 2 octobre 2006, Microsoft et Novell annonçaient un accord qui soulevait des questions. Le 7 novembre 2007 ils ont publié un communiqué de presse [2] pour les « un an ».

Le titre : « Microsoft et Novell célèbrent une année d'interopérabilité et étendent leur accord de collaboration » ; le mot interopérabilité y figure, figure imposée de la communication, même s'il s'agit de compatibilité ; et il s'agit même des 1 an et 1 mois.

Le sous-titre : on y parle de « pont entre Windows et SuSE Linux Entreprise », donc de compatibilité entre 2 systèmes ; c'est approprié et le bon terme.

Le texte : pas de « standards ouverts » (mais un « basé sur les standards ») ; pas de « formats ouverts » (mais du « open source » et de la « compatibilité de format de document »).

Les standards ouverts ne sont pas forcément appelés pour assurer l'interopérabilité, alors que fin octobre 2006, cela était évoqué.

Sources et liens :
Et sur Formats-Ouverts.org :
  • le lundi 08 novembre 2004 : 1 article (Conférence « Méfiez-vous de votre vie numérique ! »)
  • le mardi 08 novembre 2005 : 2 articles (TEI, RDF, web sémantique, métadonnées, records management ; Deux appels en faveur des standards ouverts, mais...)
  • le mercredi 08 novembre 2006 : 1 article (La capsule Yahoo! : rendez-vous en 2020 pour se confronter aux formats)

Le format des cartes (bleues, bancaires, téléphone,...)

Depuis fin 1967, la carte bleue, et de nos jours, le format carte de crédit

La communication et le dossier de presse ont été bien réalisés : on parle [1] des 40 ans de la carte bleue [2], dont la première a été lancée le 6 novembre 1967 avec les 6 banques du groupe Carte Bleue [3].

Et le format a une place de choix, au sens physique du terme : le « format carte de crédit », comme il est souvent appelé, avec ses dimensions de 86 x 54 mm (et moins de 1 mm d'épaisseur). Ce format est utilisé par de très nombreuses autres cartes : de fidélité, d'achats, de téléphone, d'indentification, de transport, de santé,... la liste est longue.

Même si en 1967 il ne s'agissait peut-être pas de ces dimensions, toujours est-il que les nombreux rectangles de plastique modernes (avec puce électronique ou piste magnétique) et aux multiples utilisations ont un format établi, reconnu et standardisé : il est ainsi possible de glisser la carte partout (ou presque) dans les terminaux de lecture ou les distributeurs, l'interopérabilité en action, basée sur un seul format...

Et ce format est ouvert : libre à chacun de réaliser artisanalement ou pas une carte en plastique (ou en carton, ou en papier) aux dimensions de la carte de crédit... qui se glisse alors dans les porte-feuilles et autres emplacements justement prévues pour les cartes. Pour l'instant, nulle autorisation, nul brevet, nul paiement pour l'utilisation de ce format carte de crédit.

Sources et liens :
Et sur Formats-Ouverts.org :
  • le dimanche 7 novembre 2004 : 1 article (Binaire ou source : quel format prendrez-vous ?)
  • le lundi 7 novembre 2005 : 2 articles (Journée mondiale de la normalisation 2005 ; Bibliothèque numérique : Google, Amazon, MSN et la BnF, 3 annonces et 1 réaction)
  • le mardi 7 novembre 2006 : 1 article (Le format particulier du prix Renaudot 2006)

Et voilà l'ESA !

Un protocole ouvert pour des composants d'ordinateur

ESA : ce n'est pas ici l'Agence spatiale européenne, European Space Agency en angais [1]. ESA, c'est :

Enthusiast System Architecture, le premier protocole de surveillance et de contrôle du PC ouvert du marché pour les communications en temps réel et le contrôle des caractéristiques thermiques, électriques, acoustiques et fonctionnelles. [2]

Un protocole ouvert pour les échanges entre la carte mère et les composants de l'ordinateur (comme l'alimentation, le boîtier ou le système de refroidissement). Il a été mis au point par NVIDIA, fabricant de cartes graphiques, en collaboration avec des partenaires [3] comme Dell, HP, Asus, MSI et d'autres fabricants de composants (carte mère, alimentation, refroidissement, ordinateurs...). Ils ont annoncé proposer bientôt des éléments compatibles ESA.

ESA est publié, sans redevance, avec les spécifications (basées notamment sur l'USB) pour que les produits soient certifiés (la procédure à suivre pour être au bon format). Pour les microprocesseurs, les 2 géants AMD et Intel vont-ils suivre ? Un mouvement qui propose aux utilisateurs la personnalisation (« tuning, overclocking, customisation ») en s'emparant des technologies est-il lancé, comme avec BUG ? Et avec des standards ouverts.

Sources et liens :
Et sur Formats-Ouverts.org :

Google, OpenSocial, Open Handset Alliance et les standards open

Les 2 annonces Open