Pour les formats ouverts !

Aller au contenu | Aller au menu | Aller à la recherche

Le site Formats-Ouverts.org, (FOo), traite des formats, protocoles et standards ouverts, dans différents domaines (comme l'interopérabilité, l'archivage), depuis le 1er juillet 2004 (plus de 1400 jours) - Les formats se rencontrent presque partout - Il y a actuellement 1582 articles en ligne, dont 14 pour le mois en cours et les notules - Les 1000 articles : le communiqué de presse (inédit et exclusif) - Les statistiques mensuelles du site - Attention : vote électronique - Les conférences - Les 3 ans et demi ! - Le 1500e article - Un index du site - Où en est le patrimoine numérique ? - Bientôt 4 ans, bientôt 1600 articles...


Notules express :


2008, les 10 ans de XMLXML10, les 10 ans de XML en 2008 RMLL, du 1er au 5 juillet 2008Du 1er au 5 juillet 2008, les neuvièmes Rencontres Mondiales du Logiciel Libre (RMLL), à Mont-de-Marsan


Voici le cinquième PdF

Palmarès des Formats (PdF) recensés par Google sur Internet

Après la tentative de juillet, il y eut le premier PdF en août, puis en septembre, en octobre et en novembre. Voici donc en ce début décembre une nouvelle photographie des formats présents sur Internet et recensés par le moteur de recherche Google en utilisant la recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des formats ouverts ou pas, et sans distinction de langue :

  • Tous formats : environ 9 670 000 000
  • HTML : environ 2 190 000 000, soit 22,64%
  • HTM : environ 748 000 000, soit 7,73%
  • SHTML : environ 233 000 000, soit 2,41%
  • PDF : environ 195 000 000, soit 2,01%
  • Flash (swf) : environ 44 900 000 soit 0,46%
  • doc : environ 28 300 000, soit 0,29%
  • xml : environ 24 700 000, soit 0,25%
  • txt : environ 18 400 000, soit 0,19%
  • ppt : environ 9 340 000, soit 0,09%
  • PS : environ 6 960 000, soit 0,07%
  • xls : environ 6 700 000, soit 0,07%
  • rtf : environ 3 490 000, soit 0,03%
  • XHTML : environ 2 380 000, soit 0,02%
  • php : environ 248 000 000, soit 2,56%
  • asp : environ 376 000 000, soit 3,88%
  • rss : environ 1 810 000, soit 0,02 %
  • tex (TeX et LaTeX) : environ 1 920 000, soit 0,02%
  • rdf : environ 1 850 000, soit 0,02%
  • jpg : environ 5 500 000, soit 0,08%
  • jpeg : environ 469 000, soit 0,005%
  • png : environ 1 330 000, soit 0,01%
  • gif : environ 3 580 000, soit 0,04%
  • Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb et cfm)
  • SVG : environ 314 000
  • sxw (traitement de texte d'OpenOffice.org avant la version 2.0) : environ 156 000
  • exe : environ 838
  • deb : environ 2 840 000, soit 0,03%
  • rpm : environ 16 700
  • cfm : environ 157 000 000, soit 1,62%
  • zip : environ 132 000
  • rar : environ 21 600
  • odt : environ 10 200
  • ods : environ 262
  • odp : environ 779
  • Mesure effectuée le mercredi 7 décembre 2005, entre 19h00 et 19h20, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a toujours des questions sans réponse à propos des méthodes de calcul de Google (comme htm est-il inclus dans html ?).

Remarques :

  • le format ouvert SVG, à l'honneur avec Firefox 1.5 ne fait pas encore de bond spectaculaire, mais sera à suivre (comme l'OpenDocument Format).
  • par rapport à novembre, les résultats de cette mesure ne changent guère, avec de légères augmentations ou diminutions ; une anomalie flagrante : les fichiers .exe passent de 2 590 000 à 838.

On a toujours le format brut (ou absolu), avec par exemple des millions de fichiers, mais qui correspondent en format relatif, (en pourcentage) à bien moins... (2 380 000 fichiers XHTML, soit 0,02% !). Suivant le format utilisé, l'information aura plus ou moins d'impact...

Sources et liens :

Voici le quatrième PdF

Palmarès des Formats (PdF) recensés par Google sur Internet

En juillet, il y eut une tentative, puis successivement les PdF début août, septembre et octobre. Voici donc en ce début novembre une nouvelle photographie des formats présents sur Internet et recensés par le moteur de recherche Google en utilisant la recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des formats ouverts ou pas, et sans distinction de langue :

  • Tous formats : environ 9 680 000 000
  • HTML : environ 2 180 000 000, soit 22,52%
  • HTM : environ 758 000 000, soit 7,83%
  • SHTML : environ 241 000 000, soit 2,48% (nouveau)
  • PDF : environ 198 000 000, soit 2,04%
  • Flash (swf) : environ 44 800 000 soit 0,46%
  • doc : environ 29 000 000, soit 0,29%
  • xml : environ 24 800 000, soit 0,25%
  • txt : environ 18 600 000, soit 0,19%
  • ppt : environ 9 350 000, soit 0,09%
  • PS : environ 7 110 000, soit 0,07%
  • xls : environ 6 630 000, soit 0,07%
  • rtf : environ 3 610 000, soit 0,03%
  • XHTML : environ 2 290 000, soit 0,02% (nouveau)
  • php : environ 257 000 000, soit 2,65%
  • asp : environ 394 000 000, soit 4,07%
  • rss : environ 1 800 000, soit 0,02 %
  • tex (TeX et LaTeX) : environ 1 920 000, soit 0,02%
  • rdf : environ 2 010 000, soit 0,02%
  • jpg : environ 5 420 000, soit 0,05%
  • jpeg : environ 510 000, soit 0,005%
  • png : environ 1 310 000, soit 0,01%
  • gif : environ 3 470 000, soit 0,03%
  • Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb, exe et cfm)
  • SVG : environ 275 000 (nouveau)
  • sxw (traitement de texte d'OpenOffice.org avant la version 2.0) : environ 166 000
  • exe : environ 2 590 000, soit 0,03%
  • deb : environ 3 120 000, soit 0,03%
  • rpm : environ 30 400
  • cfm : environ 156 000 000, soit 1,61% (nouveau)
  • zip : environ 134 000 (nouveau)
  • rar : environ 21 800 (nouveau)
  • odt : environ 921 (nouveau)
  • ods : environ 289 (nouveau)
  • odp : environ 542 (nouveau)
  • Mesure effectuée le vendredi 4 novembre 2005, entre 19h30 et 19h55, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul de Google (htm est-il inclus dans html ?).

Remarques :

  • de nouveaux formats ont été pris en compte, dont le format ouvert OpenDocument Text (odt), Spreadsheet (ods, tableur) et Presentation (odp) ;
  • par rapport à octobre, les résultats de cette mesure ne changent guère ;
  • enfin, mea culpa pour les images : le mode d'estimation des 3 premières mesures n'était pas adapté, car basé sur une recherche de texte qui ne figure pas dans un fichier image ; ce mois-ci, Google Image a été utilisé avec comme mot recherché la seule première lettre du nom du format (ainsi p pour png) qui figure dans le nom du fichier ; les 10,71 millions en jpg, jpeg, png et gif représentent 0,09%.

On a toujours le format brut (ou absolu), avec par exemple des millions de fichiers, qui correspondent en format relatif, (en pourcentage) à bien moins... (18,6 millions de fichiers txt, soit 0,19%). L'information aura plus ou moins de force suivant le format retenu...

Sources et liens :

Voici le troisième PdF

Palmarès des Formats (PdF) recensés par Google sur Internet

Après une tentative (en juillet), puis le premier PdF (début août) suivi du deuxième PdF (début septembre), voici donc une nouvelle photographie en ce début octobre des formats présents sur Internet et recensés par le moteur de recherche Google en recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des formats ouverts ou pas, et sans distinction de langue :

  • Tous formats : environ 9 650 000 000
  • HTML : environ 2 210 000 000, soit 22,90%
  • HTM : environ 735 000 000, soit 7,61%
  • PDF : environ 188 000 000, soit 1,95%
  • Flash (swf) : environ 42 700 000 soit 0,44%
  • doc : environ 27 900 000, soit 0,29%
  • xml : environ 24 400 000, soit 0,25% (nouveau ce mois)
  • txt : environ 19 300 000, soit 0,20%
  • ppt : environ 9 320 000, soit 0,10%
  • PS : environ 7 870 000, soit 0,08%
  • xls : environ 6 550 000, soit 0,07%
  • rtf : environ 3 530 000, soit 0,04%
  • php : environ 244 000 000, soit 2,53%
  • asp : environ 372 000 000, soit 3,85%
  • rss : environ 2 430 000, soit 0,02 % (nouveau ce mois)
  • tex (TeX et LaTeX) : environ 2 040 000, soit 0,02%
  • rdf : environ 1 900 000, soit 0,02% (nouveau ce mois)
  • Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb et exe)
  • sxw (traitement de texte d'OpenOffice.org) : environ 165 000
  • jpg : environ 172 000
  • jpeg : environ 3 070
  • png : environ 112 000
  • gif : environ 185 000
  • exe : environ 2 600 000, soit 0,03%
  • deb : environ 2 980 000, soit 0,03%
  • rpm : environ 30 200
  • Mesure effectuée le mercredi 5 octobre 2005, entre 19h15 et 19h45, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul (htm est-il inclus dans html ?).

Remarque : il ressort par rapport à août et à septembre, que les résultats de cette mesure augmentent fortement en valeur absolue (on passe ainsi de 3,57 milliards de pages tous formats à plus de 9,65 ; ou 71 à 188 millions de PDF). Cependant, en valeur relative, c'est-à-dire en proportion (%), il est intéressant de noter que les formats restent avec le même classement et presque le même pourcentage (à l'exception du .exe).

Encore une fois, il y a le format brut (ou absolu), comme 42 millions de pages Flash, et le format relatif, soit moins de 0,5% (0,44) ! Suivant le format retenu, l'information a plus ou moins de force...

Sources et liens :

Voici le deuxième PdF

Palmarès des Formats (PdF) recensés par Google sur Internet

Après une tentative en juillet et le premier PdF début août, voici donc une nouvelle photographie en ce début septembre des formats présents sur Internet et recensés par le moteur de recherche Google en recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), mais cette fois avec plus de formats (ouverts ou pas) et sans distinction de langue :

  • Tous formats : environ 3 570 000 000
  • HTML : environ 816 000 000, soit 22,85%
  • HTM : environ 283 000 000, soit 7,92%
  • PDF : environ 71 200 000, soit 1,99%
  • Flash (swf) : environ 16 300 000 soit 0,45%
  • doc : environ 10 300 000, soit 0,28%
  • txt : environ 7 240 000, soit 0,20%
  • ppt : environ 3 350 000, soit 0,09%
  • PS : environ 2 780 000, soit 0,07%
  • xls : environ 2 410 000, soit 0,06%
  • rtf : environ 1 290 000, soit 0,03%
  • php : environ 90 700 000, soit 2,54%
  • asp : environ 142 000 000, soit 3,97%
  • tex (TeX et LaTeX) : environ 696 000, soit 0,02%
  • Tous les nombres ci-dessous représentent moins de 0,01% (sauf le format deb)
  • sxw (traitement de texte d'OpenOffice.org) : environ 59 900
  • jpg : environ 170 000
  • jpeg : environ 2 020
  • png : environ 10 200
  • gif : environ 176 000
  • exe : environ 14 500
  • deb : environ 1 240 000 soit 0,03%
  • rpm : environ 30 200
  • Mesure effectuée le dimanche 4 septembre, entre 22h30 et 23h00, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul (htm est-il inclus dans les html ? php inclut-il php3 ?).

Juste une remarque : il ressort par rapport à août, que certains nombres de cette mesure baissent... dont celui par exemple de Tous formats, qui perd 10 millions. Cela peut paraître énorme, comme lire 10 millions de documents recensés au format .doc, mais cela ne représente que 0,28% de l'ensemble des fichiers recensés par cette mesure !

Il y a bien pour les données chiffrées, d'un côté le format absolu (10 millions !), et de l'autre le format relatif (soit moins de 0,3% de l'ensemble...) : suivant celui qui est utilisé, cela est plus ou moins percutant...

Sources et liens :

Voici le premier PdF

Voici le premier PdF, Palmarès des Formats (recensés par Google)

L'article expliquant le 15 juillet qu'il est impossible d'établir un classement des formats les plus utilisés, ouverts ou pas, n'était pas exact, mea culpa : en effet, grâce à l'astuce détaillée en commentaires par Sébastien Billard, des statistiques sont disponibles.

Le principe est d'utiliser le moteur de recherche Google avec ses options avancées : il s'agit d'indiquer le type de format de fichier souhaité et un mot que l'on ne souhaite pas dans les fichiers. En utilisant un « mot » inexistant (long et avec uniquement des consonnes par exemple), on obtient un résultat.

La première mesure (BETA comme dirait Google) a été faite dans la nuit du 1er au 2 août 2005, entre 23h15 et 23h45 heure de Paris. Voici donc le premier article de la nouvelle catégorie Palmarès (des fichiers recensés par Google) :

  • Tous formats : environ 3 580 000 000, dont envriron 3 380 000 000 en anglais et environ 86 000 000 en français.
  • PDF : environ 72 200 000, soit 2,02% ; dont environ 64 400 000 en anglais et environ 4 720 000 en français.
  • flash : environ 16 000 000 soit 0,45%.
  • doc : environ 10 700 000, soit 0,30% ; dont environ 9 290 000 en anglais et environ 702 000 en français.
  • txt : environ 7 290 000, soit 0,20%.
  • ppt : environ 3 700 000, soit 0,10% ; dont environ 3 250 000 en anglais et environ 141 000 en français.
  • PS : environ 3 500 000, soit 0,10% ; dont environ 3 070 000 en anglais et environ 215 000 en français.
  • xls : environ 2 450 000, soit 0,07% ; dont environ 1 770 000 en anglais et environ 163 000 en français.
  • rtf : environ 1 370 000, soit 0,04% ; dont environ 856 000 en anglais et environ 205 000 en français.

Au même moment, la page d'accueil de Google en anglais indiquait : « Searching 8,058,044,651 web pages ».

Les 8 formats précis ci-dessus ne représentent donc que 3,28% de tous les formats. Et même le PDF avec plus de 72 millions ne représente qu'un peu plus de 2%... En tout cas dans le cadre de cette mesure.

Le nom de PdF est bien sûr un clin d'œil au nom du format d'Adobe... mais avec une minuscule entre les deux majuscules (classements, hit-parade, baromètre, charts, top des formats ne sonnaient pas aussi bien ; même chose quant à formamètre, formatomètre ou formatimètre construits comme pluviomètre, altimètre ou chronomètre).

Sources et liens :