Quel format pour la publication scientifique ?

février 17, 2011

J’ai eu hier une discussion passionnante avec Tommaso Venturini, Paul Girard et Julien Rault (voir ses travaux sur le logiciel SPIRE), membres du MediaLab de Science Po (dirigé par Bruno Latour) au sujet du futur des formats de publications scientifiques et le projet de créer un « Journal od Digital Social Sciences ». Ci-dessous quelques réflexions écrites dans le train en rentrant.

Comment se fait-il qu’au XXI siècle le standard de la publication soit encore le papier ? En science, beaucoup d’entre nous se documentent, effectuent des recherches, lisent et écrivent sur ordinateur (et maintenant sur tablette). L’ordinateur est évidemment également au centre des pratiques de recherche, pour, entre autres, la collecte et l’analyse de données, la programmation et la simulation de modèles. Ce constat ne se limite évidemment pas qu’aux sciences dures, la majorité des sciences sociales ayant maintenant intégrées l’informatique au coeur de leurs pratiques. Et pourtant toutes ces recherches, si innovantes fussent-elles dans leurs méthodes, finissent irrémédiablement publiées sous la forme maintenant bicentenaire de l’article scientifique papier.

On ne mesure sans doute pas suffisamment le retard scientifique que fait prendre ce goulot d’étranglement. Il est si souvent difficile de reproduire une expérience décrite dans un article, alors qu’il serait si simple d’inclure dans le corps même de l’article les données et algorithmes nécessaires à la poursuite de la recherche qui y est présentée. Un nouveau format pour la publication scientifique ne devrait évidemment pas se contenter de permettre l’inclusion de sons, de videos, il devrait proposer des interfaces pour que lecteurs, éditeurs et relecteurs puissent à leur tour explorer les données présentées, les projeter éventuellement sous des angles inédits, dans le but d’évaluer en profondeur la qualité de la recherche produite, dans l’espoir qu’elle serve de base à de future exploration.

Imaginons un article scientifique composé dans un format  capable de coder des livres-machines comme le format Bookapp. Chaque page pourrait accueillir non seulement des animations et des vidéos, mais aussi de véritables interfaces de visualisation pour explorer les graphes et les données présentées, lancer, pourquoi pas, d’autres expériences sur les mêmes modèles. Les annexes contiendraient le code des algorithmes, les corpus utilisés pour l’étude, le tout exportable et facilement réutilisable pour toute personne souhaitant poursuivre la recherche.

Trois points importants

1. Fermeture et autosuffisance. Il est crucial que toutes ces ressources soient incorporées dans l’article lui-même et non pas des liens vers des ressources extérieures. Pour jouer son rôle traditionnel d’archive, l’article se doit être une forme close, auto-suffisante.

2. Citabilité. Chacune de ses parties se doit d’être parfaitement citable. J’ai déjà décrit une solution générique qui permet de résoudre ce problème, y compris pour le cas d’objets complexes comme des livres-machines. Reste à assigner un numéro de référence à chaque publication de ce type (DOI, ISSN ou autre). Ceci ne devrait pas poser de problème.

3. Archivage. Il convient que des journaux et des bibliothèques archivent ces articles d’un nouveau genre avec le même soin et la même diligence qu’ils le font pour le format papier. Il sera sans doute nécessaire d’effectuer les opérations de conversion et de maintenance nécessaires à ce que les articles publiés restent lisibles au fil des ans. C’est un enjeu de taille qui demandera (comme aujourd’hui) des efforts et des financements réguliers.

Il y a bien-sûr d’autres chantiers importants dans le domaine de la publication scientifiques (l’open-access, la reforme du peer-reviewing, etc.) mais le format de publication est il me semble une question cruciale, à ma connaissance très peu discutée. Espérons que nous aurons l’occasion très bientôt de lancer une première expérience dans ce sens.

13 Réponses to “Quel format pour la publication scientifique ?”


  1. […] This post was mentioned on Twitter by jjtokyo, Caro_B and jhmorin, Frederic Kaplan. Frederic Kaplan said: Nouveau billet : Quel format pour la publication scientifique ? http://bit.ly/hPbu9g […]

  2. Jean Richard Says:

    Je ne suis pas un chercheur: la perspective de cet article serait-il orienté par cette activité.

    Question: quel type de codage? Opensource? html? xml? xhtml? car une « application livre » doit être fondée sur le principe de l’interopérabilité sinon cela devient trop coûteux et pose des problèmes d’archivage.

    La « clôture » de l’article scientifique ou autre me semble fondée sur le paradigme du livre et de l’archive, surtout, et non sur des paradigmes, en devenir, issus du numérique. Évidemment, elle a l’avantage d’instaurer un contrôle et un balisage du point de vue du chercheur / auteur / éditeur, mais l’aspect « communautaire » du partage et de l’évolution des savoirs ne s’en trouve-t-il pas limité?

    Ou alors, le modèle de l’auto-suffisance, de la clôture, fonctionne-t-il comme un attracteur autour desquels des satellites peuvent se mettre en orbite!

    Pour ce qui est de la citabilité: se fonder sur la structuration classique d’un texte implique que cette structuration est immuable à jamais. On pourrait consiérer un autre élément qui n’est pas pris en compte: une norme de marqueur temporel pourrait-être plus simple. Chaque occurrence dans un texte, dans une séquence audio, vidéo, même photo peut être indexée sur un marqueur temporel. Et si le corpus de data rompt avec la linéarité temporelle, et se trouve être plutôt rhizomatique, on peut alors établir des balises de bifurcation qui s’ajoutent aux marqueurs temporels. Pour les marqueurs temporels: voir l’usage qui en est fait dans le traitement texte sur iPad, iA Writer: chaque signe (plein ou vide) du texte a une valeur temporelle. Ou alors, plusieurs type de marqueurs peuvent être conjugués comme tu le proposes: il suffit alors qu’au début du corpus de data une table de translation permette de savoir quels sont les marqueurs utilisés et que les moteurs de recherche sophistiqués permettent de les utiliser pour des requêtes.


    • Merci pour tes idées concernant la citabilité. Je ne pense pas qu’on puisse tout faire avec un marqueur temporel qui est intrinsèquement unidimensionnel. Par exemple je ne peux vouloir faire référence à une partie d’un graphique, à une zone sur une carte, à une branche d’un diagramme, à une vue d’un objet en 3D. Mais toutes ces stratégies s’intègrent effectivement bien dans un système de référence procédural.
      Sur les autres points, je réponds plus bas.


  3. Je ne suis pas persuadé non plus de la nécessité de la fermeture et de l’autosuffisance. Je crois même que c’est une utopie. Que l’article porte avec lui-même ses données (et encore, pas sûr que les plateformes l’accueillant soient capables de les servir au mieux), mais de là à ce qu’il s’accompagne des logiciels qui permettent de les jouer ou les lire… J’ai des doutes. D’autant qu’il faudrait des logiciels multiplateformes… J’ai l’impression que c’est une mauvaise direction. Incorporer dans l’article les vidéos, les images, les données et les logiciels pour tout lire reviendrait à construire des machines très consommatrices de ressources.

    Quand on regarde la même question sous l’angle de l’archivage, on se dit alors qu’il y a 2 solutions. Archiver des versions légères, de textes et de données brutes pour permettre leur portabilité future. Et démultiplier, disséminer et fabriquer des redondances pour faciliter la pérennité. La citabilité ne dépendrait alors plus d’une URL, mais d’un identifiant, permettant d’aller jusqu’au coeur du document, comme tu en montrais superbement l’exemple.


    • Jean, Hubert, merci pour vos remarques. Construire un format de publication capable de résister au temps est évidemment un défi. Mais je ne suis pas sûr que la difficulté vient de la puissance expressive du format en question. L’enjeu est avant tout social. Il faut motiver une communauté autour de ce format. Ce qui compte c’est d’une manière ou d’une autre de construire un système ouvert, extensible, améliorable au fil du temps, un peu comme le système procédural du citation que je proposais il y a quelque semaine. Il s’agirait d’une certaine manière d’un langage de programmation négocié par les acteurs qui le pratique. Je crois aussi que nous pouvons construire ce format de manière multiplateforme en facilitant la construction de lecteurs capables de l’interpréter. Évidemment, à ce stade ce ne sont que des convictions. J’espère pouvoir vous montrer dans quelques temps comment cette vision pourrait s’articuler techniquement.

  4. charlax Says:

    Très intéressant et très stimulant !

    Pour l’autosuffisance, cela me fait penser au projet IDEO http://designthinking.ideo.com/?p=496 (première partie)

    Pouvoir vérifier les sources serait vraiment une grande avancée, et permettrait aux publications scientifiques d’être beaucoup plus réfutables/falsifiables au sens de Karl Popper. Or, comment atteindre cette objectif sans avoir une forme d’autosuffisance ?

    Peut-être la notion de cache pourrait-elle offrir un bon compromis.


    • Merci pour le lien. Oui je crois effectivement dans l’importance de l’auto-suffisance et de la stabilité des publications scientifiques. Cela n’empêche évidemment pas qu’un débat puisse s’organiser autour d’une publication. De la même manière, le processus de recherche qui conduit à la publication pourrait lui aussi être archivé. Mais la science a toujours, il me semble, besoin pour progresser de se référer à des objets stables aux frontières bien définies. Ce n’est qu’à cette condition qu’elle peut tenir un discours falsifiable au sens de Popper.

  5. JM Salaun Says:

    Bonjour,

    Il me semble qu’il manque une dimension dans votre raisonnement. L’article scientifique est aussi un étalon de mesure pour l’économie interne de la science, celle qui régit les carrières et les subventions.
    Cette dimension, qui est aussi communautaire, compte sans doute pour beaucoup dans le conservatisme et la stabilité du format, sans rapport avec sa pertinence fonctionnelle.


    • Aujourd’hui, ce qui important pour l’économie interne de la science, c’est la « bibiométrie », basée sur différentes mesures de la manière dont les articles d’un scientifique sont cités (h-index, g-index, etc.). A priori, le format que je décris permet de calculer toutes ces mesures sans difficulté. Par contre, il faudra beaucoup temps pour que les journaux utilisant des formats de ce genre soient reconnus comme des revues scientifiques importantes. Mais c’est le cas aussi pour n’importe quel nouveau journal scientifique qui tente de percer. L’idéal serait donc qu’un journal reconnu, type Nature ou Science, fasse le premier le pas.

  6. ateliersvh Says:

    L’affaire de plagiat concernant la thèse de doctorat produite par le ministre allemand illustre bien, me semble-t-il, votre propos. L’épuisement d’une forme héritée de la lointaine scolastique, et du support papier dont elle paraît indissociable. « Karl Theodor zu Guttenberg »… un nom qui ne s’invente pas!


  7. […] Quel format pour la publication scientifique ? […]

  8. ever Says:

    je tombe sur votre article tardivement. La question de l’archivage est certainement un enjeu. Etant donné les profits des multinationales de l’édition scientifique, il pourrait être astucieux que la charge de cet archivage soit clairement assignée à ces acteurs économiques, pour qu’ils justifient un peu leurs profits…


Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :