Bookworld : un monde où chaque livre est une ville

février 22, 2012

Cette semaine à l’occasion de la conférence LIFT, Philippe Michel, Laurent Bolli et moi-même présentons en avant première, quelques jours avant sa sortie officielle, une nouvelle application iPad de lecture sociale appelée Bookworld. C’est un projet expérimental conçu par Lecteurs.com chez Orange et  Bookapp.com. Ce billet est l’occasion de faire le point sur un projet né il y a tout juste un an lors d’un premier workshop intitulé Book Urbanism.

Dans Bookworld, chaque livre est une ville. Le quartier downtown regroupe symbolise la structure de l’ouvrage. Chaque chapitre est une tour plus ou moins haute, la structure du livre définit ainsi une “skyline” unique et caractéristique de son organisation. Tout autour de ce quartier central, des faubourgs présentent les découvertes faites par des lecteurs : descriptions des personnages, lieux ou objets remarquables dont le livre traite, mais aussi des citations, des références à d’autres livres, des résumés et avis sur l’ouvrage. Au fur et à mesure que les lecteurs documentent sous forme de fiches ce que les livres contiennent, ces faubourgs croissent jusqu’à devenir potentiellement plus important que le cœur du livre lui-même. Si par exemple deux livres traitent d’un même lieu ou font intervenir un même personnage, les deux villes deviennent voisines dans le monde des livres.  Et le monde des livres progressivement se structure en un univers riche et complexe.

Dans cette construction collective, les lecteurs peuvent jouer différents rôles. Selon leurs activités, les uns deviennent prospecteurs, critiques, biographes, géographes ou l’un des autres métiers que l’application propose. Ensemble ils contribuent à extraire des livres une multitude de détails, tissent des connexions entre les livres qu’ils aiment et construisent ainsi un véritable monde.  L’application iPad Bookworld permet de naviguer dans cet univers en 3D en croissance perpétuelle, pour découvrir de nouveaux livres et par leur intermédiaires de nouvelles personnes, de nouveaux lieux et de nouvelles choses.

Voici par exemple à quoi ressemble aujourd’hui le Seigneur des anneaux dans Bookworld : Au centre, la dense forêt de tours bleues reflète le découpage en chapitre des trois tomes de la saga. Depuis cette perspective, nous voyons également des baraques rouges, correspondant au quartier des personnages : une trentaine ont déjà été documentés. Au loin une autre ville, le Silmarillon, thématiquement liée mais aujourd’hui moins développée dans Bookworld.

Un simple “tap” sur la ville permet de voir la “gazette” et d’accéder à toutes les fiches déjà documentées par les lecteurs. Il est alors possible de découvrir visuellement les personnages, les objets, les lieux du livres mais aussi des citations (“verbatim”), des avis et des résumés.

L’approche est générale et s’applique aussi bien aux livres de fiction qu’aux essais ou à la bande dessinée. Nous avons développé toute une série d’outils pour faciliter la croissance de cette base de connaissance. Ils permettent par exemple de chercher automatiquement des images et des informations sur un personnage ou les citations issues d’un livre sur le web. L’utilisateur  choisit parmi les résultats proposés ceux qui lui semblent les plus pertinents et les ajoutent à la fiche correspondante. Les sources des informations ajoutées sont indiquées sur la fiche ce qui permet de retrouver où l’information a été glanée. Ce type de recherche semi-automatique dans laquelle la machine propose des résultats que l’utilisateur filtre ensuite par rapport à des critères pertinences difficiles à modéliser (qu’est ce qu’une bonne représentation d’un personnage, qu’est-ce que une bonne citation ? ) nous semble un intéressant compromis. Nous verrons comment les utilisateurs se l’approprient.

Le grand défi est maintenant de peupler ce monde. Pour lancer le processus avant la sortie officielle de l’application, nous avons aménagé une véritable bibliothèque dans l’espace LIFT expérience contenant une sélection de best-sellers, d’essais classiques et de bandes dessinées. Notre équipe sur place s’attellera à transformer le maximum de livres en villes pendant les trois jours que durent la conférence. Nous invitons également tous les participants à venir avec les livres qu’ils voudraient “urbaniser”. Notre équipe les guidera dans ce processus un peu particulier en leur montrant la meilleur manière, pour chaque livre de créer le quartier central et de faire croître les faubourgs.

Book urbanism

Cette étrange aventure est née d’un workshop intitulé “Book Urbanism : Developing books like cities” organisé à LIFT il y a un an par Laurent Bolli et moi-même. Nous invitions les participants à réfléchir à la fécondité des métaphores urbaines pour décrire à la fois la structure et l’expérience de lecture d’un livre.Notre hypothèse était qu’en comparant les livres à des villes, nous pourrions en retour imaginer la transcription de certains services urbains (guides touristiques, systèmes de signalisation, système d’adressage, quartiers commerciaux) pour les livres. Nous proposions de penser les projets éditoriaux comme des projets de construction, les listes de lecture comme des itinéraires de voyages, les processus  d’enrichissement comme des développements urbains, les modèles économiques du livres comme des modèles économiques de la ville, les expériences de lecture comme des déambulations dans une cité.

Un livre, comme une ville, est effectivement un espace 3D dans lequel il est possible d’organiser spatialement un discours (la fonction architecturante du livre). Lors de ce premier workshop nous avions d’abord discuté d’un certain nombre d’exemples de livres et de villes permettant de comparer visuellement et structurellement certaines villes à certains livres et vice versa. Nous avions par exemple comparé Los Angeles à Wikipedia et montré comment cette encyclopédie en ligne pouvait être considérée comme le premier “méga-livre”, une ville en croissance perpétuelle souffrant des mêmes problèmes que les grandes villes (vandalisme, problème de signalisation, problème de contrôle, nécessité d’un service régulier de nettoyage).

Nous avions ensuite étudié un certain nombre de cas particulier : la comparaison des modèles commerciaux des quartiers de shopping avec ceux des catalogues et des brochures, les espaces publicitaires urbains avec leur équivalent dans les magazines, les architectures sponsorisées et les livres produits grâce à des mécènes, les favelas et les plateformes éditoriales de co-création, les villes-machines de la science fiction (p.e. Dark City d’Alex Proyas) avec les nouveaux modèles de livres-machines.

Enfin, nous avions demandé aux participants de se regrouper en “Ministères” pour travailler de manière créative sur des aspects spécifiques du monde des livres-villes. Le “Ministère des Postes et Télécommunications” avait planché sur un système d’adressage universel permettant de repérer tous les éléments possibles d’un livre-ville. Le “Ministère du Tourisme” avait imaginé des campagnes de promotions pour les livres-villes. Le “Ministère du Commerce” devait proposer des modèles commerciaux attractifs pour inciter les acteurs privés à participer aux développement de certains livre-ville. Le “Ministère de la Population” était en charge des dynamiques participatives permettant le développement harmonieux des livres-villes. Enfin, le “Ministère de la Connectivité et de la Circulation” avait pour mission d’organiser la circulation des personnes et des ressources à l’intérieur mais aussi entre les livres-villes sous forme de routes, de transports aériens, etc.

Naissance du projet Bookworld

L’équipe d’Orange Valley propose depuis avril 2010 une plateforme de lecture sociale appelée Lecteurs.com. L’objectif de ce service est de proposer aux amoureux de la lecture un espace de rencontre où ils peuvent partager des coups de coeurs et enrichir ensemble des informations sur les livres qu’ils aiment. La plateforme permet de faire des commentaires sur des livres, de partager des listes de lecture, de découvrir de nouveaux livres grâce aux recommandations de ses amis et de lire des ebooks. Le site se veut aussi une passerelle douce vers la lecture numérique en faisant la promotion des usages. Le service comptabilise aujourd’hui un peu de 165 000 inscrits.

Une des originalités graphiques de lecteurs.com est que chaque lecteur est représenté par un badge montrant ses livres préférés. La constitution de ce premier avatar (“je suis ce que je lis”) est une des premières étapes lorsque l’on s’inscrit sur la plateforme. D’une manière générale tout le site est centré sur les lecteurs eux-mêmes. Les plus actifs sont mis en avant sous la forme d’un TOP 10 mensuel.

L’équipe d’Orange Valley avait déjà adapté ce service sous la forme d’une application iPhone permettant la lecture d’ebook mais souhaitait proposer sur iPad une expérience très différente. Nous avons commencé à explorer ensemble plusieurs pistes et l’idée de poursuivre la piste métaphorique de Book urbanism s’est rapidement dessinée. Sur iPad, le service Lecteurs.com prendrait la forme expérimentale de Bookworld, un monde de livres en croissance perpétuelle, une autre manière de visualiser et de faire l’expérience de la lecture sociale.

Book urbanism 2

Le projet Bookworld explore certaines des pistes discutées dans ce workshop initial. Mais cette première instanciation est loin d’avoir épuisé le sujet. Les livres-villes de Bookworld sont encore extrêmement simples comparés aux développements potentiels que cette métaphore permet d’imaginer. Une partie du second workshop “Book urbanism 2” que nous organisons cette année à LIFT consiste précisément en une critique constructive de cette première version et en une exploration de pistes concrètes pour approfondir la métaphore.

Quelles représentations pour les livres-villes ? Dans Bookworld nous tentons de faire un pont entre l’univers essentiellement textuel des livres et l’univers essentiellement visuel des villes. Dans la première version de l’application toutes les villes donnent lieu à un quartier central dont la structure est seulement déterminée par le découpage en chapitres de l’œuvre. Il serait peut-être intéressant de développer, comme nous l’avions fait dans le workshop l’an dernier, une taxonomie de représentation correspondant à des types de livres différents. Il serait également important que les circuits de circulations dans l’œuvre apparaisse de manière plus intuitive et synthétique dans leur représentation sous forme de ville. Faudrait-il coder et faire apparaître plus explicitement les arcs narratifs et argumentatifs dans la structure de la ville ? Dans la mesure où une partie du contenu sémantique de chaque chapitre est balisé par le processus de documentation par fiche que l’application propose nous pourrions exploiter cette information dans la représentation elle-même. Notons enfin que notre moteur 3D permet aujourd’hui de survoler chaque livre-ville et le considérer sous différent angle mais que nous ne proposons pas encore une véritable immersion architecturale. Est-ce une bonne piste à explorer ? Comment se déplacer efficacement dans un livre-ville ?

Quels services pour les livres-villes ? Les services urbains pertinents pour les livres-villes avaient été particulièrement bien développés dans le workshop précédent mais ils ne se sont à ce jour que peu concrétisés dans l’application. Dans cette première version nous proposons des métiers, comme des castes de personnages, qui dépendent des activités d’enrichissement que l’utilisateur pratique. Nous pouvons aller plus loin et imaginer de vrais services. Il manque aujourd’hui l’équivalent des agences de voyages pour les livres : des services qui proposerait des itinéraires de lecture, mis en valeur par des brochures permettant d’anticiper visuellement les meilleurs moments mais aussi les passages difficiles (lecture Jacuzzi / lecture Mer du Nord) par exemple sous la forme de systèmes de dénivellation. Il y aussi une opportunité pour des guides qui vous accompagneraient lors de vos lectures, comme lorsque vous visitez une ville avec une personne locale rappelant les anecdotes, vous invitant à porter votre regard sur des détails que le visiteur pressé d’ordinaire néglige. La lecture, comme la découverte d’une ville, n’est pas forcément un plaisir solitaire. Il existe déjà des multiples manière de lire ensemble (voir mon cours introductif sur les social reading technologies).  Toutes ces fonctions de médiation sont difficilement automatisables par des machines. Nous avons besoin de la pertinence et de la sympathie d’un interlocuteur humain.

Pour résumer, notre objectif avec ce projet est de faire des livres des lieux habités. Avec la lecture classique, ils ne sont le plus souvent que  des ruines que l’on visite sans y séjourner et dont on ne ramène juste quelques cartes postales. Nous devrions pouvoir nous rencontrer dans des livres, travailler dans des livres, vendre des services et des objets dans des livres, bref faire des livres des espaces de vie et pas simplement des échappatoires immersives, des cachettes ou des jardins secrets. Si vous êtes sur Genève cette semaine, rejoignez-nous dans cette étrange aventure. Sinon attendez encore quelques jours et essayez la première version de l’application sur iPad.

 


Les trois futurs des livres-machines

février 10, 2012

Je participe ce lundi 13 Février à une conférence débat au Centre Pompidou sur l’évolution machinique du livre organisée par Xavier de la Porte et Hubert Guillaud. Je me réjouis de la discussion avec Etienne Mineur et Alain Giffard sur ces questions. En préparation à cette rencontre j’ai rédigé ce billet qui résume une partie de mes réflexions sur les trois devenir machiniques possibles pour le livre. 

L’erreur la plus commune dans les discussions au sujet du futur du livre imprimé consiste à placer le débat sur les avantages et les défauts respectifs du papier et du digital. Il me semble qu’il ne sert à rien d’opposer deux expériences de lecture. Quelques dizaines d’années après l’invention de Gutenberg, les livres imprimés ressemblaient à si méprendre à leurs homologues papier. L’expérience utilisateur était la même. Pourtant quelque chose de fondamental avait changé dans leur mode de production.

Il est donc crucial de sentir les grandes tendances technologiques qui silencieusement sont en train de tracer les futurs possibles pour le livre. Dans ce billet, je propose de replacer l’évolution des livres dans le cadre plus général d’une théorie de l’évolution des représentations régulées. Une représentation régulée est une représentation dont la production et l’usage est soumis à un ensemble de règles. Un annuaire, une table de compte, un arbre généalogique, un diagramme de production, une carte d’une région, une encyclopédie, une feuille Excel, une présentation PowerPoint sont autant d’exemple de représentations régulées. La plupart des représentations régulées tendent vers plus de régulations au fil du temps (il y a des exceptions comme l’expression poétique qui au contraire tend vers la dérégulation).

Le processus général de cette régularisation est la transformation de conventions en mécanismes. Cette mécanisation procède en deux étapes successives :
(1) La mécanisation des règles de production
(2) La mécanisation des règles d’usage.

Au travers de cette double mécanisation les représentations régulées finissent par devenir de véritables machines.

Comment les cartes sont devenues des machines ?

Au XIVe siècles il y avait encore très peu de règles sur la manière de dessiner une carte géographique. Comme on peut le voir sur cette carte, aucune des conventions maintenant classiques (échelle, orientation vers le nord) n’était à cette époque encore en place. 150 ans plus tard, comme le montre cette carte du XVIe siècle tout ces éléments sont maintenant en place. Un véritable savoir-faire tend pour la mesure que pour la représentation s’est constitué. La carte, encore entièrement faite à la main s’est standardisée. Prenons maintenant cette carte du XXIe siècle montrant la profondeur des océans. Sa production n’inclut presque plus aucun processus manuel. Elle a été entièrement mécanisée. La mécanisation des règles de production est maintenant complète, mais son usage est encore régie par des conventions.

Le passage des cartes traditionnelles à des systèmes d’information géographique comme Google maps illustre la seconde phase du processus de mécanisation. Cette seconde mécanisation a quatre conséquences remarquables :
1. En devenant machine, la carte a internalisé ses propres usages. Les cartes machines sont plus puissantes que les cartes traditionnelles mais toutes les opérations possibles avec elles sont spécifiées à l’avance. Vous ne pouvez pas vous servir d’une carte machine comme parapluie ou paquet cadeau ! Ce passage est celui de l’outil à la machine. Vous pouvez vous servir d’un marteau comme presse papier, un usage non conventionnel. Impossible de faire cela avec une presse industrielle.
2. En devenant machines, les cartes tendent à s’agréger ensemble pour ne devenir qu’une seule carte. Il s’agit sans doute d”une propriété générale : Au fur et à mesure que les représentations régulées deviennent plus régulières, elles tendent à s’agréger sous la forme de systèmes unifiés. C’est un cas particulier du processus de concrétisation étudié par Gilbert Simondon.

3. En devenant machines, les cartes tendent à perdre leur stabilité pour ne devenir qu’un instant de pause dans un flux perpétuel. Google maps est fondamentalement une vidéo que nous consultons sur pause.

4. En devenant machines, les cartes changent de modèle commercial. Les services cartographiques sont proposés gratuitement mais en échange de la récupération des traces et des ajouts des utilisateurs. Leur valeur d’usage a augmenté et en même temps leur valeur d’échange pour l’utilisateur est devenue nulle. Ceux qui proposent ces services gratuits accumulent du capital linguistique et sémantique, lui-même monnayable.

Ce qui s’est passé pour les cartes s’est également passé pour plusieurs autres représentations régulées, comme l’évolution des tableaux en tableurs.

Que peut-on en déduire pour l’évolution du livre imprimé ?

Les livres sont des représentations régulées. Leur production a déjà été entièrement mécanisée. Il y a donc une pression forte pour à présent mécaniser leur usages conventionnels et en faire des machines complètes. Par analogie, nous devrions nous attendre à observer 4 bouleversements :

1. La transition du livre outil au livre machine intégrant sa propre interactivité.
2. L’agrégation de tous le livres-machines en l’équivalent d’un seul grand livre.
3. L’évolution du livre comme document stable en un document dépendant du temps.
4. L’arrivée d’un nouveau modèle commercial où  l’usage des livres aura plus de valeur d’échange que les livres eux-mêmes.

Certes un livre n’est pas vraiment comme une carte. Une carte est une représentation régulée de dimension 2. Un livre est un volume, une conteneur, une représentation régulée de dimension 3. Le livre peut accueillir des représentations de dimensions 2 : texte mise en page, cartes, diagramme, arbres, tables, etc. Parce qu’il est un volume fermé, le livre offre une solution pour organiser un discours dans l’espace. Il a une fonction “architecturante” permettant d’accueillir les narrations riches et les démonstrations complexes.

Chaque genre de livres est associé à des règles de structuration conventionnelles. La première mécanisation du livre commençant avec l’imprimerie a transformé ces règles en mécanismes. L’informatisation n’a fait que prolonger cette mécanisation en permettant une gestion souple de ces modèles structurels. En principe, la seconde étape du processus de mécanisation, la transformation des usages en mécanismes, devraient donner encore plus de pouvoir à l’auteur-architecte.

Mais comme les cartes, en devenant machines, les livres tendent à s’agréger en un seul grand livre, perpétuellement remanié. Ce grand livre-machine n’est rien d’autre que l’Encyclopédie. Depuis le XVIIIe siècle, l’Encyclopédie et le Livre sont porteurs de valeurs opposées. Le livre se définit par sa clôture, l’Encyclopédie est toujours en expansion. Le Livre se prête aux parcours linéaire, l’Encyclopédie suit une logique d’accès aléatoire. Fonction architecturante contre fonction totalisante, le Livre structure un discours quand l’Encyclopedie essaie d’englober le monde. Le Livre compose quand l’Encyclopédie décompose.

Dès ses premières incarnations éditoriale, L’Encyclopédie s’est trouvée à l’étroit sous forme de volumes imprimés. Dès qu’elle l’a pu l’encyclopédisme s’est incarné dans les technologies du réseau. L’ordinateur mondial qui s’est constitué avec le web est basé sur les principes et les motivations de l’encyclopédisme. Son action de description/décomposition s’est appliquée à l’ensemble de la culture.

L’Encyclopédie décompose tous les objets structurés. Elle extrait leur “contenu” et en fait un réseau. Les albums sont devenus des ensembles de chansons. Les journaux des ensembles d’articles. Elle fera des livres la même chose : une collection de pages, une collection de mots.

Les trois futurs des livres-machines

Percevant cette dynamique globale, nous pouvons voir se dessiner trois futurs pour les livres-machines

A. Les livres deviennent des ressources standardisées dans le système encyclopédique global

B. Les livres se réinventent sous la forme d’applications fermées et immersives

C. Après les écrans, les livres papiers deviennent des interfaces structurantes pour accéder à l’ordinateur planétaire.

A. L’Encyclopédie

Ce scénario correspond à la tendance dominante. Les livre sont déjà en train de devenir des ressources standardisées. Cette standardisation opère sur trois niveaux

- Des formats standards pour décrire le contenu d’un livre se mettent en place : ePub, TEI. A partir de ces descriptions standardisées, il est possible de produire plusieurs mises en pages selon les interfaces de lecture utilisées.

- La décomposition se poursuit au plan sémantique. Les textes et les images utilisées peuvent elles aussi être associés à “noeuds sémantiques” bien définis (des lieux bien définis, des personnes bien définies, des citations bien définies). Ces noeuds sémantiques servent de pivots entre les livres standardisés. D’autres types de modélisations plus ou moins sophistiquées sont également tentées, l’objectif étant d’accumuler du capital sémantique.

- La décomposition se poursuit en incluant l’usage des livres. De nouveaux formats ouverts sont aujourd’hui à l’étude pour décrire les chemins de lecture, les notes, les prêts de livres entre lecteurs. Toute la trajectoire de vie d’un livre standardisé va elle-même être décrite de manière standard. Ces “reading analytics” vont sans doute constituer un minerai de valeur exploitable économiquement.

Cette standardisation sur trois niveaux est couplée à une “digitalisation” massive. Le terme “digitalisation” décrit en fait une extraction et standardisation du contenu de millions de livres. Ces livres deviennent des données d’une immense base de données qui intègre également de nombreuses autres informations sur nos pratiques de lecteur et plus généralement sur nos vies.
L’absorption du Livre par l’Encyclopédie inaugure l’âge des lectures industrielles, pour reprendre le terme d’Alain Giffard.

B. Les applications

Alternative à l’encyclopédisme, les applications retrouvent la forme close des livres qui en faisait des îles, des réservoirs d’innovation. Les applications offrent plus de contrôles à leurs concepteurs, permettent l’utilisation des dernières ressources techniques (multitouch, GPS, accéléromètre), permettent des utilisations non connectées, peuvent inclure des vidéos, des simulations, des jeux et sont encore peu standardisées.

Les applications sont des conteneurs qui peuvent inclure des médias de dimensions 4. Elles peuvent offrir des services similaires à celles d’un site mais sont animées par une logique différente : fermeture et contrôle, la logique du livre.

Beaucoup critiquent leur fermeture en argumentant sur les bases de l’idéologie de l’Encyclopédie: ouverture, échange, partage. En l’absence de standard, le contenu des applications pourrait être difficile à lire dans quelques années.  Mais protégées par leur carapace, les applications permettent véritablement d’explorer la seconde phase de mécanisation du livre, les différentes manières dont le livre peut internaliser ses propres interactions. Les auteurs et les éditeurs peuvent concevoir de manière beaucoup plus précise l’expérience qu’ils souhaitent offrir à leurs lecteurs : des livres de cours plus pédagogiques, des romans plus immersifs, des guides voyages plus contextuels, des magazines plus divertissants, des articles plus érudits…  mais aussi des types de livres complètement nouveaux … des livres qui changent selon le moment et l’endroit où on les lit, des livres qui apprennent au fur et à mesure qu’ils sont lus et tous les autres possibles qu’offrent les livres algorithmiques.

Malheureusement, les nouveaux contenus peuvent être longs et difficiles à produire, ne fonctionner que sur les machines les plus récentes. Les éditeurs n’ont pas les budgets pour se lancer dans des créations ambitieuses. Comme ce fut le cas avec le CD-rom, ces obstacles  pourraient mettre en péril cette lignée dans l’évolution du livre.

C. Le papier comme interface

Il y une troisième voies qu’explore actuellement des artistes-ingénieurs comme Etienne Mineur ou des chercheurs dans le cadre des premières recherches sur le Paper Computing. Le papier et livre sont des interfaces extraordinaires qui peuvent maintenant être utilisées pour contrôler avec précision n’importe quel système informatique. Ils constituent peut-être l’avenir de nos écrans tactiles. Un livre relié permet d’organiser une séquence d’activités dans le temps et l’espace. Loin d’un recul, ce serait le retour de la fonction “architecturante” et des qualités ergonomiques du codex.

Dans cette approche, non seulement le livre papier ne va pas disparaître, mais il pourrait bien devenir une interface privilégiée pour d’autres activités que la lecture. Demain, nous pourrons choisir notre musique grâce à des livres, programmer notre télévision grâce à des livres, obtenir des informations sur Internet grâce à des livres. Un des avenir du livre papier pourrait donc être de devenir une interface efficace, bon marché, facile à produire et durable pour le monde numérique.

Ceux qui croient que l’avenir du livre passe nécessairement par les écrans font probablement un rapprochement trop rapide avec l’évolution récente du monde de la musique. Certes, nous assistons aujourd’hui à la constitution de très grandes bibliothèques de livres numérisés qui font penser aux « bibliothèques musicales » qui sont aujourd’hui très répandues. Mais la mort programmée du CD, support « classique » de la musique il y a encore quelques années, et l’avènement des baladeurs numériques, n’annoncent pas forcément par une analogie simpliste, la mort du livre et l’avènement des “liseuses”. Que le CD disparaisse à plus ou moins brève échéance n’a aucune importance : c’est un objet aujourd’hui dépassé, qui n’a pas d’existence autre que de se faire lire par une machine. Au contraire du CD, le livre est un objet-interface qui dispose d’un grand nombre d’atouts. Autonome et léger, il offre des possibilités interactives très intéressantes. Par exemple, nous sommes capables en quelques dizaines de secondes de retrouver un mot dans un dictionnaire parmi des dizaines de milliers. Difficile, sans clavier, de retrouver un morceau sur votre balladeur avec une bibliothèque de cette taille. De même, nous pouvons parcourir rapidement la structure d’un livre pour acquérir une première idée, superficielle certes mais tout de même précieuse, de ce qu’il contient. Impossible de faire de même avec les fichiers de son ordinateur personnel. Ces atouts permettent de penser que le livre, en tant qu’interface, a encore de beaux jours devant lui et qu’il est probablement même capable d’investir de nouveaux territoires pour le moment dominés par les interfaces électroniques — clavier et souris et interaction tactiles qui sont aujourd’hui nos modes d’accès par défaut vers les informations numérisées.

Nuançons néanmoins cet enthousiasme en rappelant que cette approche est aujourd’hui essentiellement encore du domaine de la recherche et de l’expérimentation, quand parallèlement le processus de transformation des livres en une immense encyclopédie mondiale tourne à plein régime, supposant, à tord ou à raison, que les pages des livres se liront préférentiellement sous la forme d’images derrières des vitres.

Prédictions faciles

Voici donc esquissés trois futurs des livres-machines. Est-ce que c’est trois systèmes industriels cohabiteront ? Tentons quelques prédictions faciles. Les publications les plus proches de la logique de l’Encyclopédie seront les premiers entièrement machinisés, intégrant l’ordinateur planétaire. Cela concerne typiquement les Encyclopédies, dictionnaires, publications scientifiques, livres de cuisines, guides de voyages … Les publications les plus lointaines de la logique de l’Encyclopédie resteront sous format papier, augmenté ou non, et exploreront en parallèle les machinisations sous forme d’applications. Nous pensons ici surtout aux livres pour enfants et aux romans.

Certains éditeurs vont réaliser qu’ils ne publient pas simplement des livres ou des magazines mais qu’ils gèrent en fait des corpus encyclopédiques. Ils vont les exploiter numériquement en explorant de nouveaux modèles commerciaux, sans doute à terme basé sur la gratuité. D’autres se spécialiseront dans une industrie multimédia de qualité, assez proche dans sa logique économique du monde du cinéma, mêlant potentiellement papier et digital. Ce seront probablement eux les véritables explorateurs des nouvelles potentialités du livre devenu machine.


Stephen Wolfram contre Larry Page, c’est Leibniz contre d’Alembert

janvier 31, 2012

Le renouveau de la logotechnie leibnizienne

Depuis plusieurs années, Stephen Wolfram, l’inventeur de Mathematica, poursuit un ambitieux objectif : transformer nos connaissances aujourd’hui exprimées maladroitement de manière linguistique en des représentations algorithmiques, directement traitables par un ordinateur. L’équipe progresse toujours un peu plus dans la construction de cet immense chantier. Des pans entiers de nos connaissances scientifiques mais aussi de nombreux faits culturels alimentent maintenant une base de connaissances structurées sur laquelle il est possible de faire des inférences. Wolfram Alpha peut maintenant répondre à de nombreux types de questions comme la taille actuelle de l’Internet, la limite de x / sin (x) quand x tend vers 0, mais aussi l’âge qu’aurait Lady Gaga en 2028.

Le projet de Wolfram s’inscrit dans une longue tradition en intelligence artificielle et dans une tendance technologique forte. Dans les années 1980s, Douglas Lenat avec le projet Cyc tentait de construire une encyclopédie du sens commun sous forme de descriptions traitables par une machine. Au Canada, Pierre Levy travaille depuis de nombreuses années à un métalangue IEML dont l’ambition est de fournir un système de coordonnées “mathématico-linguistique” pour la construction collaborative d’un “Hypercortex”. Ces projets proposent des approches technologiques relativement différentes les uns des autres pour tenter de construire ce que l’on pourra appeler un capital sémantique (je reviendrai sur cette notion dans un prochain billet), mais tous partagent plus ou moins le même rêve : construire une langue technique dont le cœur serait une sémantique computationelle.

La langue algébrique universelle de Leibniz

Dans un billet de 2009, Stephan Wolfram présentait l’essence de son projet Wolfram Alpha comme étant précisément une tentative de “rendre la connaissance computable” pour contourner le problème quasiment insoluble de l’analyse du langage naturel.  Dans son livre de 2011, la sphère sémantique, Pierre Levy parle d’une “écriture permettant la maîtrise intellectuelle des flux d’information”. Ce renouveau des projet de construction d’une langue technique nouvelle, créée artificiellement par l’homme pour permettre l’inférence sémantique automatique ressemble à s’y m’éprendre au projet logotechnique de Leibniz au XVIIe siècle. Leibniz voulait lui aussi construire une langue universelle et scientifique.

“après avoir fait cela, lorsqu’il surgira des controverses, il n’y aura plus besoin de discussion entre deux philosophes qu’il n’y en a entre deux calculateurs. Il suffira, en effet, qu’ils prennent leur plume, qu’ils s’assoient à une table, et qu’il se disent réciproquement (après avoir appelé, s’ils le souhaitent, un ami) : calculons” (cité dans Gerhardt, 1875 Die philosophischen Schriften von G.W. Leibniz)

Calculons ! Un algorithme efficace peut remplacer les préceptes de la méthode cartésienne. Nous n’avons pas besoin de méthodes pour penser, nous avons besoin d’algorithmes et d’une langue symbolique adaptée. Leibniz développe cette même idée d’une sémiologie générale dans cette lettre du 10 Janvier 1714

“Ce pourrait être en même temps une manière de langue ou d’écriture universelle, mais infiniment différente de toutes celles qu’on a projetées jusqu’ici, car les caractères et les paroles même y dirigeraient la raison, et les erreurs (excepté celles de fait) n’y seraient que des erreurs de calcul”

Leibniz est en avance sur Boole de plusieurs siècles. Dans le passage suivant, il décrit très précisément les avantages de cette langue algébrique capable de manipuler aveuglement des symboles pour faire des raisonnements justes, sans pour autant avoir à préciser à quoi ces symboles sont attachés.

“Les langues ordinaires, bien qu’elles servent au raisonnement, sont cependant sujettes à d’innombrables équivoques, et ne peuvent être employées pour le calcul, c’est-à-dire de façon à ce que l’on puisse découvrir les erreurs de raisonnement en remontant à la formation et à la construction des mots, comme s’il s’agissait de solécismes ou de barbarismes. Cet avantage très admirable n’est donné pour le moment que par les signes employés par les arithméticiens et les algébristes, chez lesquels tout raisonnement consiste dans l’utilisation de caractères, et toute erreur mentale est la même chose qu’une erreur de calcul. En méditant profondément sur cet argument, il m’est apparu aussitôt clair que toutes les pensées humaines pouvaient se transformer entièrement en quelques pensées qu’il fallait considérer comme primitives. Si ensuite l’on assigne à ces dernières des caractères, on peut former, à partir de là, les caractères des notions dérivées, d’où il est toujours possible d’extraire leurs réquisits et les notions primitives qui y entrent, pour dire la chose en un mot, les définitions et les valeurs, et donc aussi leurs modifications que l’on peut faire dériver des définitions.” (Die scientia universali seu calculo philosophico in Gerhardt, 1875 Die philosophischen Schriften von G.W. Leibniz)

L’intuition de Leibniz se base sur ses propres succès. Il explique que les progrès qu’il a fait faire aux mathématiques, le calcul infinitésimal en particulier, sont fondés sur sa réussite à trouver des symboles adaptés pour représenter les quantités et leur relations. C’est sans doute de là que lui vient l’intuition que pour découvrir de nouvelle vérité, il faut mécaniser l’inférence (la base du calcul formel tel qu’il est pratiqué dans Mathematica).

Allons-nous  vers la réalisation du langage algébrique rêvé par Leibniz ? Comme nous l’avons vu, certains projets prennent véritablement cette direction.

Dans l’avant dernier chapitre de “la recherche de la langue parfaite”, Umberto Eco nous met néanmoins en garde :

“C’est précisément lorsque l’on revisite d’anciens projets qui se sont montrés utopiques et qui ont échoué, que l’on peut prévoir les limites ou les faillites possibles de chaque entreprise qui prétend être un début dans le vide. Relire ce qu’on fait nos ancêtres n’est pas un simple divertissement archéologique, mais une précaution immunologique”.

La langue algébrique sémantique universelle est-elle une utopie ? ou fallait-il juste attendre trois cents ans pour la voir enfin éclore ?

A-t-on besoin de modèles sémantiques sophistiqués ?

Certains ne croient pas à cette voie et pensent que nous n’avons pas vraiment besoin de modèles sémantiques sophistiqués pour organiser la connaissance du monde. Grâce à l’océan de données que nous avons à notre disposition, des méthodes moins “intelligentes” peuvent parfois se révéler plus efficaces.

Dans un éditorial un peu provoquant de juin 2008, Chris Anderson affirmait que nous n’avons tout simplement plus besoin de modèles et faisait de Google le contre-exemple à opposer aux approches logotechniques.

Google’s founding philosophy is that we don’t know why this page is better than that one: If the statistics of incoming links say it is, that’s good enough. No semantic or causal analysis is required. That’s why Google can translate languages without actually “knowing” them (given equal corpus data, Google can translate Klingon into Farsi as easily as it can translate French into German). And why it can match ads to content without any knowledge or assumptions about the ads or the content.

Un peu plus bas, il cite Peter Norvig, directeur de recherche chez Google : “All models are wrong, and increasingly you can succeed without them.”

Il n’y a pas que Google qui s’inscrit dans cette philosophie. En 2011, Watson, l’ordinateur d’IBM est devenu champion de Jeopardy. Il a battu les meilleurs joueurs mondiaux pour répondre à des questions de culture générale, un domaine dont on pourrait facilement argumenter qu’elle est pour une machine bien plus difficile que les échecs.  Même si Watson utilise une version de Wikipedia codée sémantiquement (DBPedia), ainsi que les bases lexicales et sémantiques WordNet et Yago, la philosophie sous-jacente relève plus du recoupement statistique de multiples sources que d’une langue algébrique rigoureuse comme en rêvait Leibniz. David Ferruci qui a dirigé le projet est relativement explicite sur ce point :

There’s no single formula that makes a computer understand and answer natural language questions. It’s really this huge combination of smaller algorithms that look at the data from many different perspectives, and they consider all sorts of possibilities and all sorts of evidence. Watson brings all these various algorithms together to judge that evidence with respect to every one of its possibly hundreds or thousands of different answers to decide which one is most likely the correct answer, and ultimately computes a confidence in that. And if that confidence is above a threshold, then Watson says, “Hey I want to answer this question. I want to buzz in and take the risk. (IBM’s Watson computer takes the Jeopardy! challenge)

Paradoxalement, cette posture n’est pas si loin de celle des encyclopédistes à la fin du XVIIIe siècles. La langue universelle est alors perçue comme un vieux rêve de l’âge classique. D’Alembert  ne croit plus à l’existence d’un système de représentations  générales de la pensée. L’Encyclopédie n’est pas une magnifique construction mathématique, c’est un labyrinthe. Chaque article est une carte particulière, un point de vue sur le monde. Il n’y a pas de système de coordonnées globales, il y a une infini variété de perspectives.

“On peut imaginer autant de systèmes différents de la connaissance humaine, que de Mappemondes de différentes projections” (Encyclopédie, Discours préliminaire, p. XV)

Pour être capable de décrire méthodiquement tous les savoirs du monde, d’Alembert refuse pragmatiquement l’aveugle et parfaite mécanique des langues algébriques. L’Encyclopédie revient au texte et à l’image comme sources premières et immédiates de connaissance. Sur ces bases, il construit un réseau, avec embranchements multiples. En fait, il invente l’approche philosophique du web.

Aujourd’hui, en ce début de XXIe siècle, deux conceptions s’affrontent, l’une héritière du rêve mathématique de l’âge classique, l’autre de l’encyclopedisme des Lumières. Wolfram contre Page, c’est Leibniz contre d’Alembert. L’enjeu de ce combat philosophico-technique n’est rien moins qu’une certain vision de ce qu’est la connaissance du monde.


Pourquoi la narration interactive est-elle si délicate ?

janvier 23, 2012

Le 4 avril dernier,  j’ai eu la chance de participer à un débat à Lausanne avec Marie-Laure Ryan. Pour préparer cette rencontre j’ai lu deux de ses livres (Narrative as Virtual Reality et Avatars of Story),  excellents tous les deux. J’ai aussi assisté à l’un de ses cours sur les jeux narratifs et les histoires ludiques… J’ai retrouvé mes notes ce week-end et j’essaie dans ce billet de reconstruire partiellement son propos.

Pourquoi la narration interactive est-elle si délicate ? Comment se fait-il que, malgré les progrès symétriques de l’intelligence artificielle et de la narratologie,  la plupart des histoires dont nous sommes les héros restent encore bien fades par rapport à l’immersion que provoque un bon roman ou un bon film ? Comment se fait-il que nous ne parvenons pas encore à maîtriser ce genre hybride à la croisée du jeu et du récit ? Cet aveu d’impuissance est partagé.  Brenda Laurel dans Computer as Theater  compare la narration interactive à la “Licorne”, celle qu’on ne peut jamais capturer. Lev Manovich dans le langage des nouveaux médias, parle de la narration interactive comme du “Saint Graal“. Où se cache la subtile difficulté dans le mariage de ces deux genres ?

Jeux et histoires ont tant de choses en commun

Lire des histoires. Jouer à des jeux. Deux formes majeures et ancestrales de divertissements qui partagent de nombreux traits communs. Jeux et histoires mettent en scène des événements qui appartiennent à des mondes séparés.

Dans les pages d’un roman, je peux pleurer en découvrant le destin tragique d’une héroïne. Mais paradoxalement ces pleurs ne sont pas du chagrin, ils font même partie du plaisir de la lecture.

De la même manière, nous pouvons et aimons être ennemis dans un jeu mais amis dans la vie. C’est le cercle magique de Johan Huizinga, celui que nous franchissons quand nous acceptons les règles d’un jeu.  Un cercle qui s’applique aussi dans une certaine mesure au monde de la lecture. Dans les fictions, comme dans beaucoup de jeux, il s’agit de suspendre son jugement, d’accepter des règles du  “faire semblant”. L’auteur fait semblant d’être le narrateur. Nous faisons semblant de croire aux histoires qu’il nous raconte. Lire et jouer c’est goûter au plaisir d’univers parallèles régis par des lois qui leur sont propres.

La dimension narrative des jeux

Une grande partie de l’intérêt des jeux vient de la dimension narrative qui leur est associée. Les jeux ne sont rarement de purs plaisirs mathématiques. Peu de jeux sont intéressants en tant que tels. Prenons le jeux de l’oie. Les règles sont simples. La progression des joueurs est entièrement déterminée par le hasard. L’intérêt ne vient que par le drame des chutes, les revirement de situations suprenants. L’enjeu est ici essentiellement narratif. Un joueur en retard peut encore gagner. Au contraire, un jeu où le joueur qui prendrait de l’avance finirait presque à coup sur la course en tête n’aurait sans doute qu’un faible intéret narratif. Il serait aussi inintéressant qu’un film, où le héros ne ferait que progresser sans jamais chuter.

De la même manière,  si un match de football peut parfois être plus palpitant qu’un film, c’est parce que les règles du football sont construites pour optimiser l’enjeu narratif. De spectaculaires retournement de situations sont possibles. Les match de foots sont de bonnes histoires avant d’être des démonstrations de virtuosité sportive.

Les difficultés de la narration interactive

Ces similarités frappantes entre les univers fictionnels et ludiques devraient naturellement conduire à des rapprochements : des jeux narratifs, des historiques ludiques. Pourtant, l’exploration de ces hybrides conduit souvent à des difficultés. Le mariage des jeux et des fictions n’est pas aussi naturel qu’on pourrait le penser.

Quelle est la difficulté ? Dans une narration interactive, l’auteur essaie de contrôler la direction de l’intrigue de manière à lui donner une structure bien formée mais, dans le même temps, le joueur/lecteur reclame la liberté de réagir sans être explicitement contrôlé par l’auteur. La narration interactive est donc structurée par deux forces opposées, dont le juste équilibre est très difficile à trouver.

La narration interactive poursuit un double objectif esthétique. Il s’agit d’une part d’obtenir une histoire émergente où chaque récit est potentiellement unique et d’autre part de proposer une expérience immersive au lecteur/joueur qualitativement différente de celle qu’il peut trouver dans les fictions. La question de d’immersion est complexe dans la mesure où elle peut soit être ludique (absorption dans l’accomplissement d’une tâche, la concentration du joueur d’échec) ou narrative (engagement de l’imagination dans la contemplation d’un monde narratif). Cette immersion prend dans les deux cas des formes spatiales, temporelles (suspens) et émotionnelle (pleurer, rire).

Quand on pose le problème de cette manière, il devient clair que celle certaines formes de récits et de jeux peuvent être adapté à ce type de narration.

Les formes majeures de la narration interactive

Le genre le plus facile à adapter en narration interactive est l’épopée. Elle met en scène une intrigue typique des traditions culturelles orales, souvent centrée sur les action d’un héros solitaire, comme Gilgamesh ou Ulysse. L’épopée propose un mode narratif infiniment prolongeable dans la mesure où les relations entre les personnages n’évoluent presque pas. Ces avantages structuraux expliquent que la plus grande partie des jeux vidéos soit basés sur une intrigue épique. Les actions du héros sont des actes physiques faciles à simuler. Le scénario de base peut se répéter indéfiniment. La nature solitaire de la quête simplifie les relations entre les personnages. Le thème du voyage donne lieu à variations de décors visuellement attrayante.

Juste derrière l’épopée, l’intrigue épistémique, centrée sur le désir de résoudre un mystère, est aussi un genre relativement bien adapté la narration interactive. Il s’agit dans ce genre d’organiser deux narrations : celle des événements de l’intrigue et celle de l’histoire des investigations, le meurtre et l’enquête. Ces deux narrations peuvent typiquement correspondre  aux forces contraires qu’il s’agit d’équilibrer dans toute narration interactive : l’élément prédéterminé et l’élément libre. Le joueur mène l’enquête au sujet d’une histoire en partie indépendante de ses propres actes. L’immersion spatiale et temporelle est également facilitée par ce type de narration. Par exemple, dans un jeu vidéo, l’intrigue épistémique peut prendre la forme de la recherche d’indices visuels. L’enquêteur est plongé dans l’univers graphique de l’histoire. Symétriquement, les éléments prédéterminés de la narration organisent implicitement une immersion temporelle. L’enquêteur est plongé dans une trame temporelle dont il n’a pas le contrôle total.

Au contraire, l’intrigue dramatique classique, celle à l’œuvre aussi bien dans Phèdre quand la plupart des récits contemporains, est beaucoup plus difficile à adapter dans la mesure où elle concerne essentiellement l’évolution d’un réseau de relations humaines. C’est une forme close basée sur un arc narratif qui passe typiquement par des phases d’exposition, de crise et de résolution. Le récit converge vers son dénouement.  Il est difficile de trouver un rôle pour le joueur dans ce type de mécanique narrative. Une approche consiste à confier au joueur un des personnages et de laisser la machine contrôler les autres selon une logique qui leur serait propre. Mais l’explosion combinatoire menace. Le risque est surtout de briser l’arc narratif en l’ouvrant. Comment garantir que l’histoire sera toujours intéressante ? L’exemple classique de ce type d’exploration est Façade, un drame interactif en un acte. Mais peu d’autres projets ont suivi.

Peut-on considérer les jeux en ligne multijoueurs comme d’immense narrations interactives ? Leur monde est en effet riche en légendes.  Ils proposent des “quêtes” qui sont autant de mini-histoires. Chaque groupe de joueurs peut vivre sa propre épopée. Mais pour des raisons pratiques, les “quêtes” n’ont aucun effet durable. Le dragon ressuscite pour être prêt à périr de nouveau sous les coups d’autres aventuriers. Ces mécanismes sont fondamentalement anti-narratifs et au delà du plaisir répétitif de l’”épopée” ils ne semblent pas offrir la base pour des narrations d’une certaine ampleur.

Que sont les Sims en terme de narration interactive ? Alfred Hitchcock disait que “le drame est une vie à laquelle on a supprimé les moments ennuyeux” (F. Truffaud, Le cinéma selon Hitchcock, Paris, Ramsay, 1983). D’une certaines manière, les Sims proposent exactement l’inverse. Les Sims c’est la vie avec les moments dramatiques supprimés. Si le jeu a eu le succès que l’on connaît c’est peut-être précisément parce que la part des relations interpersonnelles y a été réduit à un minimum caricatural. Chris Crawford était plutôt sévère sur ce point.

The Sims isn’t about people, it’s a housekeeping sim. It’s consumerism plus housekeeping. It works, it’s certainly better than shooting, and that’s its success. But interpersonal interaction is not about going to the bathroom. It’s much much more. The Sims is ultimately a cold game. The interactions people have, have a really mechanistic feel. (The Guardian, Feb 2005)

Aucune de ces productions ne semble donc s’approcher du “Saint Graal” : une narration interactive aussi passionnante qu’un bon roman, un bon film ou une bonne série télévisée. Les meilleurs jeux dans ce domaine restent avant tout des jeux. Les histoires émergentes que construisent leurs joueurs ne parviennent pas à passer le cap du simple divertissement récréatif. Mais au fond est-ce que cette quête du Graal a vraiment un sens ? Ne faut-il pas admettre que jeux et récits sont des formes radicalement différentes ? Ou est-ce simplement une question de temps et de persévérance ? Un jour, peut-être, nous aurons tellement  progressé dans notre compréhension fine de ce qu’est une bonne histoire que nous serons capables de construire à la volée des narrations interactives très supérieures aux productions actuelles. Seul le temps le dira …


L’improbable résurrection d’HTML

janvier 18, 2012

HTML n’aurait pas du survivre au 21ème siècle. Dès 1998, les puissants de l’Internet voulaient laisser mourir cette langue préhistorique et ils avaient des arguments de poids. Pour le World Wide Web Consortium (W3C), le futur langage du web serait une modernisation d’XHTML, une langue claire, précise et sans ambiguïté. Mais dans un recoin du cyberspace, un groupe de rebelles croyait encore au vieux langage des débuts du web. Contre l’avis des sages, ils continuèrent à l’améliorer. Voici l’histoire d’HTML5, avant qu’Hollywood ne l’adapte en film

La standardisation du web et des contenus de l’Internet (livres, films, images, etc.) est un des enjeux centraux pour le futur de la culture. Nombreux sont ceux qui défendent coûte que coûte les standards, les présentant comme les nécessaires garants de l’interopérabilité et la pérennité des données. Sans standardisation point de salut. Le combat rhétorique et technique autour l’ePub s’inscrit dans ce débat. Mais de ce point de vue l’histoire d’HTML5 est riche d’enseignements.

Prenez un navigateur des plus récents, Chrome ou Firefox par exemple. Tentez de charger une des toutes premières pages de web qui, par oubli ou coquetterie, serait restée identique à ce qu’elle était à l’époque. Miracle ! Ça marche. Pourtant ni Chrome, ni Firebox n’existaient quand cette page a été écrite. Les premières règles d’écriture, simples et flexibles, d’HTML ont traversé le temps et les modes. Une telle compatibilité dans le temps est suffisamment rare dans le monde de la technologie pour être soulignée. Les choses auraient d’ailleurs pu tourner très différemment.

Acte I : HTML face au processus de standardisation
A la fin des années 1990, HTML était fortement critiqué. En plus d’être vieux, il n’était pas un “beau” langage. Sa syntaxe n’était pas vraiment stricte. Le problème venait du fait que certaines expressions mal formées étaient malgré tout comprises par les navigateurs. HTML était comme une langue orale et vivante, tolérante aux fautes de grammaire, ouverte à de nouvelles conventions. Mais ce manque de rigueur était devenu intolérable pour certains informaticiens. Le web était maintenant quelque chose de sérieux. Comme dans toute industrie qui se respecte, il lui fallait de vrais standards. Ainsi naquit XHMTL 1.0, un langage XML qui reprenait les conventions d’HTML mais qui en faisaient des règles strictes, validables automatiquement. Grâce à XHMTL, un éditeur de page web comme Dreamweaver pouvait avertir le programmeur imprudent s’il s’écartait de la juste syntaxe. XHTML permettait de garantir qu’une page serait correctement interprétée par tous les navigateurs qui implémentaient le nouveau langage. Les développeurs professionnels applaudirent. C’était fini le temps du grand “n’importe quoi”. Les choses sérieuses allaient pouvoir commencer.

Au départ, ce fut un succès. XHTML devint le standard des programmeurs web sérieux. Mais les moins sérieux découvrirent vite une chose que les sages du W3C auraient aimé cacher. En pratique, la plupart des navigateurs acceptaient aussi les syntaxes qui ne suivaient pas strictement les règles de XHTML. Ils connaissaient la loi mais ne faisaient pas la police. En fait, vous pouviez garder vos vielles et mauvaises habitude de programmation HTML, tout marchait nickel ! Voilà qui était embêtant pour les défenseurs de la rigueur.

Les sages du W3C décidèrent de durcir le ton et proposèrent XHTML 2, une version plus rigoureuse et moins tolérante. Dans cette seconde version, ils remirent en cause les premières bases d’HTML (ex: les balises <h1>,<h2> … ) pour proposer de meilleures solutions plus élégantes et efficaces (ex : une unique balise <h> dont la signification change selon sa position dans l’arbre constitué par une page). Magnifique… seul souci, il fallait que tout le monde réapprenne à écrire des pages web convenables, mais il fallait aussi réadapter toutes les pages existantes.

Acte 2 : HTML résiste et prouve sa vigueur comme langue vivante 

En 2004, alors que le processus de standardisation battait son plein, un groupe de programmeurs prit un point de vue opposé. Plutôt que de s’attarder sur la pureté du langage, ils s’attaquèrent à compléter les pièces manquantes du puzzle technique que représente une application web. Plutôt que d’inventer le langage qui devrait remplacer HTML, ils travaillèrent à étendre, progressivement, par ajouts successifs, les capacités du vieux langage. Leur philosophie était “construisons ce dont nous avons besoin, les standards suivront”.

En 2007, le vent avait tourné.  L’enthousiasme de la communauté était maintenant du côté des travaux de ces rebelles, pragmatiques et respectueux du passé. Revirement rarissime, le W3C décida finalement de ne plus soutenir XHTML 2 et de commencer à formaliser un nouveau standard HTML5. Sauf qu’HTML5 n’était pas un langage unifié mais une collection d’outils, de conventions et librairies.  Personne ne s’accordait d’ailleurs sur ce que l’on devait exactement  inclure dans HTML5.

La tentative de standardisation d’HTML5 n’empêcha pas les rebelles de continuer à faire progresser le langage selon leur philosophie. Pour éviter la confusion, ils affirmèrent qu’ils ne travaillait plus sur HTML5, mais tout simple sur HTML, une langue vivante qui comme toute langue vivante ne peut cesser d’évoluer de changer, toujours en avance sur le dictionnaire des académiciens.

L’histoire d’HTML est celle de la victoire de la pratique sur la règle. Selon cette philosophie de l’innovation, jamais une page HTML ne sera déclarée obsolète. Jamais un page HTML ne sera forcée de contenir un numéro de version. Jamais les développeurs web ne devront remettre à jour leur anciennes pages. Jamais HTML ne devra attendre une nouvelle version pour inclure des innovations. Les fonctionnalités d’HTML les plus récentes ne seront peut-être pas “supportées” dans un premier temps par tous les navigateurs mais si elles sont vraiment pertinentes et intéressantes, les navigateurs s’adapteront et les standards finiront par les officialiser.

La victoire d’HTML sur les processus standardisation conduit à une philosophie de l’innovation inédite dans l’écosystème si complexe de l’ordinateur planétaire. Quelques principes de base. Ne casser pas l’existant. Laisser les utilisateurs explorer les meilleures routes et bétonner ensuite les plus empruntées. Préférer toujours les solutions pratiques aux solutions belles. A méditer …

Ceux qui veulent en savoir plus sur HTML5 et son histoire pourront consulter l’excellent “Missing Manual” de M. MacDonald, dans lequel j’ai largement puisé pour écrire ce billet.


Quand les mots valent de l’or

janvier 17, 2012

A l’automne dernier, suite à un billet sur ce blog, le Monde diplomatique m’a contacté pour me demander de développer mes idées sur le capitalisme linguistique dans un article plus long. L’article est paru en dernière page dans l’édition de novembre, il a ensuite était traduit dans de nombreuses langues, par exemple en espagnol (“Palabras que valen oro“), en brésilien (“Quandos as palavras valem ouro“), en italien (“Quando le parole valgono oro”), etc. Puis il y a eu des réactions multilingues diverses sur les blogs. Réjouissantes réactions multiculturelles pour un article qui traite précisément du juteux marché des langues vivantes.

L’histoire de Google tient en deux algorithmes : l’un l’a rendu populaire, l’autre l’a rendu riche. La première de ces méthodes, élaborée par Larry Page et Sergey Brin alors qu’ils étaient encore étudiants en thèse à l’université Stanford (Californie), consistait en une nouvelle définition de la pertinence d’une page Web en réponse à une requête donnée. En 1998, les moteurs de recherche étaient certes déjà capables de répertorier les pages contenant le ou les mots demandés. Mais le classement se faisait souvent de façon naïve, en comptabilisant le nombre d’occurrences de l’expression cherchée. Au fur et à mesure que le Web grandissait, les résultats proposés aux internautes étaient de plus en plus confus. Les fondateurs de Google proposèrent de calculer la pertinence de chaque page à partir du nombre de liens hypertexte pointant vers elle – un principe inspiré de celui qui assure depuis longtemps la reconnaissance des articles académiques. Plus le Web grandissait, plus l’algorithme de Page et Brin affinait la précision de ses classements. Cette intuition fondamentale permit à Google de devenir, dès le début des années 2000, la première porte d’entrée du Web.

Alors que bien des observateurs se demandaient comment la société californienne pourrait bien monétiser ses services, c’est l’invention d’un second algorithme qui a fait d’elle l’une des entreprises les plus riches du monde. A l’occasion de chaque recherche d’internaute, Google propose en effet plusieurs liens, associés à des courtes publicités textuelles, vers des sites d’entreprises. Ces annonces sont présentées avant les résultats de la recherche proprement dits. Les annonceurs peuvent choisir les expressions ou mots-clés auxquels ils souhaiteraient voir associée leur publicité ; par exemple, les recherches contenant le mot « vacances ». Ils ne paient que lorsqu’un internaute clique effectivement sur le lien proposé pour accéder à leur site. Afin de choisir quelles publicités afficher pour une requête donnée, l’algorithme propose un système d’enchères en quatre étapes :

- L’enchère sur un mot-clé. Une entreprise choisit un mot ou une expression, par exemple « vacances », et définit le prix maximum qu’elle serait prête à payer si un internaute arrive chez elle par ce biais. Pour aider les acheteurs de mots, Google fournit une estimation du montant de l’enchère à proposer pour avoir de bonnes chances de figurer sur la première page de résultats. Les acheteurs peuvent limiter leur publicité à des dates ou des lieux spécifiques. Mais attention : comme on va le voir, le fait d’avoir l’enchère la plus haute ne garantit pas que vous serez le premier sur la page.

- Le calcul du score de qualité de la publicité. Google attribue à chaque annonce, sur une échelle de un à dix, un score, fonction de la pertinence de son texte au regard de la requête de l’utilisateur, de la qualité de la page mise en avant (intérêt de son contenu et rapidité de chargement), et du nombre moyen de clics sur la publicité. Ce score mesure à quel point la publicité fonctionne, assurant à la fois de bons retours à l’annonceur, et d’imposants revenus à Google, qui ne gagne de l’argent que si les internautes choisissent effectivement de cliquer sur le lien proposé. L’algorithme exact qui établit ce score reste secret, et modifiable à loisir par Google.

- Le calcul du rang. L’ordre dans lequel les publicités apparaissent est déterminé par une formule relativement simple : le Rang est l’Enchère multipliée par le Score. Une publicité ayant un bon score peut ainsi compenser une enchère plus faible et arriver devant. Google optimise ici ses chances que l’internaute clique sur les publicités proposées.

Ce jeu d’enchères est recalculé pour chaque requête de chaque utilisateur — des millions de fois par seconde ! Ce second algorithme a rapporté à la firme de Moutain View la coquette somme de 9,720 milliards de dollars pour le troisième trimestre 2011 — un chiffre en croissance de 33 % par rapport à la même période de l’année 2010 *.

Le marché linguistique ainsi créé par Google est déjà global et multilingue. A ce titre, la Bourse des mots qui lui est associée donne une indication relativement juste des grands mouvements sémantiques mondiaux. Google propose d’ailleurs des outils simples et ludiques pour explorer une partie des données qu’il collecte sur l’évolution de la valeur des mots. C’est ainsi que nous pouvons voir comment les fluctuations du marché sont marquées par les changements de saison (les mots « ski » et « vêtements de montagne » ont plus de valeur en hiver, « bikini » et « crème solaire » en été). Les flux et les reflux de la valeur du mot « or » témoignent de la santé financière de la planète. Google gagne évidemment beaucoup d’argent sur les mots pour lesquels la concurrence est forte (« amour », « sexe », « gratuit »), sur les noms de personnes célèbres (« Picasso », « Freud », « Jésus », « Dieu »), mais également dans des domaines de langue où la spéculation est moindre.   Tout ce qui peut être nommé peut donner lieu à une enchère.

Google a réussi à étendre le domaine du capitalisme à la langue elle-même, à faire des mots une marchandise, à fonder un modèle commercial incroyablement profitable sur la spéculation linguistique. L’ensemble de ses autres projets et innovations technologiques – qu’il s’agisse de gérer le courrier électronique de millions d’usagers ou de numériser l’ensemble des livres jamais publiés sur la planète – peuvent être analysés à travers ce prisme. Que craignent les acteurs du capitalisme linguistique ? Que la langue leur échappe, qu’elle se brise, se « dysorthographie », qu’elle devienne impossible à mettre en équations. Quand Google corrige à la volée un mot que vous avez mal orthographié, il ne fait pas que vous rendre service : il transforme un matériau sans grande valeur (un mot mal orthographié) en une ressource économique directement rentable. Quand Google prolonge une phrase que vous avez commencé à taper dans la case de recherche, il ne se borne pas à vous faire gagner du temps : il vous ramène dans le domaine de la langue qu’il exploite, vous invite à emprunter le chemin statistique tracé par les autres internautes. Les technologies du capitalisme linguistique poussent donc à la régularisation de la langue. Et plus nous ferons appel aux prothèses linguistiques, laissant les algorithmes corriger et prolonger nos propos, plus cette régularisation sera efficace.

Pas de théorie du complot : Google n’entend pas modifier la langue à dessein. La régularisation évoquée ici est simplement un effet de la logique de son modèle commercial. Pour réussir dans le monde du capitalisme linguistique, il faut cartographier la langue mieux que n’importe quel linguiste ne sait le faire aujourd’hui. Là encore, Google a su construire une stratégie innovante en développant une intimité linguistique sans précédent avec ses utilisateurs. Nous nous exprimons chaque jour un peu plus au travers d’une des interfaces de Google ; pas simplement lorsque nous faisons une recherche, mais aussi quand nous écrivons un courrier électronique avec GMail ou un article avec Google Docs, quand nous signalons une information sur le réseau social Google+, et même oralement, à travers les interfaces de reconnaissance vocale que Google intègre à ses applications mobiles. Nous sommes des millions chaque jour à écrire et à parler par le biais de Google. C’est pourquoi le modèle statistique multilingue qu’il affine en permanence et vers lequel il tente de ramener chaque requête est bien plus à jour que le dictionnaire publié annuellement par nos académiciens. Google suit les mouvements de la langue minute par minute, car il a le premier découvert en elle un minerai d’une richesse extraordinaire, et s’est doté des moyens nécessaires pour l’exploiter.

La découverte de ce territoire du capitalisme jusqu’ici ignoré ouvre un nouveau champ de bataille économique. Google bénéficie certes d’une avance importante, mais des rivaux, ayant compris les règles de cette nouvelle compétition, finiront par se profiler. Des règles finalement assez simples : nous quittons une économie de l’attention pour entrer dans une économie de l’expression. L’enjeu n’est plus tant de capter les regards, que de médiatiser la parole et l’écrit. Les gagnants seront ceux qui auront pu développer des relations linguistiques intimes et durables avec un grand nombre d’utilisateurs, pour modéliser et infléchir la langue, créer un marché linguistique contrôlé et organiser la spéculation sur les mots. L’utilisation du langage est désormais l’objet de toutes les convoitises. Nul doute qu’il ne faudra que peu de temps avant que la langue elle-même ne s’en trouve transformée.

* “Google Q3 2011: $9.72 Billion In Revenue, $2.73 Billion In Net Income”, TechCrunch, 13 Octobre 2011.

Si vous voulez citer cet article, merci d’utiliser la référence suivante :

Kaplan, F (2011) Vers de la capitalisme linguistique : Quand les mots valent de l’or, Le Monde diplomatique, N 692, Novembre 2011, p.28


Chacun dans sa bulle digitale

novembre 29, 2011

Retour d’une journée d’entretiens à Lyon sur le corps et ses variations. Déjeuner mémorable avec un Michel Serres, pétillant et virtuose, Yves Coppens, beaucoup plus facétieux que je ne l’imaginais, George Vigarello, extraordinaire historien du corps et Patrick Bazin, le nouveau directeur de la BPI plein d’idées pour son institution. Nous avons discuté passionnément du futur du livre et des bibliothèques, de Google, d’une paléontologie des objets techniques, des nouvelles interfaces et du corps qui s’y adapte. Dans le train du retour, j’ai mis au propre ce petit texte sur l’incorporation. Quand nous interagissons avec nos écrans, où sommes-nous ? Incorporés dans un système technique qui ressemble à beaucoup d’autres ? ou dans une bulle fondamentalement différente ?

Extensions : la tête dans les nuages.

Nous avons fait dans les cinq dernières années une découverte extraordinaire : nous sommes capables de marcher dans la rue tout en interagissant du bout de nos doigts avec notre téléphone portable. Notre inconscient prend en charge toutes les fonctions de navigation et d’évitement d’obstacles qui ont été si longues à acquérir pendant la première année de notre vie, nous permettant ainsi de nous mouvoir dans la complexité de l’espace urbain sans presque jamais quitter l’écran des yeux. Parfois bien-sûr nous rentrons dans un passant, nous trébuchons sur une marche et, à cet instant douloureux, nous redevenons un corps se déplaçant dans l’espace physique urbain. Mais la plupart du temps, nous réussissons ce tour de force d’être à la fois physiquement ici et mentalement ailleurs.

L’interaction avec nos téléphones portables n’est qu’un exemple de notre extraordinaire capacité à nous métamorphoser. Notre peau n’est pas la limite de notre corps. Nous nous baissons intuitivement quand nos portons un chapeau, les femmes adaptent leur marche lorsqu’elles portent des talons hauts. Ceci est également vrai pour des dispositifs plus complexes. Apprendre à conduire une voiture demande de longues heures de pratique. Au début, la voiture est un dispositif en partie imprédictible, une machine aux réactions aléatoires. Puis au fil des heures, la voiture devient une extension de nous-mêmes, comme une seconde peau. Nous avons assimilé sa taille et sa vitesse, le temps qu’il nous faut pour accélérer et freiner. Conduire devient aussi naturel que marcher, une activité inconsciente. Nous pouvons penser à autre chose en le faisant. Certains réussissent même à interagir avec leur téléphone portable en conduisant.

Ce processus général d’incorporationla transformation d’un objet extérieur en une prothèse, est encore mal compris. Nous savons qu’il est lié à notre capacité à parfaitement prédire le comportement de l’objet extérieur. Pour que le marteau devienne une extension de notre main il faut que nous ayons construit un bon modèle de son comportement physique  de manière à pouvoir parfaitement prédire ses réactions. Dès le moment où nous prédisons bien le comportement de nos prothèses, notre attention peut se déplacer ailleurs, sur le clou, par exemple. Quand l’action de planter un clou devient elle-même une routine absolument prédictible, nous pouvons nous concentrer sur le plan général de notre projet, l’action de planter un clou, comme celle de doubler dans le cas de la conduite, devenant alors une étape intégrée ne nécessitant plus toute notre attention. Ce n’est que si un imprévu survient que nous devrons nous désolidariser de notre prothèse, porter à nouveau notre attention sur l’objet lui-même, le considérer de nouveau comme une partie extérieure, et c’est un processus douloureux.

Chaque incorporation correspond à un changement d’espace. Le violoniste apprend d’abord à maîtriser son instrument. Au fil des heures, il l’incorpore et peut être ensuite tout entier concentré sur la mélodie. Puis, au fil des concerts, son attention se porte non plus sur les notes mais sur l’interprétation. Il a de nouveau changé d’espace.

D’autres lieux, régis par d’autres lois. Le jeune enfant venant d’apprendre à marcher quitte l’espace de la maîtrise de son propre corps pour commencer à explorer les lieux qui l’entourent. La maîtrise vocale lui donne accès à la parole. Il sait prononcer les sons, mais il lui faut maintenant les arranger selon les conformations de langue. Puis, plus tard, il lui faudra maîtriser les lois des conversations, un autre espace.

Le stylo s’intègre à notre main quand nous écrivons. Toute notre attention se porte sur l’acte d’écrire. Nous ne pensons ni à notre posture, ni à la page. Nous sommes le texte en train de s’écrire.

Même si nous les incorporons complètement et même si elles deviennent totalement inconscientes, les “interfaces” que nous utilisons pour explorer ces autres espaces influencent de manière importante la nature de nos trajectoires dans les espaces supérieurs. Nietzsche raconte comment utiliser une machine à écrire a profondément changé son écriture jusque là manuscrite. Ses phrases se raccourcissaient, devenaient plus denses.  Aujourd’hui le choix d’un traitement texte particulier, comme celui d’un violon, modèle sans que nous n’en ayons particulièrement conscience notre écriture. Comme le suggère François Bon, nous devrions toujours accorder notre traitement de texte avant de commencer à écrire.

Revenons à nos téléphones portables et réfléchissons à la manière dont nous les manipulons. Comme beaucoup d’autres objets nous utilisons nos doigts et nos yeux. Pour autant ils ne nous offrent pas la richesse sensorimotrice de la plupart des autres objets. Quand nous saisissons un verre nous savons immédiatement à quel point il est plein, si le liquide qu’il contient est chaud ou froid. Nos doigts façonnés par des millions d’années d’évolutions nous communiquent des informations d’une extrême richesse.

Les téléphones portables et maintenant les tablettes nous proposent essentiellement des images protégées par du verre. Certes ces images réagissent à notre toucher, mais notre sens de la vue est absolument nécessaire à l’ensemble des interactions qu’elles proposent. Vous pouvez faire vos lacets sans regarder vos chaussures. Mais vous ne pouvez pas interagir avec votre téléphone ou votre tablette de cette manière.  Cette prédominance du visuel encourage le processus d’immersion, la déconnexion avec le monde physique et social traditionnel. Les téléphones et les tablettes, comme les livres et plus encore que la télévision, sont des interfaces absorbantes.

Absorption : la bulle digitale

Qu’y a-t-il d’aussi fascinant derrière les vitres de ces fenêtres ? Une seule machine, un ordinateur planétaire, une méga-structure technique, un objet-monde comme dirait Michel Serres. Depuis sa création cette machine est porteuse d’une utopie. Grâce à ces fenêtres c’est en apparence toute l’information du monde qui est au bout de nos doigts. La fenêtre nous ouvre à un monde élargi temporellement et spatialement. Nous pourrions non seulement voir tout ce qui ce passe simultanément sur l’ordinateur-monde mais aussi à d’infinies mémoires resurgissant du passé. The “Long Here” and the “Big Now”. Il y a là une extrêmement séduisante promesse.

Notre évolution nous a donné un goût immodéré pour le sucre et le gras, jadis si rare et maintenant si commun. Aujourd’hui nous devons lutter pour apprivoiser cette appétence au risque de devenir obèses. De la même manière, il est possible que nous ayons un appétit naturel pour les informations pertinentes (ce qui est amusant, étonnant, sexuellement intéressant, ce qui se dit sur nous, ce qui nous permet d’apprendre plus, voir le livre de J-L. Dessalles sur cette question). Et nous construisons beaucoup de nos comportements dans le but de rassasier cette curiosité.

Or c’est précisément le modèle commercial qu’exploitent les services les plus importants de l’ordinateur-planétaire : nous proposer des portails d’informations pertinentes de manière à ce que nous découvrions, explorions, produisions au travers d’interfaces de ces services. J’ai discuté ailleurs de cette transition entre une économie de l’attention à une économie de l’expression, dans le contexte du capitalisme linguistique naissant. En nous proposant des interfaces incitant à une intimité linguistique sans précédent, Google peut organiser le marché mondial de la spéculation sur les mots. Comme le disait Andrew Lewis, “Si vous ne payez pas pour quelque chose, vous n’êtes pas le client, vous êtes le produit”. Ici c’est chacune de nos paroles, gestes, comportement qui, explicités par le contact avec l’interface digitale, affine la granularité des espaces commercialement exploitables. Si Google peut réaliser plusieurs dizaines de milliards de chiffre d’affaire simplement en organisant la spéculation linguistique c’est précisément parce que le marché linguistique n’est pas borné à un nombre finis de produits ou d’emplacements, il s’étend au fur et à mesure que la cartographie des mots s’affine et évolue. C’est pourquoi il est si important de capter non pas l’attention, mais l’expression.

Comme l’a bien analysé Eli Pariser dans “The Filter Bubble”. les services de l’ordinateur planétaire sont en compétition les uns avec les autres pour proposer automatiquement les informations qui seront pour nous les plus pertinentes. Or la pertinence est évidemment personnelle, dépendante de nos parcours de vies, de nos goûts esthétiques, de nos tendances politiques, des groupes sociaux au sein desquels nous évoluons.  Le 4 décembre 2009, Google a fait une petite modification à son algorithme de recherche. Il a proposé d’intégrer par défaut dans les critères de sélection une cinquantaine d’éléments dépendant du profil de l’utilisateur. Il peut ainsi me proposer des résultats qui ont plus de chance d’être pertinents (sur lesquels j’ai le plus de chance de cliquer).  Par conséquent, si je ne clique jamais sur certains types d’informations elles apparaîtront moins. Cela veut également dire que vous et moi n’obtiendrons pas les mêmes résultats pour la même recherche.

Imaginez que je cherche une information sur un grand opérateur téléphonique, peut-être obtiendrais-je des informations sur les derniers forfaits pour téléphones portables car dans le passé j’ai souvent cliqué sur ce genre d’information. Mais peut-être que vous obtiendrez des informations sur la vague de suicides dans cette même entreprise car ces questions vous ont intéressées dans le passé. Si j’ai tendance à être de gauche, j’aurais plus de propositions de gauche. Si je m’intéresse au libéralisme, on me proposera plus de libéralisme.

Insensiblement notre point de vue sur le monde quitte l’objectivité initiale de l’algorithme fondateur pour intégrer une subjectivité absolue basée sur une analyse automatique de  nos parcours de vie. Les fenêtres nous donnent accès n’ont pas à un grand univers partagé, mais à des univers parallèles.

Comme pour le capitalisme linguistique, ces dynamiques de personnalisation sont des conséquences logiques des services proposés par la machine monde. C’est précieusement parce qu’il y a trop d’information qu’on nous propose de la filtrer. Il est naturel que les algorithmes rivalisent les uns avec les autres pour nous fournir de l’information toujours plus personnalisée. Ils nous suggèrent quotidiennement le prochain livre à livre, le prochain film à voir, la prochaine musique à écouter, les personnes à suivre sur Twitter et choisissent même pour nous les meilleurs partenaires amoureux. Nous consultons des journaux personnalisés produits automatiquement et reflétant nos intérêts. Bientôt des chaînes de télévisions seront produites sur le même modèle. Partout, les algorithmes choisissent pour nous. De la même manière que Google prolonge nos phrases pour les rendre maximalement exploitable commercialement, il s’agit en parallèle d’anticiper et de régulariser nos propres opinions.

Nous avons déjà fait de Google et de Facebook nos prothèses, comme notre voiture et notre vélo. Nous les conduisons de manière inconsciente, pensant que ce sont des dispositifs techniques comme les autres. Nous ne réalisons pas que nous nous incorporons dans des interfaces qui ne nous appartiennent pas. Elles sont contrôlées par d’autres. Leur géométrie est extrêmement variable,  continuellement optimisée selon des critères définis par des modèles commerciaux qui ont maintenant faits plus que leurs preuves. C’est là la grande différence avec les dispositifs techniques classiques. Quelqu’un d’autre a pris le contrôle de la forme de la voiture.

Le village global malgré ses promesses initiales court le risque de ressembler à un voisinage conformiste. Les images sous le verre ne sont pas nécessairement des fenêtres vers la connaissance universelle, mais plutôt de simples hublots donnant sur notre propre bulle digitale.


Variations sur le corps, corps variables

novembre 23, 2011

Invité par Michel Serres et Yves Coppens, j’interviens samedi à Lyon dans la journée “Variations sur le corps“. Je discuterai de la question du corps et de l’incarnation et de son rapport à la technologie. En particulier, je reviendrai sur une nouvelle conception de l’incarnation qui nous permet de penser un corps à géométrie variable autour des concepts de noyau et d’enveloppes. Paradoxalement, ce sont des expériences en robotique qui ont permis de préciser certaines intuitions anciennes sur ces questions. Je discuterai les implications de cette nouvelle conception en particulier dans un monde où nous sommes continuellement en interaction avec des dispositifs techniques globalisés.

Corps à géométrie variable

Lorsque nous interagissons avec des dispositifs techniques notre corps s’étend, et change de forme. Le bâton, le marteau, le stylo, la fourchette, l’éplucheur, la raquette, l’épée prolongent notre main pour  se trouver, après un peu d’habitude, complètement intégrés à notre corps. Sans y penser, nous nous baissons un peu plus lorsque nous portons un chapeau, changeons notre démarche lorsque nous portons des pantoufles ou des talons aiguilles. Nous sommes la voiture que nous sommes en train de conduire. Il nous aura fallu de longues heures de corps à corps avec cette machine pour nous habituer à son maniement. Au début c’est un corps étranger, hostile et résistant. Mais une fois cet apprentissage réussi, la voiture est comme un second squelette, une seconde peau. Nous avons intégré le volume de sa carrosserie, sa vitesse de freinage et d’accélération. A partir d’un certain point, conduire devient aussi naturel que marcher, une activité inconsciente.

Notre enveloppe corporelle est donc extensible, étirable, changeante. Nous l’étendons au marteau que nous saisissons le temps de planter un clou, puis une fois l’opération terminée l’outil redevient un objet extérieur, à portée de main, mais séparé. Notre schéma corporel n’est pas un modèle de notre corps, c’est un espace à géométrie variable. A chaque instant, nous sommes le point de vélocité maximale, l’extrémité du bâton, la pointe de l’épée, l’icône de la souris. Cette avec cette extrémité active que nous agissons, mais aussi que nous sentons, mesurons, éprouvons. Ce processus d’incorporation, encore mal compris et relativement peu étudié, est fondamental. Vivre c’est se métamorphoser en permanence.

Pierre-Yves Oudeyer et moi-même avons proposé il y a quelques années une approche particulière du processus d’incarnation basé sur les concepts de noyaux et d’enveloppes. La première version de ce modèle a été publié en 2008 dans un article en Français dans La Revue Philosophique de la France et de l’Etranger, intitulé “le corps comme variable expérimentale“. En 2009, nous avons publiés en version étendue de cet article en Anglais dans le journal Control, Measurement, and System Integration, intitulée “Stable kernels and fluid body envelopes“. Dans ces deux articles, nous revenions sur l’évolution des concepts de corps et de processus d’animation dans les 60 dernières années en robotique.

 

Le corps séparé

Les premiers automates du XVIIIe siècle (Vaucanson, Jaquet-Droz, etc) furent sans doute les premiers à introduire une distinction nette entre une mécanique corporelle et un procédé d’animation programmable. L’Écrivain de Pierre et Henri-Louis Jaquet-Droz est équipé de quarante cames qui contrôlent le mouvement de sa plume. Le même corps peut ainsi effectuer différentes séquences selon les positions du système de cames. Progressivement, les dispositifs mécaniques permettant la programmation se multiplient : métiers à tisser, cartes perforées, cylindres de cire. Les procédés d’animation se développent sous la forme de modules toujours plus indépendants du corps mécanique de l’automate

Au milieu du XXe siècle, avec l’arrivée de l’ordinateur numérique, le divorce entre le corps physique et le procédé d’animation est consommé. L’automate, que l’on nomme dorénavant robot, se conçoit comme un corps physique doté de senseurs et d’actuateurs contrôlés par un programme informatique, description abstraite, « informationnelle » de son comportement. Il est alors facile de faire « exécuter » successivement de nombreux programmes différents sur le même corps robotique.

Deux disciplines complémentaires voient le jour. D’un côté, les chercheurs en intelligence artificielle s’attellent à imaginer des algorithmes permettant à la machine de classer, de prédire, de décider. De l’autre, les roboticiens développent de nouveaux senseurs et de nouveaux actionneurs élargissant ainsi le « monde » dans lequel les robots évoluent.

Immanquablement, les deux disciplines divergent. De nombreux chercheurs en intelligence artificielle en particulier ne considèrent plus l’incarnation comme une composante essentielle de leur recherche. Ils préfèrent concentrer leur effort sur la modélisation de comportements cognitifs humains complexes, élaborent des modèles de l’intelligence humaine adaptés au diagnostic médical, à la preuve de théorèmes mathématiques ou aux jeux de société. Ces algorithmes viennent soutenir une vision de l’intelligence humaine comme étant avant tout un système de manipulation de symboles. La psychologie cognitive s’empare de cette hypothèse soutenant que ce type de processus de traitement de l’information rend mieux compte des mécanismes de l’intelligence que ne font les théories comportementalistes très influentes outre-Atlantique. Les hypothèses cognitivistes et computationalistes, stipulant que la pensée est réductible à un ensemble de calculs symboliques, s’imposent. Le corps, quant à lui, est oublié, irrémédiablement séparé des mécanismes de l’intelligence.

Symétriquement, alors qu’un domaine de recherche entier explore l’intelligence sans corps, un autre s’attelle à développer des corps sans intelligence. Les premiers robots industriels sont installés dans des environnements prédictibles, contrôlés à l’extrême. Sur les chaînes de montages, ils exécutent des mouvements calibrés. Dans les ateliers, ils réalisent des manipulations standardisées avec précision. Malheureusement, dès qu’il s’agit de faire évoluer les machines dans des environnements non contraints, non connus à l’avance ou changeants, le comportement des robots semble impossible à programmer.

Entre les années 1950 et la fin des années 1980, le schisme qui sépare les concepteurs de « corps » et les chercheurs en « intelligence » a des conséquences directes sur les performances des machines produites. Les algorithmes d’intelligence artificielle conçus pour manipuler des symboles définis a priori et non ambigus se révèlent fortement inadaptés à la complexité et l’imprévisibilité du monde réel. À titre d’illustration, considérons le problème qui consiste à essayer de faire marcher un robot quadrupède à partir d’un algorithme d’intelligence artificielle classique. Il ne s’agit plus de manipuler des symboles abstraits, mais un corps complexe qui, selon les configurations, peut rapidement se trouver en position de déséquilibre, notamment si, comme pour la plupart des robots, il est constitué de membres rigides dont le programme doit contrôler la position. Le revêtement du sol, les degrés de friction sous les pattes influencent directement les mouvements de la machine. Pour fonctionner, il est nécessaire que le système soit équipé d’un modèle précis du corps du robot et aussi de l’environnement dans lequel il évolue. C’est, dans bien des cas, quasiment impossible. Vu sous cet angle, marcher à quatre pattes peut se révéler être un problème plus difficile que démontrer des théorèmes mathématiques.

Le corps retrouvé

Pour sortir de cette impasse, une nouvelle école de pensée voit alors le jour à la fin des années 1980, autour de chercheurs comme Rodney Brooks, Luc Steels et Rolf Pfeifer. L’intelligence artificielle incarnée (embodied artificial intelligence) rejette l’approche symbolique et désincarnée de l’intelligence artificielle « classique » en postulant qu’il ne peut y avoir d’intelligence sans corps et sans environnement. Rodney Brooks ajoute que le corps et l’environnement ne sont pas modélisables et que la recherche doit donc renoncer à construire des modèles de la réalité extérieure pour se concentrer sur l’interaction directe avec l’environnement : « Le monde est le meilleur modèle de lui-même ».

Ce changement de perspective annonce un renouveau des expériences robotiques et un retour à des méthodes de conception et d’expérimentation qui caractérisaient la robotique d’avant l’ordinateur numérique. Les « tortues » cybernétiques de Grey Walter construites en 1948 sont alors prises comme exemple de ce que doit être une bonne conception intégrant de manière fine la conception de la machine physique aux comportements souhaités. Ces robots entièrement analogiques étaient capables de comportements complexes, sans pour autant utiliser de « représentations » internes. Leur conception tenait compte du fait qu’il s’agissait de machines physiques, soumises à la gravité ou aux frictions, qui produisent leur simulation sensorielle par leur propre mouvement. La nature et la disposition de leur système sensoriel leur permettaient de résoudre des « tâches » complexes comme retrouver leur station de recharge, sans qu’il soit nécessaire pour autant de faire appel à un quelconque « raisonnement ».

Pour tenter de convaincre les cognitivistes qui ne voient en l’intelligence qu’une forme sophistiquée de traitement de l’information, les chercheurs en intelligence artificielle incarnée tentent de définir le type de traitement « computationnel » morphologique (morphological computation) réalisé par le corps lui-même. Pour résoudre un problème comme la marche quadrupède, plutôt que de construire un système de contrôle plus sophistiqué, il est plus efficace de construire un corps doté des dynamiques physiques adaptées. Si l’on remplace les membres rigides et les moteurs puissants du robot par un système équipé de ressorts inspirés de la dichotomie muscle-tendon que l’on retrouve chez les animaux quadrupèdes, il suffit alors d’un système de contrôle simplissime produisant juste un mouvement périodique de chaque patte pour obtenir une marche élégante et adaptée. Une fois posé sur le sol, le robot se stabilise après quelques pas dans un rythme de marche correspondant à ses dynamiques naturelles. La vitesse de marche correspondante n’est pas arbitraire et il est d’ailleurs difficile pour le robot de sortir de ce qui constitue « un bassin d’attraction » de ce système dynamique. Seule une perturbation suffisamment importante peut permettre au robot de quitter ce rythme naturel pour retomber ensuite vers un autre « attracteur » correspondant par exemple à un comportement de « trot ». Ainsi, en rupture avec la division héritée du partage en disciplines de l’après-guerre, l’intelligence artificielle incarnée réaffirme l’importance du corps en illustrant son rôle pour la construction de comportements complexes : conception corporelle et procédés d’animation doivent être envisagés comme formant un tout cohérent.

Le corps comme variable expérimentale

Au début des années 1990, les expériences de la nouvelle intelligence artificielle se concentrent essentiellement sur la modélisation de comportements d’insectes, exemples stratégiquement éloignés des programmes d’intelligence artificielle classique qui jouent aux échecs. Mais, dans les années qui suivent, certains chercheurs tentent d’étendre cette même approche pour construire des robots capables d’apprendre comme le font les jeunes enfants. L’idée n’est pas nouvelle, puisqu’elle était exprimée par Alan Turing dans ce qui a été un des articles fondateurs de l’intelligence artificielle, mais la perspective « sensori-motrice » développée par l’intelligence artificielle incarnée lui donne une dimension inédite. Comment, en effet, une machine pourrait-elle développer par elle-même des compétences sensori-motrices pour interagir avec son environnement ? Par quels mécanismes pourrait-elle s’engager dans une trajectoire développementale ouverte comme celles qui caractérisent le développement de l’enfant ? En quelques mois à peine, un enfant apprend à contrôler son corps, à manipuler des objets, à échanger avec ses proches pour devenir un être autonome capable d’interactions complexes, tant physiques que sociales. De jour en jour, il acquiert des savoir-faire de plus en plus complexes tant sur le plan perceptif que dans ses possibilités d’interaction. Dans quelle mesure une machine pourrait-elle faire la même chose ?

En posant ces questions, les chercheurs en robotique « développementale » ou « épigénétique »  remettent partiellement en cause les bases initiales de l’intelligence artificielle incarnée et introduisent une rupture méthodologique. L’importance du corps est toujours affirmée, puisqu’il s’agit de développer des compétences sensori-motrices intimement liées à une morphologie et un environnement donnés. Mais, tout en gardant une approche holistique, il semble de nouveau nécessaire d’identifier, au sein du système robotique, un processus indépendant de tout corps, de toute niche écologique et de toute tâche particulière. En effet, par définition, un mécanisme qui puisse permettre de pousser à apprendre toujours de nouvelles compétences ne peut être spécifique à certains types de comportements, de milieu ou même de corps. Il doit être général et abstrait, indépendant du corps.

Ainsi, à peine retrouvé, le corps se trouve de nouveau divisé. Mais la séparation n’est plus celle héritée des cartes perforées et de l’ordinateur numérique qui distinguait le matériel du logiciel. Dans ce nouveau dualisme méthodologique, il s’agit de séparer une enveloppe corporelle potentiellement variable correspondant à un espace sensori-moteur donné et un noyau d’entraînement, ensemble de processus généraux et stables capables de contrôler n’importe quelle interface corporelle. En distinguant ainsi un processus d’incarnation général et des espaces corporels particuliers, les développements les plus récents de la robotique épigénétique conduisent à reconsidérer le corps sous un autre angle. Contrairement aux corps physiques stables et lourds, entièrement ancrés dans le réel, les enveloppes corporelles, quant à elles, sont potentiellement des espaces variables et changeants. Contrairement aux programmes d’animation toujours différents de la robotique et de l’automatique, nous considérons maintenant un noyau stable, toujours identique, agissant comme un moteur pour le développement. Ce n’est plus le corps qui reste et les programmes qui changent. C’est exactement l’inverse : le programme reste et le corps change.

Cette vidéo montre un robot qui apprend à marcher à partir d’un noyau d’entraînement générique qui le pousse simplement à explorer son corps. Le même programme peut être associé à un autre “corps” et donner une trajectoire comportementale complètement différente. Il faut en général plus de trois heures pour que l’algorithme découvre plusieurs ensembles de paramètres permettant au robot de marcher en avant, en arrière, latéralement ou de tourner sur lui-même. À aucun moment, le robot n’a comme objectif d’apprendre à marcher. Dans cette expérience le robot découvre d’abord comment marcher en arrière mais ce premier attracteur est le résultat de la structure particulière de son corps. Une jambe plus longue ou un dos plus souple aurait pu le conduire à une trajectoire différente.  Du point de vue méthodologique, nous pouvons par ces approches de faire du corps une variable expérimentale dont on peut étudier les effets toutes choses égales par ailleurs.

Le corps variable

Paradoxalement, la robotique, si souvent associée aux comportements saccadés de corps rigides et fixes, propose aujourd’hui un cadre théorique et expérimental pour étudier l’influence du corps : elle permet de penser le corps comme une variable. Outre son intérêt méthodologique, cette approche ouvre la voie à une nouvelle conception du corps, fluide et en continuelle redéfinition. Penser le corps comme une variable expérimentale nous permet de penser la variabilité du corps.
Plus qu’une technologie des corps animés, la robotique apparaît alors comme science et pratique de l’incarnation. En dégageant le concept de noyau stable et générique, origine de la motricité et de l’exploration, et le concept d’enveloppes corporelles changeantes, elle offre un cadre explicatif nouveau pour reconsidérer les questions du développement, de l’inné et de l’acquis. En effet, qu’est-ce que le développement si ce n’est une séquence d’incarnations successives : non seulement un corps en perpétuel changement, mais aussi des espaces corporels qui se succèdent les uns aux autres ? Chaque nouvelle compétence acquise change l’espace à explorer. La marche en est à nouveau un exemple illustratif. Une fois maîtrisée, elle permet à l’enfant l’accès à un nouvel espace de recherche.

Penser le corps variable, c’est aussi penser une notion de corps étendu capable d’incorporer les objets qui l’entourent sous la forme d’agencements transitoires. Dans cette perspective, outils, instruments de musique et véhicules sont autant d’enveloppes corporelles à explorer, sans différence fondamentale avec leur pendant biologique.

En pensant le corps variable, ne pourrait-on pas considérer le raisonnement symbolique et la pensée abstraite comme autant de formes d’extensions corporelles ? Si, comme le suggèrent Lakoff et Nunez, il y a une correspondance directe entre la manipulation sensori-motrice et les raisonnements mathématiques les plus abstraits, nous pouvons naturellement considérer que même les processus mentaux les plus « intérieurs » peuvent être pertinemment interprétés comme des enveloppes corporelles à explorer. L’usage de la langue elle-même ne pourrait-il pas être interprété comme une incarnation corporelle particulière ? Nous discutons de cette dernière question avec le linguiste Benjamin Bergen dans un article publié dans Infant and Child Developpment intitulé “Computational models in the debate over language learnability“.

Au fur et à mesure que le temps passe,  il devient clair que cette approche particulière du processus d’incarnation permet de penser de manière inédite nos interactions avec les nouvelles interfaces et les relations globales que permettent les technologies numériques et l’ordinateur planétaire. Notre voisinage s’est étendu. Nos incarnations se sont diversifiées. Intéragir dans le micro-monde que propose FaceBook, c’est faire corps avec une interface particulière, comme lorsque nous jouons du Piano, écrivons un texte dans un logiciel, lisons un ebook ou faisons une recherche sur Google. La grande différence c’est que dans ce corps à corps technologique nous sommes en contact avec les représentations produites par d’autres corps. Plus ces boucles interactives se resserrent, plus ces interactions technologiques ressemblent à des danses.

Une véritable science des interfaces passera donc par une compréhension fine de ce nouveau dualisme. Il nous faut bien-sûr explorer les mécanismes neuraux qui supportent peut-être cette articulation entre noyau et enveloppe (nous avons commencé cette cartographie dans un article intitulé In search of the neural circuits of intrinsic motivation publié il y a quelques années dans Frontiers in Neuroscience).  Il nous faut surtout nous débarrasser des vieux paradigmes du corps machine et de l’esprit programme, pour penser la variabilité de notre corps et considérer toute activité immersive, même dans le monde digital, comme une forme d’incarnation.


Les albums pour enfants, avant-garde de l’innovation

novembre 16, 2011

Ce vendredi, je donne un exposé dans le cadre de la conférence L’avenir du Lire, sur la place particulière des albums pour enfants dans le paysage de l’édition. L’occasion de poursuivre des réflexions entamées au début de l’année dernière lors du laboratoire des nouvelles lectures et des les croiser avec celles plus récentes sur la standardisation du livre.

L’édition jeunesse est plus que jamais un laboratoire pour l’innovation

Les albums pour enfants ont toujours été à l’avant-garde. Techniquement d’abord, les concepteurs d’albums et les imprimeurs ont toujours rivalisé d’ingéniosité pour expérimenter de nouveaux formats de livres, pliables, tirables, colissables, en relief, bruités, machinisés… C’est aussi dans ce domaine qu’ils sont les plus audacieux narrativement, explorant sans cesse de nouvelles manières de construire des récits. Autant d’innovations qui trouvent parfois leur place dans les autres secteurs, beaucoup plus traditionnels et conservateurs, de l’édition.

Ce n’est donc pas un hasard, si dans le monde de l’édition digitale, les livres pour enfants sont aujourd’hui ceux qui explorent avec le plus de créativité les possibilités offertes par les nouvelles interfaces de lecture. Nous avons vu depuis quelques mois des “livres” qui réagissent à l’orientation des tablettes, à la manière dont le lecteur les “secouent”. Les personnages de leurs histoires s’animent. Tirettes digitales, effet pop-up et autres possibilités inédites se déclenchent sous la pression des doigts des jeunes lecteurs. Ici encore, les albums pour enfants constituent le laboratoire où s’inventent les nouvelles manière d’interagir avec les publications digitales.

Mais ce n’est pas tout. Alors que beaucoup réfléchissent aux meilleures manières de rendre le livre numérique social (voir mon cours sur les Social Reading Technologies), la littérature pour enfants peut de nouveau nous servir de guide. Dans un monde où la lecture traditionnelle est si souvent associée à une pratique solitaire, les livres pour enfants font figure d’exception. Ils se lisent socialement de multiples manières.  Les parents les lisent à leurs enfants.  Parents et enfants les lisent ensemble (certains éditeurs proposent aujourd’hui des livre adaptés à la lecture à deux voix, l’enfant qui apprend à lire se charge des courts dialogues alors que l’adulte s’occupe des descriptions plus longues).  Les grands frères lisent aux petites sœurs. Les petites soeurs lisent à leurs poupées.  Ainsi, il est fort probable que ce seront les livres digitaux pour enfants qui inaugureront de nouvelles manière de lire ensemble.

Chaque album pour enfant est comme une île.

La puissance d’innovation des albums pour enfants est liée à leur caractère fermé, autonome. Chaque album pour enfant est comme une île, un monde en soi. Déconnectées du continent documentaire, les îles sont des réservoirs d’innovation.

Aujourd’hui la plupart des explorations digitales dans cette partie de l’édition prennent la forme d’applications pour tablettes et smartphones, fermées et innovantes. Les applications offrent un contrôle complet à leur concepteur, la possibilité de créer un monde en soi. Le revers de la médaille est que les applications sont encore très peu standardisées. Les nouveaux contenus peuvent être longs et difficiles à produire, ne fonctionner que sur les machines les plus récentes. Les éditeurs n’ont pas les budgets pour se lancer dans des créations ambitieuses. Comme ce fut le cas avec le CD-rom, ces obstacles  pourraient mettre en péril cette lignée innovante.

L’édition jeunesse résiste à la standardisation du livre.

Il est important de comprendre que la voie explorée par les applications va à l’encontre d’un processus global de standardisation. De la même manière que les cartes sont devenues des machines, les livres tendent à devenir des ressources standards et agrégées, des données dans la grande encyclopédie mondiale. Comme celui des cartes, leur modèle commercial va sans doute changer dans les années qui viennent : nous entrons dans un monde où  l’usage des livres aura peut-être plus de valeur que les livres eux-mêmes.

La guerre économique du livre numérique est comme souvent une guerre de standards. Il s’agit d’imposer et de contrôler à la fois les formats qui permettent de décrire les livres comme des ressources standardisées, mais aussi de prolonger ce processus encyclopédique sur le contenu des livres eux-mêmes de manière à cataloguer les lieux, les personnes et les objets cités comme des nœuds sémantique clairement définis. Il s’agit enfin de pouvoir décrire l’usage des livres eux-mêmes selon des formats standardisés. Propulsé par la numérisation massive (c.a.d l’extraction massive de contenu sous des formes standards), nous entrons dans l’ère des lectures industrielles. Comme ce fut le cas avec la machinisation des cartes, parmi tous les modèles commerciaux de ce nouveau monde, il y a la gratuité d’accès, spectre terrifiant pour bien des éditeurs.

Certains types de livres, fortement régulés, se laissent facilement standardiser. Peux-être certains livres pour enfants prendront-ils cette voie. Mais il est probable que les albums les plus innovants ne trouveront pas leur place dans cette logique de conteneur-contenu. L’édition jeunesse offre donc un des rare bastion de résistance à cette grande vague.

Le dilemme de la standardisation et de l’innovation

Reste donc la voie des applications, fermées, non standards mais qui offrent de véritables possibilités d’innovation. Protégées par leur carapace, les applications permettent véritablement d’explorer  les différentes manières dont le livre peut internaliser ses propres interactions. Nous sommes loin d’avoir fait le tour des livres à géométries variables, des livres qui changent selon le moment et l’endroit où on les lit, des livres qui se lisent a plusieurs de manières inédites, des livres qui apprennent au fur et à mesure qu’ils sont lus et tous les autres possibles qu’offrent les livres algorithmiques. Plus généralement, les applications permettent de designer avec précision le type d’immersion que l’on souhaite offrir à son lecteur, ce que le livre standard a complètement renoncé de proposer.

Aujourd’hui les éditeurs jeunesse sont donc face à un dilemme.

1. Standardiser leur collection et parier sur le volume

2. Concevoir quelques livres-applications très innovants (qui pourraient ouvrir la voie sur un autre futur du livre que celui proposé aujourd’hui par les standards) et parier sur leur succès.

La seconde voie est une ambition pas forcement à la portée financière de tous les éditeurs, surtout des plus modestes. D’une certaine manière le processus de production d’une application n’est pas si éloigné de celui d’un film. Les modèles commerciaux et les risques sont de même nature. Pour se lancer dans la production d’application à succès l’éditeur doit investir et prendre des risques souvent plus importants, en tout cas moins maîtrisés,  que dans le cas du papier. Le monde de l’édition a besoin maintenant de “producteurs” qui misent sur le succès de certains titres comme on investit dans la réussite de certains films. Certains se sont déjà lancé dans l’aventure avec plus ou moins du succès. D’autres préfèrent attendre encore un peu que les premières innovations dans ce domaine se standardisent. Car au final les innovations les plus réussies qui naîtront sur les îles rebelles de l’édition jeunesse, finiront un jour sans doute elles aussi par devenir des standards et trouver leur place sur le grand continent des documents bien formatés. Comme au cinéma.


La standardisation du livre : en théorie et en pratique

octobre 25, 2011

Je donne cette semaine un cours sur la standardisation de la chaîne du livre. L’histoire du livre est finalement l’histoire d’une succession de processus de standardisation et les guerres économiques actuelles sont en grande partie des guerres de standards. L’idée d’orienter ce cours autour de cette question m’a été donnée par la lecture du dernier livre de Milad Doueihi, Pour un humanisme numérique, dans lequel il articule l’idée que le plus important dans l’évolution vers le Cloud Computing est l’instauration de ce qu’il appelle le Nuage “standard”.

Le cours s’organise en quatre parties.

La première partie  donne un panorama du processus de standardisation du livre, d’un point de vue historique d’abord (rejoignant mes précédentes présentations sur les représentations régulées et le devenir machinique du livre) puis aborde les questions actuelles sur la guerre des plate-formes (Google, Apple, Amazon et surtout Adobe qu’on oublie trop souvent) et des formats. Je finis en montrant comment la standardisation qui s’applique sur trois niveaux (le formatage du texte, sa description sémantique et la description des trajectoires de lecture et de partage qui lui sont associés) donne naissance à des continents documentaires et à de services inédits.

La seconde partie se focalise sur XML, comme instrument fluide du processus de standardisation. Il s’agit d’une introduction destinée à ceux qui n’en maîtrisent pas encore les principes (graphistes, éditeurs, etc.). L’objectif est de comprendre à quoi sert XML et quelle est son originalité en particulier comment il permet de négocier des standards et de les réviser au fil du temps.

Les troisième et quatrième parties sont des travaux pratiques. Nous verrons d’abord comment partir d’un même fichier XML pour d’une part alimenter une mise en page InDesign et d’autre part produire automatiquement une animation Flash parlante. Nous terminerons par le processus inverse, l’extraction du contenu d’un fichier PDF pour produire du XML bien formé dans le but par exemple de créer un fichier ePub (comme nous l’avions fait au Salon du Livre pour les éditeurs et les bibliothécaires).


Suivre

Get every new post delivered to your Inbox.

Joignez-vous à 66 followers