Posts Tagged ‘interface’

Tout Rousseau en numérique

juin 27, 2012

Les éditions Slatkine et Honoré Champion ont présenté hier la monumentale édition des oeuvres complètes de Jean-Jacques Rousseau dans la maison natale du philosophe dans la vieille ville à Genève. Ce fut un évènement haut en couleur et en érudition. A cette occasion, j’ai présenté les grands principes de fonctionnement de la version numérique de ces oeuvres complètes, dont les éditions Slatkine nous ont fait l’honneur de nous confier la conception et la réalisation.

La mise en scène se prêtait bien à mon propos. J’avais en face de moi, sur une table basse, les imposants 24 volumes de l’édition papier et je présentais l’édition numérique sur un fin écran suspendu par deux fils au plafond. La question était donc : Comment faire rentrer un si imposant volume dans une si fine surface ?

Un monument de papier est par essence en trois dimensions. On peut le visiter comme un lieu. Nos repères et habitudes pour la navigation spatio-temporelle sont opérants. Selon l’échelle de la métaphore choisie, chaque volume est la pièce d’un appartement ou une ville d’un pays.

Sur une surface sans épaisseur, nous devons inventer des artifices supplémentaires pour compenser cette troisième dimension  tout d’un coup manquante. Voici quelques unes des idées, développées en particulier par notre designer Gael Paccard,  que nous explorons dans cette réalisation.

1. Des menus proportionnels aux contenus auxquels ils donnent accès

Sur une interface informatique classique, les menus hiérarchiques sont souvent identiques quel que soit la quantité de contenus auxquels ils donnent accès. Une des particularités de cette nouvelle édition des oeuvres complètes de Rousseau est qu’elle fait la part belle à des pans entiers de l’oeuvre du philosophe sur lesquels les éditions précédentes n’avaient pas porté autant d’attention. Les 2400 lettres occupent 7 volumes, les écrits sur la musique plus de 1500 pages. La nouvelle importance relative de ces différentes sections se perçoit d’un coup d’oeil sur l’édition papier, mais risquait de disparaitre dans la version numérique.

Nous avons donc choisi d’utiliser pour la navigation hiérarchique des menus verticaux, dont la hauteur de chaque section est proportionnelle au nombre de pages auxquelles elles donnent accès. L’utilisateur sait déjà mieux ce qui l’attend derrière chaque clic. Cette solution a également l’avantage de donner un profil visuel aux oeuvres complètes dans leur ensemble. Nous rappelons ce profil en permanence à gauche de l’interface de manière à permettre une navigation agile depuis n’importe quelle partie de l’oeuvre, vers n’importe quelle autre.

2. Des barres de navigation indiquant la densité textuelle des pages

Un problème similaire de navigation se pose au sein d’un livre donné. Les ascenseurs/sliders de navigation tels qu’ils sont utilisés dans certaines liseuses ne donnent qu’une information très pauvre visuellement. L’utilisateur voit simplement sa position relative par rapport au début et à la fin du livre. Nous avions introduit dès nos premiers Bookapps sur iPad, un procédé visuel simple et efficace en proposant des barres de navigations sous la forme d’histogrammes dans lesquels chaque page d’un livre est représentée par le nombre de mots qu’elle contient. Cette représentation, fine et dense (qui plairait sans doute assez à Edward Tufte pour cette raison), permet de voir synthétiquement les différentes structures du livre (changement de chapitre, passages avec illustrations, zones de notes) en les identifiant par leur densité textuelle relative. Maintenant que nos yeux sont informés, notre dextérité est suffisante pour placer le curseur où nous le souhaitons.

3. De nouvelles manières de circuler

Notre interface propose un moteur de recherche un peu particulier. Lorsque vous tapez « Luxembourg », vous trouverez bien sûr l’ensemble des pages où ce mot est présent, chacune présentée par un petit extrait donnant le contexte d’apparition du mot. Ces extraits sont regroupés par oeuvre. Vous pouvez à loisir effectuer cette recherche sur le livre que vous êtes en train de consulter, sur le thème auquel il appartient (par exemple « Confessions et documents autobiographiques ») ou sur l’ensemble des oeuvres complètes.

Au-dessus des résultats de recherche, vous trouverez également les noms des personnes mentionnés dans les oeuvres complètes qui correspondent au mot cherché, en l’occurrence ici, Charles-Francois-Frédéric de Montmorency-Luxembourg, maréchal-duc de Luxembourg et Madeline-Angélique, duchesse de Luxembourg. En choisissant un de ces deux noms, vous arrivez sur une page qui présente l’ensemble des apparitions de cette personne dans l’oeuvre de Rousseau, mais également le réseau social des personnes qui lui sont associées. Ce réseau est construit en calculant les cooccurrences (sur une mêmes page) de cette personne avec les autres personnes citées par Rousseau. Si deux personnes apparaissent ensemble sur plus de 5 pages dans toute l’oeuvre nous considérons qu’un lien les unit. Le maréchal du Luxembourg apparait par exemple très souvent avec sa femme la duchesse, mais aussi avec Louis de Neufville, duc de Villeroy. Pour comprendre le lien qui unit ces deux personnes, l’interface vous permet d’afficher les pages où elles apparaissent effectivement ensemble. Ce principe simple de navigation montre que se cache dans l’oeuvre de Rousseau un véritable « Facebook » du XVIIIe siècle. Notre interface se contente de l’expliciter.

4. Une ressource facilement citable

Étant donné que cette nouvelle édition est à ce jour la plus complète ressource disponible sur le philosophe, il nous semblait important qu’elle puisse être utilisée comme une ressource pour toutes les études futures de Rousseau publié sur le web. Chaque page de l’oeuvre est associée à une URL unique qui permet d’y faire référence dans un article, un email, un tweet, etc. La consultation de l’oeuvre est ensuite gratuite pendant 5 minutes, un temps suffisant pour prendre connaissance du passage en question. Pour une lecture plus longue ou une exploration plus vaste de cette édition, il faudra s’acquitter d’un droit d’accès avec une formule pour les particuliers et une formule pour les institutions.

Cette édition électronique sera disponible à la rentrée prochaine, mais il aurait été dommage de ne pas l’annoncer alors que « le citoyen de Genève » fête ce 28 juin ses 300 ans.

La construction collective des métadonnées en bibliothèque

avril 28, 2012

Nous avons organisé ce jeudi, avec Alain Jacquesson et Silvère Mercier (blog), une formation pour les bibliothécaires (comme l’an dernier) au Salon du Livre de Genève.  Alain Jacquesson a fait un point complet et critique sur les ressources numériques disponibles aujourd’hui pour les bibliothèques et les centres de documentation en ce qui concerne les revues (NewJour, DOAJ, Seals, Revues.org, CAIRN) et les monographies (Projet Gutenberg, Gallica, Rero.doc, Google Livre, Internet Archive, Hathi Trust). Il a également fait le point sur les nouveaux services de prets (Overdrive, Amazon). Silvère Mercier a proposé un atelier sur les stratégies des médiations numériques en faisant découvrir par la pratique les outils pour proposer du contenu éditorial sous la forme  de « dispositifs ponctuels » (storify, mindmeister, Libraything, scoop.it, Google maps, Dailymontion, Pearltrees, Markup.io, Prezi, etc.) à insérer dans des « dispositifs de flux » (Blog, twitter, profil Facebook, etc.). J’ai pour ma part proposé d’explorer la manière dont on pouvait développer en bibliothèque la lecture sociale et la production collective de métadonnées, une direction encore relativement peu explorée. Le billet ci-dessous reprend en partie mon argumentaire. 

 

 

La bibliothèque est une interface physique 

Une bibliothèque est toujours un volume organisé en deux sous-espaces : une partie publique (front-end) avec laquelle les usages peuvent interagir, une partie cachée (back-end) utilisée pour la logistique et le stockage.  A la Bibliothèque Nationale de France, c’est un système robotisé qui fait la jonction entre les espaces immenses et sous-terrains ouverts au public et les quatre tours qui stockent les livres. L’architecte Dominique Perrault a imaginé une vertigineuse bibliothèque-machine où la circulation des hommes a été pensée symétriquement à la circulation des livres.

Alain Galey discute dans « The Human Presence of Digital Artefacts » la vue séctionnée de la New York Public Library telle quelle apparait sur la couverture du Scientific American le 27 Mai 1911. La bibliothèque est ici sans ambiguïté présentée comme interface physique mettant en contact des lecteurs avec des collections de livres archivés. Au sommet les bibliothécaires gèrent les requêtes et le catalogue et utilisent un système de tubes pneumatiques pour commander les livres stockés dans les étages inférieurs. Les livres, une fois localisés, remontent vers par des mini-ascenseurs.  Presque un siècle avant la bibliothèque Francois Mitterand, la NY Public Library est présentée commune une bibliothèque-machine, préfigurant le rêve de l’open-access des digital humanities.

Dans d’autres grandes bibliothèques et surtout dans tous les centres de documentations de taille beaucoup plus modeste, c’est encore aujourd’hui une logisitique humaine plus ou moins complexe qui organisent les circulations de livres entre le front-end et le back-end. Dans un article du dernier numéro de ligne en ligne, Véronique Poirier décrivait avec poésie l’articulation de ces deux espaces à la BPI.

Tous les matins et chaque mardi, la bibliothèque est fermée au public. Elle se transforme alors en une vaste ruche où se croisent les chariots bleus, rouges, jaunes, verts. Des livres quittent les étagères, d’autres les remplacent. L’espace étant limité, une volumétrie stable (près de 390 000 livres), doit être maintenu grâce à une gestion rigoureuse de l’équilibre entre le nombre d’ouvrages acquis et le nombre de « désherbés ».

Ce souci d’équilibre et de sélection, éléments clés dans la gestion de toutes les bibliothèques et centre de documentation, grand ou petit,  est aussi une des problématiques centrales des interfaces. Celui qui conçoit un site web ou une application iPad se demande également comment organiser au mieux l’espace de navigation et les cheminements des utilisateurs, comment articuler l’expérience « front-end » avec la logistique et le stockage back-end. Mais quand le créateur d’applications doit composer avec une surface de quelques centimètres carrés, le bibliothécaire dispose lui souvent d’un volume articulable en rayonnage, en espace d’échanges, en zones de travail spécialisées.

Durant les dernières années, nous avons vu apparaître de grandes bibliothèques construites selon un autre type d’organisation. Le Rolex Learning Center au sein duquel j’ai la chance d’avoir mon bureau, est organisé selon une logique tout autre et selon un plan qui optimise plus les échanges et les activités autour du livre, que l’accès aux livres eux-mêmes. Cette nouvelle tendance peut-elle servir de modèle directeur pour des bibliothèques de taille plus modeste ?

La tentation de la virtualité 

Avec l’arrivée du numérique, Il est tentant pour la bibliothèque de nier sa dimension physique, de ne devenir qu’une machine à information aux front-ends démultipliés, accessibles par toutes sortes de terminaux et aux back-end entièrement informatisés. On se souvient que Jacques Attali, alors conseiller de Francois Mitterand, avait en son temps critiqué le projet architecturale la bibliothèque-machine de la BNF pour lui opposer l’urgente nécessité d’une BNF directement numérique et algorithmique, accessible de partout et qui serait le meilleur outil possible pour la diffusion de la culture française à travers le monde.

Mais sur ce point, les questions stratégiques et patrimoniales des grandes bibliothèques ne rejoignent pas les questions locales pour nombre de modestes centres de documentation. Les bibliothèques n’ont aujourd’hui que des droits très encadrés pour l’exploitation digitale des livres qu’elles proposent en lecture ou en prêt. Impossible pour elles de construire de nouveaux services en exploitant directement des nouveaux circuits commerciaux de livre numérique « grand public » dans la mesure où la législation leur interdit la diffusion de contenus obtenus « sous le régime réservé à l’acquisition personnelle » (rappelons que les bibliothèques achètent plus cher les livres et les DVDs précisément pour pouvoir les exploiter dans le cadre particulier des services qu’elles proposent). Dans ces conditions, il est peu étonnant que ce soit en ordre dispersé et expérimentant parfois dans les zones grises qui entourent ces nouveaux usages, qu’elles essaient aujourd’hui de proposer certaines offres de prêt numérique complémentaire à leurs services traditionnels.

Dans billet écrit suite à un différent avec une bibliothécaire de Martigues, François Bon rappelait les deux manières de lire du numérique en bibliothèque

a. La bibliothèque acquiert le droit de diffusion un certain nombre de titres à un tarif défini par l’« interprofession » et les diffuse avec des DRM chronodégrable (la lecture n’est autorisée que pendant un certain temps).  En France, c’est la solution adoptée par Numilog basé sur Adobe Digital Reader et un logiciel de lecture particulier type Bluefire par exemple).

b. La bibliothèque acquiert le droit de diffuser en streaming certains contenus à des utilisateurs identifiés (via leur carte d’abonné par exemple). Plusieurs bibliothèques diffusent de cette manière les titres de publie.net

Ces nouvelles formes de prêt numérique sont un enjeu important et transverse sur dans le paysage de la lecture numérique. Il faut suivre avec attention les initiatives canadiennes dans ce domaine  au travers de la plateforme pretnumerique.ca (voir le billet de Clément Laberge) qui combine les usages de types a et b pour éviter que ce marché soit remporté par des fournisseurs externes. En effet, le risque est de voir la bibliothèque se faire l’intermédiaire de solution de prêt proposé par d’autres fournisseurs. La solution Overdrive est par exemple adoptée par un nombre semble-t-il croissant de bibliothèques aux USA. Ces questions sont donc en rapport direct avec la constitution des plateformes interprofessionnelles et de circuits de distribution indépendants des grands libraires digitaux que sont Google, Apple et Amazon.

Néanmoins, penser que l’avenir des bibliothèques se joue uniquement dans le succès ou l’échec de leur virtualisation et la constitution d’archives de contenus « empruntables » est peut-être un pari risqué. En ne portant son attention que sur l’indépendance des circuits de distribution et des services numériques, ne risque-t-on pas de passer à côté de ce qui pourrait être la vraie valeur des bibliothèques dans ce paysage de pratique de lecture en grande mutation ?

Pour Silvère Mercier, les bibliothèques peuvent se différencier en proposant de l’information de qualité, des services de questions-réponses et d’autres activités éditoriales. À côté des organes de presse, elles peuvent proposer une information et des services différents, ancrés dans leur rôle de service publique. C’est une piste riche et passionnante, déjà bien explorée par certaines initiatives locales.

Parmi ces services, il me semble qu’un dispositif particulier mériterait d’être développé de façon plus poussée : la construction et la curation collectives des métadonnées.

La bibliothèque comme lieu de production et de curation collective de métadonnées riches

Une bibliothèque n’est pas qu’une archive de contenus accessibles selon des règles de prêt particulières. C’est aussi et avant tout une interface physique de découverte. Je discutais dans un précédent billet de la pauvreté des interfaces proposées par les grandes libraires numériques. Deux types d’algorithmes statistiques sont utilisés en exploitant soit les corrélations d’achats ( “Ceux qui comme vous ont acheté ce livre ont aussi aimé celui-là”), soit les corrélations d’opinions (“Ceux qui ont aimé ce livre ont aussi aimé celui-là”). Les livres ne sont, dans ce jeu algorithmique, que de simples identifiants, des produits comme les autres.

Une des missions de la bibliothèque est d’organiser une rencontre physique différente entre des lecteurs et des livres. Le bibliothécaire est un match-maker. Il peut travailler à cette mission en utilisant aux mieux les trois atouts qu’il a sa disposition : un espace physique organisable, une équipe compétente et une communauté locale plus ou moins fidèle.

Beaucoup d’exemples tirant profit de ce triangle vertueux pourraient être envisagés, mais dans ce billet je ne développerai qu’une lignée de pratique qui semble pertinente (et relativement nouvelle). Les bibliothèques et les centres de documentations peuvent participer à l’organisation la production et la curation sociale de métadonnées riches.

La production et l’organisation métadonnées ont toujours été au coeur du travail du bibliothécaire. Elles constituent une de ces compétences premières. Plusieurs exemples récents ont montré que dans certaines conditions la production sociale de métadonnées riches était envisageable pour peu que les bonnes boucles d’engagements soient mises en place (voir mes billets Wikipedia est un jeu et Un monde où chaque ville est un livre). En détaillant par exemple des fiches de personnages, de lieux et d’objets, d’auteur sur les livres les plus empruntés et invitant les usages à faire de même, une bibliothèque peut mettre en place une communauté locale de pratique, une sorte de club de lecture qui travaille lui-même à un but plus vaste et organise ses contributions dans un réseau d’autres communautés locales.

Pour cela il faut bien sûr des outils communs et neutres.  Je n’ai pas de doute que des tels outils seront créés dans les prochains mois, car plusieurs dynamiques poussent dans ces directions

— Le développement des humanités digitales et la prise de conscience de leur importance géostratégique (voir mon billet sur cette question)   permettent de dégager d’important fonds de recherche académique dans ces nouvelles directions. Une des missions des humanités digitales est précisément de contribuer à la production d’outils communs et neutres permettant à des communautés de pratiques de s’organiser pour produire des métadonnées riches.

— La prise de conscience simultanée de l’importance historique des bibliothèques dans la constitution du capital linguistique et sémantique (voir mon billet « Le trésor de guerre de Google Books ») et de l’importance de ne pas laisser ce capital entièrement dans des mains privées. Les bibliothèques ne peuvent que dans des conditions particulières numériser et diffuser les livres qu’elles proposent, mais elles peuvent en extraire des informations linguistiques et sémantiques et les rendre accessibles gratuitement comme un bien commun. De la même manière qu’elles ont parfois contribué sans s’en rendre tout à fait compte à la constitution des nouveaux empires du capitalisme linguistique, elles peuvent aussi maintenant jouer un rôle moteur dans constitution d’immenses bases de données libres détaillant le contenu des livres, leurs relations mutuelles et permettant ainsi les bases d’outils de découverte sans précédent.

Une interface physique centrée sur la visualisation et la production de métadonnées

Plutôt que de construire une bibliothèque pensée comme une interface physique à la distribution de livres (le modèle de la bibliothèque machine que nous avons discuté au début de ce billet) nous pourrions envisager d’adapter certains espaces des bibliothèques aux activités de curation collective. Tout pourrait commencer par des visualisations intéressantes. La bibliothèque pourrait par exemple présenter un grand mur une carte des relations entre les auteurs d’un certain pays, la géographie des lieux d’une famille de romans policiers, l’arbre généalogique des personnes d’une saga, etc. Ces données visuelles, ces diagrammes et ces cartes seraient autant d’invitation à découvrir des livres et des auteurs nouveaux.

Dans une seconde étape, le bibliothécaire pourrait inviter les abonnés les plus motivés à participer à ces processus cartographiques. Notre expérience avec Bookworld nous a confirmé que visualisation et participation sont intimement liées. Voir un livre-ville complexe donne envie d’en construire un soi-même. La bibliothèque en mettant en scène et en valeur les productions de certains abonnés pour amorcer des pratiques locales, une forme de nouveaux clubs de lecture, où il ne s’agirait plus tant de critiquer les livres qu’on a lus, mais de travailler ensemble à leur cartographie.

Les métadonnées que les bibliothécaires produisent, structurent et organisent depuis les débuts des pratiques documentaires ont toujours été à la base de l’organisation physique des espaces que les bibliothèques proposent. Pourquoi ne pas continuer dans cette voie en élargissant les pratiques et les services à une communauté locale de lecteurs ?

Variations sur le corps, corps variables

novembre 23, 2011

Invité par Michel Serres et Yves Coppens, j’interviens samedi à Lyon dans la journée « Variations sur le corps« . Je discuterai de la question du corps et de l’incarnation et de son rapport à la technologie. En particulier, je reviendrai sur une nouvelle conception de l’incarnation qui nous permet de penser un corps à géométrie variable autour des concepts de noyau et d’enveloppes. Paradoxalement, ce sont des expériences en robotique qui ont permis de préciser certaines intuitions anciennes sur ces questions. Je discuterai les implications de cette nouvelle conception en particulier dans un monde où nous sommes continuellement en interaction avec des dispositifs techniques globalisés.

Corps à géométrie variable

Lorsque nous interagissons avec des dispositifs techniques notre corps s’étend, et change de forme. Le bâton, le marteau, le stylo, la fourchette, l’éplucheur, la raquette, l’épée prolongent notre main pour  se trouver, après un peu d’habitude, complètement intégrés à notre corps. Sans y penser, nous nous baissons un peu plus lorsque nous portons un chapeau, changeons notre démarche lorsque nous portons des pantoufles ou des talons aiguilles. Nous sommes la voiture que nous sommes en train de conduire. Il nous aura fallu de longues heures de corps à corps avec cette machine pour nous habituer à son maniement. Au début c’est un corps étranger, hostile et résistant. Mais une fois cet apprentissage réussi, la voiture est comme un second squelette, une seconde peau. Nous avons intégré le volume de sa carrosserie, sa vitesse de freinage et d’accélération. A partir d’un certain point, conduire devient aussi naturel que marcher, une activité inconsciente.

Notre enveloppe corporelle est donc extensible, étirable, changeante. Nous l’étendons au marteau que nous saisissons le temps de planter un clou, puis une fois l’opération terminée l’outil redevient un objet extérieur, à portée de main, mais séparé. Notre schéma corporel n’est pas un modèle de notre corps, c’est un espace à géométrie variable. A chaque instant, nous sommes le point de vélocité maximale, l’extrémité du bâton, la pointe de l’épée, l’icône de la souris. Cette avec cette extrémité active que nous agissons, mais aussi que nous sentons, mesurons, éprouvons. Ce processus d’incorporation, encore mal compris et relativement peu étudié, est fondamental. Vivre c’est se métamorphoser en permanence.

Pierre-Yves Oudeyer et moi-même avons proposé il y a quelques années une approche particulière du processus d’incarnation basé sur les concepts de noyaux et d’enveloppes. La première version de ce modèle a été publié en 2008 dans un article en Français dans La Revue Philosophique de la France et de l’Etranger, intitulé « le corps comme variable expérimentale« . En 2009, nous avons publiés en version étendue de cet article en Anglais dans le journal Control, Measurement, and System Integration, intitulée « Stable kernels and fluid body envelopes« . Dans ces deux articles, nous revenions sur l’évolution des concepts de corps et de processus d’animation dans les 60 dernières années en robotique.

 

Le corps séparé

Les premiers automates du XVIIIe siècle (Vaucanson, Jaquet-Droz, etc) furent sans doute les premiers à introduire une distinction nette entre une mécanique corporelle et un procédé d’animation programmable. L’Écrivain de Pierre et Henri-Louis Jaquet-Droz est équipé de quarante cames qui contrôlent le mouvement de sa plume. Le même corps peut ainsi effectuer différentes séquences selon les positions du système de cames. Progressivement, les dispositifs mécaniques permettant la programmation se multiplient : métiers à tisser, cartes perforées, cylindres de cire. Les procédés d’animation se développent sous la forme de modules toujours plus indépendants du corps mécanique de l’automate

Au milieu du XXe siècle, avec l’arrivée de l’ordinateur numérique, le divorce entre le corps physique et le procédé d’animation est consommé. L’automate, que l’on nomme dorénavant robot, se conçoit comme un corps physique doté de senseurs et d’actuateurs contrôlés par un programme informatique, description abstraite, « informationnelle » de son comportement. Il est alors facile de faire « exécuter » successivement de nombreux programmes différents sur le même corps robotique.

Deux disciplines complémentaires voient le jour. D’un côté, les chercheurs en intelligence artificielle s’attellent à imaginer des algorithmes permettant à la machine de classer, de prédire, de décider. De l’autre, les roboticiens développent de nouveaux senseurs et de nouveaux actionneurs élargissant ainsi le « monde » dans lequel les robots évoluent.

Immanquablement, les deux disciplines divergent. De nombreux chercheurs en intelligence artificielle en particulier ne considèrent plus l’incarnation comme une composante essentielle de leur recherche. Ils préfèrent concentrer leur effort sur la modélisation de comportements cognitifs humains complexes, élaborent des modèles de l’intelligence humaine adaptés au diagnostic médical, à la preuve de théorèmes mathématiques ou aux jeux de société. Ces algorithmes viennent soutenir une vision de l’intelligence humaine comme étant avant tout un système de manipulation de symboles. La psychologie cognitive s’empare de cette hypothèse soutenant que ce type de processus de traitement de l’information rend mieux compte des mécanismes de l’intelligence que ne font les théories comportementalistes très influentes outre-Atlantique. Les hypothèses cognitivistes et computationalistes, stipulant que la pensée est réductible à un ensemble de calculs symboliques, s’imposent. Le corps, quant à lui, est oublié, irrémédiablement séparé des mécanismes de l’intelligence.

Symétriquement, alors qu’un domaine de recherche entier explore l’intelligence sans corps, un autre s’attelle à développer des corps sans intelligence. Les premiers robots industriels sont installés dans des environnements prédictibles, contrôlés à l’extrême. Sur les chaînes de montages, ils exécutent des mouvements calibrés. Dans les ateliers, ils réalisent des manipulations standardisées avec précision. Malheureusement, dès qu’il s’agit de faire évoluer les machines dans des environnements non contraints, non connus à l’avance ou changeants, le comportement des robots semble impossible à programmer.

Entre les années 1950 et la fin des années 1980, le schisme qui sépare les concepteurs de « corps » et les chercheurs en « intelligence » a des conséquences directes sur les performances des machines produites. Les algorithmes d’intelligence artificielle conçus pour manipuler des symboles définis a priori et non ambigus se révèlent fortement inadaptés à la complexité et l’imprévisibilité du monde réel. À titre d’illustration, considérons le problème qui consiste à essayer de faire marcher un robot quadrupède à partir d’un algorithme d’intelligence artificielle classique. Il ne s’agit plus de manipuler des symboles abstraits, mais un corps complexe qui, selon les configurations, peut rapidement se trouver en position de déséquilibre, notamment si, comme pour la plupart des robots, il est constitué de membres rigides dont le programme doit contrôler la position. Le revêtement du sol, les degrés de friction sous les pattes influencent directement les mouvements de la machine. Pour fonctionner, il est nécessaire que le système soit équipé d’un modèle précis du corps du robot et aussi de l’environnement dans lequel il évolue. C’est, dans bien des cas, quasiment impossible. Vu sous cet angle, marcher à quatre pattes peut se révéler être un problème plus difficile que démontrer des théorèmes mathématiques.

Le corps retrouvé

Pour sortir de cette impasse, une nouvelle école de pensée voit alors le jour à la fin des années 1980, autour de chercheurs comme Rodney Brooks, Luc Steels et Rolf Pfeifer. L’intelligence artificielle incarnée (embodied artificial intelligence) rejette l’approche symbolique et désincarnée de l’intelligence artificielle « classique » en postulant qu’il ne peut y avoir d’intelligence sans corps et sans environnement. Rodney Brooks ajoute que le corps et l’environnement ne sont pas modélisables et que la recherche doit donc renoncer à construire des modèles de la réalité extérieure pour se concentrer sur l’interaction directe avec l’environnement : « Le monde est le meilleur modèle de lui-même ».

Ce changement de perspective annonce un renouveau des expériences robotiques et un retour à des méthodes de conception et d’expérimentation qui caractérisaient la robotique d’avant l’ordinateur numérique. Les « tortues » cybernétiques de Grey Walter construites en 1948 sont alors prises comme exemple de ce que doit être une bonne conception intégrant de manière fine la conception de la machine physique aux comportements souhaités. Ces robots entièrement analogiques étaient capables de comportements complexes, sans pour autant utiliser de « représentations » internes. Leur conception tenait compte du fait qu’il s’agissait de machines physiques, soumises à la gravité ou aux frictions, qui produisent leur simulation sensorielle par leur propre mouvement. La nature et la disposition de leur système sensoriel leur permettaient de résoudre des « tâches » complexes comme retrouver leur station de recharge, sans qu’il soit nécessaire pour autant de faire appel à un quelconque « raisonnement ».

Pour tenter de convaincre les cognitivistes qui ne voient en l’intelligence qu’une forme sophistiquée de traitement de l’information, les chercheurs en intelligence artificielle incarnée tentent de définir le type de traitement « computationnel » morphologique (morphological computation) réalisé par le corps lui-même. Pour résoudre un problème comme la marche quadrupède, plutôt que de construire un système de contrôle plus sophistiqué, il est plus efficace de construire un corps doté des dynamiques physiques adaptées. Si l’on remplace les membres rigides et les moteurs puissants du robot par un système équipé de ressorts inspirés de la dichotomie muscle-tendon que l’on retrouve chez les animaux quadrupèdes, il suffit alors d’un système de contrôle simplissime produisant juste un mouvement périodique de chaque patte pour obtenir une marche élégante et adaptée. Une fois posé sur le sol, le robot se stabilise après quelques pas dans un rythme de marche correspondant à ses dynamiques naturelles. La vitesse de marche correspondante n’est pas arbitraire et il est d’ailleurs difficile pour le robot de sortir de ce qui constitue « un bassin d’attraction » de ce système dynamique. Seule une perturbation suffisamment importante peut permettre au robot de quitter ce rythme naturel pour retomber ensuite vers un autre « attracteur » correspondant par exemple à un comportement de « trot ». Ainsi, en rupture avec la division héritée du partage en disciplines de l’après-guerre, l’intelligence artificielle incarnée réaffirme l’importance du corps en illustrant son rôle pour la construction de comportements complexes : conception corporelle et procédés d’animation doivent être envisagés comme formant un tout cohérent.

Le corps comme variable expérimentale

Au début des années 1990, les expériences de la nouvelle intelligence artificielle se concentrent essentiellement sur la modélisation de comportements d’insectes, exemples stratégiquement éloignés des programmes d’intelligence artificielle classique qui jouent aux échecs. Mais, dans les années qui suivent, certains chercheurs tentent d’étendre cette même approche pour construire des robots capables d’apprendre comme le font les jeunes enfants. L’idée n’est pas nouvelle, puisqu’elle était exprimée par Alan Turing dans ce qui a été un des articles fondateurs de l’intelligence artificielle, mais la perspective « sensori-motrice » développée par l’intelligence artificielle incarnée lui donne une dimension inédite. Comment, en effet, une machine pourrait-elle développer par elle-même des compétences sensori-motrices pour interagir avec son environnement ? Par quels mécanismes pourrait-elle s’engager dans une trajectoire développementale ouverte comme celles qui caractérisent le développement de l’enfant ? En quelques mois à peine, un enfant apprend à contrôler son corps, à manipuler des objets, à échanger avec ses proches pour devenir un être autonome capable d’interactions complexes, tant physiques que sociales. De jour en jour, il acquiert des savoir-faire de plus en plus complexes tant sur le plan perceptif que dans ses possibilités d’interaction. Dans quelle mesure une machine pourrait-elle faire la même chose ?

En posant ces questions, les chercheurs en robotique « développementale » ou « épigénétique »  remettent partiellement en cause les bases initiales de l’intelligence artificielle incarnée et introduisent une rupture méthodologique. L’importance du corps est toujours affirmée, puisqu’il s’agit de développer des compétences sensori-motrices intimement liées à une morphologie et un environnement donnés. Mais, tout en gardant une approche holistique, il semble de nouveau nécessaire d’identifier, au sein du système robotique, un processus indépendant de tout corps, de toute niche écologique et de toute tâche particulière. En effet, par définition, un mécanisme qui puisse permettre de pousser à apprendre toujours de nouvelles compétences ne peut être spécifique à certains types de comportements, de milieu ou même de corps. Il doit être général et abstrait, indépendant du corps.

Ainsi, à peine retrouvé, le corps se trouve de nouveau divisé. Mais la séparation n’est plus celle héritée des cartes perforées et de l’ordinateur numérique qui distinguait le matériel du logiciel. Dans ce nouveau dualisme méthodologique, il s’agit de séparer une enveloppe corporelle potentiellement variable correspondant à un espace sensori-moteur donné et un noyau d’entraînement, ensemble de processus généraux et stables capables de contrôler n’importe quelle interface corporelle. En distinguant ainsi un processus d’incarnation général et des espaces corporels particuliers, les développements les plus récents de la robotique épigénétique conduisent à reconsidérer le corps sous un autre angle. Contrairement aux corps physiques stables et lourds, entièrement ancrés dans le réel, les enveloppes corporelles, quant à elles, sont potentiellement des espaces variables et changeants. Contrairement aux programmes d’animation toujours différents de la robotique et de l’automatique, nous considérons maintenant un noyau stable, toujours identique, agissant comme un moteur pour le développement. Ce n’est plus le corps qui reste et les programmes qui changent. C’est exactement l’inverse : le programme reste et le corps change.

Cette vidéo montre un robot qui apprend à marcher à partir d’un noyau d’entraînement générique qui le pousse simplement à explorer son corps. Le même programme peut être associé à un autre « corps » et donner une trajectoire comportementale complètement différente. Il faut en général plus de trois heures pour que l’algorithme découvre plusieurs ensembles de paramètres permettant au robot de marcher en avant, en arrière, latéralement ou de tourner sur lui-même. À aucun moment, le robot n’a comme objectif d’apprendre à marcher. Dans cette expérience le robot découvre d’abord comment marcher en arrière mais ce premier attracteur est le résultat de la structure particulière de son corps. Une jambe plus longue ou un dos plus souple aurait pu le conduire à une trajectoire différente.  Du point de vue méthodologique, nous pouvons par ces approches de faire du corps une variable expérimentale dont on peut étudier les effets toutes choses égales par ailleurs.

Le corps variable

Paradoxalement, la robotique, si souvent associée aux comportements saccadés de corps rigides et fixes, propose aujourd’hui un cadre théorique et expérimental pour étudier l’influence du corps : elle permet de penser le corps comme une variable. Outre son intérêt méthodologique, cette approche ouvre la voie à une nouvelle conception du corps, fluide et en continuelle redéfinition. Penser le corps comme une variable expérimentale nous permet de penser la variabilité du corps.
Plus qu’une technologie des corps animés, la robotique apparaît alors comme science et pratique de l’incarnation. En dégageant le concept de noyau stable et générique, origine de la motricité et de l’exploration, et le concept d’enveloppes corporelles changeantes, elle offre un cadre explicatif nouveau pour reconsidérer les questions du développement, de l’inné et de l’acquis. En effet, qu’est-ce que le développement si ce n’est une séquence d’incarnations successives : non seulement un corps en perpétuel changement, mais aussi des espaces corporels qui se succèdent les uns aux autres ? Chaque nouvelle compétence acquise change l’espace à explorer. La marche en est à nouveau un exemple illustratif. Une fois maîtrisée, elle permet à l’enfant l’accès à un nouvel espace de recherche.

Penser le corps variable, c’est aussi penser une notion de corps étendu capable d’incorporer les objets qui l’entourent sous la forme d’agencements transitoires. Dans cette perspective, outils, instruments de musique et véhicules sont autant d’enveloppes corporelles à explorer, sans différence fondamentale avec leur pendant biologique.

En pensant le corps variable, ne pourrait-on pas considérer le raisonnement symbolique et la pensée abstraite comme autant de formes d’extensions corporelles ? Si, comme le suggèrent Lakoff et Nunez, il y a une correspondance directe entre la manipulation sensori-motrice et les raisonnements mathématiques les plus abstraits, nous pouvons naturellement considérer que même les processus mentaux les plus « intérieurs » peuvent être pertinemment interprétés comme des enveloppes corporelles à explorer. L’usage de la langue elle-même ne pourrait-il pas être interprété comme une incarnation corporelle particulière ? Nous discutons de cette dernière question avec le linguiste Benjamin Bergen dans un article publié dans Infant and Child Developpment intitulé « Computational models in the debate over language learnability« .

Au fur et à mesure que le temps passe,  il devient clair que cette approche particulière du processus d’incarnation permet de penser de manière inédite nos interactions avec les nouvelles interfaces et les relations globales que permettent les technologies numériques et l’ordinateur planétaire. Notre voisinage s’est étendu. Nos incarnations se sont diversifiées. Intéragir dans le micro-monde que propose FaceBook, c’est faire corps avec une interface particulière, comme lorsque nous jouons du Piano, écrivons un texte dans un logiciel, lisons un ebook ou faisons une recherche sur Google. La grande différence c’est que dans ce corps à corps technologique nous sommes en contact avec les représentations produites par d’autres corps. Plus ces boucles interactives se resserrent, plus ces interactions technologiques ressemblent à des danses.

Une véritable science des interfaces passera donc par une compréhension fine de ce nouveau dualisme. Il nous faut bien-sûr explorer les mécanismes neuraux qui supportent peut-être cette articulation entre noyau et enveloppe (nous avons commencé cette cartographie dans un article intitulé In search of the neural circuits of intrinsic motivation publié il y a quelques années dans Frontiers in Neuroscience).  Il nous faut surtout nous débarrasser des vieux paradigmes du corps machine et de l’esprit programme, pour penser la variabilité de notre corps et considérer toute activité immersive, même dans le monde digital, comme une forme d’incarnation.