Posts Tagged ‘ISBN’

Bookworld : Pourquoi expliciter le réseau interne des livres

mars 16, 2012

La première version de l’application iPad Bookworld est disponible sur l’AppStore depuis une semaine (voir la présentation et l’historique du projet dans mon précédent billet). Le Temps a  fait un bel article dessus. L’application sera également présentée au Salon du Livre de Paris ce samedi. Lorsque nous avons montré pour la première fois l’application il y a quinze jours, de nombreuses personnes m’ont demandé à quoi pouvait bien servir une application dans laquelle chaque livre est une ville. Ceci mérite peut-être en effet une petite explication.

Un livre n’est pas une trottinette

Mon discours sur le potentiel et l’importance de Bookworld rejoint par certains aspects celui que tient Valla Vakili lorsqu’il parle de Small Demons. A l’heure des grandes librairies digitales, comment découvre-t-on un nouveau livre ? Le processus de découverte est aujourd’hui presque entièrement délégué à deux types d’algorithmes basés sur l’analyse de deux types de corrélations statistiques.

Les premiers font du data mining sur les corrélations d’achats. "Ceux qui comme vous ont achète ce livre on aussi aimé celui-là".

Les seconds font du data mining sur les corrélations d’opinions. "Ceux qui ont aimé ce livre ont aussi aimé celui-là".

Dans les deux cas, les livres ne sont rien d’autre des identifiants dans une grande base de données de produits. Ils se résument à leur ISBN ou plus généralement à leur SKU. Leur "contenu" est au mieux "taggé", le plus souvent totalement ignoré. Le fait qu’Amazon ait étendu cette même algorithmie commerciale à une myriade d’autres produits est tout à fait révélateur du fait que cette machinerie ne fait aucune différence fondamentale entre un livre et une trottinette.

De plus, dans les deux cas, les statistiques de corrélations tendent à former de grands "hubs" où un petit nombre de livres pivots deviennent des passages obligés. L’algorithmie "homophile" renforce les best-sellers par rétroaction positive et ne favorise pas les chemins de traverses (voir le billet de Hubert Gillaut sur ce point ainsi que les réflexions de Danah Boyd).

Derrière ces choix algorithmiques se cachent donc des enjeux essentiels pour les chemins de la découverte d’objets culturels nouveaux.

Un livre contient lui-même un réseau d’objets culturels

Dans Bookworld, nous considérons qu’un livre est déjà un réseau complexe en tant que tel. Tout livre est une une organisation temporelle et spatiale qui structure un discours sur des personnes, des lieux, des objets (c’est même une des fonctions centrales du livre selon Pascal Robert). C’est pourquoi nous le représentons sous la forme d’une ville, métaphore potentiellement riche pour donner corps à ce réseau d’interaction.

L’application est construite pour que les lecteurs aient envie d’entreprendre ensemble ce travail titanesque qui consiste à document ce réseau, à l’expliciter. Plus il y a d’information sur un livre, plus la ville le représentant devient complexe, plus elle se lie à d’autres livres-villes construisant ainsi petit à petit la topologie de ce monde livresque.

Rob le héros du roman "Haute Fidelité" de Nick Hornby a une chanson pour chaque moment de la vie. Son passe temps favori consiste à classer les musiques (et accessoirement aussi les films) dans des TOP 5 thématiques. Quand je visite dans Bookworld la ville livre correspondant au roman, je découvre ou redécouvre cette constellation de films et de musiques. Au loin je vois d’autres villes-livres qui partagent certaines références en terme de musique, films, etc. des connections parfois insoupçonnées qu’aucun autre système de recommandation artificiel ou humain n’aurait pu trouver s’il a fait l’économie de ce processus cartographique.

La lecture est un processus d’attachement puis d’incorporation

Dans son exposé à Books in Browsers Valla Vakili explique bien que la lecture d’un livre est essentiellement une rencontre entre les référents culturels d’un lecteur et l’univers organisé de référents culturels proposé par une narration. Le personnage que Nick Hornby dessine en creux à partir à partir des objets culturels qu’il aime ou déteste me parle car je me retrouve d’une certaine manière dans ses références ou dans sa relation avec la musique. Ce processus d’attachement est fondamental dans ce qui nous fait aimer un livre. Inversement, quand un livre nous laisse indifférent ce que nous n’avons pas pu réussi à créer ces liens.

Si la rencontre entre le livre et son lecteur se passe bien, ce dernier incorpore, petit à petit, certains référents culturels du livre. Nous les faisons notre. Après ma rencontre avec la Terre du Milieux, les Hobbits ont désormais fait partie de mon monde… Tout comme ce morceau de Marvin Gay que la lecture de "Haute Fidelité" m’a fait écouter pour la première fois. Riches de ces nouveaux référents nous sommes prêts à de nouvelles rencontres livresques qui nous auraient peut-être laissées indifférents quelques semaines plus tôt. La métaphore touristique file toujours aussi bien. Dans le monde des livres aussi, certains itinéraire sont meilleurs que d’autres.

Documenter le contenu des livres ne tient donc pas d’un simple excès encyclopédique. Les liaisons narratives explicitées dans Bookworld ont une pertinence bien différente des corrélations statistiques exploitées par les algorithmes d’Amazon ou d’Apple. Caché dans la structure de ces réseaux que nous nous proposons de collectivement expliciter se cache sans doute une autre algorithmie de la découverte.

Un système de référence procédural pour les livres électroniques

février 2, 2011

Comment représenter sans ambiguïté la position d’un "contenu" au sein d’un livre électronique ?

Pour désigner un mot d’un texte, un numéro de caractère ou un pourcentage de la longueur totale peut suffire.

Mais malheureusement un livre électronique n’est pas qu’un texte.

Dans un livre papier, le numéro ISBN désignant l’édition particulière, associé au numéro de page, au numéro de ligne, puis de caractères forme une référence relativement non ambiguë.

Mais malheureusement un livre électronique n’est pas comme un livre papier. Il n’a pas forcement de pages. A l’inverse il peut contenir des images, des vidéos, des animations, des liens, des embranchements, des systèmes de circulations infiniment variés. C’est à proprement parler une machine. Et il n’est pas simple de designer sans ambiguïté une partie précise d’une machine.

Face à ce défi, deux approches complémentaires peuvent être envisagées.

Nous pouvons choisir de décrire non pas la position du contenu mais sa signature. Une chaîne de caractères suffisamment longue pour ne pas se retrouver dupliquée deux fois peut finalement constituer une bonne référence pour un passage d’un texte. De même nous pouvons de diverses manières calculer la signature d’une image, d’un tableau, d’un texte. Évidemment dans ces derniers exemples, il faut s’accorder sur une convention de calcul, ce qui n’est pas la chose la plus aisée.

L’autre approche possible est ce que j’appelle un système de référence procédural. Il s’agit à partir d’un point de départ non ambiguë de définir une succession de pas, un chemin, un itinénaire pour se rendre au contenu que l’on souhaite désigné, un peu comme on indiquerait son chemin à un passant dans la rue. Il y a de multiples manières de le faire et c’est précisément la force d’un tel système. Nous allons donc définir une série d’opérateurs (découper le livre en chapitres, en pages, etc.) leur associer un nom générique (CHAP, PAGE) et un code simplifié (C,P) dans le but de produire des références les plus courtes possibles.

Exemples :

Ligne 45 du premier chapitre

(CHAP1:LINE-45) > #C:1:L:45

Quatrième commentaire de la page 6

(PAGE6:COMMENT4) > #P:6:CO:4

Seconde vidéo du quatrième commentaire de la page 6

(PAGE6:COMMENT4:VIDEO2) > #P:6:CO:4:V:2

Seconde 45 de la seconde video du quatrième commentaire de la page 6

(PAGE6:COMMENT4: VIDEO2:TIME:45) > #P:6:CO:4:V:2:T:45

Troisième mot du transcript de la seconde video du quatrième commentaire de la page 6

(PAGE6:COMMENT4:VIDEO2:WORD:3) > #P:6:CO:4:V:2:W:3

Ligne 45 du premier chapitre de l’édition desiginée par l’ISBN 9780141182803

(ISBN:9780141182803:CHAP1:LINE-45) > #I:9780141182803:C:1:L:45

Mot "Robot" à 45.75% du texte principal du livre designé par l’ID Open Library OL86344

(ID: OL86344W:PTEXT:45.75:WORD:“ROBOT”) > #I:OL86344W:PT:45.75:W:ROBOT

Ces exemples illustrent la manière dont plusieurs types de référence peuvent cohabiter au sein d’un même système procédural.  La syntaxe choisie ici reprend le #, des tag Twitter de manière à pouvoir être immédiatement utilisable dans ce contexte. Le ":" sépare les opérateurs les uns des autres.

Deux grands avantages à un tel système de référence

1) Il marche a priori pour tous les livres passés, présents et à venir, papiers ou électroniques

2) Il est utilisable dès aujourd’hui

Suivre

Recevez les nouvelles publications par mail.

Rejoignez 205 autres abonnés