Bibliothèque numérique : Google face à l’Europe

Dossier : Google m'a tuer ! (Le livre et Internet)Magazine N°653 Mars 2010
Par Alexandre MOATTI (78)

REPÈRES

REPÈRES
Le 15 décembre 2004, Google annonçait son projet Google Books de numérisation de 15 millions de livres en six ans, en partenariat avec les plus importantes bibliothèques américaines. Trois mois plus tard, le président de la Bibliothèque nationale de France (BNF), Jean-Noël Jeanneney, lançait un vibrant plaidoyer en faveur d’une bibliothèque numérique européenne ; Jacques Chirac enfourchait alors ce cheval de bataille et, avec cinq autres chefs d’État (Allemagne, Espagne, Hongrie, Italie, Pologne), écrivait au président de l’Union européenne pour promouvoir le projet. À l’époque, ce projet soulevait un grand enthousiasme et le pouvoir politique y voyait l’occasion de redorer l’image de l’Europe à la suite de l’échec du référendum sur la Constitution en mai 2005.

Cinq ans après son lancement, la Bibliothèque numérique européenne (Europeana) est loin de répondre aux attentes soulevées à sa création. L'écart entre ce projet et celui de Google s'est fortement creusé.

Europeana n’est pas conçue pour rivaliser avec Google Books

Europeana, mise en service le 20 novembre 2008, a eu un démarrage laborieux : le site a été fermé plusieurs semaines car mal dimensionné par rapport au nombre d'accès. La force de Google est justement le nombre de ses serveurs et la rapidité de traitement des requêtes faites. Le site Europeana fonctionne maintenant, mais il se limite à un portail de recherche de documents multimédias (livres et imprimés, manuscrits, fonds photographiques, vidéos…), renvoyant aux sites des bibliothèques de chaque pays, avec des visualisations très diverses. Le document est parfois visible sur Europeana, parfois sur le site de la bibliothèque contributrice, chacune avec un visualiseur différent, ou directement en format d'affichage HTML ou PDF ; trois à quatre clics sont nécessaires pour y accéder.
 

Pour une bibliothèque numérique francophone


Illustration de l'auteur

Finalement, cinq ans après, on constate que ce ne sont pas les incantations qui font avancer les projets, ou qui font venir les internautes sur les sites. La réalisation d'une biblio­thèque numérique complémentaire de Google Books appelle, à la lumière de ce qui précède, quelques lignes d'action simples. Il s'agit d'abord d'une bibliothèque numérique pour le public le plus large possible, pas seulement pour des chercheurs ou thésards.
Elle doit avoir des objectifs ambitieux en termes d'audience, en évitant le syndrome de certains sites publics où le rapport audience-fonds investis est faible (l'objectif pourrait être de multiplier par cinq l'audience actuelle de Gallica, c'est-à-dire de passer à 1 million de visiteurs par mois). Elle tiendra un langage clair vis-à-vis de l'internaute, donc aura une gouvernance et une stratégie claires. Elle évitera la diabo­lisation des moteurs de recherche : une bibliothèque numérique aura toujours besoin des moteurs grand public pour l'indexation des textes.
Elle procédera, aussi, d'une fédération des initiatives de numérisation existantes dans le monde francophone, sous forme d'un projet bottom-up associant les bibliothèques universitaires et grandes bibliothèques municipales.
Et bien sûr, millions d'ouvrages et millions d'euros pour la numérisation sont certes importants, mais la promotion et l'ergonomie du site sont tout aussi importantes pour attirer, conserver et faire revenir l'internaute, et méritent elles aussi une partie des fonds alloués. Si l'on peut conserver la mobilisation et l'enthousiasme initiaux, ces quelques lignes traceraient la voie étroite et royale d'un dessein – d'une réplique – qui constituerait un projet de rayonnement de la culture francophone, symbole d'une diversité culturelle effective et assumée.

La sobriété, marque de fabrique de Google

À l'inverse, sur Google Books, la simplicité l'emporte ; Google y applique la recette de son moteur de recherche, afficher une page d'une grande sobriété. On n'y trouve que des livres, tous présentés de la même manière. Europeana est un site magnifique, une médiathèque bling-bling, renvoyant vers de nombreuses bibliothèques ou vidéothèques ; Google Books est une bibliothèque numérique effective et fonctionnelle, où l'on sait quoi trouver. Europeana est un site pour curieux occasionnels, potentiellement nombreux – un site d'agrément ; Google Books est un site d'habitués – un outil de travail. À notre époque d'hypercommunication, il faut livrer un message simple, ce que fait Google. Sans faire l'apologie de Google, on peut néanmoins déplorer le décalage d'avec la réalité des discours politico-médiatiques tenus en France et en Europe : Europeana n'est certainement pas conçue pour rivaliser avec Google Books.
 

Les bibliothèques européennes et l'histoire

Les bibliothèques nationales, sur lesquelles s'appuie le projet européen, constituent un patchwork aux réalités très différentes. En France, le monde patrimonial est très centralisé, aligné derrière la BNF, puissante grâce au dépôt légal instauré par François Ier. La Grande-Bretagne, pays lui aussi de longue tradition patrimoniale, s'était dès le départ dissociée du projet européen : c'est avec Microsoft qu'elle annonçait une alliance en 2005. L'Espagne a plutôt une tradition de bibliothèques universitaires (celles-ci ne sont hélas pas intégrées au projet Europeana…) : de fait la Complutense, Bibliothèque de l'université de Madrid, a été la première bibliothèque européenne après Oxford à signer avec Google – quand on connaît l'impor­tance de la langue espagnole ce fut un coup dur porté au projet. Quant aux partenaires comme l'Allemagne ou l'Italie, d'unification plus récente, leur tradition est moins centralisée : on n'y trouve pas de bibliothèque " nationale ", mais plusieurs centres bâtis au cours de l'histoire. L'une des cinq à six " bibliothèques historiques " allemandes, la Bibliothèque d'État de Bavière, a rejoint les signataires de l'accord avec Google en mars 2007.

Différents projets, pour Google comme pour les éditeurs

Clarifions un point rarement évoqué par les journalistes ou par Google. Sont à distinguer la numérisation de livres patrimoniaux, libres de droits d'auteur – et la mise en ligne de livres sous droits d'éditeur et d'auteur, qui défraie la chronique judiciaire dans divers pays. Nombre d'éditeurs récusent Google Books, d'autres y participent, avec leurs livres en " aperçu limité ".

Internet et la confiance
Les projets de diffusion de la connaissance sur Internet, bibliothèques ou encyclopédies en ligne, tablent sur la confiance, confiance faite à l'inter­naute pour démêler le bon grain de l'ivraie, confiance mutuelle entre contributeurs, ou entre contributeurs et lecteurs, sur Wikipédia. Ceux qui agitent ces épouvantails (ordre des résultats de recherche sur Google, qualité des pages de Wikipédia) sont d'une génération qui, n'ayant pas toujours compris ses usages, voit en Internet surtout ses dangers.

La sphère privée a d'ailleurs réagi fort différemment suivant les pays. En France, les éditeurs ont crié au charron et se sont retournés vers les pouvoirs publics pour bénéficier d'un soutien financier à la mise en ligne d'extraits d'ouvrages : à cet effet, la taxe parafiscale sur les photocopieurs-scanners a été augmentée dans une certaine discrétion, fin 2006, dégageant environ 10 millions d'euros supplémentaires par an, gérés par le Centre national du Livre. On trouvera, par exemple, 230 extraits d'ouvrages Gallimard sur Gallica ; et, à nouveau, pour chaque éditeur une visualisation différente.

En Allemagne, pays où l'appel à l'État est limité, le lobby culturel peu prégnant et le monde des bibliothèques moins centralisé, 1 000 éditeurs et libraires se sont regroupés dès 2005 en consortium et ont mis en ligne, avec une visualisation unique, 100 000 ouvrages (voir http://libreka.de).

Y a-t-il un réel besoin de consulter un ouvrage ancien écrit dans une autre langue ?

Début 2005, Google Books avait été critiqué pour son fameux page ranking (ordre des résultats de recherche) – ainsi la Révolution française y aurait été vue à travers des ouvrages vantant " les vaillants aristocrates britanniques triomphant des jacobins sanguinaires2 ".

Cette crainte est largement infondée – on sait comment fonctionne un moteur de recherche, s'appuyant sur les références les plus consultées. Elle procède d'une diabolisation de l'Internet et d'un manque de confiance en l'internaute : quiconque utilise un moteur ou une bibliothèque numérique effectue, dès le premier clic, un travail de recherche – l'internaute est capable d'analyser lui-même les informations reçues.

Qu'est-ce que le patrimoine européen ?

Sacoche d'un ordinateur sous forme de livre
Sacoche d’un micro-ordinateur, sous forme de livre ancien (Société Twelwe South).

La France avait, en 2004, une longueur d'avance sur Google et sur les autres pays européens : le site Gallica de la BNF existait depuis cinq ans et cumulait 80 000 ouvrages. On aurait pu capitaliser sur cette avance en lançant, avec le même portage politique fort, une bibliothèque numérique francophone3, développant autour de Gallica les projets de nombreuses bibliothèques (universitaires notamment), en France et dans la francophonie. Une autre option a été choisie, celle d'une bibliothèque européenne : le projet fut long à démarrer, la Commission européenne a attendu que les 24 autres pays se mettent à niveau avant d'organiser laborieusement l'assemblage de ce patrimoine numérique babélien.

Google prévient toute concurrence avec d'autres moteurs de recherche

Mais y a-t-il un réel besoin de l'internaute à consulter un ouvrage ancien écrit dans une autre langue – sachant que les ouvrages littéraires et scientifiques importants sont généralement traduits ? Un mythique " patrimoine européen " fut souvent évoqué : n'est-ce pas justement ce qu'a numérisé Google en cinq ans, laissant Europeana loin derrière ? Le patrimoine des grandes bibliothèques américaines alliées à Google est justement le patrimoine allemand, anglais, espagnol, français, italien… autrement dit le patrimoine de l'émigration européenne qui a fait les États-Unis. Une bibliothèque numérique bénéficiait en 2005 d'une " fenêtre de tir " avec le soutien politique fort existant à l'époque. Mais la Commission européenne a ralenti le projet en le transformant en médiathèque et non simple bibliothèque d'imprimés ; elle a proclamé le projet prioritaire sans dégager des financements pour la numérisation : ceux-ci restent du ressort de chaque " État membre ".

Coopération ou compétition ?

Même si l'exercice paraît facile a posteriori, demandons-nous ce qui aurait pu être fait à partir de 2005. Dans l'option européenne (répétons qu'elle ne nous paraissait pas la meilleure), on aurait pu mener une négociation commune, par exemple sous l'égide de la Commission européenne, entre l'ensemble des bibliothèques et Google.

Cela aurait fourni le chaînon manquant – le financement de la numérisation – au projet européen. Après la diabolisation de Google, ç'eût été Canossa : mais justement, quelles sont les contreparties que requiert Google en échange de la numérisation gratuite des livres patrimoniaux ? Elles sont connues, car la loi américaine impose à toute structure publique de publier ses contrats. La bibliothèque dispose de ses ouvrages numérisés par Google, qu'elle peut placer sur son site.

Financements public et privé
Les États membres financent directement leur apport à la Bibliothèque numérique européenne. Ce système à deux paliers montre, une fois de plus, son incapacité à faire face à la concurrence d'une entreprise à centre de décision unique et à action rapide. De fait, rares sont les pays qui ont lancé une numérisation de leur patrimoine : fin 2009, plus de 80 % des documents d'Europeana proviennent de France – notre pays continue à devancer ses partenaires.

Les atouts de Google
Avec Google Books, Google capitalise sur ses deux forces principales, issues de sa compréhension profonde de l'Internet : une capacité à gérer des accès simultanés à des documents de plus en plus volumineux – même une grande bibliothèque américaine ne peut s'improviser gestionnaire d'une telle ferme de serveurs ; et une stratégie fondée sur l'idée que les moteurs sont – et seront toujours plus à l'avenir – la porte d'accès à Internet.

 
Il y a toutefois deux restrictions importantes. D'abord, la bibliothèque ne peut en faire d'usage commercial, car Google se réserve à terme le droit de vente de l'impression de la copie numérique sous forme de livre – se positionnant ainsi sur le marché potentiel du livre numérique à imprimer. Ensuite, Google prévient toute concurrence avec d'autres moteurs de recherche (Bing, Yahoo, AOL…) en spécifiant la non-indexabilité des fichiers du site de la bibliothèque : la bibliothèque numérique de l'université reste invisible à un quelconque moteur de recherche externe – sachant que pour Google l'indexation de la copie du livre sur ses propres serveurs est automatique.

Ainsi, un internaute assidu du site University of California, ou présent dans la bibliothèque et y utilisant l'Intranet, trouvera sans problème les oeuvres numérisées sur le site de cette université ; un autre internaute (99 % des cas) trouvera l'œuvre via Google et la consultera sur Google Books. Nous ne jugeons pas ce que certains en France qualifient de " pacte faustien " des bibliothèques – il s'agit bien de diabolisation, même si elle reste feutrée et littéraire ! – nous nous contentons de fournir des éléments d'analyse. Quant aux bibliothèques qui ont signé avec Google, elles estiment de leur mission que leur patrimoine soit ainsi diffusé, même en dehors de leur site.


Recherche de l’ouvrage Calcul de l’effet des machines de Coriolis (X1808) sur le moteur Google. Le deuxième résultat, après Wikipédia, est l’ouvrage cherché, visible sur Google Books. Bravo pour le page ranking, s’il me donne ce que je cherche en deuxième résultat.


Le nouveau visualiseur Gallica de la BNF. Ouvert sur deux pages, le Mémoire sur les roues hydrauliques à aubes courbes (1827) de Jean-Victor Poncelet (X 1807).

La foire à la numérisation

Quaero (latin pour «Je cherche»)
La coexistence en 2005-2006 des deux projets Quaero (moteur de recherche franco-allemand) et BNUE (Bibliothèque numérique européenne), tous les deux dirigés contre Google, apportait une certaine confusion dans l’esprit du grand public, voire de nos décideurs : certains imaginaient que Quaero serait le «moteur» de BNUE. L’ensemble de ces projets (Quaero, BNUE, Géoportail) faisait partie en 2005 d’une stratégie politique au plus haut niveau (voir Wall Street Journal, «Le Google», 4 août 2006).
Concernant Quaero, un bilan d’utilisation des fonds publics serait là aussi utile à dresser.

Depuis 2005, le paysage a profondément changé, comme souvent sur Internet. Microsoft a abandonné MSN Books en mai 2008 ; il reste partenaire d'une bibliothèque numérique, Open Content Alliance, qui ne bénéficie pas de la notoriété de Google. Même du côté de Google, les opportunités pourraient se tarir ; suite aux atermoiements du projet européen et en l'absence d'un projet francophone alternatif, trois bibliothèques francophones d'importance ont contracté avec Google : la Bibliothèque universitaire de Lausanne (Suisse), celle de Gand (Belgique) et la Bibliothèque municipale de Lyon. Elles contiennent une partie importante du patrimoine de langue française.

L'obligation de dépôt légal ne porte en France que sur l'exemplaire papier

Quel intérêt Google aurait-il à numériser un ouvrage déjà numérisé par une autre bibliothèque ? Il y va de la saine gestion de ses fonds. Question duale – qu'une bibliothèque ou des gestionnaires publics pourraient se poser : quel intérêt y a-t-il à numériser sur fonds publics un ouvrage qu'on peut déjà trouver sur Internet ? Et, en corollaire, qu'est-ce qu'une bibliothèque numérique : un site lié à l'institution (BNF, Bibliothèque de Lyon, etc.), ou une plateforme universelle comme l'est Google Books ?

Ces questions ne sont pas neutres, lorsqu'on parle comme en ce moment de remèdes miracle pour la numérisation du patrimoine, l'appel au " grand emprunt " salvateur, ou la coopération franco-allemande… Cette dernière idée laisse perplexe vu l'échec d'un autre projet informatique franco-allemand, le moteur de recherche Quaero, lui aussi lancé en fanfare en 2005, censé être le moteur de recherche européen rivalisant avec Google, et finalement abandonné par les Allemands.

La bataille des référencements

Dépôt légal sous format numérique?
Il est un point malheureusement fort peu mentionné dans les débats actuels. Alors que tous les ouvrages existent sous forme numérique chez l’auteur, l’éditeur et l’imprimeur, l’obligation de dépôt légal en France ne porte actuellement que sur l’exemplaire papier. Une loi de 2005 a rendu possible – c’est bien le moins – mais non obligatoire le dépôt légal des fichiers numériques, en complément du livre papier. Que penseront nos petits-enfants dans soixante-dix ans, une fois ces ouvrages libres de droit, quand ils voudront les intégrer dans leur bibliothèque numérique, et ne retrouveront plus chez les éditeurs les fichiers numériques correspondants?

Il pourrait bien se faire que les positions soient figées pour un certain temps dans la diffusion de la connaissance sur Internet. À Wikipédia les encyclopédies en ligne – Google semble avoir renoncé à développer son encyclopédie Knol. À Google les bibliothèques numériques : la guerre Europeana-Google Books n’aura pas lieu. De nombreux chercheurs, mais aussi de jeunes internautes du type geek, privilégient des références Google Books : la bataille des réfé- rences données par les prescripteurs (par exemple, les contributeurs à Wikipédia) est importante, car elle draine les internautes vers telle ou telle bibliothèque numérique. Europeana est sans doute morte avant d’avoir vécu – elle continuera à engloutir de l’argent européen pour la confection du site, le graphisme, les serveurs – tout sauf la numérisation ; à l’instar de nombreux sites européens, coûteux, esthétiques et à audience limitée, elle attirera quelques internautes comme curiosité mais non comme outil de travail. Gallica, en avance en 2004, reste un bon outil de travail. On peut redouter néanmoins que les postures du monde administrativo-politique, son incompréhension chronique des usages de l’Internet, sa vision baroque et son évocation mystique d’une « exception culturelle», enfin la lourdeur de la surcouche européenne, définie comme prioritaire, n’aient déjà compromis l’avenir de cet outil.

_______________________________
1. BNUE, ou Europeana, www.europeana.eu
2. Jean-Noël Jeanneney, « Quand Google défie l'Europe », Le Monde, 24 janvier 2005.
3. J'avais, dans mon rapport au ministre de la Culture R. Donnedieu de Vabres (avec Valérie Tesnière et Noémie Lesquins, janvier 2006, www.bibnum.net), préconisé cette option (voir aussi Alexandre Moatti, « Pour une bibliothèque numérique francophone », Le Monde, 20 septembre 2007).

Témoignages

Le Kindle est une pure « liseuse ». Son écran e-Ink lui donne une longue autonomie et permet une lecture confortable, en tournant les pages séquentiellement. Choisir son livre sur le portail d’Amazon, puis le trouver installé dans sa liseuse, via les réseaux mobiles, est son innovation «magique» car Amazon s’est construit une large offre de titres comme principal distributeur des éditeurs américains. D’où son succès, particulièrement dans les fictions ou les livres rapidement périssables. Les chiffres en témoignent : durant la période de Noël, Amazon a vendu davantage de versions Kindle que papier lorsque les deux étaient disponibles. Cette liseuse révolutionne l’édition, comme l’iPhone pour l’Internet mobile.

Inversement, à Princeton dont Jeff Bezos, le PDG d’Amazon, est un ancien élève, le pilote d’utilisation universitaire rencontra les vives critiques des étudiants. L’appareil est mal adapté aux annotations et à la consultation de plusieurs textes en parallèle. Les livres électroniques auront sans doute diverses trajectoires, selon leurs utilisations, avec des terminaux et des modèles économiques différents.

Jean-Philippe Papillon (90),
directeur général de SagaTel et IT.Cal

Le réseau implique évidemment une modification en profondeur des habitudes de lecture et de consultation, dans la manière d’aborder les problèmes. La survie des bibliothèques traditionnelles est liée à la survie du livre. Pour le moment au moins, il me semble que le livre ne va pas disparaître : plus on utilise les ressources en ligne, plus on est amené à recourir à des livres, dans le cas de recherches telles que les miennes en tout cas. On a même l’impression, peut-être en partie illusoire, que les livres publiés sont de plus en plus nombreux, ou que du moins on a accès à un nombre croissant de livres et d’articles (grâce au prêt entre bibliothèques en particulier).

Françoise Létoublon,
helléniste, Institut universitaire de France, Grenoble

 

Poster un commentaire