La numérisation du patrimoine considérable dont notre pays est dépositaire s’inscrit nécessairement dans la durée. Rien que pour la Bibliothèque nationale de France et ses dizaines de millions de documents de toutes sortes, il faut compter en décennies. Aussi, l’objectif stratégique qu’elle poursuit est clair, et il est constant : la numérisation massive et aussi exhaustive que possible de son patrimoine, en vue de sa mise en ligne. C’est la priorité absolue. Depuis près de six ans, la BnF a mis en œuvre deux programmes de numérisation de masse de ses imprimés : grâce à une subvention du Centre national du livre, quelque dix millions de pages sont mis en ligne chaque année dont une part très importante provient désormais d’autres bibliothèques françaises. Depuis 2009, la BnF a engagé dans les limites de son budget propre la numérisation méthodique de ses collections spécialisées : manuscrits, estampes, photographies, cartes et plans, monnaies, etc, au rythme d’un million de prises de vue par an. Gallica donne ainsi aujourd’hui accès librement à plus de deux millions de documents de toute nature avec des fonctionnalités constamment améliorées et désormais des versions pour mobile. Ce résultat est impressionnant mais nous sommes loin du compte ! Des pans entiers sont numérisés à un rythme beaucoup trop lent, surtout pour les collections qui sortent du champ des aides du CNL.
Ce constat n’est pas neuf et si l’on n’y remédiait pas, l’avantage pris notamment par Google ne cesserait de s’accroître. Afin de compléter les moyens existants, l’État a mis en place, sous l’autorité du Commissariat Général à l’Investissement, un dispositif spécifique : des fonds peuvent être affectés à la numérisation du patrimoine mais ne peuvent être débloqués qu’à l’occasion de partenariats avec des entreprises dans des projets dont la viabilité économique doit être démontrée, selon un modèle qui va s’appliquer aussi à la numérisation des œuvres indisponibles du XXe siècle. Il s’agit en effet de favoriser la croissance et l’emploi, objectif dont il est difficile de contester la pertinence. Il eût été absurde de se priver a priori d’une telle possibilité d’accroître notre effort.
En accord avec le Ministère de la Culture, la BnF, au mois de juillet 2011, lançait un appel public à partenariats, en identifiant une douzaine de projets majeurs. Deux de ces projets ont abouti le mois dernier : l’un va permettre la numérisation intégrale des collections sonores de la BnF antérieures à 1962 – plus de 700 000 titres sur disques 78 tours ou microsillons, un ensemble unique au monde par sa richesse et aujourd’hui très difficilement accessible. Ce projet constitue une première mondiale qui fera date. Notre partenaire Believe Digital, société française et leader européen dans la diffusion musicale numérique, et son associée, la société belge Memnon, vont pouvoir, grâce à la contribution des investissements d’avenir, accomplir une prouesse technique sans précédent par le nombre de titres numérisés et par la qualité du rendu, fruit d’un effort de recherche-développement spécifique. Alors qu’au rythme actuel il nous aurait fallu plus d’un siècle pour parvenir à ce résultat, l’accord va permettre de réaliser ce tour de force en sept ans ! La majorité de la collection étant encore sous droits (80 % pour les microsillons), elle ne peut être mise en libre accès sans acquitter des droits d’auteur. Outre la consultation d’extraits gratuits sur Gallica, Believe Digital assurera la diffusion de cet ensemble sur des centaines de plateformes, y compris celles qui, comme Deezer, proposent l’écoute légale d’œuvres protégées. La démultiplication de l’accès à ces trésors cachés sera donc phénoménale. L’exclusivité accordée en contrepartie à notre partenaire est de dix ans après la signature du contrat, c'est-à-dire qu’elle cessera trois ans à peine après la réalisation complète de son investissement, beaucoup moins que les sept ans recommandés par l’Union européenne.
L’accord avec ProQuest, éditeur académique américain, concerne les imprimés les plus anciens antérieurs à 1700, au nombre de soixante-dix mille et obéit à un modèle économique différent. Comme le précédent, il va bien au-delà d’une simple opération de numérisation puisqu’il s’accompagne d’un important travail scientifique d’enrichissement des descriptions. Il s’inscrit dans un vaste programme international « Early European Books », qui inclut l’Angleterre, l’Italie, le Danemark et les Pays-Bas. Bien entendu, les livres de la même période déjà disponibles sur Gallica, en particulier les éditions anciennes de tous les grands auteurs, de Rabelais aux classiques du XVIIe, restent en libre accès. L’accord avec ProQuest prévoit d’ailleurs d’enrichir cet ensemble de 3500 ouvrages supplémentaires. La numérisation se fera par lots et s’effectuera en six ans au total, là où la BnF aurait mis seule au moins 25 ans. Elle sera de qualité supérieure à celle de Google. Alors que les originaux ne sont aujourd’hui consultables que par un seul lecteur à la fois et sous condition, leur version numérique deviendra donc accessible immédiatement aux quelque 1500 lecteurs quotidiens de la BnF et à ceux des centaines de bibliothèques de recherche qui ont souscrit de par le monde au programme « Early European Books ». Les bibliothèques françaises bénéficieront d’une remise correspondant à la part des ouvrages de la BnF. Les ouvrages viendront tous en libre accès sur Gallica dix ans après leur numérisation. Cette durée est très sensiblement inférieure à celle que nos partenaires européens ont accordée à ProQuest faute de pouvoir participer au financement. L’accord va donc nous permettre d’atteindre nettement plus vite l’objectif de diffusion universelle de cet ensemble.
L’imputation de « privatisation du domaine public » avancée par certains à propos de ProQuest est évidemment fausse. Les œuvres en question sont et restent bien entendu dans le domaine public ; tout autre éditeur peut demander à publier les mêmes textes s’il le souhaite. L’expression d’« expropriation du bien commun » est tout aussi fausse : on ne peut être exproprié que d’un bien existant, alors que le but de cet accord est justement de créer ce bien nouveau (les collections numériques). Certes, les chercheurs français qui s’intéressent à cette collection savante, souvent en latin, devront pendant quelques années continuer à se rendre à la BnF pour la consulter, comme c’est le cas aujourd’hui, mais cette fois sans restriction aucune. Une extension au territoire national, excluant tous les autres pays, nous aurait valu les critiques de la Commission européenne, mais la question peut être traitée notamment dans le cadre d’une politique nationale de licence ou selon d’autres formules. En tout état de cause, l’élargissement des accès, dans le modèle des investissements d’avenir, suppose soit une dépense supplémentaire directe soit un allongement des durées d’exclusivité, que nous avons cherché au contraire à éviter. Et je le répète, l’accord avec ProQuest nous permettra de mettre en libre accès l’intégralité de cette collection, mieux décrite, plus vite et plus complètement que ce que nos moyens actuels, et à plus forte raison nos moyens futurs dans un contexte budgétaire difficile, nous auraient permis de faire. A moins d’un accroissement très significatif des subventions publiques en France et en Europe, peu probable dans la situation actuelle, la revendication du « tout en libre accès, tout de suite », le refus de principe de tout partenariat n’obéissant pas à ce mot d’ordre, conduiraient en pratique à ralentir la numérisation du patrimoine dans notre pays et même à l’interdire chez ceux de nos voisins qui n’ont pas d’alternative.
On ne peut ignorer en effet que ces partenariats, pour lesquels la filiale de la BnF a reçu une dotation de cinq millions d’euros, permettent de lancer des projets qui en auraient coûté sans cela au moins le triple. Ils vont entraîner la création de dizaines d’emplois et apporter un soutien décisif à une entreprise française qui s’affirme comme un leader dans son domaine. Il est enfin pour le moins inapproprié de parler de dérive commerciale de la BnF alors que celle-ci a exclu toute sélection des corpus en fonction de leur potentiel marchand et que tous les revenus de sa filiale seront réinvestis dans la numérisation de son patrimoine.
S’en tenant au seul aspect de l’accès gratuit, certains en sont venus à reprocher à la BnF de n’avoir pas préféré un partenariat avec Google, hypothèse qui, on le sait, avait déclenché une vive controverse en son temps. Il est vrai que les ouvrages numérisés par Google sont aussitôt mis en libre accès sur Google Books. C’est un atout considérable, mais qui ne doit pas conduire à ignorer les problèmes que la commission Tessier avait bien mis en lumière, notamment la durée excessive des clauses d’exclusivité d’exploitation commerciale et de non-indexation par les autres moteurs, ou encore le fait que Google Books n’indexe pas les autres bibliothèques numériques telles que Gallica. Au demeurant, après avoir réglé son litige avec les éditeurs et numérisé de très importantes quantités d’ouvrages français, l’intérêt de Google pour les collections de la BnF semble avoir fortement diminué. Il reste désormais à trouver les moyens de permettre à Gallica ainsi qu’à Europeana de donner accès aux ouvrages que Google numérise à la bibliothèque de Lyon, puisque les deux partenaires en acceptent le principe.
Le libre accès gratuit et universel, immédiat pour la plupart des documents du domaine public, différé pour ceux qui sont encore protégés ou qui sont numérisés dans le cadre des investissements d’avenir, reste le principe fondateur de Gallica. La BnF a déjà fait tomber quelques barrières que l’on croyait encore inamovibles il y a peu même si cela paraît insuffisant aux yeux des militants de l’Open Data : la libre réutilisation des données de Gallica est depuis 2010 possible pour toute forme d’exploitation autre que commerciale –en particulier pour la recherche et l’enseignement ; en tant que président d’Europeana, j’ai plaidé pour que la France place sous licence libre ses « métadonnées », c'est-à-dire la description des œuvres, si nécessaire à l’exploitation par les moteurs de recherche. Aller au-delà ne peut résulter que d’une politique nationale qui doit aussi composer avec le souhait de l’État de valoriser son patrimoine immatériel et de trouver de nouvelles ressources. La BnF est sans nul doute l’un des plus gros fournisseurs au monde de ressources numériques en accès gratuit et nous pouvons en être fiers. Le souci d’élargir toujours plus l’accès à ses richesses et de toucher de nouveaux publics est ce qui guide la BnF, conformément aux valeurs qui sont les siennes.
Une action rapide et économe en deniers publics (certes pas en efforts de concertation) serait d'imposer par la loi le dépôt numérique aux éditeurs, en lieu et place du dépôt légal physique. Les économies obtenues permettront de lancer de nouveaux projets.
Deuxième action, valoriser le patrimoine informationnel de la BNF déjà tombé dans le domaine public. Actuellement, Gallica est quasi inutilisable du fait que ce service utilise des images, au lieu du texte. Un trafic internet important peut être valorisé et dégager des recettes nouvelles pour la BNF.
Troisième action, favoriser l'accès à des collections étrangères numériques, plutôt que d'acheter quantités de revues, livres etc. qui coûtent très cher à manipuler et ne sont que rarement ouverts. Les chercheurs universitaires préfèrent les collections numériques, car elles permettent des recherches, des analyse textuelles, etc. mais ils se heurtent à la résistance des bibliothécaires.