Fin octobre, Jean-Noël Lafargue, dont on ne recommandera jamais assez le blog ((Qui s'appelle Le Dernier Blog pour une raison qu'il explique ici, et à laquelle le temps qui passe ne cesse d'ajouter à l'ironie, puisqu'il en crée régulièrement de nouveaux, comme ici ou là ou encore là si vous préférez les Pokémons.)), avait piqué ma curiosité avec ce reportage sur le scanner à livres fabriqué, essayé et adopté par les partageux bidouilleurs de La Quadrature du Net — dont l'action ne se limite pas, et de loin, à scanner de vieux Jules Verne, mais qui montrent ainsi que le partage, la réflexion sur les communs, l'internet libre et toussa toussa, ce n'est pas que des mots. Et ce n'est pas qu'à Paris : Benjamin Sonntag, ci-devant confondateur de La Quadrature et directeur technique d'Octopuce, était à Nancy samedi 18 janvier pour y présenter cet intrigant scanner. Les réjouissances avaient lieu à l'invitation de Nancy Numérique, et se tenaient dans une des salles de lecture de la superbe bibliothèque municipale, rue Stanislas ((L'après-midi avait également lieu une démonstration tout public à la Médiathèque de la Manufacture, mais je n'y étais pas.)).
L'idée de départ est la suivante : concevoir un appareil qui facilite la numérisation de livres tout en évitant de les abîmer. Contrainte supplémentaire : que l'investissement, la fabrication et l'utilisation soient à la portée d'un (ou plusieurs) bricoleur ayant quelques week-ends devant lui. Il ne s'agit donc pas d'écraser vos livres pour les faire entrer dans un scanner à plat, ni de mettre au point un système qui tourne les pages tout seul (ça existe, c'est cher et pas non plus sans danger pour le livre), mais de trouver le juste milieu. Benjamin Sonntag est parti du projet développé par Dan Reetz et la communauté regroupée autour du site diybookscanner.org, et y a ajouté un logiciel de gestion de projet de sa conception.
Le principe : un berceau en V accueille le livre ouvert, qui est plaqué par le dessous contre une vitre vers laquelle pointent deux appareils photo préréglés, qui photographient chaque double page. La machine permet ainsi de scanner jusqu'à 700 pages par heure, et la moulinette de logiciels ((Je ne détaille pas ici, tout les liens sont disponibles sur cette page. Tous les logiciels et plans utilisés sont évidemment libres.)) qui y est reliée recadre les pages, ajuste le contraste et les convertit en noir et blanc, avant de les envoyer à la reconnaissance optique de caractères. On peut donc obtenir en à peu près deux heures un fichier texte de son livre, qu'il ne restera plus qu'à relire et à peaufiner pour en faire un bel ePub, par exemple. Seule la phase de démarrage a l'air exigeant : il faut découper et assembler précisément le bois pour garantir les angles de prise de vue (mais des planches prédécoupées sont également en vente), installer et configurer les logiciels pour mettre en place la chaîne de traitement (sous Linux pour le modèle présenté, j'imagine que cela doit être également possible sous Windows). Pour environ 700€ appareils photo compris, certainement moins si l'on découpe soi-même le bois, on dispose d'un scanner parfaitement fonctionnel et d'une qualité bluffante — cela se voyait dans les yeux des bibliothécaires présents.
Maintenant, à quoi ça sert ? À ne pas laisser Google s'occuper de la culture à ta place, camarade. À faire vivre le domaine public en participant au mouvement mondial de partage des connaissances, les livres ainsi numérisés pouvant rejoindre les silos d'Archive.org ou de Wikisource, par exemple. À numériser ses propres livres pour les mettre dans sa tablette ou s'en servir comme outil de travail — les livres en papier, c'est bien, mais il n'y a pas de bouton « rechercher » dedans. Tout cela pose des questions de droits d'auteur, bien sûr. Qu'ai-je le droit de numériser ? Tous les livres que je possède (ou que j'emprunte en bibliothèque) à condition que je possède aussi le scanner. Qu'ai-je le droit de diffuser ? Tous les livres du domaine public. Pourquoi ma bibliothèque n'a-t-elle pas de bookscanner à disposition du public ? Parce que le droit doit encore évoluer, mais les bibliothécaires sont comme toi : ils veulent que le savoir circule, et soit approprié. Dans le bon sens du terme : assimilé, réutilisé librement — et pas confisqué pour faire la fortune de celui qui a les clés du coffre. Et tu sais quoi ? Ça ne tuera pas les bibliothèques, ni les auteurs, ni les éditeurs, ni les libraires. Sauf ceux qui ne veulent pas voir que le monde change. Alors quoi ? On monte un bookscanner à Nancy ?