Jean-Noël Jeanneney, le président de la Bibliothèque nationale de France, se réjouit de cette annonce. Jeanneney indique l'une des failles selon lui de Google Print « Si vous tapez Victor Hugo, vous avez à peine un ouvrage en français. Man Who Laughs, c'est bien, mais c'est mieux dans la langue d'origine.»
Au delà de l'intérêt et des questions soulevés par le projet de Google, je me suis demandé quel était la situation d'autres projet de ce type.
J'ai donc été faire un tour sur Gallica et j'ai cherché « Victor Hugo ». On obtient évidemment plus de réponses qu'avec Google Print. Cependant les livres sont scannés dans un format image. Il est donc impossible par exemple de faire de la recherche pur texte ou de manipuler aisément le contenu (par exemple pour faire des citations). La collection de Gallica est impressionnante mais mériterait de revoir le format des documents.
Ensuite, direction le projet Gutenberg. Recherche sur « Victor Hugo ». On obtient quelques livres en français dans un format parfaitement lisible par n'importe quel ordinateur. On peut faire de la recherche pur texte, faire du copier-coller pour des citations.
Rappelons que la philosophie du projet Gutenberg, lancé en 1971 par Michaël S. Hart, « de rendre accessibles au plus grand nombre la littérature et les oeuvres culturelles, sous des formes électroniques utilisables par la quasi-totalité des ordinateurs, afin que l'on puisse facilement les lire, les utiliser, les citer et les diffuser ». Le projet numérise les livres appartenant au domaine public pour édifier la bibliothèque gratuite et universelle. Le site du projet Gutenberg assure aujourd'hui la diffusion de près de 16 000 livres sous format électronique, avec près de 500 nouveaux livres par mois. Ce gigantesque travail est réalisé par plus d'un millier de bénévoles du monde entier, qui numérisent, transcrivent et relisent les ouvrages, en se partageant efficacement le travail (http://www.pgdp.net/c/default.php ). Cet effort collectif est à la mesure de l'enjeu de la diffusion de la connaissance et de l'accès au savoir pour tous.
On lira avec intérêt l'audition de Michaël Hart par la fondation Temps Nouveaux.
Le projet Gutenberg démontre ce qu'il est possible de faire par le travail de bénévoles intéressés par la diffusion de la connaissance.
1 De Manue -
Cette comparaison entre Gallica et le projet Gutenberg illustre parfaitement la problématique des bibliothèques numériques à l'heure actuelle. Les bibliothèques sont tenues de valider le contenu qu'elles mettent en ligne et de le garantir comme fidèle à l'original. Elles ne peuvent pas recourir à des bénévoles, car si elles le faisaient le coût du contrôle qualité serait énorme (il faudrait tout relire et vérifier). L'autre possibilité est de faire du mode image qui reste pour une institution dix fois (environ) moins cher que le mode texte, et qui garantit cette fidélité à l'original. Pour le projet Gutemberg, il n'y a pas ce problème et le recours à des bénévoles est possible. Des solutions commencent à apparaître où le mode image est conservé pour l'affichage tandis que le mode texte est utilisé pour la recherche d'occurences ; c'est ce que fait Google mais la manipulation du texte (pour récupérer les citations par exemple) reste difficile ou, dans le cas de Google, impossible. Et puis cela pose de nouveaux problèmes techniques, et les bibliothèques ont encore du chemin à faire avant de savoir les résoudre.
2 De Piotrr -
"Des solutions commencent à apparaître où le mode image est conservé pour l'affichage tandis que le mode texte est utilisé pour la recherche d'occurences ; c'est ce que fait Google mais la manipulation du texte (pour récupérer les citations par exemple) reste difficile ou, dans le cas de Google, impossible"
Persée (www.persee.fr) le fait de manière très astucieuse, au moyen d'un pop up textuel qui s'ouvre lorsqu'on clique sur l'image de la page.
Je voulais juste ajouter que la pertinence d'une comparaison entre Google, Gallica et Gutenberg me semble finalement assez limitée : Gallica et Gutenberg s'attaquent essentiellement aux oeuvres libres de droits. L'enjeu majeur pour Google concerne les oeuvres sous copyright. C'est très bien de faire des recherches sur Victor Hugo, mais il me semble aussi utile de pouvoir accéder à
Peyrache-Leborgne (Dominique) - 1997
Poétique du sublime de la fin des Lumières au Romantisme. Diderot, Schiller, Wordsworth, Shelley, Hugo, Michelet - Paris : Champion, "Bibliothèque de littérature générale et comparée"-9, 1997, (520 pp.)
(c'est publié chez Champion, avant de le voir chez Google, les poules auront des dents ;-) )
3 De guerby -
Aucun des textes ni aucune des images de Gallica ne sont dans le domaine public, meme pour les oeuvres depuis longtemps dans le domaine public, ils les redistribuent en pretendant remettre une licence (payante !) donc un droit d'auteur dessus, voir :
www.bnf.fr/pages/zNavigat...
Le projet de google est la seule chance avec le projet Gutenberg d'avoir le domaine public digitalisé *vraiment* dans le domaine public, on peut oublier la BNF malheureusement.
Laurent
PS : j'ai déja contacté par courriel la BNF, j'ai recu une réponse confirmant la tarification pour une oeuvre du 19eme si je voulais la mettre sur ma page web.
4 De guerby -
Bonne URL:
www.bnf.fr/pages/zNavigat...
PS: la prévisualisation est cassée elle ne montre pas les séparations de paragraphes (firefox 1.06) ni les liens.
5 De Gabriel Ballard -
I enjoyed reading your stuff. Cool site. black girls on their mission: www.sun.com , <a href="www.av.com">think that will make relief</a> , <a href="www.apple.com" rel="itsok">my parents didnt told me about it</a>
6 De NICI33Vn -
I opine that the argumentative term paper composing seems to be the most time wasting procedure. Nevertheless, we rely on the <a href="http://quality-papers.com">custom writing</a> service assistance anytime when it is demanded.