mardi 18 mars 2014

Histoire Naturelle à l'âge du numérique

A lire sur: http://www.bulletins-electroniques.com/actualites/75127.htm

La Bibliothèque du Patrimoine de la biodiversité (BHL, Biodiversity Heritage Library), un consortium des bibliothèques d'histoire naturelle et de botanique du monde entier, possède une collection de plus de 40 millions de pages de texte décrivant l'organisation de la vie sur terre. C'est actuellement la seule source d'information disponible gratuitement pour la majorité des espèces que nous connaissons sur notre planète.

Le problème : la majeure partie de cette information n'est pas numériquement accessible. "Les capacités de recherche possibles sur le site de BHL sont actuellement limitées, et ne sont utiles que pour trouver des informations sur un petit nombre d'espèces connues", dit Evangelos Milios de la faculté d'informatique de l'université de Dalhousie. "Ces manuscrits sont importants pour les biologistes, car ils témoignent de l'état de la vie sur terre au cours de l'histoire et sont les seules sources dont nous disposons sur les espèces telles que nous les connaissions il y a 200 ou 300 ans."

Avec Anatoliy Gruzd, directeur du Laboratoire des médias sociaux de l'université de Dalhousie, le Dr Milios est co-responsable d'une équipe qui aide à la reconstruction de l'histoire de la biodiversité à l'ère du numérique. Le projet s'appelle "Mining Biodiversity" (MiBio, 'extraction' de la biodiversité), et l'équipe de Dal est l'une des 14 au monde qui ont été choisies lors du troisième Digging into Data Challenge (Challenge fouille des données), un concours dédié au développement de nouvelles idées et outils sur la façon dont le 'Big Data' pourrait modifier la recherche dans le domaine des sciences humaines et sociales. Chaque équipe représente un consortium de chercheurs et de professionnels de l'information issus des grandes universités ou bibliothèques.

Extraire la prochaine génération d'information:
En collaboration avec le Centre national de Text Mining à l'Université de Manchester et la BHL, MiBio visera à transformer la BHL en une bibliothèque numérique de nouvelle génération. Il va également fournir une bibliothèque en ligne avec un système de recherche sémantique pour aider les chercheurs et le public à accéder aux documents scientifiques sur la biodiversité.

Dr Milios dit que l'équipe va travailler à enrichir la bibliothèque numérique à grande échelle, à faciliter l'accès aux documents relatifs à la biodiversité par le biais d'un moteur de recherche amélioré , et à stimuler la collaboration et l'échange entre les utilisateurs de la BHL grâce aux médias sociaux . Il intégrera l'exploration de texte, la visualisation, le crowdsourcing (approvisionnement par les utilisateurs) et des médias sociaux dans la BHL. "L'Université de Dalhousie a les capacités technologiques pour mener ce projet", explique le Dr Milios . "Notre expertise dans l'extraction de texte et sa visualisation est complémentaire de celle de notre partenaire, le Centre national de Text Mining (NaCTeM) au Royaume-Uni."

Un défi majeur du projet sera de retranscrire la dynamique évolutive de la biodiversité telle qu'enregistrée dans les anciens livres d'histoire naturelle. Cela soulève des questions de terminologie scientifique, la signification des noms taxonomiques ayant évolué au cours du temps. Par exemple, à l'origine le mot "reptile" comprenait les amphibiens, ce qui n'est plus le cas aujourd'hui. "Dans une archive numérique comme la BHL, le suivi de l'évolution de la terminologie au fil du temps est cruciale pour la recherche", explique le Dr Milios . "D'autres aspects du projet porteront sur la correction des textes que nous obtenons de la numérisation, sur la reconnaissance optique des polices de caractères des livres anciens et, enfin, sur le lien entre la terminologie extraite du texte avec les ressources taxonomiques actuelles."

Partage social:
Un élément clé de ce projet est le développement d'un environnement de médias sociaux, pour permettre aux utilisateurs de discuter et d'échanger des objets numériques. Le résultat attendu est la transformation de la BHL, d'une bibliothèque numérique traditionnelle en une bibliothèque numérique sociale. "La partie intéressante pour mes étudiants et moi-même au laboratoire des médias sociaux est d'essayer de concevoir la façon de transformer des documents scientifiques existants en objets "sociaux" numériques qui soient facilement partagés entre chercheurs et grand public via les réseaux sociaux", explique le Dr Gruzd . "Notre espoir est que cela va aider à rendre les documents et objets anciens de la biodiversité plus accessibles et contribuera à accroître la sensibilisation du public sur la façon dont la biodiversité a changé au fil du temps."

Avant que cet environnement "médias sociaux" soit lancé, les Drs . Gruzd et Milios et leur équipe vont passer les dix-huit prochains mois à analyser des milliers de morceaux de la littérature numérisée. "Ce projet démontre vraiment la force et la recherche de pointe à l'Université Dalhousie dans les domaines des médias sociaux, de text mining et de la visualisation", explique le Dr Gruzd. "Il démontre aussi que notre recherche est reconnue internationalement."

Les 14 équipes lauréates du "Digging into Data Challenge" ont reçu un total de 5,1 millions de dollars de subventions d'un groupe de 10 organismes internationaux qui financent la recherche du Canada, des Pays-Bas , le Royaume-Uni et les Etats-Unis. Le MiBio recevra environ $ 125,000 dont le financement du Conseil de recherches en sciences humaines du Canada (CRSH), et $ 125.000 du Conseil de recherches en génie du Canada en sciences naturelles (CRSNG).
Pour en savoir plus, contacts :
- Dr. Evangelos E. Milios (eem@cs.dal.ca), Faculty of Computer Science, Dalhousie University, 6050 University Avenue, PO BOX 15000, Halifax, NS B3H 4R2, Canada
- BHL, http://www.biodiversitylibrary.org/
- Institute for Big Data Alalytics, https://bigdata.cs.dal.ca/
Code brève, ADIT : 75127
Sources : http://redirectix.bulletins-electroniques.com/3cRpP
Rédacteurs :
Jean-Christophe Auffray, Conseiller pour la science et la technologie, Ambassade de France au Canada, jean-christophe.auffray@diplomatie.gouv.fr

Origine : BE Canada numéro 431 (10/02/2014) - Ambassade de France au Canada / ADIT - http://www.bulletins-electroniques.com/actualites/75127.htm

Aucun commentaire:

Enregistrer un commentaire