Chronique du libre n°2

Le Mozilla Science Lab

Tout le monde connait Mozilla grâce à Firefox mais les projets de l’organisation ne se limitent pas à un navigateur. La mission de Mozilla est de promouvoir l’ouverture, l’innovation et la bonne santé du Web. La Fondation Mozilla propose des programmes pour mapper ces valeurs à la science, les médias, à la politique ou l’éducation afin de les rendre ouverts, collaboratifs et partageables.

Dans ce deuxième article des Chroniques du Libre, nous allons donc parler d’open science et plus particulièrement d’un projet de la Fondation Mozilla relativement peu connu : Le Mozilla Science Lab.

MSL

Le Mozilla Science Lab

Comme vous le savez sans doute, Internet s’est beaucoup développé grâce aux chercheurs et aux travaux de recherche. Les scientifiques ont créé cet outil qui a considérablement changé nos habitudes. Mais les habitudes des scientifiques n’ont que très peu changé. Les travaux scientifiques sont encore basés sur des papiers dont le partage est un sujet souvent évoqué. C’est pour cette raison que le Mozilla Science Lab a vu le jour en 2013.

Ce projet est mené par Kaitlin Thaney qui défend depuis des années l’idée d’open science (qui a notamment eu un rôle dans le développement des sciences commons, travaillé au MIT, puis aidé à lancer le groupe Digital Science à Londres). Elle a été rejoint par Greg Wilson, fondateur du programme Software Carpentry, qui aide les chercheurs à développer leurs compétences en Informatique depuis 1998.

Le Mozilla Science Lab permet de mettre en relation les étudiants, les programmeurs, les graphistes et les chercheurs (5000 aujourd’hui en comptant ceux de Software Carpentry) autour du développement de projets scientifique open source. D’ailleurs, ils recherchent constamment des personnes pour enseigner ou mentorer des projets afin d’aider le Software Carpentry à organiser de petits groupes de travail dans plusieurs universités. De plus, la communauté organise aussi des Code Sprint, participe à des festivals et organise chaque mois des appels de la communauté.

En 2015, le MSL cherche à travailler autour de l’apprentissage et de l’engagement et lancera un programme de bourses afin d’aider les chercheurs en début de carrière. Il organisera aussi des évènements (workshop, code sprint), développera ses ressources et formera des partenariats avec d’autres groupes pour soutenir les régions telles que l’Australasie. Le Mozilla Science Lab cherche aujourd’hui à implanter cette façon de travailler et de la faire reconnaitre afin de pouvoir inciter plus de personnes à contribuer.

Projets

Dans cette seconde partie, nous allons parler de 3 projets du Mozilla Science Lab.

Pathogens

Pathogens. Image de Stefan Walkowski

L’objectif du projet est de rassembler et organiser les données génétiques accessibles au public afin de mieux comprendre les interactions entre les organismes dans des microbiomes. Récemment, des chercheurs ont découvert que certaines bactéries pouvaient tenir un journal de leurs précédentes infections en mémorisant certaines parties d’ADN des phages les attaquant dans leur propre génome (plus précisément dans le CRISPR). Ce “log d’attaque” permet à la bactérie d’identifier les phages qui les attaquent et fournit une voie pour l’évolution des interactions de ces organismes.

Ce projet vise à fournir des outils pour assembler et filtrer efficacement de grandes quantités de données. Le résultat idéal étant de réaliser un réseau d’interactions hôte-pathogène pouvant être facilement interrogé, permettant ainsi aux chercheurs de répondre à des questions sur l’évolution d’un microbiome.

Le projet contient environ 5 membres en ce moment. Le plus facile pour commencer à contribuer est soit de visiter la page du site ou le github. Le projet en cours est de produire une carte interactive pour montrer le lien entre les phages et les bactéries pour permettre aux chercheurs de regarder les connexions entre les organismes dans un environnement spécifique.

Diversibee

Diversibee

Jana Vamosi est professeur agrégé à l’Université de Calgary au Canada. Elle étudie comment la biodiversité fonctionne et le rôle que jouent certaines espèces dans le fonctionnement des écosystèmes.

La perte de la biodiversité est un problème depuis de nombreuses années. Malheureusement, beaucoup de personnes ignorent le rôle de ces espèces dans l’environnement (outre le fait qu’une espèce soit jolie, charismatique voir fascinante). Ce programme vise à résoudre ce problème et d’illustrer le concept de la diversité fonctionnelle.

Se basant sur des travaux précédents, nous savons aujourd’hui que les joueurs sont capables de trouver rapidement la solution optimale à un problème. Diversibee est un jeu basé sur une récente étude où les scientifiques ont montré que les myrtilles étaient plus grosses lorsqu’elles étaient pollinisées par plusieurs groupes d’abeilles. Chaque groupe ajoutant aux myrtilles une valeur de 311 \$ par acre (par exemple, si 2 groupes d’abeilles étaient recensés, les myrtilles avaient une valeur ajoutée de 311 \$ et de 622 \$ pour 3 groupes). Le problème étant que ces abeilles habitent dans des forêts. L’agriculteur possédant donc quelques hectares de forêt peut donc augmenter la valeur de ses myrtilles. Par contre, s’il déboise ses terres, il peut alors mettre plus de myrtilles pour être une entreprise lucrative. Le but du jeu est alors de trouver la configuration maximale, celle où la configuration de la forêt maximise le rendement des myrtilles ainsi que le maintien des populations d’abeilles.

Ce projet est actuellement développé par 3 personnes du Mozilla Science Lab, ainsi que 3 autres personnes via github. Si vous souhaitez contribuer, vous pouvez vous rendre sur le repository git ou la page du projet et de contacter Jana Vamosi si vous avez la moindre question. Toute idée pour développer le projet est le bienvenue. En ce moment, des développeurs JavaScript et des designers sont recherchés.

Trillian

Trillian

Pour continuer dans la lignée du premier CdS, parlons un peu d’espace. L’astronomie génère un nombre astronomique (sans mauvais jeu de mots) de données. Ces données peuvent être issues de télescopes, de missions spatiales ou de simulations (par exemple les données de WISE, SDSS, 2MASS, Spitzer, GALEX, etc.). Autant de sources d’informations qui peuvent servir pour de multiples projets. Malheureusement, aujourd’hui aucune institution ne peut héberger autant de données. Rechercher quelque chose dans le ciel entier est donc quasiment impossible. En effet, un chercheur est obligé de télécharger une petite partie de ces données, d’écrire un code pour en extraire la partie intéressante avant de pouvoir analyser les données. Trillian cherche à inverser cette méthode. C’est-à-dire que l’utilisateur n’aura qu’à fournir un modèle en entrée (c’est-à-dire décrire ce qu’il recherche. Par exemple se baser sur l’âge, la masse, la galaxie hôte, les coordonnées, etc.) de Trillian et le moteur de calcul appliquera le modèle à toutes les données possibles. Pour travailler sur autant de données, la base de données de Trillian est distribuée sur tous les espaces de stockage mis à la disposition par la communauté.

Pour le moment, 5 personnes travaillent activement sur le projet. Il existe de nombreuses manières de les rejoindre :

  • Aider dans le design de l’infrastructure de l’application ainsi que sa sécurité.
  • Héberger des données sur un espace de stockage libre.
  • Coder si vous maîtrisez Python, PostgreSQL ou Docker
  • etc

Les avantages de l’open sciencedaily

On peut tout naturellement se demander pourquoi ces projets sont open source. Faire de l’open science demande d’avoir une certaine confiance dans les données fournies ainsi que dans les personnes contribuant au projet. Si le projet nécessite plusieurs groupes de travail, il y aura sans aucun doute un manque de normalisation des compétences. Mais une fois ces désavantages montrés, on peut enfin voir les bénéfices qu’apportent cette manière de penser. On peut aujourd’hui collecter, utiliser, analyser des données assez facilement. Si ces données n’avaient pas été accessibles, ces projets n’auraient pas vu le jour.

De plus, l’open science permet à des personnes de différents environnements de discuter et de rendre des projets possibles. Il s’agit d’une bonne occasion de rendre possible un projet porté par une personne n’ayant aucune connaissance en développement informatique. Et vice versa, une personne possédant des connaissances en développement informatique peut se servir de ses connaissances pour résoudre de véritables problèmes. Ce système peut vous proposer diverses compétences (ainsi que du matériel) que vous n’auriez pas pu avoir à votre disposition. S’appuyer sur les compétences de la communauté permet d’ouvrir le champ des possibles et de favoriser le dialogue dans différentes disciplines. Le Mozilla Science Lab est une bonne plateforme pour pouvoir lancer ce dialogue et permet de trouver des liens entre des domaines apparemment sans lien. L’open science accélère la communication et la collaboration, qui sont les clés de la recherche.

Enfin, le web peut permettre d’améliorer la façon dont la recherche se fait aujourd’hui (par exemple pour éliminer les goulots d’étranglement que représente la perte de temps apportée par la rétroingénierie d’une expérience, la perte financière causée par un manque de données, une mauvaise gestion et par les projets qui ont besoin de repartir de zéro).

Pour conclure cet article, je vous propose une citation d’Isaac Newton que m’a cité Madeleine Bonsma pour définir son point de vue de l’open science :
> Si j’ai vu plus loin, c’est en montant sur les épaules de géants.

Pour aller plus loin