La base de données PHENOPSIS

De la plate-forme PHENOPSIS à la base de données

On estime à 600.000 le nombre moyen annuel de données métérologiques produites par la plate-forme (environ 1700 données par jour pour l'ensemble de la plate-forme).

De plus, la plate-forme peut produire plus de 2500 images plusieurs fois par jour (plus de 500 images dans le visible par chambre de culture et plus de 500 images infra-rouge pour 2 chambres de culture). On estime également à 10 millions le nombre moyen annuel de données d'irrigation à enregistrer (environ 15.000 données 2 fois par jour pour l'ensemble de la plate-forme).

Par ailleurs, chaque expérimentation dure plusieurs semaines pendant lesquelles différentes variables sont mesurées par l'expérimentateur.

Le nombre annuel moyen de données à enregistrer est ainsi estimé à 10 millions, and le volume total moyen annuel de fichiers à stocker à moins d'1 To.

Cette importante quantité de données générée par les chambres de culture, les robots et les expérimentateurs nécessitait un outil pour :

  • Stocker ces données ainsi que les métadonnées de manière organisée
  • Les consulter, les extraire et les télécharger
  • Les analyser

Une base de données a donc été créée avec le Système de Gestion de Base de Données MySQL 5.0.


La structure de la base de données

Chaque chambre de culture (table Chambre) est désignée par les identifiants C1, C2 et C3, et chaque expérimentation (table Manip) par un identifiant de la forme CiMj, avec i le numéro de la chambre, et j le numéro de l'expérimentation.

Chaque expérimentation comprend 504 pots maximum avec pour chacun un identifiant de la forme CiMj-k, k étant le numéro du pot (table PotManip).

Chaque pot contient un certain nombre de plantes d'un même génotype (table Genotype).

Toutes les variables stockées sont définies dans une même table (table Variable). Elles sont de 4 types :

  • Des variables de consignes environnementales définissant les conditions d'une expérimentation dans le temps (table Consigne).
  • Des variables météorologiques mesurées plusieurs fois par heure sur chacune des 3 chambres par des capteurs (table MesureMeteo).
  • Des variables collectées automatiquement par les robots sur les 1500 pots : données d'humidité du sol dans les pots et photos des pots prises dans le visible et/ou l'infra-rouge (table MesureRobot).
  • Des variables mesurées sur différentes parties de la plante à divers moments de son développement : stades phénologiques, nombre de feuilles, surface de la rosette, etc. (table MesureOrgane), les parties étudiées de la plante étant définies par ailleurs (table Organe).

Remarque sur la gestion des fichiers (images, scans, protocoles, ..) : on stocke dans la base de données le nom des fichiers et leur chemin sur le serveur.

Tous les événements et remarques sont archivés (table Commentaire).

Des groupes d'utilisateurs permettent de définir pour chaque expérimentation et chaque génotype les utilisateurs ayant le droit de consulter les données qui en sont issues (tables Utilisateur, UtilisateurSpecial, Groupe et GroupeUtil).

Schéma de la base de données

Modèle physique des données

Haut de page