Les associations ayant des moyens limités pour des causes justes, j'interviens bénévolement dans le déploiement d'une plateforme de visualisation de l'important jeu de données (>3M) généré par le programme Chiroptères Cavernicoles Prioritaires de Nouvelle-Aquitaine porté par France Nature Environnement Nouvelle-Aquitaine. Un défi alliant série temporelle, données géographiques et trajectoires d'individus déployé par conteneurisation avec Docker sur la plateforme Hugging-Face.

Contexte du projet

Porté par France Nature Environnement Nouvelle-Aquitaine, le projet Chiroptères Cavernicoles Prioritaires de Nouvelle-Aquitaine (CCPNA) est un programme à large échelle démarré en 2016 dans l’objectif d’étudier plusieurs espèces de chauves-souris afin d’aborder quatre thématiques :

  • La génétique, afin de définir les contours des populations et mettre en évidence d’éventuels freins aux échanges génétiques ;
  • L’écotoxicologie, pour tenter d’aborder à quels polluants les espèces peuvent être exposées ;
  • L’épidémiologie, ou l’étude de la circulation des virus, permet de mettre en lumière d’éventuels risques d’exposition pour ces dernières comme de comprendre des mécanismes de circulation couplés au paysage ou à leurs mœurs ;
  • Les déplacements, avec la pose de puces sous-cutanées, RFID ou Pit-tag, inertes avec un identifiant unique chez les Grands Rhinolophes, Murin à oreilles échancrées et le Minioptère de Schreibers. Les contrôles d’individus marqués permettent de retracer leurs déplacements. À terme, ces données pourraient permettre d’établir des taux de survie et de comprendre comment les individus utilisent les différents connus au cours de leur vie.

Pour ce dernier point, plus d’une quarantaine de sites sur l’ensemble de la région est équipé d’une antenne automatique permettant de détecter 24/7 le passage d’un individu marqué, générant un nombre très important de données jusqu’à aujourd’hui (> 3M). Sans compter de nombreux sites supplémentaires qui sont suivis avec une antenne éphémère à différents moments de l’année.

Les associations ayant des ressources limitées pour l’analyse de ces jeux de données complexes, je réalise bénévolement les études de ce projet afin de permettre aux associations protectrices de la nature et de l’environnement (APNE) d’améliorer leurs connaissances sur ces espèces protégées et permettre de prendre les meilleures décision pour leur conservation.

Etude démographique et spatio-temporelle

L'analyse repose donc sur l'exploitation des données de marquage et de recapture. Les modèles Cormack-Jolly-Seber ont été mobilisés pour estimer simultanément deux indicateurs fondamentaux : le taux de survie apparent (Φ), qui traduit la probabilité qu’un individu marqué soit encore présent l’année suivante, et le taux de recapture (p), indicateur de la probabilité de détecter un individu survivant.

Ces estimations reposent sur un jeu de données soigneusement harmonisé afin de réduire les biais, notamment en uniformisant la définition des classes d’âge, en standardisant la codification des espèces et en garantissant la cohérence temporelle et spatiale des données.

La mise en place de métriques complémentaires, telles que le nombre moyen de passages et le temps de résidence, permet d’aller au-delà des simples estimations démographiques. Ces mesures offrent un aperçu de l’intensité d’utilisation des gîtes, de la mobilité intra-saisonnière et de la variation interannuelle des comportements. Elles constituent ainsi une base solide pour relier les dynamiques observées.

En complément, une analyse spatio-temporelle a permis de caractériser les trajectoires individuelles à partir des séquences de recaptures. Les distances inter-sites ont été calculées en utilisant la distance euclidienne entre les coordonnées GPS des sites de départ et d’arrivée. Les trajectoires ont été agrégées par espèce, sexe et classe d’âge afin de détecter des patterns migratoires ou saisonniers, et de mesurer l’ampleur des déplacements. Par ailleurs, la fidélité aux sites a été estimée en calculant la proportion d’individus revenant sur un site donné d’une année à l’autre, permettant d’évaluer la stabilité des colonies et la connectivité entre gîtes.

Accessibilité aux acteurs-décideurs

Afin que les APNE puissent explorer leurs données pour communiquer, et prendre des décisions de conservation importantes, j’ai travaillé sur un tableau de bord interactif en ligne pour traiter géographiquement et statistiquement l’ensemble des données d’antennes, permettant de visualiser rapidement les métriques de monitoring des individus, les trajectoires entre les sites et les connexions entre les sites.

Pour ce faire, ce dashboard est composé de quatre onglets, avec une présentation du projet, une carte interactive permettant de visualiser les trajectoires avec de nombreux filtres, un diagramme de Gantt pour visualiser la phénologie temporelle des individus en fonction des sites et enfin un onglet avec un ensemble de métriques descriptives.

Tous les graphiques sont conçus afin de permettre une interactivité avec les utilisateurs. La plateforme est pour le moment déployée sur Hugging-Face via un container Docker.

Pour le moment, les associations continuent d'utiliser des supports *.csv pour la gestion de leurs données, la plateforme permettra de communiquer avec une base de données qui améliorera la sécurité et le traitement des données. Le projet génère actuellement plus de 500 000 données par an et dépasse les 3M de données en 2024.

Suite à une invitation du Plan Régional d'Action Chiroptères, ce projet bénévole ainsi que mes analyses statistiques ont fait l'objet d'une présentation aux Rencontres Chiroptères Régionales de 2024 à Limoges.