1. Contexte
La qualité des milieux aquatiques et de la ressource en eau peut être appréhendée du point de vue de sa contamination chimique, en particulier par des contaminants émergents, ou de la biodiversité qu’elle accueille. La présence de ces contaminants, en grande partie rejetés avec les effluents traités de station d’épuration, est néfaste pour la santé des écosystèmes avec des effets nocifs sur les organismes aquatiques et une perte de biodiversité, et pour la santé humaine avec une mauvaise qualité des ressources pour la production d’eau potable et l’augmentation des risques d’antibiorésistance.
Afin de caractériser cette contamination chimique, des méthodes d’analyse non ciblée par spectrométrie de masse haute résolution (HRMS) ont été développées. Au Leesu, deux thèses ont été menées sur cette thématique et ont permis d’une part de développer la méthode analytique (Huynh et al. 2021) et les outils informatiques de traitement des données (Sade et al. 2022), et d’autre part d’appliquer ces méthodes à différentes eaux urbaines afin d’évaluer la variabilité spatio-temporelle de la contamination.
En parallèle, l’étude de l’ADN environnemental (ADNe), dans lequel les signaux des macro- et micro-organismes de l’environnement sont récupérés à partir d’échantillons d’eau est de plus en plus utilisée pour la surveillance de la biodiversité des milieux et de la diffusion des bactéries et gènes d’antibiorésistance (ARB/ARG). De telles méthodes par analyse de métagénomique ont été utilisées au Leesu dans une thèse récente, et ont permis par exemple de caractériser avec précision les différentes communautés bactériennes présentes dans la Seine et les dynamiques de ces communautés soumises à différentes pressions anthropiques (ex. rejets urbains, traitements de désinfection des eaux usées) et aux variations saisonnières/climatiques (Bagagnan 2024).
Les progrès techniques qui permettent aujourd’hui d’enregistrer des empreintes chimiques par des approches non ciblées, ou de mesurer l’ADN environnemental pour étudier la biodiversité, fournissent d’énormes quantités de données. Le défi consiste à mettre en place les outils d’analyse biologique et chimique multivariée pour faciliter l’utilisation de ces données. L’utilisation d’outils numériques comme l’apprentissage machine se développe pour traiter et interpréter les spectres HRMS de contaminants dans les eaux, de même que dans le domaine de l’ADN environnemental pour extraire des indicateurs de biodiversité ou expliquer les variabilités spatio-temporelles.
Pour l’instant ces deux approches HRMS et ADNe n’ont pas été couplées. Or les mélanges complexes de produits chimiques doivent être pris en compte en même temps que leurs effets complexes et leurs impacts sur les écosystèmes. Le couplage entre l’empreinte chimique des contaminants et l’ADNe qui mesure la biodiversité est un enjeu majeur pour la surveillance de la qualité des milieux récepteurs.
L’objectif général de ce projet de thèse est donc d’évaluer la possibilité d’interpréter conjointement les empreintes chimiques HRMS de contaminants dans les eaux (des eaux usées brutes aux rejets traités dans l’environnement) avec les informations sur la biodiversité données par l’ADNe en développant et appliquant des méthodes numériques.
2. Cadre et partenaires du projet
Cette thèse s’insère dans les actions de recherche du Leesu dans le programme OPUR et en collaboration étroite avec le Service Public de l’Assainissement Parisien (SIAAP).
Les analyses de contaminants émergents s’appuient sur les instruments analytiques de la plateforme Prammics (OSU Efluve), en particulier les instruments de chromatographie en phase liquide (Waters Vion – UPLC-IMS-QTOF). L’UPLC-IMS-QTOF est un instrument de HRMS équipé d’une séparation par mobilité ionique (IMS). L’ADNe sera séquencé par un prestataire par des méthodes de métabarcoding ou métagénomique. Les séquences obtenues seront traitées par des outils bio-informatiques (kaiju, eggNOG-mapper, BWA-MEM, rgi et autres programmes bio-informatiques) permettant d’identifier taxonomiquement chaque groupe de macro ou micro-organismes séparément et également les différentes fonctions/activités des microorganismes présents dans l’échantillon.
3. Objectifs
Les objectifs de la thèse sont les suivants :
- Identifier pour chaque type de données (HRMS et ADNe) des traceurs ou indicateurs d’intérêt à partir de la littérature scientifique et automatiser leur traitement (comme les ARB/ARG, les biocides, les antibiotiques…)
- Appliquer des méthodes de traitement des données pour coupler les données HRMS et d’ADNe en utilisant des outils statistiques avancés ou numériques de type machine learning.
- Proposer une stratégie d’échantillonnage pertinente pour acquérir les deux types de données (HRMS et ADNe) dans les filières de traitement des eaux usées du SIAAP et effectuer un suivi régulier des différents points d’échantillonnage.
- Suivre et interpréter le devenir temporel de molécules/marqueurs d’intérêt identifiés précédemment (suivi à différentes fréquences : saisonnières, hebdomadaires, journalières et le long des différents points de prélèvement)
4. Laboratoire d’accueil
La thèse se déroulera au Laboratoire Eau Environnement et Systèmes Urbains (LEESU - UMR MA102 (Université Paris-Est Créteil et École des Ponts ParisTech), principalement sur le site de Créteil (61 avenue du Général de Gaulle, Créteil), et au sein de la direction innovation du SIAAP. La thèse se déroulera à 20% au SIAAP pour les formations opérationnelles, les campagnes d’échantillonnage, les comités de pilotage du projet et les transferts de compétences opérationnelles.
4. Profil recherché
Formation de niveau M2 ou ingénieur en bioinformatique/biostatistiques.
Le candidat devra posséder une expérience en analyses de données omiques, des compétences en statistiques, ainsi que des connaissances de base du logiciel R. Une bonne compréhension de la biologie générale, de l’écotoxicologie microbienne, et des problématiques liées aux données métagénomiques sera considérée comme un atout.
5. Contacts et modalités de candidature
Encadrement
- Adèle Bressy, chargée de recherche HDR de l’École des Ponts, chimie de l’environnement, hydrologie (adele.bressy[at]enpc.fr)
- My Dung Jusselme, maîtresse de conférence UPEC, biologie moléculaire, microbiologie environnementale (thi-my-dung.jusselme[at]u-pec.fr)
- Julien Le Roux, maître de conférences UPEC, chimie analytique, outils statistiques et numériques, chimie de l’environnement (julien.le-roux[at]u-pec.fr)
- Sabrina Guérin, responsable innovation au SIAAP
Candidature
Envoyer CV, lettre de motivation et contact de référent.e.s scientifiques à adele.bressy[at]enpc.fr et thi-my-dung.jusselme[at]u-pec.fr.
Offre de thèse (fichier PDF)