Contexte scientifique du stage
De nombreux polluants sont présents dans les eaux urbaines mais leur comportement et leurs transformations dans les stations de traitement des eaux usées et dans l’environnement sont peu connus. Le développement de la spectrométrie de masse haute résolution (HRMS) permet d’analyser de manière non-ciblée les eaux et d’identifier des produits inconnus. Les méthodes actuelles de traitement de données issues d’analyses en HRMS sont longues et complexes et nécessitent des approches statistiques et l’utilisation d’algorithmes de détection et d’analyse des données complexes. De plus, les logiciels propriétaires installés sur l’instrument d’analyse ne permettent pas de traiter les données de manière satisfaisante (manque d’outils statistiques ou graphiques de plus en plus utilisés dans la communauté). Des outils complémentaires (ex. algorithmes libres, outils statistiques et graphiques supplémentaires) peuvent donc être utilisés mais nécessitent une part importante de développement.
Cadre et partenaires du projet
Le stage s’insère dans le cadre du projet de recherche WaterOmics financé par l’Agence Nationale de la Recherche (2017-2021). Ce projet s’intitule « Traquer les micropolluants organiques dans les eaux urbaines par spectrométrie de masse haute résolution : approches omiques, empreintes et indices » et comporte trois tâches de recherche :
- Développement analytique de protocoles pour la caractérisation de polluants dans les eaux usées par HRMS
- Développement de méthodes de traitement de données et d’indices
- Application des méthodes développées aux eaux urbaines (performance du traitement des polluants dans les eaux usées).
Une thèse est en cours sur ce projet (Nina Huynh).
Objectifs du stage
Le stage s’insèrera dans la tâche 2 du projet WaterOmics (développement des méthodes de traitement de données) et consiste principalement en des aspects data science. Les objectifs sont les suivants :
- Poursuivre le développement d’une application (R / shiny) pour le traitement de données issues de l’analyse en HRMS, incluant diverses méthodes statistiques et graphiques.
- Utiliser un package de traitement de données (Patroon, développé sous R) rassemblant plusieurs algorithmes libres, et l’adapter aux besoins du projet de recherche (extraire des données d’intérêt, ex. formules brutes proposées par les algorithmes).
- Développer des méthodes de caractérisation de polluants à partir des données (basées sur des méthodes existantes et documentées, ex. défaut de masse, diagrammes de Van Krevelen…)
Profil recherché
Formation de niveau M1 ou M2 ou équivalent :
- Compétences en statistiques avancées
- Compétences en programmation et utilisation de langages de programmation utilisés pour le traitement de données (ex. R ou python). Le candidat devra être capable de prendre en main le langage R rapidement.
- Aisance dans la rédaction de rapport et bon niveau d’anglais souhaitable
Caractéristiques du stage proposé
- Début du stage : mars/avril 2020
- Durée du stage : 5-6 mois
- Candidature : envoi de curriculum vitae détaillé et de lettre de motivation à Julien Le Roux et Nina Huynh
- Indemnité de stage : environ 450 € / mois
- Lieu du stage : Université Paris-Est Créteil, Laboratoire eau, environnement, et systèmes urbains (LEESU), 61 avenue du Général de Gaulle, 94010 CRETEIL Cédex
Pilotes du projet : Julien Le Roux et Régis Moilleron