Bonjour ! Tout d’abord, merci pour votre visite sur ce site. Je me présente : Caroline de Pourtalès, ingénieure généraliste diplômée de l’IMT Atlantique, titulaire d’un double-diplôme de master en Data Science à Polytech Nantes. Actuellement, je travaille depuis 3 ans au CNRS en tant qu’ingénieure d’étude en intelligence artificielle au sein du réseau PNRIA (https://www.ins2i.cnrs.fr/fr/reseau-des-ingenieurs-cnrs-du-programme-national-de-recherche-en-intelligence-artificielle-pnria).
En dehors de mon travail, j’ai de nombreux hobbies : tricot, couture, voyages…
Je suis très curieuse et autodidacte, ainsi en ce moment, je m’intéresse à la biologie. Par exemple, j’ai lu “Tout ce que vous avez toujours voulu savoir sur le blob sans jamais oser le demander” d’Audrey Dussutour, ainsi que “Évolution, écologie et pandémies” de Samuel Alizon. Ces lectures m’ont poussé à explorer davantage la bioinformatique. Merci aux éditions Dunod pour leurs livres clairs et concis ! J’espère bientôt obtenir un projet PNRIA dans ce domaine afin de mettre à contribution ces nouvelles connaissances.
Mon intérêt pour la biologie n’est pas nouveau, je m’intéresse énormément aux liens entre médecine et intelligence artificielle et je souhaite continuer à développer des solutions à long terme pour aider les médecins.
Général : Linux, Super Calculateurs, Multi-GPU
Langages : Python, C++, R
Deep Learning : NLP, Transformers,, LLM, RNN, Computer Vision (YOLO, U-Net, VIT, ViVIT, ResNet, Faster-RCNN, Mask-RCNN), Multi-modal (CLIP, BLIP)
Frameworks, Librairies & Technologies : PyTorch (torch-geometric, Lightning), scikit-learn, HuggingFace, NLTK, Spacy, OpenCV, MLFlow, Uv
Données : Pandas, SQL, Numpy, HDF5
Visualisation : matplotlib, Bokeh, Plotly, Shiny, Seaborn
Ops : Github, Gitlab, Docker, CI/CD
Gestion de projets scientifiques : Pilotage de projets multidisciplinaires, élaboration de l’état de l’art, problématisation des enjeux de recherche, rédaction d’articles scientifiques, encadrement de chercheurs/juniors, coordination et suivi de projet.
Dans le cadre d’une collaboration avec le réseau PNRIA et le Cancéropole de Toulouse, un outil de diagnostic a été développé pour améliorer l’analyse d’images médicales et la prise de décision clinique. Ce projet s’appuie sur des technologies avancées en intelligence artificielle et en traitement d’images, intégrées dans un pipeline Python.
Filtrage des zones d’intérêt Les images, très grandes et lourdes, ne peuvent pas être analysées pixel par pixel. Il est donc nécessaire de sélectionner des régions d’intérêt. Nous avons choisi de nous concentrer sur les zones présentant une densité suffisante de cellules : ni trop vide, ni trop dense au point de rendre les cellules indistinguables.
Pour cela, les images sont ouvertes à l’aide de OpenSlide, qui permet d’obtenir des vues multi-résolution grâce à des cadrillages de différents niveaux de zoom. Le filtrage est ensuite réalisé à l’aide de filtres OpenCV, combinés à une technique de clustering basée sur k-means pour identifier les régions pertinentes.
Détection des cellules avec un fine-tuning de Mask-RCNN Pour détecter les cellules, nous utilisons Mask-RCNN, un modèle d’apprentissage profond performant pour la segmentation d’objets dans les images. Mask-RCNN repose sur deux étapes principales : la génération de propositions de régions (Region Proposal Network) et la classification/segmentation de ces régions. Après un fine-tuning spécifique sur les données de moelle osseuse, nous avons obtenu d’excellents résultats de segmentation, avec une détection précise des contours et des zones des cellules.
Classification des cellules avec PyRadiomics Une fois les cellules détectées, leur classification est effectuée à l’aide de PyRadiomics, un outil qui permet d’extraire des caractéristiques avancées (texture, forme).
Explicabilité pour un retour du diagnostic aux médecins Afin de rendre les résultats compréhensibles et exploitables par les médecins, nous avons intégré des outils d’explicabilité, notamment SHAP (SHapley Additive exPlanations). Ceux-ci permettent de fournir des explications claires sur les prédictions du modèle. Des outils de visualisation interactifs ont également été développés pour faciliter l’interprétation des résultats.
Références
Bennis A, Leleux P, Canali A, Pourtales CD, Mouysset S, Simoncini D, Brousset P, Frenois FX, Recher C, Alliot JM, Rieu JB, Bertoli S. PB1764: SEGMENTATION AND CLASSIFICATION OF BONE MARROW CELLS FROM MULTI-PRECISION NUMERIZATION OF BONE MARROW SMEARS (BMS) FROM PATIENTS WITH ACUTE MYELOID LEUKEMIA (AML) USING AI TECHNIQUES. Hemasphere. 2023 Aug 8;7(Suppl ):e5127496. doi: 10.1097/01.HS9.0000973912.51274.96. PMCID: PMC10430235.
Génération de signaux de caractérisation de nanomatériaux.
Développement d’un Pair-Variational Autoencoder pour la traduction d’un signal dans une autre modalité.
Le projet AUTOFILL vise à générer et traduire automatiquement des signaux expérimentaux de caractérisation de nanomatériaux entre différentes modalités (par exemple, SAXS ↔ LES). Pour cela, nous avons implémenté un modèle inspiré du papier Pair-Variational Autoencoders (PairVAE) for Linking and Cross-Reconstruction.
x_A ou x_B dans un vecteur latent z.z alimentant les deux décodeurs, permettant à chacun de reconstruire à la fois sa modalité d’origine et, via un mécanisme de cross-reconstruction, la modalité opposée.x_A, l’encodeur A génère z, puis le décodeur B doit produire un signal x̂_B réaliste dans la modalité B, et vice-versa.x_A et x̂_A (resp. x_B et x̂_B).x̂_{B|A} et x̂_{A|B}), ce qui renforce l’alignement des représentations latentes.z encode efficacement l’information commune aux deux signaux.Références
Étude automatisée des comportements sociaux de macaques japonais à partir d’enregistrements vidéo.
Développement d’un pipeline pour la quantification automatisée des signaux de spectroscopie par résonance magnétique (MRS).
Références
Clarke WT, Stagg CJ, Jbabdi S. FSL-MRS: An end-to-end spectroscopy analysis package. Magnetic Resonance in Medicine 2021;85:2950–2964 doi: 10.1002/mrm.28630.