Utiliser l’IA (traitement du langage naturel) pour extraire les données pertinentes (diagnostic, stade, biomarqueurs...) depuis des résultats d'analyse en PDF et les structurer dans la base de données de MedSpeakers.
Missions :
- Collecte et anonymisation d’un jeu de rapports anapath au format PDF
- Détection automatique des champs cliniques pertinents via NLP
- Intégration automatisée dans une base structurée (MySQL / PostgreSQL)
- Déploiement d’une interface pour validation HCP
- Python, NLP (spaCy, transformers, pdfplumber, PyMuPDF)
- Connaissance des structures médicales et des comptes rendus anapath
- Bases de données relationnelles, API Laravel (REST)
Bac+4 (IA / bioinformatique )