Détails de l'offre de référence (S04.06.25)







Informations générales

  • Titre : Extraction automatique de données cliniques des fichiers PDF
  • Référence : S04.06.25
  • Académie : Medspeakers
  • Catégorie : Informatique et digital
  • Nombre de postes ouverts : 1
  • Adresse : Menzah 4
  • Date de publication : 02/06/2025

Description de poste

Utiliser l’IA (traitement du langage naturel) pour extraire les données pertinentes (diagnostic, stade, biomarqueurs...) depuis des résultats d'analyse en PDF et les structurer dans la base de données de MedSpeakers.

Missions :
- Collecte et anonymisation d’un jeu de rapports anapath au format PDF
- Détection automatique des champs cliniques pertinents via NLP 
- Intégration automatisée dans une base structurée (MySQL / PostgreSQL)
- Déploiement d’une interface pour validation HCP

Compétences demandées

- Python, NLP (spaCy, transformers, pdfplumber, PyMuPDF)
- Connaissance des structures médicales et des comptes rendus anapath
- Bases de données relationnelles, API Laravel (REST)

Qualifications demandées

Bac+4 (IA / bioinformatique )