IA & ESSAIS CLINIQUES Les innovations à suivre
Le recrutement des patients reste l’une des étapes les plus critiques des essais cliniques. Identifier les bons candidats, vérifier leur éligibilité, obtenir leur consentement : ce processus, encore largement manuel, est le premier facteur de retard des essais. L’intelligence artificielle (IA) promet d’y remédier, et les premières preuves terrain s’accumulent. Un système automatisé de matching patient-essai fonctionne déjà en conditions réelles. Au-delà du recrutement, les jumeaux numériques (des modèles virtuels capables de simuler la réponse d’un patient à un traitement) ouvrent une transformation plus profonde du design même des essais.
Faisons le point sur ces innovations à suivre, désormais adossées à un cadre réglementaire en construction.
Quelques définitions utiles3
Avant d’entrer dans le vif du sujet, trois concepts méritent d’être clarifiés.
Le machine learning (apprentissage automatique dit ML) est une méthode d’IA dans laquelle, au lieu de programmer manuellement chaque règle de décision, un humain fournit à un programme informatique un grand nombre d’exemples passés (comme des dossiers de patients, des résultats d’essais) dont les informations pertinentes ont été préalablement extraites et organisées (comme l’âge, le stade de la maladie, les résultats biologiques, etc.). À partir de ces exemples, le programme apprend à reconnaître des schémas récurrents et peut ensuite les appliquer à de nouvelles situations, comme prédire si un patient a de bonnes chances d’être éligible à un essai.
Le deep learning (apprentissage profond dit DL) est une forme avancée de cette méthode de machine learning. La différence : au lieu de travailler sur des données préalablement triées par un humain, le programme est capable de traiter directement des données brutes et non organisées, comme une image de scanner ou le texte libre d’un compte-rendu médical. Pour y parvenir, il décompose l’information par couches successives de calculs, un peu comme un lecteur qui passerait des mots aux phrases, puis au sens global d’un document.
Le natural language processing (traitement du langage naturel dit NLP) est le domaine de l’IA spécialisé dans le texte. Sa fonction : permettre à un programme informatique de lire un document rédigé en langage courant (comme une observation médicale, un compte-rendu opératoire, une lettre de sortie) et d’en extraire les informations exploitables (par exemple : diagnostic, traitement en cours, résultats biologiques). Les systèmes modernes de traitement du langage naturel s’appuient sur le deep learning pour y parvenir.
Le recrutement : premier facteur d’échec des essais cliniques
Le recrutement des patients reste le talon d’Achille des essais cliniques. Par exemple, en oncologie, seuls 5 à 7 % des patients adultes participent à un essai, alors même que le nombre d’études disponibles ne cesse de croître1. Les difficultés d’inclusion entraînent des retards de 1 à 6 mois pour la majorité des études, et 11 % des centres de recherche ne parviennent pas à inclure un seul participant. Chaque jour de retard représente un coût de 600 000 à 8 millions de dollars pour le promoteur2.
L’étape la plus complexe est d’apparier des patients à un essai : confronter le dossier médical complet d’un patient aux critères d’inclusion et d’exclusion d’une étude est un travail encore largement manuel, chronophage et exposé aux erreurs. Automatiser cette tâche est d’autant plus ardue que les données de santé sont stockées dans des formats différents d’un hôpital à l’autre1.
L’IA appliquée au recrutement : où en est-on ?3
Une revue publiée dans le Journal of the American Medical Informatics Association a passé au crible l’ensemble des études publiées sur le sujet, pour dresser un état des lieux : quelles méthodes d’IA sont utilisées pour le recrutement dans les essais cliniques, dans quelles pathologies, avec quels résultats, et quelles limites ? Sur 5 731 articles identifiés, 51 études ont été retenues, toutes publiées entre 2004 et 2023, avec une accélération nette après 2020.
Parmi ces études, l’oncologie est le domaine le plus représenté, devant la maladie d’Alzheimer et les essais multi-pathologies.
Côté méthodes et domaines d’IA utilisés pour aider le recrutement, la majorité des travaux (43 %) reposent sur du machine learning classique, dans lequel le programme apprend à partir de données préalablement structurées par un humain (âge, diagnostic, résultats biologiques). 20 % utilisent des logiciels commerciaux prêts à l’emploi, comme Watson for Clinical Trial Matching ou Mendel.ai, qui combinent machine learning et traitement du langage naturel dans une interface directement utilisable par les équipes de recherche clinique. Le deep learning, plus récent, n’est utilisé que dans 10 % des travaux.
A noter que le traitement du langage naturel, domaine de l’IA qui permet au programme de lire le texte libre des dossiers médicaux et d’en extraire automatiquement les informations exploitables, est présent dans 25 % des études toutes méthodes confondues.
En termes de résultats, les bénéfices documentés sur le recrutement sont tangibles : les équipes de recherche clinique identifient davantage de patients éligibles, en moins de temps et à moindre coût. Le logiciel Mendel.ai a par exemple augmenté de 24 à 50 % le nombre de patients correctement identifiés comme éligibles, avec un temps de prescreening réduit de plusieurs semaines à quelques minutes. Plusieurs études rapportent également une meilleure précision dans la sélection des candidats, avec moins de patients écartés à tort ou retenus par erreur. Plus marginalement, certains travaux soulignent l’intérêt d’interfaces simplifiées pour les équipes de recherche et la possibilité de réaliser le screening et le consentement à distance, facilitant l’accès des patients éloignés des centres investigateurs.
Ces gains ne doivent toutefois pas masquer les limites : la fiabilité des outils reste dépendante de la qualité des données d’entrée, leur transférabilité d’un centre à l’autre est faible, et il n’existe pas de référentiel commun pour évaluer leurs performances.
L’IA appliquée au recrutement : focus sur un système de matching patient-essai testé à grande échelle1
Parmi les initiatives les plus abouties, un système semi-automatisé de matching patient-essai (clinical trial patient matching) a été développé et validé par une équipe du Yale Cancer Center. Le principe : le système fonctionne en deux étapes. D’abord, des règles d’éligibilité définies par des experts cliniques (critères d’inclusion et d’exclusion de chaque essai). Ensuite, du traitement en langage naturel qui lit le texte libre des dossiers médicaux des patients (observations, comptes-rendus, courriers) pour y retrouver les informations pertinentes et les comparer automatiquement à ces critères.
Pour que ce système puisse fonctionner d’un hôpital à l’autre, les données ont été au préalable converties dans un format commun, le modèle OMOP (Observational Medical Outcomes Partnership), qui joue le rôle de traducteur universel entre des systèmes d’information hospitaliers tous différents.
Évalué d’abord sur un essai en cancer colorectal métastatique, le système a atteint une précision de 94 % en rétrospectif et 88 % en prospectif, avec une sensibilité de 100 %. Autrement dit, aucun patient réellement éligible n’a été manqué par l’algorithme. La charge de revue des dossiers a été divisée par dix et le temps de screening réduit de 41 %.
Déployé ensuite sur 29 essais multi-spécialités, le système a screené plus de 98 000 patients depuis septembre 2022, identifié 825 candidats éligibles et contribué à l’inclusion de 117 patients. Atout clé : le modèle de données commun OMOP rend les données indépendantes du système d’information de chaque hôpital, ouvrant la voie à un déploiement multi-sites sans reconfiguration lourde.
Au-delà du recrutement : l’IA au service du design des essais
Au-delà du recrutement, l’IA transforme le design même des essais. Les jumeaux numériques (digital twins) en sont l’illustration la plus ambitieuse. Le principe : à partir des données cliniques, génétiques et comportementales d’un patient réel, un modèle informatique crée sa réplique virtuelle, capable de simuler comment ce patient réagirait à un traitement donné4.
L’application la plus concrète concerne les bras contrôle synthétiques : les données générées par les jumeaux numériques, c’est-à-dire la simulation de ce qui serait arrivé au patient sous placebo, remplacent ou complètent le bras placebo classique. L’intérêt est triple : réduire le nombre de patients exposés à un placebo, diminuer la taille des cohortes et accélérer les inclusions.
La validité de l’approche repose sur une question préalable : les prédictions des jumeaux numériques sont-elles fiables ? Des travaux de validation rétrospective sur des cohortes Alzheimer suggèrent que oui, les trajectoires simulées s’alignent avec les trajectoires cliniques réellement observées chez les patients4.
Ces perspectives ne relèvent plus de la seule recherche académique : les régulateurs commencent à s’en emparer. Dès septembre 2022, l’Agence européenne des médicaments (EMA) avait émis un avis de qualification favorable pour la méthodologie PROCOVA (Prognostic Covariate Adjustment). Cette méthode utilise les scores pronostiques générés par les jumeaux numériques comme variable d’ajustement dans l’analyse statistique, permettant de réduire la taille de l’échantillon tout en conservant la puissance statistique4–5. La FDA (Food and Drug Administration) a confirmé la concordance de cette approche avec ses propres recommandations. Plus récemment, le 14 janvier 2026, les deux agences ont conjointement publié 10 principes directeurs pour l’utilisation de l’IA dans le développement du médicament5–6. Non contraignants, ces principes constituent le premier cadre transatlantique commun.
Limites et questions ouvertes
Deux limites majeures freinent encore le déploiement de ces approches. La première tient à la qualité des données : des dossiers médicaux incomplets ou mal renseignés produisent des prédictions peu fiables, quel que soit le degré de sophistication du programme. La seconde tient à leur représentativité : un jumeau numérique est entraîné à partir de données issues d’une population donnée. Si cette population est trop étroite, par exemple des patients jeunes, sans autres pathologies, traités dans des centres hospitalo-universitaires nord-américains : le modèle risque de ne pas fonctionner pour des patients plus âgés, porteurs de plusieurs maladies chroniques, ou pris en charge dans des contextes de soins différents4.
Autre frein : la transparence. Certains programmes d’IA fonctionnent en « boîte noire » : ils produisent un résultat, mais sans rendre visible le raisonnement qui y a conduit. Pour un clinicien ou un régulateur, impossible de vérifier pourquoi le programme a pris telle décision, ce qui limite la confiance. Des référentiels internationaux commencent à imposer des exigences de transparence dans la description des systèmes d’IA utilisés en recherche clinique, mais leur adoption reste partielle4. Surtout, les validations prospectives sont encore rares : la démonstration en conditions réelles, sur des populations diverses, demeure la condition de toute généralisation.
En résumé
L’IA dans les essais cliniques n’est plus un concept théorique. Des systèmes de matching fonctionnent déjà en conditions réelles, et les jumeaux numériques commencent à trouver leur place dans le cadre réglementaire.
Les fondations sont posées : affaire à suivre !
Rédaction : Camille ZYTO
Avec la relecture médicale des Dr Soussan DANILOSKI et Dr Hervé BONNAUD
Sous la direction éditoriale du Pr Damien SENE
Bibliographie
- Gong G, , et al. Clinical Trial Patient Matching: A Real-Time, Common Data Model and Artificial Intelligence-Driven System for Semiautomated Patient Prescreening in Cancer Clinical Trials. JCO Clin Cancer Inform. 2026;10:e2500262.
- Chaudhari N, et al. Recruitment and retention of the participants in clinical trials: challenges and solutions. Perspect Clin Res. 2020;11(2):64-69.
- Lu X, et al. Artificial intelligence for optimizing recruitment and retention in clinical trials: a scoping review. J Am Med Inform Assoc. 2024;31(11):2749-2759.
- Badani A, et al. AI and innovation in clinical trials. npj Digit Med. 2025;8:683.
- European Medicines Agency. Qualification opinion for Prognostic Covariate Adjustment (PROCOVA™). EMA; 2022. https://www.ema.europa.eu/en/documents/regulatory-procedural-guideline/qualification-opinion-prognostic-covariate-adjustment-procovatm_en.pdf
- Food and Drug Administration, European Medicines Agency. Guiding Principles of Good AI Practice in Drug Development. FDA/EMA; January 14, 2026. https://www.ema.europa.eu/en/news/ema-fda-set-common-principles-ai-medicine-development-0
