Les projets d’IA dans le domaine de la santé se distinguent des autres projets d’IA – jusqu’au flux de travail

Author:

  • Lisa Di Jorio, Director of AI Research & Strategy, Imagia 
  • Rebecca Simpson, ML Technical Lead, Imagia
  • Cecile Low-Lam, Biostatistics Researcher, Imagia

Lorsque nous avons créé EVIDENS™, notre plateforme de découverte pilotée par l’IA qui transforme les données de santé du monde réel en informations cliniquement exploitables, nous avons dû creuser en profondeur pour analyser et tirer de la valeur de tout ce que nous faisions bien – et de tout ce que nous pouvions améliorer.

Sur ce dernier point, nous savions qu’un facteur clé de notre réussite serait notre capacité à formaliser et à standardiser nos processus. Si certains outils et processus d’IA existants étaient intéressants, ils ne correspondaient pas vraiment aux réalités distinctes de la recherche dans le domaine des soins de santé. Nous avons réussi à mener à bien de nombreux projets, mais avec des équipes et des individus utilisant à chaque fois des processus, des outils, des moteurs, des cadres, etc. différents.

Pour mieux comprendre notre problème de normalisation, nous avons donc cartographié le cycle de vie de nos projets basés sur l’IA, ce qui nous a permis de détecter et de traiter les problèmes sous-jacents à chaque étape.

Le résultat est le système d’IA unifié d’Imagia, un flux de travail qui a aidé à structurer notre moteur d’IA et EVIDENS.

Voici où nous sommes arrivés.

​​Une analyse de la manière dont nous gérons nos projets de recherche en IA pour les soins de santé

Comme pour tout projet de recherche ou de produit d’IA, le parcours de nos projets commence une fois que (i) nous avons clairement identifié le problème que nous essayons de résoudre et que (ii) nous avons accès aux données de l’organisme de santé sous leur forme brute.

PHASE I : Explorer les données.

Les données sont la base de l’apprentissage automatique et le point de départ de notre voyage vers les projets d’IA. Pourtant, nous ne pouvons généralement pas travailler avec n’importe quelles données ; elles doivent répondre à certains critères de qualité pour s’assurer qu’elles conviennent au problème que nous essayons de résoudre. Les difficultés d’accès aux données dans le domaine de la santé rendent ce point particulièrement important.

C’est au cours de cette phase que nos experts en biostatistique procèdent à une première analyse qui permet de déterminer les principales caractéristiques des données, d’identifier les tendances et les valeurs aberrantes, de valider les hypothèses, ainsi que de séparer les données afin de réserver un sous-ensemble pour de futures validations de modèles d’IA. Cette exploration peut être effectuée indépendamment du moteur d’IA et en utilisant une variété d’outils.

PHASE II : Produire des ensembles de données prêts à l’emplois pour l’IA

Les librairies d’IA sont particulières ; elles ne peuvent interagir avec les données que si celles-ci sont présentées dans des formats spécifiques.

Les données médicales se présentent sous de nombreux formats, mais ne seront exploitables dans un projet basé sur l’IA que lorsque converties sous une forme brute. (Par exemple, les images doivent être converties en valeurs brutes de pixels ; les données textuelles doivent être sous une forme brute, ce qui signifie que les formats propriétaires tels que les PDF sont inadmissibles).

Mais pour obtenir des résultats basés sur l’apprentissage machine précis, les données doivent souvent subir une deuxième série de transformations. Par exemple, nous pouvons vouloir normaliser les valeurs d’intensité des tomodensitogrammes d’un fabricant à l’autre. Ou dans le cas de données histopathologiques, il est parfois utile de segmenter des parties spécifiques du tissu.

Ces transformations de données rendent cette phase du projet d’IA particulièrement complexe, avec des répercussions potentielles de grande ampleur.

Tout d’abord, les transformations de données sont extrêmement sensibles, ce qui engendre des risques. Une mauvaise transformation peut conduire à des résultats erronés sans déclencher de signaux d’alerte durant cette phase ou les suivantes. Deuxièmement, ces transformations nécessitent un pipeline capable de gérer des calculs lourds tout en restant suffisamment flexible pour que les utilisateurs puissent facilement explorer différents types de prétraitement et de transformation des données. Dans cette optique, nous avons identifié deux types de transformations de données :

  • Les transformations hors ligne. Certaines transformations sont coûteuses en calcul – elles peuvent ajouter des heures au processus – et ne peuvent pas être exécutées de manière réaliste chaque fois qu’un modèle doit accéder à un ensemble de données. Les transformations hors ligne doivent être exécutées une seule fois, les résultats étant stockés à un endroit où le modèle peut y accéder à tout moment lors des étapes suivantes.
  • Transformations en ligne / à la volée. L’opposé des transformations hors ligne. Ici, le coût de l’exécution répétée de cette transformation pendant la formation ou pour une prédiction n’a pas d’impact négatif sur le temps de réalisation, et peut impliquer des transformations dont les paramètres doivent varier pour différentes expériences. Par exemple, le recadrage d’un scanner thoracique pour centrer l’image sur les nodules identifiés est une transformation rapide qui peut être effectuée à la volée.

Ces transformations diffèrent dans leur mise en œuvre, mais si elles se présentent sous un format et une structure strictement définis et similaires – notre principal défi à ce stade – cette différence devient invisible pour l’utilisateur final.  Et cette standardisation libère alors nos scientifiques pour qu’ils se concentrent sur l’écriture du contenu de la transformation, la « viande » de la transformation en quelque sorte.

PHASE III : Entraînement des modèles sur les ensembles de données.

Avec des jeux de données appropriés en main, nous sommes maintenant prêts à entraîner nos modèles. L’équipe se concentre alors sur l’identification du modèle le plus approprié pour le problème que nous essayons de résoudre.

L’entraînement des modèles consiste à fournir un ensemble de données à un modèle sélectionné, qui apprend progressivement à effectuer une tâche donnée avec une précision croissante. C’est souvent là que réside la valeur d’une organisation dont les services et produits sont basés sur IA : dans sa capacité à trouver ou à créer le meilleur modèle de manière efficace et cohérente. Dans le cas d’Imagia, nous avons développé une équipe multidisciplinaire d’experts en médecine, en apprentissage automatique et en statistiques pour construire de manière optimale des modèles prédictifs en ligne avec les connaissances médicales.

Il n’existe pourtant pas de recette universelle pour choisir le « meilleur » modèle. Le développement d’un modèle prédictif d’IA est un processus itératif au cours duquel de multiples combinaisons de paramètres sont testées (c’est-à-dire rééchantillonnage, prétraitement, sélection de variables et réglage des hyper paramètres).

Cette multitude de tests représente, de loin, l’un de nos plus grands défis. Elle couvre un large éventail de caractéristiques requises. Nous devons être en mesure de suivre de manière optimale la quantité de données, de métriques et de résultats générés afin de prendre des décisions éclairées. Nous voulons être en mesure de déployer nos systèmes sur diverses technologies et dans divers environnements. Nous voulons pouvoir enregistrer les bons modèles afin que nos scientifiques puissent les réutiliser ou les former à nouveau.

Essentiellement, tout cela se traduit par un grand nombre de modèles candidats qui sont créés, entraînés, évalués, comparés et enregistrés. La décision finale est basée sur de multiples artefacts et résultats de modèles qui se traduisent sous forme de métriques, de graphiques ou de résumés.

Au cours de cette phase, notre objectif est de libérer notre équipe de scientifiques autant que possible du fardeau de l’opérationnalisation de la formation afin qu’elle puisse se concentrer sur la construction et la création de modèles efficaces.

PHASE IV : Effectuer des prédictions sur le terrain.

Nous sommes maintenant prêts à mettre notre modèle entraîné en production. Il est suffisamment robuste pour pouvoir effectuer des prédictions fiables sur des données inconnues – à condition que l’environnement dans lequel ces nouvelles données se présentent soit comparable aux conditions de l’environnement d’entraînement du modèle.

Par exemple, dans notre cas d’utilisation de prédiction de la malignité des polypes, nous avons entraîné le modèle sur les mêmes tours d’endoscopie que celles dans lesquelles il a ensuite été déployé, afin de fournir des prédictions en temps réel sur chaque image vidéo.

PHASE V : surveiller le comportement du modèle.

Dans le domaine médical, il est particulièrement important de vérifier que le modèle que nous avons conçu se comporte comme nous l’avions prévu ; il peut avoir un impact sur la vie des patients.

Au cours de cette phase finale et continue, il est prévu d’utiliser chaque métrique, événement et trace pour détecter tout comportement inattendu et réagir en conséquence. Ces changements peuvent être déclenchés par un certain nombre d’événements, dont les causes peuvent aller de la démographie (par exemple, le modèle est utilisé sur une population cible différente de celle sur laquelle il a été entraîné) à l’utilisation (un utilisateur final applique le modèle d’une manière qui n’était pas prévue).

Le résultat : un système d’IA unifié d’Imagia dédié à la recherche en santé

En résolvant et en normalisant le flux de travail de nos projets d’IA, nous avons réussi à construire un moteur d’IA, l’un des principaux composants d’EVIDENS, de manière à répondre aux différents profils d’utilisateurs dans le domaine de la santé, quel que soit leur niveau d’expertise en IA. Cela nous rapproche un peu plus de la possibilité de faire profiter les patients des avantages de l’IA.

Vous pouvez en savoir plus sur notre moteur d’IA et sur la façon dont il a été conçu ici, et vous pouvez vous inscrire à notre infolettre pour recevoir d’autres développements passionnants d’Imagia sur les soins de santé et la recherche en IA.

Related posts

Comment permettre la réalisation à l’interne de tests par biomarqueurs dans le cadre de la sélection des traitements ciblés contre le cancer?

Comment permettre la réalisation à l’interne de tests par biomarqueurs dans le cadre de la sélection des traitements ciblés contre le cancer?

Les traitements personnalisés contre le cancer au moyen de thérapies ciblées sont deux ou trois fois plus efficaces que les traitements d

...
En savoir plus
Imagia Cybernétique acquiert Canexia Health pour améliorer l'accessibilité à l'oncologie de précision

Imagia Cybernétique acquiert Canexia Health pour améliorer l'accessibilité à l'oncologie de précision

Imagia Cybernetique, une société d’IA en santé qui développe des solutions cliniques pour la prise en charge des patients atteints

...
En savoir plus
Les projets d'IA dans le domaine de la santé se distinguent des autres projets d'IA - jusqu'au flux de travail

Les projets d'IA dans le domaine de la santé se distinguent des autres projets d'IA - jusqu'au flux de travail

Lorsque nous avons créé EVIDENS™, notre plateforme de découverte pilotée par l’IA qui transforme les données de santé du monde

...
En savoir plus