Heal: un cadre pour l’évaluation des actions en santé des performances d’apprentissage automatique







L’équité en santé est une préoccupation sociétale majeure dans le monde entier, les disparités ayant de nombreuses causes. Ces sources comprennent des limites d’accès aux soins de santé, des différences de traitement clinique et même des différences fondamentales dans la technologie de diagnostic. Dans la dermatologie par exemple, les résultats du cancer de la peau sont pires pour les populations telles que les minorités, celles qui ont un statut socioéconomique inférieur ou des personnes ayant un accès limité aux soins de santé. Bien qu’il y ait beaucoup de promesses dans les progrès récents de l’apprentissage automatique (ML) et de l’intelligence artificielle (IA) pour aider à améliorer les soins de santé, cette transition de la recherche au chevet doit s’accompagner d’une compréhension approfondie de savoir si et comment elles ont un impact sur l’équité en santé.
Capitaux propres en santé est défini par les organisations de santé publique comme une équité d’opportunité pour tout le monde d’être aussi saine que possible. Surtout, les capitaux propres peuvent être différents de égalité. Par exemple, les personnes ayant des obstacles plus importantes à l’amélioration de leur santé peuvent nécessiter un effort plus ou différent pour vivre cette opportunité équitable. De même, l’équité n’est pas justice tel que défini dans l’IA pour la littérature sur les soins de santé. Alors que l’équité de l’IA s’efforce souvent d’égmenter les performances de la technologie de l’IA dans différentes populations de patients, cela ne se concentre pas dans l’objectif de hiérarchiser les performances en ce qui concerne les disparités de santé préexistantes.
Dans « Évaluation de l’équité en santé des performances de l’apprentissage automatique (Heal): un cadre et une étude de cas de modèle AI Framework and Dermatology AI», Publié dans Lancet EclinicalMedicinenous proposons une méthodologie pour évaluer quantitativement si les technologies de santé basées sur la ML fonctionnent équitablement. En d’autres termes, le modèle ML fonctionne-t-il bien pour ceux qui ont les pires résultats pour la santé pour la ou les conditions que le modèle est censée aborder? Cet objectif ancre sur le principe selon lequel l’équité en santé devrait hiérarchiser et mesurer les performances du modèle en ce qui concerne les résultats de santé disparates, qui peuvent être dus à un certain nombre de facteurs qui incluent les inégalités structurelles (par exemple, démographique, social, culturel, politique, économique, environnemental et géographique).
Le cadre des capitaux propres de la santé (Heal)
Le Cadre Heal propose un processus en 4 étapes pour estimer la probabilité qu’une technologie de santé basée sur ML fonctionne équitablement:
- Identifier les facteurs associés aux inégalités de santé et définir les mesures de performance des outils,
- Identifier et quantifier les disparités de santé préexistantes,
- Mesurez les performances de l’outil pour chaque sous-population,
- Mesurez la probabilité que l’outil privilégie les performances en ce qui concerne les disparités en matière de santé.
La sortie de la dernière étape est appelée la métrique de la guérison, ce qui quantifie à quel point les performances du modèle ML sont anticipées avec les disparités en matière de santé. En d’autres termes, le modèle fonctionne-t-il mieux avec les populations qui ont les pires résultats pour la santé?
Ce processus en 4 étapes est conçu pour informer les améliorations pour rendre les performances du modèle ML plus équitables, et est censé être itératif et réévalué régulièrement. Par exemple, la disponibilité des données sur les résultats de la santé à l’étape (2) peut éclairer le choix des facteurs démographiques et des supports à l’étape (1), et le cadre peut être appliqué à nouveau avec de nouveaux ensembles de données, modèles et populations.
Avec ce travail, nous faisons un pas vers l’encouragement de l’évaluation explicite des considérations sur l’équité en santé des technologies de l’IA, et encourageons la hiérarchisation des efforts pendant le développement du modèle afin de réduire les inégalités de santé pour les sous-populations exposées aux inégalités structurelles qui peuvent précipiter les résultats disparus. Nous devons noter que le cadre actuel ne modélise pas les relations causales et ne peut donc pas quantifier l’impact réel qu’une nouvelle technologie aura sur la réduction des disparités des résultats pour la santé. Cependant, la métrique Heal peut aider à identifier les opportunités d’amélioration, où les performances actuelles ne sont pas prioritaires en ce qui concerne les disparités préexistantes pour la santé.
Étude de cas sur un modèle de dermatologie
En tant qu’étude de cas illustrative, nous avons appliqué le cadre à un modèle de dermatologie, qui utilise un réseau neuronal convolutionnel similaire à celui décrit dans travaux antérieurs. Cet exemple de modèle de dermatologie a été formé pour classer 288 conditions cutanées à l’aide d’un ensemble de données de développement de 29k cas. L’entrée du modèle se compose de trois photos d’une préoccupation cutanée ainsi que des informations démographiques et des antécédents médicaux structurés. La sortie se compose d’une liste classée d’éventuelles affections cutanées correspondantes.
En utilisant le cadre Heal, nous avons évalué ce modèle en évaluant s’il a priorisé les performances en ce qui concerne les résultats de santé préexistants. Le modèle a été conçu pour prédire les conditions dermatologiques possibles (à partir d’une liste de centaines) sur la base de photos d’une préoccupation cutanée et de métadonnées des patients. L’évaluation du modèle se fait à l’aide d’une métrique d’accord top-3, qui quantifie à quelle fréquence les 3 premières conditions de sortie correspondent à la condition la plus probable comme suggérée par un panel dermatologue. La métrique Heal est calculée via l’anticorrélation de cet accord top 3 avec les classements des résultats de la santé.
Nous avons utilisé un ensemble de données de 5 420 cas de télédermatologie, enrichi pour la diversité de l’âge, du sexe et de la race / ethnique, pour évaluer rétrospectivement la métrique de guérison du modèle. L’ensemble de données consistait en des cas de «magasin-et-arrière» de patients de 20 ans ou plus de fournisseurs de soins primaires aux États-Unis et des cliniques de cancer de la peau en Australie. Sur la base d’une revue de la littérature, nous avons décidé d’explorer la race / l’ethnicité, le sexe et l’âge comme facteurs potentiels d’iniquité, et avons utilisé des techniques d’échantillonnage pour garantir que notre ensemble de données d’évaluation avait une représentation suffisante de toutes les groupes raciaux / ethniques, sexe et d’âge. Pour quantifier les résultats de santé préexistants pour chaque sous-groupe, nous nous sommes appuyés sur des mesures de publique bases de données approuvé par l’Organisation mondiale de la santé, comme Des années de vie perdues (Ylls) et Années de vie ajustées au handicap (Dalys; années de vie perdues plus des années vivaient avec handicap).
![]() |
Guérissez la métrique pour toutes les conditions dermatologiques entre les sexes, y compris les résultats pour la santé (DALYS pour 100 000), les performances du modèle (accord top 3) et les classements pour les résultats pour la santé et les performances des outils. (* Comme ci-dessus.) |