Cette semaine apporte son nouveau chapitre dans le grand livre de l’IA.
Selon un audit mené en Ontario, l’assistant virtuel de votre médecin pourrait inventer des informations
Les fausses demandes de consultation en thérapie et les ordonnances erronées font partie des erreurs les plus courantes.
Ces dernières années, de nombreux médecins surchargés de travail ont eu recours à ce qu’on appelle des « assistants médicaux basés sur l’IA » pour les aider à synthétiser automatiquement les entretiens avec les patients, les diagnostics et les décisions thérapeutiques sous forme de notes structurées destinées à être consignées dans les dossiers médicaux. Cependant, un récent audit mené par le vérificateur général de l’Ontario a révélé que les transcripteurs assistés par IA recommandés par le gouvernement provincial produisaient régulièrement des informations erronées, incomplètes ou fantaisistes, susceptibles « d’aboutir à des plans de traitement inadéquats ou préjudiciables pouvant avoir des répercussions sur l’état de santé des patients ».
Tous ces facteurs ont contribué à la conclusion générale de la vérificatrice générale selon laquelle ces systèmes de prise de notes basés sur l’IA « n’ont pas été évalués de manière adéquate ».
Dans un rapport récent intitulé « Utilisation de l’intelligence artificielle au sein du gouvernement de l’Ontario », la vérificatrice générale a examiné les résultats de transcription de deux conversations simulées entre un patient et un médecin, réalisées par 20 fournisseurs de services de transcription assistée par IA qui avaient été approuvés et présélectionnés par le gouvernement provincial en vue de leur acquisition par les prestataires de soins de santé. Ces 20 prestataires ont tous présenté des lacunes en matière de précision ou d’exhaustivité lors d’au moins un de ces tests simples : neuf d’entre eux ont inventé de toutes pièces des informations sur les patients, 12 ont mal consigné les informations et 17 ont omis des détails essentiels concernant les problèmes de santé mentale abordés.
Dans son rapport, la vérificatrice générale met en évidence de multiples exemples préoccupants d’erreurs contenues dans ces résumés, qui pourraient avoir un impact direct et négatif sur la prise en charge ultérieure des patients. Cela inclut les cas où un assistant virtuel a inventé de toutes pièces des prescriptions pour des analyses de sang ou des traitements, a mal retranscrit les noms de médicaments sur ordonnance et/ou a omis des « détails essentiels » concernant des problèmes de santé mentale abordés lors des conversations simulées.
Parmi l’ensemble des fournisseurs agréés, l’assistant de saisie médicale basé sur l’IA testé n’a obtenu qu’une note moyenne de 12 sur 20 dans la section « précision des notes médicales générées » de la grille d’évaluation de Supply Ontario. Mais cet indicateur d’« exactitude », qui semblait pourtant essentiel, ne représentait qu’environ 4 % de la note globale d’un fournisseur, ce qui permettait d’atteindre facilement le seuil minimum requis pour être approuvé, même si un transcripteur IA obtenait un « zéro » pour cet indicateur (un autre indicateur, mesurant la « présence locale en Ontario », comptait pour 30 % de la note globale).
Tous ces facteurs ont contribué à la conclusion générale de la vérificatrice générale selon laquelle ces systèmes de prise de notes basés sur l’IA « n’ont pas été évalués de manière adéquate ». Faisant preuve de retenue et de modération, le rapport souligne qu’« il est important que les systèmes de transcription assistée par IA soient testés afin de garantir la qualité des notes générées et de minimiser les inexactitudes ». Il recommande aussi que les services informatiques utilisant ces systèmes obligent les médecins à « confirmer qu’ils ont bien relu les notes produites » avant de les enregistrer dans les dossiers des patients.
D’un autre côté, les services de santé du secteur public en Ontario ne sont pas tenus d’utiliser ces systèmes de transcription basés sur l’IA dans le cadre de leur travail et peuvent, s’ils le souhaitent, faire appel à des prestataires non agréés pour ces services. Toutefois, le fait que le gouvernement de l’Ontario ait recommandé des systèmes de synthèse basés sur l’IA présentant des failles aussi manifestes et potentiellement préjudiciables aux patients devrait inciter à la prudence tout médecin (ou ses patients) qui les utilise.
L’évolution de ce dossier sera à suivre avec attention.
À lire également :
Article original publié par Ars Technica AI : Ars Technica AI