top of page

La inteligencia artificial médica no es tan inteligente con pacientes nuevos



 

Para este 2024 en el campo de la medicina se prevén avances muy notorios, gracias al empleo de la inteligencia artificial, el aprendizaje automático y a otras tecnologías exponenciales. No hablamos de meras elucubraciones, sino de realidades de ensayos clínicos que se están desarrollando. Como, por ejemplo, el uso de la inteligencia artificial para el diagnóstico precoz del cáncer de pulmón o la aplicación del machine learning para el triaje de pacientes. [1] Además, esta misma semana conocíamos también que los primeros robots que atienden pacientes han llegado a los hospitales. [2]

 

Sin embargo, en paralelo estamos constantemente leyendo noticias respecto a los sesgos, fallos y alucinaciones de la inteligencia artificial. De hecho, en el ámbito de la medicina, la inteligencia artificial está presentando fallos discriminatorios en el diagnóstico [3]; y por el momento, no está resultando fiable para las predicciones de los resultados de un tratamiento en pacientes nuevos, de los cuales el sistema no tiene datos históricos.

 

¿Cuáles son los usos de la IA en la medicina?

 

El potencial de la inteligencia artificial en el ámbito de la medicina es evidente, tanto en el área diagnóstica como en el área de la práctica clínica.

 

La inteligencia artificial sirve como apoyo a los médicos para el diagnóstico de patologías y enfermedades. Las herramientas, que utilizan inteligencia artificial (lA), permiten detectar patrones entre grandes conjuntos de datos y predecir cómo responderán los individuos a un tratamiento particular, lo que es fundamental para la medicina de precisión, en la que los profesionales de la salud intentan adaptar el tratamiento a cada persona.

 

¿Realmente la IA falla en la precisión de los resultados de los tratamientos?

 

Algunos ensayos que se han realizado muestran que los algoritmos de la inteligencia artificial consiguen una alta precisión de los resultados de los tratamientos respecto a aquellas personas con cuyos datos fueron entrenados. Pero, no es así respecto de pacientes nuevos, cuyos datos no fueron utilizados en el entrenamiento de la inteligencia artificial; es decir, aquellos pacientes a los que la inteligencia artificial no había “tratado” previamente y le eran desconocidos. [4] [5][6]

 

Así se ha mostrado en un trabajo publicado el 11 de enero en ScienceL. Los investigadores demostraron que los modelos de lA pueden predecir con alta precisión los resultados del tratamiento para las personas correspondientes a la muestra con la que el sistema de inteligencia artificial fue entrenado. Sin embargo, su desempeño caía, a poco más que el azar, cuando se aplicaba a subconjuntos de la muestra inicial o a diferentes conjuntos de datos.

 

Asimismo, un análisis de ensayos sobre la esquizofrenia mostró que dichas herramientas no logran adaptarse a nuevos conjuntos de datos. El estudio realizado con pacientes con esquizofrenia evidenció que los algoritmos diseñados para ayudar a los médicos a realizar el tratamiento no se adaptaban bien a datos nuevos e invisibles.

 

¿Cómo se entrenó la IA para llegar a dicha conclusión en los ensayos?

 

Para llegar a dicha conclusión, los investigadores evaluaron un algoritmo que se usa comúnmente en modelos de predicción psiquiátrica, y se basaron en datos de cinco ensayos clínicos de fármacos antipsicóticos, en los que participaron 1.513 participantes de América del Norte, Asia, Europa y África, a los que se les había diagnosticado esquizofrenia. Los ensayos, que se llevaron a cabo entre 2004 y 2009, midieron los síntomas de los participantes antes y cuatro semanas después de tomar fármacos para el tratamiento.

 

El equipo entrenó el algoritmo para predecir mejoras en los síntomas en las semanas siguientes del tratamiento. Primero, los investigadores probaron la precisión del algoritmo con las muestras con las que se había desarrollado y compararon sus predicciones con los resultados reales registrados. En este punto, descubrieron que la precisión era alta.

 

A continuación, utilizaron varios enfoques para evaluar qué tan bien se generalizaba el modelo a nuevos datos. Para ello, entrenaron el algoritmo con todos los datos de una prueba (o un grupo de pruebas) y midieron su rendimiento en una prueba separada. En este caso, el modelo tuvo un desempeño deficiente, generando predicciones casi aleatorias cuando se aplicó a conjuntos de datos con los que no había sido entrenado. El equipo repitió el experimento utilizando un algoritmo de predicción diferente, pero obtuvo resultados similares.

 

¿Qué se puede hacer para mejorar la precisión de la IA?

 

Concretamente, el coautor del estudio anteriormente referido, Adam Chekroud -psiquiatra de la Universidad de Yale en New Haven-, destacó que los resultados del ensayo demostraban básicamente que los algoritmos deben probarse en múltiples muestras, para mejorar la precisión de los sistemas. Los hallazgos resaltaban cómo los modelos de predicción clínica deben probarse rigurosamente en grandes conjuntos de datos para garantizar que sean confiables.

 

Sin embargo, en la práctica, una revisión sistemática de 308 modelos de predicción clínica de resultados psiquiátricos encontró que solamente alrededor del 20% de los modelos fueron validados en muestras distintas a aquellas en las que fueron desarrollados.



Conclusión

 

La inteligencia artificial es una tecnología de gran utilidad para el avance de la medicina, y la especialización e individualización de los tratamientos. Sin embargo, aún estamos recorriendo el camino para su desarrollo fiable. Para ser eficaces, los modelos de predicción deben ser consistentemente precisos en diferentes casos, con un sesgo mínimo o sin resultados aleatorios.

 

Para alcanzar dicho objetivo, los expertos señalan que debe seguirse un proceso riguroso y disciplinado acerca de cómo se construyen los algoritmos para este tipo de herramientas médicas y diagnósticas, y cómo son testados posteriormente. Señalaba Chekroud que “No podemos hacerlo simplemente una vez y pensar que es real".


T. Cantero

Médico especialista en Pediatría

 

Bibliografía

 

[1] Esteban, F. (2023, dic. 25) Increíbles avances médicos esperan 2024. https://www.businessinsider.es/increibles-avances-medicos-esperan-2024-1350698

[2] Redacción T21. (2024, feb. 09) Los robots que atienden pacientes llegan a los hospitales. El periódico. https://www.elperiodico.com/es/tendencias-21/20240209/robots-atienden-pacientes-llegan-hospitales-97945651

[3] Ball, P. (2023, dic. 07) Is IA leading to a reproducibility crisis in science? Feature.

[4] Eden, L., Romm and Tsigelny, F. (2019, jul. 26) Artificial Intelligence in Drug Treatment. Annual Reviews Pharmacol. Toxicol. 2020, 60:353.

[5] Daykan, Y, Barry, A. (2023, jul. 24) The role of artificial intelligence in the future of uroynecology. International Urogynecology Journal 34. 1663-1666.

[6] Dumitru, M, Berghi, O., Taciuc, A. (2022) Could artificial intelligence prevent intraoperative anaphylaxis? MDPI. Medicina.

 

 

 

 

39 visualizaciones0 comentarios

Comments


bottom of page