Este nueva investigación liderada por el Oxford Internet Institute y el Departamento Nuffield de Ciencias de la Salud de Atención Primaria de la Universidad de Oxford, precisa que los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés), que están basados en inteligencia artificial y entrenados para procesar y comprender el lenguaje natural a una gran enorme, entrañan un riesgo para aquellas personas que buscan un asesoramiento sobre temas de salud, debido a tienden a dar información inexacta e inconsistente.

En un comunicado publicado en sitio web del Oxford Internet Institute se describe que “ el mayor estudio con usuarios sobre modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) destinados a ayudar al público general en la toma de decisiones médicas ha determinado que estos presentan riesgos para las personas que buscan asesoramiento médico, debido a su tendencia a ofrecer información inexacta e inconsistente”.

De acuerdo a los resultados de la investigación se publicaron en la revista científica Nature Medicine, aún existe una gran brecha entre lo que prometen los modelos de lenguaje (LLM) y su utilidad real para los pacientes que los usan con el propósito de buscar información sobre sus síntomas.

Existe “una brecha significativa entre la promesa de los modelos de lenguaje de gran tamaño (LLM) y su utilidad real para quienes buscan consejo médico”, indica el Oxford Internet Institute, quien añade explicando que si bien “estos modelos ahora destacan en pruebas estandarizadas de conocimientos médicos, suponen riesgos para los usuarios reales que buscan ayuda para comprender y manejar sus propios síntomas médicos”.

Por su parte, en un comunicado publicado por el Departamento Nuffield de Ciencias de la Salud de Atención Primaria de la Universidad de Oxford se hace referencia a que “millones de personas recurren ahora a chatbots de inteligencia artificial para obtener respuestas sobre su salud, pero un importante estudio reciente advierte que esta confianza puede estar mal depositada”; y añade que “los modelos de lenguaje de gran tamaño (LLM) apoyan a personas reales en la toma de decisiones médicas concluye que estos sistemas pueden ofrecer consejos inexactos, inconsistentes y potencialmente peligrosos cuando los usuarios buscan ayuda para interpretar sus propios síntomas”.

“Aunque estos modelos ahora destacan en pruebas estandarizadas de conocimientos médicos, suponen riesgos para los usuarios reales que buscan ayuda para comprender sus propios síntomas médicos”.

En los últimos tiempos, varios proveedores de salud a nivel mundial proponen a los LLM como potenciales herramientas para llevar acabo evaluaciones entorno a la salud y “gestionar” sus afecciones antes de ir a ver a un médico.

DIFERENCIA ENTRE LOS MÉTODOS TRADICIONALES Y LOS CHATBOTS

Para analizar la capacidad de esta herramienta de inteligencia artificial, los autores Andrew M. Bean, Rebecca Elizabeth Payne, Guy Parsons, Hannah Rose Kirk, Juan Ciro, Rafael Mosquera-Gómez, Sara Hincapié M, Aruna S. Ekanayaka, Lionel Tarassenko, Luc Rocher y Adam Mahdi; hicieron una evaluación para poder identificar si los LLM podían ayudar a las personas a poder determinar con precisión sus afecciones médicas, tales como un resfriado común, anemia o cálculos biliares y a tomar la decisión sobre si acudir al médico de cabecera o al hospital

“Los participantes utilizaron modelos de lenguaje de gran tamaño (LLM) para identificar e investigar problemas de salud y decidir el curso de acción adecuado, como acudir a un médico de atención primaria o ir al hospital, a partir de la información proporcionada en una serie de escenarios médicos específicos elaborados por médicos” detalla el Oxford Internet Institute, quien prosigue explicando que “quienes usaron LLM no tomaron mejores decisiones que los participantes que recurrieron a métodos tradicionales, como las búsquedas en línea o su propio criterio”.

La investigación mostró a los autores una fractura “en la comunicación en ambos sentidos”. Además, las personas que participaron en este nuevo estudio “a menudo no sabían qué información necesitaban los LLM para ofrecer un asesoramiento preciso, y las respuestas que recibían combinaban con frecuencia recomendaciones acertadas y erróneas, lo que dificultaba identificar el mejor curso de acción”, precisa el Oxford Internet Institute.