Los radiólogos superan a la inteligencia artificial en la identificación de enfermedades pulmonares en radiografías de tórax

Radiologists outperform artificial intelligence in identifying lung diseases in chest X-rays.

Compartir en Pinterest
Una radiografía de tórax puede ayudar a identificar varias enfermedades pulmonares/Getty Images
  • La inteligencia artificial (IA) y las herramientas de aprendizaje automático están cada vez más presentes en el ámbito de la atención médica y más allá.
  • Un nuevo estudio comparó las herramientas de IA con los radiólogos humanos y encontró que los radiólogos eran superiores a las máquinas en la identificación de afecciones a partir de las radiografías de tórax.
  • Los investigadores informaron que cuanto más complicado era el diagnóstico, más eficientes eran los expertos humanos en comparación con las herramientas de IA.

La inteligencia artificial (IA) ya está transformando la forma en que interactuamos con el mundo, desde ayudar a predecir huracanes mejor que nunca hasta proporcionar consejos financieros.

Pero cuando se trata de leer sus radiografías de tórax en la consulta del médico, es posible que las IA no estén listas para reemplazar a los radiólogos del mundo.

Así lo revela un nuevo estudio publicado en la revista Radiology.

En el estudio, investigadores daneses utilizaron un grupo de 72 radiólogos y cuatro herramientas de IA comerciales para interpretar 2,040 radiografías de tórax de adultos mayores (edad promedio de 72 años).

Alrededor de un tercio de las radiografías mostraban al menos una de tres afecciones diagnosticables: enfermedad del espacio aéreo, neumotórax (pulmón colapsado) o derrame pleural (también conocido como “agua en los pulmones”).

Los investigadores informan que las herramientas de IA fueron razonablemente sensibles, diagnosticando enfermedad del espacio aéreo entre el 72% y el 91% de las veces en casos positivos, entre el 63% y el 90% de las veces para el neumotórax, y entre el 62% y el 95% de las veces para el derrame pleural.

Sin embargo, los investigadores señalaron que estas herramientas de IA también producían un alto número de falsos positivos, y su precisión disminuía cuanto más complicado se volvía el diagnóstico. Esto era especialmente cierto en casos de múltiples afecciones concurrentes o cuando la evidencia de la radiografía era más pequeña.

Por ejemplo, en el caso del neumotórax, cuando se sumaban estos falsos positivos, los valores predictivos positivos para los sistemas de IA oscilaban entre el 56 por ciento y el 86 por ciento. En cambio, los radiólogos acertaban el 96 por ciento de las veces.

Los valores predictivos positivos para el derrame pleural eran similares a los del neumotórax, con una precisión que variaba entre el 56 por ciento y el 84 por ciento.

La IA era aún peor para diagnosticar la enfermedad del espacio aéreo, solo prediciendo positivamente la afección en el 40% al 50% de los casos.

“En esta muestra de pacientes difíciles y de edad avanzada, la IA predijo la enfermedad del espacio aéreo cuando no estaba presente cinco o seis de cada 10 veces. No se puede tener un sistema de IA trabajando solo a esa tasa”, dijo el Dr. Louis Plesner, autor principal del estudio y radiólogo en el Departamento de Radiología del Hospital Herlev y Gentofte en Copenhague, Dinamarca, en un comunicado de prensa. “Los sistemas de IA parecen ser muy buenos para encontrar enfermedades, pero no son tan buenos como los radiólogos para identificar la ausencia de enfermedad, especialmente cuando las radiografías de tórax son complejas”.

Otro problema, según Plesner, es que una alta tasa de falsos positivos sería costosa tanto en tiempo, pruebas innecesarias como en mayor exposición a la radiación para los pacientes.

Reacción de los expertos en IA al estudio de la radiografía de tórax

“Este estudio no me sorprende y es exactamente lo que se esperaría de un sistema de IA”, dijo Zee Rizvi, cofundador y presidente de Odesso Health, un servicio asistencial de IA para automatizar los registros médicos electrónicos.

“En el mejor de los casos, la IA complementa las habilidades humanas de manera complementaria”, dijo a Medical News Today. “Considerar que la IA y la capacidad humana son mutuamente excluyentes siempre conducirá a resultados decepcionantes. No hemos avanzado lo suficiente en el espacio de la IA y el aprendizaje profundo como para eliminar por completo a los humanos de la ecuación de la productividad y los resultados para los pacientes. Es así de simple”.

El Dr. Fara Kamanger, dermatólogo y presidente de la Sociedad Dermatológica de San Francisco, así como fundador de la herramienta de salud cutánea IA DermGPT, respondió positivamente al estudio, aunque señaló sus limitaciones.

“El diseño de este estudio es sólido, ya que incorpora varias herramientas de IA e involucra a dos radiólogos para confirmar el diagnóstico. En caso de desacuerdo, se consulta a un tercer radiólogo”, dijo Kamanger a Medical News Today. “El potencial de la IA en la atención médica es vasto y abarca diversas aplicaciones, como el desarrollo de medicamentos, la investigación, la atención al paciente, la gestión de consultas, la gestión de recetas y seguros, y más. Es alentador ver a los médicos desempeñar un papel proactivo en el liderazgo del desarrollo de la IA en la atención médica”.

Inteligencia artificial vs. médicos

Kamanger estuvo de acuerdo con Rizvi en que es poco probable que la inteligencia artificial reemplace a los expertos humanos en el campo de la salud en un futuro cercano.

“Los médicos humanos tienen la ventaja de realizar una evaluación clínica de 360 grados, que incluye la evaluación de la apariencia física del paciente, los signos vitales y la correlación clínica. Este enfoque integral permite a los médicos considerar diversos factores y realizar diagnósticos precisos”, dijo ella. “Para mejorar aún más los sistemas de inteligencia artificial, es importante incorporar este enfoque integral en su desarrollo. Al integrar datos de diversas fuentes y considerar múltiples aspectos de la evaluación del paciente, los sistemas de inteligencia artificial pueden esforzarse por imitar de manera más efectiva la práctica clínica de los médicos humanos”.

“Sin embargo, es crucial reconocer que el juicio clínico y la experiencia humana seguirán siendo invaluables para brindar una atención integral al paciente”, agregó Kamanger.

Una cosa que Rizvi dijo que le gustaría ver es un estudio de seguimiento que combine los enfoques humano y de máquina.

“Este estudio se basa en la suposición binaria de que los resultados dependen ya sea de la inteligencia artificial o de los radiólogos”, dijo él. “Si se realizara un estudio para examinar la cooperación entre la inteligencia artificial y los radiólogos, el resultado sería sin duda más sólido que la suma de sus partes”.