
Un importante estudio de desafío encuentra que los modelos de IA de alto rendimiento pueden detectar el cáncer de mama en las mamografías de detección con una precisión comparable a la de los radiólogos experimentados.
Los algoritmos de inteligencia artificial (IA) han demostrado una alta eficacia para identificar el cáncer de mama en imágenes de mamografía, según un estudio reciente publicado en Radiología el 12 de agosto de 2025.
Estos algoritmos se presentaron en el Desafío de IA de la Sociedad Radiológica de América del Norte (RSNA), una competencia de crowdsourcing con más de 1500 equipos participantes. De las presentaciones, los 10 mejores mostraron un rendimiento cercano al del radiólogo de detección promedio en Europa y Australia.
El desafío se llevó a cabo para evaluar la eficacia de los algoritmos presentados para la detección del cáncer de mama. El RSNA permitió presentaciones entre noviembre de 2022 y febrero de 2023, anunciando públicamente los resultados en mayo de 2023. Hubo 5415 casos de detección de mama incluidos en el conjunto de evaluación, ninguno de los cuales fueron casos de cáncer a intervalos.
El examen patológico se utilizó para identificar cáncer y lesiones benignas. Los datos adicionales recopilados incluyeron la lateralidad del cáncer, la edad del paciente, el estado invasivo y si se realizó una biopsia. La densidad de los senos también se incluyó cuando estaba disponible.
Se permitió desarrollar algoritmos de IA utilizando cualquier arquitectura. Sin embargo, se ejecutaron en el servidor Kaggle para su evaluación, lo que los limitaba a las especificaciones técnicas del servidor. Estos algoritmos proporcionaron datos de predicción a nivel de pecho, con algunos reportando resultados como predicciones binarias y otros en una escala de probabilidad continua.
Prevalencia del cáncer y puntuaciones de rendimiento. Las mujeres tenían 59 años cuando se sometían a mamografías de detección, con un 2% de los senos con cáncer probado por biopsia. De los casos sin cáncer, el 3,2 % fue reportado benigno a través de la biopsia. Mientras que el 52 % de los senos no tenían datos de densidad disponibles, el 5,2 % eran A, 20 % B, 20,1 % C y 2,6 % D.
Había 1537 algoritmos de IA incluidos en el análisis final, 1072 de los cuales proporcionaron predicción binaria y 465 proporcionaron una probabilidad predicha. Al clasificar los algoritmos con una métrica F1 probabilística, se informó de una puntuación de 0,555 para el algoritmo superior.
Se informó de una tasa media de recuperación del 1,7 % para los algoritmos, junto con una tasa media de detección de cáncer del 0,54 %. Para el algoritmo mejor clasificado, estas tasas fueron del 1,5 % y del 1 %, respectivamente, frente al 2,4 % y al 1,2 % para los 3 primeros, y del 3,5 % y 1,3 % para los 10 primeros.
Valores predictivos y sensibilidad. Los algoritmos tenían un valor predictivo positivo (PPV) mediano del 36,9 % y un valor predictivo negativo medio (VNP) del 98,5 %. Para el algoritmo mejor clasificado, los 3 primeros y los 10 primeros, los PPV fueron del 64,6%, 49,2% y 37,9%, respectivamente, mientras que los VAN fueron del 99%, 99,2% y 99,4%.
También se informó de la sensibilidad y especificidad de los algoritmos, con medianas del 27,6 % y 98,7 %, respectivamente. Para el algoritmo mejor clasificado, estas tasas fueron del 48,6% y del 99,5%. Se descubrió que el tipo de cáncer, el sitio de adquisición y el fabricante del equipo influyen en la sensibilidad.
Se reportaron sensibilidades del 56,7 % y del 29,7 % para los casos invasivos de cáncer y los casos de cáncer no invasivos, respectivamente, para el modelo de mejor rendimiento. Además, se informó de una sensibilidad más baja para el sitio 1 frente al sitio 2, y el uso de equipos Hologic se vinculó a una sensibilidad reducida.
Implicaciones. Estos resultados destacaron la eficacia de los algoritmos de IA presentados para detectar cánceres en mamografías de detección. Los investigadores concluyeron que estos algoritmos podrían usarse para aumentar la sensibilidad mientras se mantienen las tasas de recuperación clínicamente realistas.
Al publicar los algoritmos y un conjunto de datos de imágenes integral al público, los participantes proporcionan recursos valiosos que pueden impulsar una mayor investigación y permitir la evaluación comparativa necesaria para la integración efectiva y segura de la IA en la práctica clínica.
No hay comentarios:
Publicar un comentario