Uso del machine learning para predecir la progresión del cáncer de próstata El cáncer de próstata es una enfermedad cada vez más común en México, ya que se ha convertido en la primera causa de muerte por tumores malignos en hombres, cobrando en promedio 7 mil vidas cada año, según cifras del ISSSTE. 

Detectar a tiempo cualquier indicio de esta enfermedad es fundamental, considerando que cada año se diagnostican más de 25 mil casos, según cifras del Instituto Nacional de Cancerología, de los cuales, el 70% se encuentran en etapas avanzadas. 

Por ello, es importante contar con tecnologías que ayuden a la vigilancia activa de esta enfermedad. 

Massachusetts General Hospital ha integrado innovaciones como el aprendizaje automático (en inglés, machine learning) para intentar predecir la progresión del cáncer de próstata en pacientes diagnosticados. 

Principales hallazgos 

Este estudio evaluó si los enfoques de aprendizaje automático podían mejorar la predicción de la progresión del cáncer de próstata, en comparación con un modelo tradicional de regresión logística durante la vigilancia activa. 

Todos los modelos de aprendizaje automático fueron significativamente mejores que la regresión logística, en lo que respecta a la puntuación F1, la principal métrica de rendimiento. 

En comparación con los modelos de aprendizaje automático, la regresión logística también presentaba la sensibilidad (10,6 %) y el valor predictivo negativo (72 %) más bajos, pero tenía la especificidad (97 %) y el valor predictivo positivo (62 %) más elevados. 

Este trabajo confirma que los modelos de aprendizaje automático son superiores a la regresión logística para esa tarea. 

Los protocolos de vigilancia activa (VA) del cáncer de próstata de muy bajo o bajo riesgo suelen incluir visitas médicas seriadas, pruebas del antígeno prostático específico (APE) y biopsias repetidas. Aunque se ha demostrado que reduce el sobretratamiento, la vigilancia puede llevar mucho tiempo tanto para el médico como para el paciente, y la biopsia de próstata tiene múltiples riesgos. Además, algunos pacientes sienten ansiedad por aplazar la intervención. 

Para permitir una atención más personalizada, varios grupos han desarrollado modelos de predicción de la progresión en VA mediante enfoques estadísticos tradicionales. Madhur Nayan, MDCM, PhD, becario del Programa Combinado de Harvard de Oncología Urológica, de Massachusetts General Hospital, y profesor del Instituto de Ingeniería y Ciencia Médicas del Instituto Tecnológico de Massachusetts; Adam S. Feldman, MD, MPH, director de la Beca Combinada de Oncología Urológica de Harvard y director de Investigación Urológica del Departamento de Urología de Mass General, y oncólogo urológico del Centro de Cáncer de Mass General, y sus colegas se convirtieron recientemente en los primeros en evaluar enfoques de aprendizaje automático (machine learning, ML). 

En Oncología Urológica, el equipo informa de la superioridad de los modelos ML frente a un modelo de regresión logística tradicional (T-LR) para predecir la progresión de la enfermedad durante la VA. 

Fuente de datos 

Los datos para los modelos proceden de 790 pacientes diagnosticados de cáncer de próstata, localizado entre 1997 y 2016, y tratados con VA. Todos tenían un APE <10 ng/mL, estadio clínico hasta T2a y enfermedad de grado 1 en la biopsia diagnóstica. Durante una mediana de seguimiento de 6,3 años, 234 pacientes presentaron progresión de grado.

Desarrollo de modelos 

Los investigadores dividieron aleatoriamente la cohorte en un conjunto de entrenamiento (80 % de los pacientes) y un conjunto de prueba (20 %). Desarrollaron los modelos en el conjunto de entrenamiento utilizando las características del paciente y de la enfermedad medidas en el momento del diagnóstico (cuatro características para el modelo T-LR y 14 para los modelos ML). 

Los modelos ML fueron una máquina de vectores soporte, un bosque aleatorio, una red neuronal artificial de dos capas y una versión ML de regresión logística (ML-LR). Dada la prioridad clínica de predecir correctamente los pacientes con progresión de grado y la naturaleza desequilibrada del conjunto de datos (una minoría de pacientes presentaba progresión), los modelos se desarrollaron con orientación clínica para optimizar la puntuación F1. 

La puntuación F1 es la media armónica del valor predictivo positivo (también conocido como precisión) y la sensibilidad. Puede oscilar entre 0 y 1, donde 1 indica precisión y sensibilidad perfectas. 

Métrica principal de rendimiento 

En el conjunto de pruebas, las puntuaciones F1 fueron: 

Máquina de vectores soporte—0,59

ML-LR—0,52

Red neuronal artificial—0,39

Bosque aleatorio—0,38

T-LR—0,18

Todas las diferencias entre el modelo LR y los modelos ML fueron estadísticamente significativas (P <0,001).

Otras métricas 

En comparación con los modelos ML, el modelo T-LR presentó la sensibilidad (11 %) y el valor predictivo negativo (72 %) más bajos, pero la especificidad (97 %) y el valor predictivo positivo (62 %) más altos. 

A pesar de la baja sensibilidad del modelo T-LR, su estadístico c (0,69) fue superior al del bosque aleatorio (0,60) y la red neuronal artificial (0,55). La máquina de vectores soporte fue el mejor modelo en cuanto a puntuación F1 (0,59), sensibilidad (72 %), valor predictivo negativo (85 %) y estadístico c (0,70).

 Orientaciones futuras

Este trabajo no logró un modelo sólido para predecir la progresión del cáncer de próstata durante la VA. Aun así, demuestra el valor de los métodos ML para esa tarea en comparación con los enfoques estadísticos tradicionales. Un probable próximo paso será desarrollar un modelo de predicción que combine datos clínicos con una red neuronal convolucional que analice datos de resonancia magnética.