banner
Hogar / Blog / Evaluación de clasificadores de aprendizaje automático para apoyar la toma de decisiones sobre derivaciones de glaucoma en entornos de atención primaria
Blog

Evaluación de clasificadores de aprendizaje automático para apoyar la toma de decisiones sobre derivaciones de glaucoma en entornos de atención primaria

Jul 03, 2023Jul 03, 2023

Scientific Reports volumen 12, número de artículo: 8518 (2022) Citar este artículo

953 Accesos

1 Citas

3 altmétrico

Detalles de métricas

Se han propuesto varios algoritmos de inteligencia artificial para ayudar a diagnosticar el glaucoma mediante el análisis de los cambios funcionales y/o estructurales del ojo. Estos algoritmos requieren conjuntos de datos cuidadosamente seleccionados con acceso a imágenes oculares. En el estudio actual, hemos modelado y evaluado clasificadores para predecir el glaucoma autoinformado utilizando una característica ocular única y fácil de obtener (presión intraocular (PIO)) y características no oculares (edad, sexo, raza, índice de masa corporal, presión sistólica y presión arterial diastólica y comorbilidades). Los clasificadores fueron capacitados con datos disponibles públicamente de 3015 sujetos sin diagnóstico de glaucoma en el momento de la inscripción. Posteriormente, 337 sujetos informaron un diagnóstico de glaucoma en un lapso de 1 a 12 años después de la inscripción. Se evaluó la capacidad de los clasificadores para identificar estos sujetos utilizando únicamente sus características registradas en el momento de la inscripción. La máquina de vectores de soporte, la regresión logística y el refuerzo adaptativo tuvieron un rendimiento similar en el conjunto de datos con puntuaciones F1 de 0,31, 0,30 y 0,28, respectivamente. La regresión logística tuvo la mayor sensibilidad del 60% con una especificidad del 69%. Los clasificadores predictivos que utilizan principalmente características no oculares tienen el potencial de usarse para identificar sospechas de glaucoma en entornos no relacionados con la atención oftalmológica, incluida la atención primaria. Se justifica realizar más investigaciones para encontrar características adicionales que mejoren el rendimiento de los clasificadores predictivos.

El glaucoma es una neuropatía óptica progresiva que provoca la pérdida de células ganglionares de la retina; Si no se trata, puede provocar ceguera total. Es la principal causa de ceguera irreversible en el mundo. En la actualidad, afecta aproximadamente a 70 millones de personas, y se prevé que esa cifra aumente hasta alrededor de 112 millones para el año 20401. Aunque la discapacidad visual causada por el glaucoma es irreversible, la detección temprana y el tratamiento de la enfermedad pueden reducir los riesgos de pérdida permanente de la visión2. Desafortunadamente, esto se ve obstaculizado por la naturaleza asintomática del glaucoma3 y su proceso de diagnóstico complejo, subjetivo y que requiere muchos recursos4,5,6,7. Los enfoques basados ​​en inteligencia artificial (IA) pueden permitir la construcción, validación e implementación de modelos predictivos para identificar personas con alto riesgo de desarrollar glaucoma, en entornos que no necesariamente tienen acceso a dispositivos de imágenes oftálmicas (por ejemplo, atención primaria) y coordinar su atención con oftalmología.

En los últimos años se han explorado varios enfoques basados ​​en la IA para el diagnóstico de patologías oftálmicas como la retinopatía diabética8,9, el edema macular10,11 y el queratocono12. Algunos de estos esfuerzos han dado como resultado nuevos dispositivos médicos. En 2018, la Asociación de Alimentos y Medicamentos de EE. UU. aprobó IDx-DR como el primer sistema de diagnóstico de retinopatía diabética basado en IA totalmente autónomo13. Varios estudios de IA han intentado interpretar los patrones estructurales y funcionales que se manifiestan en el ojo para el pronóstico y diagnóstico del glaucoma14,15,16,17,18,19,20,21,22,23,24,25. Se han utilizado redes neuronales artificiales (RNA) y clasificadores de aprendizaje automático en datos funcionales, como los campos visuales, para identificar patrones de progresión glaucomatosa antes que los métodos más convencionales14,15,16,17. La llegada del aprendizaje profundo ha permitido el uso de imágenes de la retina, como fotografías en color del fondo de ojo (CFP)18,19,20,21,22 e imágenes de tomografía de coherencia óptica (OCT) macular23,24,25 para extraer características estructurales que permitan diferenciar el daño glaucomatoso. . En comparación con afecciones como la retinopatía diabética, donde ya se han adoptado tecnologías de diagnóstico basadas en IA clínicamente factibles, puede resultar más difícil desarrollar tales herramientas para el glaucoma, debido a la variación significativa en la apariencia de los discos ópticos. La necesidad de conjuntos de datos de entrenamiento diversos, grandes y cuidadosamente seleccionados para lograr una alta precisión diagnóstica se suma a este desafío. El rendimiento de los modelos específicos de glaucoma depende de la calidad y el número de imágenes (> 100.000), lo que lo convierte en un proceso costoso y que requiere mucho tiempo26. Además, se requieren pruebas de campo visual repetidas para tener en cuenta su subjetividad inherente, lo que las convierte en una parte importante de la carga de trabajo que se impone a los servicios oftalmológicos de los hospitales22,27.

Relativamente pocos estudios basados ​​en IA se han centrado en desarrollar modelos predictivos para el glaucoma sin utilizar campos visuales, CFP o imágenes OCT. Aprovechando la amplia adopción de registros médicos electrónicos (EHR), Baxter et al.28 utilizaron clasificadores de aprendizaje automático para identificar pacientes de alto riesgo con glaucoma de ángulo abierto (GAA) que requerían cirugía en un plazo de 6 meses. Mehta et al.29 entrenaron múltiples modelos de conjunto, cada uno usando un conjunto diferente de características, para diferenciar entre ojos glaucomatosos y sanos. Uno de esos modelos utilizó datos demográficos, sistémicos y oculares para realizar estas clasificaciones. De manera similar, Tielsch et al.30 ajustaron modelos de regresión logística a una encuesta poblacional para detectar glaucoma, utilizando factores demográficos y otros factores de riesgo conocidos. Estos estudios previos han demostrado el potencial de utilizar modelos basados ​​en IA para gestionar el glaucoma de forma más eficaz, realizar derivaciones informadas a oftalmólogos, implementar pruebas de detección de glaucoma basadas en la población más eficientes y desarrollar dispositivos inteligentes de autocontrol. Sin embargo, dado que los modelos de Baxter et al. y Mehta et al. no están entrenados en características de una población no diagnosticada, no se pueden aplicar directamente para predecir el glaucoma en la población general fuera de aquellos que ya son manejados activamente por un proveedor de atención oftalmológica. Por otro lado, aunque Tielsch et al. han entrenado su modelo en una población no diagnosticada, han informado probabilidades predichas muy bajas; Probablemente una consecuencia directa del conjunto de datos utilizado.

En el estudio actual, hemos capacitado a los clasificadores en una cohorte suficientemente grande de sujetos con un diagnóstico de glaucoma negativo en el momento de la inscripción, de modo que pueda ser representativa de la población general. Algunos de los sujetos posteriormente informaron sobre glaucoma. Se evaluaron diferentes clasificadores de aprendizaje automático en función de su capacidad para identificar a estos sujetos en función de una combinación de su información demográfica, sistémica, oftálmica y de comorbilidad tomada en el momento de la inscripción. El objetivo era explorar el uso de datos fácilmente disponibles para informar las decisiones de derivación a atención oftalmológica desde entornos de atención primaria, sin el uso de datos costosos y/o que consumen mucho tiempo, como campos visuales o imágenes de retina.

Se utilizó la base de datos del Estudio de enfermedades oculares relacionadas con la edad (AREDS) de los Institutos Nacionales de Salud (NIH) para desarrollar y evaluar los clasificadores de aprendizaje automático. El AREDS fue un estudio prospectivo multicéntrico de 12 años de duración realizado para determinar los factores de riesgo asociados con la degeneración macular relacionada con la edad (DMAE)31. Los NIH pusieron a disposición del público datos anonimizados de la historia natural de los sujetos con fines de investigación. El Comité de Acceso a Datos del Instituto Nacional del Ojo (NIH) concedió acceso al autor correspondiente a los datos de AREDS y el análisis se realizó de acuerdo con la declaración de uso de investigación aprobada (solicitud de acceso a datos n.º 89148–1). La AREDS se adhirió a los principios de la Declaración de Helsinki y cumplió con la Ley de Responsabilidad y Portabilidad del Seguro Médico32. Para el presente estudio, se utilizaron datos no genéticos, que consistían en información demográfica, sistémica, ocular (PIO) y de comorbilidad de los sujetos inscritos. El glaucoma se estableció mediante un autoinforme, en el que se preguntaba anualmente a los sujetos si un proveedor de atención oftalmológica les había diagnosticado glaucoma. Los sujetos con glaucoma se determinaron basándose en aquellos que seleccionaron "Sí" de una lista predefinida de respuestas a la pregunta "¿Alguna vez un médico le dijo que tiene glaucoma?" El diagnóstico más temprano se registró al año del inicio y el más tardío a los 12 años. Si bien son limitados debido a la falta de un diagnóstico "confirmado", los datos de AREDS brindan una oportunidad única para construir modelos predictivos utilizando datos de sujetos no glaucomatosos en el momento de la inscripción, algunos de los cuales posteriormente autoinformaron una nueva aparición de glaucoma.

La información se extrajo de la base de datos AREDS para los sujetos que tuvieron múltiples visitas de seguimiento. Los modelos se basaron en características demográficas (edad, sexo y raza), características sistémicas (índice de masa corporal (IMC), presión arterial sistólica y diastólica), una característica ocular única (PIO en el ojo derecho e izquierdo) y comorbilidades. (diabetes, artritis y DMAE). Las lecturas de la presión arterial fueron tomadas por un examinador certificado utilizando un esfigmomanómetro de mercurio33. La PIO de los participantes de AREDS se midió utilizando un tonómetro de aplanación o un neumatonómetro por profesionales experimentados33, lo cual es representativo de cómo se mide la PIO durante los exámenes oculares como parte de la atención primaria de la vista34. Hubo 7 sujetos no glaucomatosos a los que les faltaban entradas para la PIO o el IMC. Debido al número relativamente bajo de valores faltantes, no se realizó la imputación y estos casos se eliminaron del conjunto de datos. En las Tablas 1 y 2 se muestra una descripción estadística cuantitativa de las características. El número total de sujetos en la base de datos final fue 3015, todos los cuales no eran glaucomatosos cuando se registró la información resaltada en las Tablas 1 y 2. En las visitas de seguimiento posteriores, 337 sujetos informaron haber sido diagnosticados con glaucoma (clase positiva), lo que dejó 2.678 sujetos no glaucomatosos (clase negativa) al final del período de estudio.

Se llevó a cabo un preprocesamiento adicional de datos en los pasos que se destacan a continuación:

La biblioteca pandas35,36 en Python se utilizó para el procesamiento inicial de datos. Se utilizó codificación ordinal para la variable categórica AMD donde los valores enteros (1 a 4 en orden creciente de gravedad) tenían una relación ordenada natural. Para todas las demás variables categóricas (género, raza, presencia de diabetes y artritis), dado que no existía tal relación ordinal, se implementó una codificación ficticia utilizando el codificador one-hot.

Para estimar el error de generalización de los clasificadores se aplicó una estrategia de validación cruzada anidada. Cinco divisiones generadas aleatoriamente aseguraron que el 80% de los datos se usara para el entrenamiento y el 20% restante se usara para probar cada uno de los clasificadores ajustados. Los conjuntos de tren y de prueba se estratificaron para tener una proporción similar de sujetos con glaucoma y sin glaucoma. Se realizó una búsqueda de cuadrícula para el ajuste de hiperparámetros mediante una validación cruzada quíntuple en el conjunto de entrenamiento. Luego se utilizaron los mejores hiperparámetros identificados a través del proceso de búsqueda de cuadrícula para evaluar el rendimiento de los clasificadores en el conjunto de prueba. Las métricas del modelo se informan como una media de todas las ejecuciones para evaluar y comparar el desempeño de cada clasificador.

El conjunto de datos actual tenía un 11 % de casos positivos y un 89 % de casos negativos, lo que lo convierte en un conjunto de datos desequilibrado. Esto podría dar lugar a clasificadores sesgados que tienen escasa capacidad de predicción, específicamente para la clase minoritaria. Para abordar el desequilibrio de clases, se generaron datos sintéticos utilizando la técnica de sobremuestreo de minoría sintética (SMOTE)37. El algoritmo funciona generando nuevas instancias de la clase minoritaria en lugar de crear copias de las muestras existentes. Se introducen ejemplos sintéticos a lo largo de los segmentos de línea que unen cada muestra de la clase minoritaria y cualquiera o todos sus vecinos más cercanos, determinados por la distancia euclidiana entre ellos.

Se utilizaron las bibliotecas Scikit-learn38 y Keras39 en Python para construir los clasificadores. Los clasificadores incluían un método lineal (regresión logística), un método no lineal (máquinas de vectores de soporte) y un método de conjunto (impulso adaptativo). El rendimiento de diferentes clasificadores generalmente se evalúa utilizando métricas como exactitud, precisión, recuperación, especificidad, puntuación F1 y área bajo la curva (AUC) para la característica operativa del receptor (ROC) y las curvas de recuperación de precisión. Con datos desequilibrados, las medidas habituales de rendimiento, como la precisión, suelen ser engañosas. La recuperación (es decir, la sensibilidad) mide la capacidad del modelo para identificar correctamente la clase positiva (es decir, sujetos glaucomatosos). La precisión (es decir, el valor predictivo positivo) indica la proporción de predicciones positivas correctas. Dado que suele existir un equilibrio entre precisión y recuperación, a menudo se utiliza su media armónica, denominada puntuación F1. En el estudio actual, los hiperparámetros de los clasificadores se optimizan de manera que maximicen la puntuación F1. Se utilizó una técnica de búsqueda de cuadrícula en el bucle interno de la validación cruzada anidada para identificar los hiperparámetros optimizados. A continuación se proporciona una breve descripción de la configuración de cada modelo y los hiperparámetros elegidos mediante validación cruzada:

La regresión logística es un modelo lineal de clasificación que utiliza la función logística (sigmoidea) para estimar la probabilidad de que una muestra con características determinadas pertenezca a la clase predeterminada (Y = 1). Las predicciones de probabilidad se transforman en una salida binaria (0 o 1) utilizando un umbral de 0,5 en scikit-learn. El clasificador de regresión logística se configuró utilizando el solucionador Broyden-Fletcher-Goldfarb-Shanno (LBFGS) de memoria limitada. Se utilizó la regularización L2 para evitar el sobreajuste y el coeficiente de regularización inversa, C, se estableció en 0,001. El número máximo de iteraciones para que el solucionador convergiera fue 10.000. La estandarización del conjunto de datos se llevó a cabo para que todas las características estén aproximadamente centradas alrededor de cero y tengan una varianza unitaria. Esto garantiza que la regularización se aplique por igual a todas las funciones.

El clasificador de máquina de vectores de soporte (SVM) determina un hiperplano que clasifica directamente las muestras en una clase u otra. Se puede determinar una función de decisión no lineal utilizando una función central que implícitamente asigna las características a un espacio de alta dimensión. En el presente estudio, se utilizó una función de base radial y el coeficiente de regularización inversa, C, se estableció en 0,001. El coeficiente kernel, γ, representa el inverso del radio de influencia de las muestras seleccionadas por el modelo como vectores de soporte y se estableció en 0,0001. De manera similar a la configuración del clasificador de regresión logística, el clasificador SVM no es invariante de escala y, por lo tanto, las características se estandarizaron antes del entrenamiento.

Adaptive Boosting (AdaBoost) se adapta a una secuencia de alumnos débiles, como árboles de decisión, con un único nodo interno (fragmentos de decisión), en datos que se modifican repetidamente mediante la asignación de pesos. En cada iteración de refuerzo, a los ejemplos que el modelo mejorado clasifica erróneamente en el paso anterior se les asigna una ponderación más alta, mientras que las ponderaciones de los ejemplos clasificados correctamente disminuyen. Por lo tanto, cada alumno débil posterior se centra más en clasificar correctamente los ejemplos que los anteriores omitieron. Se toma una mayoría ponderada de votos de todos los alumnos débiles para determinar la clasificación final. En el modelo actual se utilizaron 200 puntos de decisión. La tasa de aprendizaje controla la contribución del nuevo elemento de decisión al modelo existente y se sugiere establecerla en valores pequeños (< 0,1)40. En el modelo actual, la tasa de aprendizaje se establece en 0,01.

Se utilizó una técnica de importancia de características de permutación para determinar el poder predictivo de las características utilizadas. La técnica se configuró para calcular la caída en la puntuación F1 cuando se barajó aleatoriamente un único valor de característica41. Esto da como resultado la ruptura del patrón entre la característica y la clase objetivo, y la caída en la puntuación F1 es indicativa de la importancia de esa característica para el modelo. Si una característica particular es importante para el modelo, mezclar aleatoriamente sus valores deteriorará el desempeño del modelo, mientras que hacer lo mismo con una característica relativamente menos importante no afectaría negativamente el desempeño del modelo. Se prefirió la importancia de la característica de permutación a la técnica de clasificación basada en impurezas utilizada en los clasificadores de árboles de decisión, ya que es independiente del modelo y no está sesgada hacia las características que exhiben una alta cardinalidad (la mayoría de las características numéricas)42.

La Tabla 3 muestra el desempeño de los clasificadores basados ​​en las medidas de resultado primarias: sensibilidad (o recuerdo), especificidad, puntuación F1, precisión y área bajo la curva de recuerdo de precisión. Como se mencionó anteriormente, la sensibilidad es una medida de los falsos negativos y la puntuación F1 es una media armónica de la sensibilidad y la precisión. La especificidad es una medida de la capacidad de clasificar correctamente como negativos (es decir, no glaucomatosos) a aquellos que no padecen la enfermedad. Como se ve en la Tabla 3, los tres clasificadores de aprendizaje automático funcionan de manera similar. Esto se destaca en la Fig. 1, que muestra la precisión promedio y las curvas de recuperación para todos los clasificadores en relación con uno de un clasificador ficticio que realiza clasificaciones aleatorias. La curva de recuperación de precisión es más informativa que la curva ROC cuando se evalúan modelos con desequilibrio de clases43. El área bajo la curva de recuperación de precisión para los tres clasificadores es mayor que la del clasificador ficticio: 0,30, 0,29 y 0,28 para AdaBoost, SVM y regresión logística, respectivamente. Los clasificadores que tienen un área mayor bajo la curva de recuperación de precisión en comparación con la del clasificador ficticio son indicativos de su capacidad aprendida para identificar patrones en los datos.

Las curvas promedio de recuperación de precisión para todos los clasificadores con respecto a un clasificador ficticio. El área bajo la curva (AUC) se informa como media (desviación estándar): refuerzo adaptativo (AdaBoost) – 0,30 (0,07), máquina de vectores de soporte – 0,29 (0,05) y regresión logística – 0,28 (0,05).

Tradicionalmente, los programas de detección de glaucoma y las derivaciones para un examen ocular completo se han realizado sobre la base de la PIO, y se considera que las personas con una PIO > 21 mm Hg tienen un alto riesgo de glaucoma30,44,45. La Tabla 3 también muestra el desempeño de un criterio similar aplicado en el conjunto de datos actual. Se predijo que los sujetos con PIO > 21 mm Hg en cualquiera de los ojos tendrían glaucoma. Con el criterio tradicional de PIO, la sensibilidad es muy pobre en comparación con los clasificadores de aprendizaje automático, como se informa en la Tabla 3. Según la sensibilidad, es probable que los clasificadores de aprendizaje automático identifiquen más del doble de sujetos con glaucoma del conjunto de datos actual.

Las capacidades predictivas de las características utilizadas para la clasificación se evaluaron utilizando la técnica de importancia de característica de permutación. La Figura 2 muestra la caída en la puntuación F1 para los 3 clasificadores a medida que se permutaba cada característica. Las características que más contribuyen a la puntuación F1 son la PIO y la edad. La edad del paciente tiene más capacidades predictivas en caso de regresión logística y máquina de vectores de soporte en comparación con AdaBoost.

Importancia de la característica de permutación aplicada a cada clasificador: (a) Regresión logística, (b) Máquina de vectores de soporte y (c) Impulso adaptativo (AdaBoost). La disminución media en la puntuación F1 se muestra para cada característica: edad, presión arterial sistólica y diastólica, sexo (masculino), índice de masa corporal (IMC), presión intraocular (PIO) en el ojo derecho (OD) y en el ojo izquierdo (OI), categoría de degeneración macular relacionada con la edad (DMAE), raza (negra, hispana, asiática y otra) y presencia de diabetes y artritis.

Los clasificadores fueron entrenados y evaluados en el conjunto de datos AREDS, que tenía sujetos que no eran glaucomatosos cuando se registraron sus características iniciales. La autoevaluación del diagnóstico de glaucoma es una limitación; puede estar sujeto a imprecisiones debido a la falta de un método ampliamente aceptado para confirmar el diagnóstico, el potencial asociado de un diagnóstico erróneo por parte de un proveedor y/o una mala comprensión de un diagnóstico (o la falta del mismo) por parte del paciente. Sin embargo, el estado de glaucoma autoinformado se ha utilizado regularmente en estudios previos46,47,48 y se ha explorado su utilidad y rendimiento49.

El conjunto de datos AREDS tiene ciertas ventajas que abordan algunas de las fuentes de sesgo que a menudo aparecen en los estudios basados ​​en IA50. En primer lugar, la base de datos final tiene 3015 sujetos, que es una cohorte relativamente grande que da como resultado un desempeño más realista de los clasificadores. En segundo lugar, a diferencia de otros estudios en los que los datos se obtienen de clínicas de glaucoma en las que hay una mayor proporción de casos de glaucoma, el estudio actual tiene 337 casos glaucomatosos y 2.678 casos no glaucomatosos, lo que representa un escenario más probable del mundo real. En tercer lugar, se tiene en cuenta la prevalencia de comorbilidades como diabetes, artritis y DMAE, ya que es muy probable que algunas personas presenten múltiples enfermedades. Los estudios basados ​​en IA que utilizan datos estructurales y funcionales14,19 generalmente consideran una población sana pero glaucomatosa, pero los pacientes a menudo presentan múltiples afecciones. Este enfoque probablemente ayudaría a los clasificadores a generalizar mejor los datos del mundo real. Los clasificadores fueron capacitados en función de la edad, el sexo, la raza, el IMC, la presión arterial sistólica y diastólica, la PIO y la prevalencia de comorbilidades de los sujetos.

La Tabla 4 resume otros estudios de predicción del riesgo de glaucoma basados ​​en IA que no utilizan pruebas de campo visual, CFP ni exploraciones OCT, junto con el actual. El modelo desarrollado por Baxter et al.28 predice pacientes con alto riesgo de progresión del glaucoma representado por la necesidad de intervención quirúrgica dentro de los 6 meses. El modelo se entrenó con datos de EHR de pacientes ya diagnosticados con glaucoma. Su conjunto de datos final fue relativamente pequeño con un total de 385 pacientes, todos ellos con glaucoma, y ​​174 de los cuales se sometieron a cirugía. Por lo tanto, su modelo no sería apropiado para determinar individuos con glaucoma de una población no diagnosticada. Mehta et al.29 entrenaron su modelo en un conjunto de datos etiquetados con ojos sanos y glaucomatosos utilizando información demográfica, sistémica y ocular. Dado que es valioso predecir el glaucoma en la población general, también aplicaron el modelo en una cohorte de cincuenta y cinco sujetos sin diagnóstico de glaucoma en el momento de la recopilación de datos, todos los cuales desarrollaron glaucoma posteriormente. Aunque su modelo predice el glaucoma con una precisión del 75%, una cohorte de cincuenta y cinco sujetos es muy pequeña para evaluar sus capacidades predictivas. Tielsch et al.30 informaron sensibilidades y especificidades de sus modelos de regresión logística para varios umbrales de decisión (0,025, 0,05, 0,1, 0,15). Observaron que el rango de probabilidades predichas de su modelo estaba por debajo de 0,2, y que la sensibilidad y la especificidad, con 0,15 como límite de probabilidad, eran del 35% y el 97%, respectivamente. Por el contrario, en el estudio actual utilizamos un umbral de probabilidad estándar de 0,5 para el clasificador de regresión logística. Sus datos tenían 191 casos de glaucoma y 5.054 casos normales, lo que lo convierte en un conjunto de datos muy desequilibrado. No han informado si se empleó alguna técnica de muestreo antes de ajustar el modelo para abordar el desequilibrio. Esto podría haber dado como resultado un modelo sesgado hacia la predicción de la clase que ocurre con más frecuencia. Como se ve en la Tabla 4, el estudio actual mitiga algunas de las limitaciones abordadas anteriormente.

La aplicación de una técnica de importancia de característica de permutación a los clasificadores en el estudio actual mostró que la PIO y la edad eran las características más predictivas en términos de aumentar la puntuación F1. Las características sistémicas, las comorbilidades y los datos raciales no contribuyeron a las capacidades predictivas de los clasificadores. Sin embargo, esto no implica que la información no sea importante en cuanto a su asociación con el glaucoma. Los resultados de la importancia de las características de permutación son específicos del conjunto de datos actual y reflejan la contribución de las características a la puntuación F1. Varios grandes estudios de prevalencia han documentado la ascendencia africana como un factor de riesgo de glaucoma con niveles más altos de PIO51,52,53. La falta de dependencia de los clasificadores con respecto a la raza probablemente se deba a la muy alta prevalencia de participantes blancos en la base de datos AREDS, lo cual es una limitación del estudio actual. Una distribución racial más equilibrada dentro de los datos puede haber arrojado resultados diferentes. Se han investigado afecciones vasculares como la presión arterial como posibles factores de riesgo del glaucoma. Sin embargo, los resultados no han sido concluyentes. Mientras que el estudio de Egna-Neumarkt54 encontró una asociación entre el glaucoma y la hipertensión sistémica, el estudio de Rotterdam55 encontró que la presión arterial estaba asociada con el glaucoma de alta tensión pero no con el glaucoma de tensión normal. Por otro lado, el Beijing Eye Study56 encontró que ni la presión arterial sistólica ni la diastólica estaban asociadas significativamente con la prevalencia de glaucoma. Para evaluar verdaderamente la importancia de cada característica, el conjunto de datos debe estar altamente estandarizado y equilibrado entre las diferentes características. Además, la mayoría de los participantes de AREDS tenían DMAE, que no es representativa de la población normal y es una limitación del enfoque actual. Si bien la técnica de importancia de permutación de características sugiere que la DMAE puede no ser un predictor importante del glaucoma, estratificar el conjunto de datos según las categorías de DMAE puede ser un enfoque adecuado para extraer información concluyente. Sin embargo, esto no se llevó a cabo en el estudio actual ya que reduciría la cantidad de muestras en el conjunto de datos, haciéndolo propenso a un sobreajuste.

El objetivo del cribado es detectar enfermedades tempranamente y tratar afecciones que ya han producido cambios patológicos pero que no han llegado a una etapa en la que se busque intervención médica de forma espontánea57. A diferencia de las herramientas de diagnóstico que requieren alta sensibilidad y especificidad, la detección puede ser relativamente menos precisa ya que no constituye la base del tratamiento. Las personas identificadas mediante una prueba de detección positiva deben ser remitidas para el diagnóstico y el tratamiento necesario. El carácter asintomático del glaucoma provoca que entre un 50% y un 90% de los casos no se detecten hasta estadios avanzados de la enfermedad4,5,6. La falta de visitas periódicas al oftalmólogo es una de las principales causas de glaucoma no diagnosticado58. Aunque estas cifras respaldan la necesidad de programas de detección del glaucoma, no son muy comunes debido a sus altos costos59 y a la falta de un método de detección ideal60,61. El Programa Student Sight Savers implementó pruebas de detección de glaucoma para más de 41.000 personas en los Estados Unidos44. La evaluación incluyó un cuestionario para determinar antecedentes familiares de glaucoma, medición de la PIO y evaluación de la función visual. Los valores de sensibilidad y especificidad para una prueba positiva en las pruebas individuales fueron 48,6% y 68,6% para antecedentes familiares confirmados de glaucoma, 22,1% y 78,6% para PIO superior a 21 mm Hg, y 58,1% y 98,6% para tres o más pruebas anormales. Ubicaciones en el campo visual. Como se muestra en el estudio actual, una función de decisión multivariable aprendida mediante técnicas basadas en datos puede proporcionar mejores resultados en comparación con un criterio fijo de detección. Las técnicas de detección deben ser rentables, sencillas, aplicadas rápidamente y causar mínimas molestias al sujeto57. Con los avances en el aprendizaje automático y la relativa simplicidad de la medición de la PIO, existe la posibilidad de abordar desafíos que son específicos del cribado del glaucoma y respaldan firmemente la necesidad de realizar más investigaciones sobre estas tecnologías62.

En el futuro, los médicos tendrán a su disposición herramientas basadas en IA específicas para el glaucoma para mejorar la gestión de la enfermedad, incluida la posibilidad de herramientas de apoyo a la toma de decisiones de derivación independientes o integradas en EHR para médicos de atención primaria y/o proveedores de servicios de gestión de la atención. Con el creciente poder de los recursos computacionales, conjuntos de datos bien seleccionados y de mejor calidad probablemente harán que estas herramientas sean altamente precisas para la detección y, potencialmente, el diagnóstico. Los resultados presentados aquí resaltan el potencial de estas herramientas para desempeñar un papel futuro en la detección temprana del glaucoma. Estos tipos de modelos predictivos pueden hacer que los programas de detección, las decisiones de derivación y el autocontrol sean más eficientes y efectivos, aumentando así las posibilidades de controlar el glaucoma de manera más efectiva, reduciendo el riesgo de pérdida de visión y mejorando la calidad de vida.

En este estudio evaluamos múltiples clasificadores de aprendizaje automático según su capacidad para predecir glaucoma autoinformado en el futuro en función de datos que se pueden obtener independientemente de un proveedor de atención oftalmológica. El objetivo era explorar el potencial de combinar datos de pacientes fácilmente accesibles con una medición simple de la PIO en un entorno no oftalmológico para informar las decisiones de derivación y, así, aumentar el número de sospechosos de glaucoma evaluados tempranamente por un oftalmólogo. Los tres clasificadores: regresión logística, máquina de vectores de soporte y refuerzo adaptativo se entrenaron con datos registrados cuando ningún sujeto informó un diagnóstico de glaucoma. Los clasificadores pudieron predecir los sujetos que posteriormente informaron un diagnóstico de glaucoma confirmado, con sensibilidades que oscilaban entre el 52% y el 60% y especificidades entre el 69% y el 77%. Es necesaria más investigación para identificar más características para mejorar el rendimiento predictivo de dichos clasificadores. Prevemos el uso de dichos algoritmos en el desarrollo de herramientas que se utilizarán en entornos de atención primaria para asesorar a los pacientes que deben ser evaluados por un proveedor de atención oftalmológica. Creemos que una herramienta de este tipo agregaría valor a la atención clínica de los pacientes con riesgo de glaucoma que, de otro modo, no visitarían a un proveedor de atención oftalmológica sin la derivación y el estímulo de su proveedor de atención primaria.

Tham, Y. et al. Prevalencia global del glaucoma y proyecciones de la carga del glaucoma hasta 2040: una revisión sistemática y un metanálisis. Oftalmología 121, 2081–2090 (2014).

Artículo PubMed Google Scholar

Tatham, AJ, Weinreb, RN y Medeiros, FA Estrategias para mejorar la detección temprana del glaucoma: el índice combinado estructura-función. Clínico. Oftalmol. (Auckland, Nueva Zelanda) 8, 611 (2014).

Google Académico

Weinreb, RN, Aung, T. & Medeiros, FA Fisiopatología y tratamiento del glaucoma: una revisión. JAMA 311, 1901-1911 (2014).

Artículo PubMed PubMed Central CAS Google Scholar

Leite, MT, Sakata, LM & Medeiros, FA Manejo del glaucoma en países en desarrollo. Arq. Sujetadores. Oftalmol. Rev. 74, 83–84 (2011).

Artículo PubMed PubMed Central Google Scholar

Hennis, A. y col. Conciencia sobre la incidencia de glaucoma de ángulo abierto en un estudio de población: Barbados Eye Studies. Oftalmología 114, 1816–1821 (2007).

Artículo PubMed Google Scholar

Susanna, R., De Moraes, CG, Cioffi, GA y Ritch, R. ¿Por qué las personas (todavía) quedan ciegas a causa del glaucoma? Traducción Vis.Sci. Tecnología. 4, 1 (2015).

Artículo PubMed PubMed Central Google Scholar

Founti, P. y col. Sobrediagnóstico de glaucoma de ángulo abierto en la población general: el estudio ocular de Salónica. Acta Oftalmol. 96, e859–e864 (2018).

Artículo PubMed Google Scholar

Gulshan, V. y col. Desarrollo y validación de un algoritmo de aprendizaje profundo para la detección de retinopatía diabética en fotografías del fondo de ojo de la retina. JAMA 316, 2402–2410 (2016).

Artículo PubMed Google Scholar

Rajalakshmi, R., Subashini, R., Anjana, RM y Mohan, V. Detección automatizada de retinopatía diabética en fotografía de fondo de ojo basada en teléfonos inteligentes utilizando inteligencia artificial. Ojo 32, 1138-1144 (2018).

Artículo PubMed PubMed Central Google Scholar

Wang, Y., Zhang, Y., Yao, Z., Zhao, R. y Zhou, F. Detección basada en aprendizaje automático de la degeneración macular relacionada con la edad (DMAE) y el edema macular diabético (EMD) a partir de tomografía de coherencia óptica (OCT) ) imágenes. Biomédica. Optar. Expreso 7, 4928–4940 (2016).

Artículo PubMed PubMed Central Google Scholar

Lee, CS y cols. Segmentación automatizada basada en aprendizaje profundo del edema macular en tomografía de coherencia óptica. Biomédica. Optar. Expreso 8, 3440–3448 (2017).

Artículo PubMed PubMed Central Google Scholar

Maeda, N., Klyce, SD, Smolek, MK y Thompson, HW Detección automatizada de queratocono con análisis de topografía corneal. Invertir. Oftalmol. Vis. Ciencia. 35, 2749–2757 (1994).

CAS PubMed Google Académico

Abràmoff, MD, Lavin, PT, Birch, M., Shah, N. & Folk, JC Ensayo fundamental de un sistema de diagnóstico autónomo basado en IA para la detección de retinopatía diabética en consultorios de atención primaria. Medicina digital NPJ. 1, 1–8 (2018).

Artículo de Google Scholar

Bizios, D., Heijl, A. & Bengtsson, B. Red neuronal artificial entrenada para el diagnóstico de glaucoma utilizando datos del campo visual: una comparación con algoritmos convencionales. J. Glaucoma. 16, 20-28 (2007).

Artículo PubMed Google Scholar

Chan, K. y col. Comparación de aprendizaje automático y clasificadores tradicionales en el diagnóstico de glaucoma. Traducción IEEE. Biomédica. Ing. 49, 963–974 (2002).

Artículo PubMed Google Scholar

Goldbaum, MH y cols. Comparación de clasificadores de aprendizaje automático para diagnosticar glaucoma a partir de perimetría automatizada estándar. Invertir. Oftalmol. Vis. Ciencia. 43, 162-169 (2002).

PubMed Google Académico

Muestra, PA et al. Uso de clasificadores de aprendizaje automático para identificar cambios glaucomatosos antes en campos visuales estándar. Invertir. Oftalmol. Vis. Ciencia. 43, 2660–2665 (2002).

PubMed Google Académico

Liu, S. y col. Un algoritmo basado en aprendizaje profundo identifica discos glaucomatosos mediante fotografías monoscópicas del fondo de ojo. Oftalmol. Glaucoma 1, 15-22 (2018).

Artículo PubMed Google Scholar

Christopher, M. y col. Rendimiento de arquitecturas de aprendizaje profundo y aprendizaje por transferencia para detectar neuropatía óptica glaucomatosa en fotografías de fondo de ojo. Ciencia. Representante 8, 1-13 (2018).

Artículo CAS Google Scholar

Li, Z. y col. Eficacia de un sistema de aprendizaje profundo para detectar la neuropatía óptica glaucomatosa basado en fotografías en color del fondo de ojo. Oftalmología 125, 1199-1206 (2018).

Artículo PubMed Google Scholar

Shibata, N. y col. Desarrollo de un algoritmo de aprendizaje residual profundo para detectar glaucoma a partir de fotografías de fondo de ojo. Ciencia. Representante 8, 1–9 (2018).

Artículo de Google Scholar

Yoo, TK & Hong, S. Enfoque de red neuronal artificial para diferenciar el glaucoma de ángulo abierto del sospechoso de glaucoma sin una prueba de campo visual. Invertir. Oftalmol. Vis. Ciencia. 56, 3957–3966 (2015).

Artículo PubMed CAS Google Scholar

Maetschke, S. y col. Un enfoque independiente de las características para la detección de glaucoma en volúmenes de OCT. MÁS UNO 14, e0219126 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Medeiros, FA, Jammal, AA & Thompson, AC De máquina a máquina: un algoritmo de aprendizaje profundo entrenado por OCT para la cuantificación objetiva del daño glaucomatoso en fotografías del fondo de ojo. Oftalmología 126, 513–521 (2019).

Artículo PubMed Google Scholar

Mahoma, H. et al. El aprendizaje profundo híbrido en tomografías de coherencia óptica de campo amplio único clasifica con precisión a los sospechosos de glaucoma. J. Glaucoma 26, 1086 (2017).

Artículo PubMed PubMed Central Google Scholar

Devalla, SK y cols. Manejo del glaucoma en la era de la inteligencia artificial. Hno. J. Oftalmol. 104, 301–311 (2020).

Artículo PubMed Google Scholar

Fung, SS, Lemer, C., Russell, RA, Malik, R. & Crabb, DP ¿Se practican recomendaciones prácticas? Un estudio transversal multicéntrico nacional sobre la frecuencia de las pruebas de campo visual en el glaucoma. Hno. J. Oftalmol. 97, 843–847 (2013).

Artículo PubMed Google Scholar

Baxter, SL, Marks, C., Kuo, T., Ohno-Machado, L. y Weinreb, RN Modelado predictivo basado en aprendizaje automático de intervención quirúrgica en glaucoma utilizando datos sistémicos de registros médicos electrónicos. Soy. J. Oftalmol. 208, 30–40 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Mehta, P. y col. Detección automatizada de glaucoma con aprendizaje automático interpretable utilizando datos clínicos e imágenes retinianas multimodales. BioRxiv. (2020).

Tielsch, JM y cols. Una evaluación poblacional de la detección del glaucoma: Baltimore Eye Survey. Soy. J. Epidemiol. 134, 1102-1110 (1991).

Artículo CAS PubMed Google Scholar

Group, T. El estudio de enfermedades oculares relacionadas con la edad (AREDS): implicaciones del diseño Informe AREDS nº 1. Control. Clínico. Ensayos. 20, 573 (1999).

Koo, E. y col. Tasas de incidencia decenal de cataratas relacionadas con la edad en el Estudio de enfermedades oculares relacionadas con la edad (AREDS): Informe AREDS no. 33. Epidemiol oftálmico. 20, 71–81 (2013).

Artículo PubMed Google Scholar

Estudio de enfermedades oculares relacionadas con la edad (AREDS) del Instituto Nacional del Ojo (NEI). https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/variable.cgi?study_id=phs000001.v3.p1&phv=54046 (2012).

Lázaro, R. Exámenes de la vista. https://www.optometrists.org/general-practice-optometry/guide-to-eye-exams/eye-exams/ (2020).

McKinney W. Estructuras de datos para computación estadística en Python. En Actas de la novena Conferencia Python in Science. vol. 445, 56–61 (Austin, Texas, 2010)

El equipo de desarrollo de pandas. pandas-dev/pandas: Pandas. (2020).

Chawla, NV, Bowyer, KW, Hall, LO y Kegelmeyer, WP SMOTE: una técnica de sobremuestreo minoritario sintético. J. Artif. Intel. Res. 16, 321–357 (2002).

Artículo MATEMÁTICAS Google Scholar

Pedregosa, F. et al. Scikit-learn: aprendizaje automático en Python. J. Mach. Aprender. Res. 12, 2825–2830 (2011).

MathSciNet MATEMÁTICAS Google Scholar

Chollet, F.Keras. https://keras.io (2015).

Friedman, J., Hastie, T. y Tibshirani, R. Regresión logística aditiva: una visión estadística del impulso (con discusión y réplica de los autores). Ana. Estadística. 28, 337–407 (2000).

Artículo MATEMÁTICAS Google Scholar

Breiman, L. Bosques aleatorios. Mach. Aprender. 45, 5–32 (2001).

Artículo MATEMÁTICAS Google Scholar

Desarrolladores de aprendizaje de Scikit. Importancia de la característica de permutación. https://scikit-learn.org/stable/modules/permutation_importance.html#id2 (2020).

Saito, T. & Rehmsmeier, M. El gráfico de recuperación de precisión es más informativo que el gráfico ROC cuando se evalúan clasificadores binarios en conjuntos de datos desequilibrados. MÁS UNO 10, e0118432 (2015).

Artículo PubMed PubMed Central CAS Google Scholar

Salim, S., Netland, PA, Fung, KH, Smith, ME y Aldridge, A. Evaluación de los métodos del programa de protección de la vista para estudiantes para la detección del glaucoma. Epidemiol oftálmico. 16, 238–242 (2009).

Artículo PubMed Google Scholar

Colegio de Optometristas. Orientación sobre la derivación de sospechosos de glaucoma por parte de optometristas comunitarios. (2010).

Wilson, MR y cols. Depresión en pacientes con glaucoma medida mediante encuestas de autoinforme. Oftalmología 109, 1018–1022 (2002).

Artículo PubMed Google Scholar

Shweikh, Y. et al. Medidas de estatus socioeconómico y glaucoma autoinformado en la cohorte del Biobanco del Reino Unido. Ojo 29, 1360-1367 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Masís, M., Kakigi, C., Singh, K. & Lin, S. Asociación entre el uso de bupropión autoinformado y el glaucoma: un estudio poblacional. Hno. J. Oftalmol. 101, 525–529 (2017).

Artículo PubMed Google Scholar

Neustaeter, A., Vehof, J., Snieder, H. y Jansonius, NM Glaucoma en epidemiología poblacional a gran escala: un proxy basado en cuestionarios. Ojo 35, 508–516 (2021).

Artículo PubMed Google Scholar

Girard, MJ & Schmetterer, L. Inteligencia artificial y aprendizaje profundo en glaucoma: estado actual y perspectivas de futuro. 257, 37–64 (2020).

Tielsch, JM y cols. Variaciones raciales en la prevalencia del glaucoma primario de ángulo abierto: Baltimore Eye Survey. JAMA 266, 369–374 (1991).

Artículo CAS PubMed Google Scholar

Leske, MC, Connell, A., Schachat, AP y Hyman, L. The Barbados Eye Study: prevalencia del glaucoma de ángulo abierto. Arco. Oftalmol. 112, 821–829 (1994).

Artículo CAS PubMed Google Scholar

Buhrmann, RR y cols. Prevalencia de glaucoma en una población rural de África Oriental. Invertir. Oftalmol. Vis. Ciencia. 41, 40–48 (2000).

CAS PubMed Google Académico

Bonomi, L. y col. Factores de riesgo vascular para el glaucoma primario de ángulo abierto: el estudio Egna-Neumarkt. Oftalmología 107, 1287-1293 (2000).

Artículo CAS PubMed Google Scholar

Dielemans, I. et al. Glaucoma primario de ángulo abierto, presión intraocular y presión arterial sistémica en la población general de edad avanzada: el estudio de Rotterdam. Oftalmología 102, 54–60 (1995).

Artículo CAS PubMed Google Scholar

Xu, L., Wang, YX y Jonas, JB Presión de perfusión ocular y glaucoma: el estudio ocular de Beijing. Ojo 23, 734–736 (2009).

Artículo CAS PubMed Google Scholar

Wilson, JMG, Jungner, G. y Organización Mundial de la Salud Principios y práctica de detección de enfermedades. 14-15 (1968).

Topouzis, F. y col. Factores asociados con el glaucoma de ángulo abierto no diagnosticado: el estudio ocular de Salónica. Soy. J. Oftalmol. 145, 327-335. e1 (2008).

Artículo PubMed Google Scholar

Weinreb, RN Detección de glaucoma. (Publicaciones Kugler, 2008).

Quigley, HA Enfoques actuales y futuros para la detección del glaucoma. J. Glaucoma. 7, 210–220 (1998).

Artículo CAS PubMed Google Scholar

Shields, MB El desafío de la detección del glaucoma. Soy. J. Oftalmol. 120, 793–795 (1995).

Artículo CAS PubMed Google Scholar

Tan, NY, Friedman, DS, Stalmans, I., Ahmed, IIK & Sng, CC Detección de glaucoma: ¿dónde estamos y hacia dónde debemos ir? actual. Opinión. Oftalmol. 31, 91-100 (2020).

Artículo PubMed Google Scholar

Descargar referencias

El conjunto de datos utilizado para los análisis descritos en este manuscrito se obtuvo de la base de datos del Estudio de enfermedades oculares relacionadas con la edad (AREDS) que se encuentra en https://www.ncbi.nlm.nih.gov/gap/ a través del número de acceso de dbGaP phs000001.v3. p1. El apoyo financiero para AREDS fue proporcionado por el Instituto Nacional del Ojo (N01-EY-0-2127). Nos gustaría agradecer a los participantes de AREDS y al Grupo de Investigación de AREDS por su valiosa contribución a esta investigación.

Instituto Nacional del Ojo (número de subvención 1R41EY031632-01).

Universidad Estatal de Carolina del Norte, Raleigh, NC, 27695, EE. UU.

Omkar G. Kaskar y Landon Grace

Lumata Health, 1111 North Lee Ave, Oklahoma City, OK, 73103, EE. UU.

Elaine Wells-Gray

Universidad de Carolina del Norte en Chapel Hill, Chapel Hill, NC, 27599, EE. UU.

David Fleischmann

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

LG fue responsable del diseño del estudio, la adquisición de datos y la revisión del manuscrito. OGK preparó y limpió los datos, desarrolló los clasificadores y participó en la redacción del manuscrito. EWG analizó los datos y fue un contribuyente importante en el desarrollo de los clasificadores y la redacción del manuscrito. DF interpretó los datos, brindó orientación técnica para elegir los datos para capacitar a los clasificadores y revisó sustancialmente el manuscrito. Todos los autores revisaron el manuscrito.

Correspondencia a Landon Grace.

La Dra. Grace es consultora y accionista de Lumata Health, EE. UU. El Dr. Wells-Gray es empleado de tiempo completo de Lumata Health, EE. UU. El Dr. Fleischman y Omkar G. Kaskar declaran que no existen posibles conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Kaskar, OG, Wells-Gray, E., Fleischman, D. et al. Evaluación de clasificadores de aprendizaje automático para apoyar la toma de decisiones sobre derivaciones de glaucoma en entornos de atención primaria. Informe científico 12, 8518 (2022). https://doi.org/10.1038/s41598-022-12270-w

Descargar cita

Recibido: 27 de julio de 2021

Aceptado: 18 de abril de 2022

Publicado: 20 de mayo de 2022

DOI: https://doi.org/10.1038/s41598-022-12270-w

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.