En la práctica clínica cotidiana, los dispositivos para la realización de electrocardiogramas (ECG) presentan un sistema automatizado de diagnóstico, donde se informa de forma preliminar el ritmo y la frecuencia cardiaca observada, como así también alteraciones específicas del ECG como subrogantes de daño vascular o estructural. En este contexto, los médicos tratantes muchas veces se encuentran sesgados por este diagnóstico preliminar automatizado, debiendo contrastar su propio criterio clínico a fin de obtener el diagnóstico definitivo más certero.
La utilización de la Inteligencia Artificial (AI) mediante clasificadores de Machine Learning (ML) se encuentra en creciente utilización y desarrollo en distintos campos de la medicina, proporcionando al equipo médico una herramienta de elevado valor para predecir y diagnosticar con un elevado poder de discriminacion diversas patologías. Hasta la fecha, no se ha realizado un contraste entre la utilización de ML, en relación a los criterios clínicos aceptados, en términos de diagnóstico de patologías mediante ECG.
El objetivo del presente estudio realizado por Weston Hughes y colaboradores de la Universidad de California (USA) fue contrastar la utilidad de los clasificadores de ML, en relación a los estándares clínicos, para analizar y caracterizar trazados electrocardiográficos.
Fue un estudio unicéntrico de cohorte transversal, utilizando para el análisis trazados electrocardiográficos realizados durante el periodo comprendido entre enero de 2003 a diciembre de 2018, pertenecientes a pacientes del centro médico de la Universidad de California. Se realizó en una etapa inicial el entrenamiento de un clasificador de ML basado en una red neural convolucional (CNN) para la realización de 38 diagnósticos de patologías subestratificadas en 5 categorías, a partir de la lectura de un ECG. En una etapa ulterior de validación se utilizó el clasificador para el diagnóstico basado en ECG, determinando el área bajo la curva ROC (AUC) en cada etapa a fin de identificar el poder de discriminacion del CNN, su sensibilidad y especificidad para el diagnostico de interés, contrastandolo con los diagnósticos proporcionados por el equipo médico y el sistema automatizado de lectura de cada dispositivo de ECG (MUSE).
La utilización de inteligencia artificial basada en clasificadores de machine learning presentó un elevado poder de discriminacion diagnóstica, comparable con el estándar de diagnóstico mediante criterio médico y superior a los sistemas de diagnóstico preliminar utilizados en los dispositivos de electrocardiograma.
Se incluyeron para el analisis un total de 992748 trazados ECG pertenecientes a 365009 pacientes adultos, con una edad promedio de 56.2 años y un 50.3% de sexo femenino. Del total de la cohorte incluida, 91440 ECG fueron utilizados en la primera etapa de entrenamiento, en donde el clasificador de ML por CNN demostró un AUC de al menos 0.960 en el 84.2% de las enfermedades testeadas (32/38 diagnósticos posibles). A su vez, la CNN fue superior en términos de la detección del ritmo cardiaco, alteraciones en la conducción y anomalías estructurales y detección de infarto agudo de miocardio, en relación a la combinación del criterio médico y al sistema MUSE.
Por contraparte, el clasificador por CNN presentó un poder de discriminacion diagnóstica inferior en relación al criterio médico en términos de detección de fibrilación auricular, ritmos de la unión auriculoventricular, extrasístoles ventriculares prematuras y síndrome de wolff-parkinson-white. Al contrastar el CNN con el sistema de diagnóstico MUSE, el CNN presentó una mejor performance de diagnóstico para todas las patologías, con excepción de la taquicardia supraventricular.