DIAGNOSIS DECISION SUPPORT SYSTEMS Beatriz Blázquez Valles, Raúl Varela Izquierdo Presentación: Aníbal R. Figueiras Vidal Grupo de Gestión y Procesamiento de Información Departamento de Teoría de la Señal y Comunicaciones Universidad Carlos III de Madrid Avda. de la Universidad 30, 28911 Leganés, España Trabajo parcialmente financiado por la Cátedra Telefónica‐UCIIIM, Sección de Sistemas para la Ayuda a la Toma de Decisiones Junio, 2010 MEDICAL DECISION SUPPORT SYSTEMS -i- PRESENTACIÓN Los humanos nos encontramos ininterrumpidamente en situaciones ante las que hay que tomar una decisión; algunas veces, las consecuencias de hacerlo son, o pueden ser, importantes. Y si bien es verdad, como sostiene Gerd Gigerenzer, que, por razones evolutivas, nos encontramos razonablemente bien preparados para resolver estos problemas en casos sobre los que la vida diaria nos ha permitido ganar cierto conocimiento, no es menos cierto que en otros, aquéllos que no nos resultan familiares, cometemos serios errores, fundamentalmente debidos a nuestras limitaciones intrínsecas –procesamos la información bajo restricciones de frugalidad y rapidez–, pero también a un defectuoso manejo de principios lógicos y probabilísticos y de una mala apreciación de los riesgos derivados de cada elección. Las limitaciones arriba enunciadas también afectan en diversos grados a los expertos en su ejercicio profesional; muy particularmente ante problemas difíciles con numerosos datos, y de forma más severa a quienes tienen un conocimiento poco profundo de las leyes probabilísticas. Por ello –y no sólo para bisoños o para compensar distracciones– se han venido desarrollando herramientas y sistemas de ayuda a la toma de decisiones, que denominaremos a partir de aquí, por razones de brevedad y confiando en que el lector evitará confusiones por esta equívoca adopción, como DSS (“Decision Support Systems”). En el ámbito de la Salud, especialmente relevante desde esta perspectiva por la gravedad de gran parte de los riesgos que se presentan, los DSS han aparecido en muchas formas y para muy variadas aplicaciones. Los DSS para el diagnóstico, DDSS (“Diagnostic DSS”), son una importante clase de ellos; en su versión más radical, se trata de un paquete algorítmico que lee datos relativos a un paciente y emite sugerencias de posibles diagnósticos, generalmente cualificadas. Pues bien: aunque la evidencia señala que los compromisos precisión– sensibilidad que proporcionan estos DDSS se muestran frecuentemente ventajosos hasta con respecto a los que supone la actuación de expertos reconocidos, el nivel de MEDICAL DECISION SUPPORT SYSTEMS - ii - aceptación de los DDSS por los agentes que intervienen (especialistas, gestores, e incluso pacientes cuando tienen acceso) es extraordinariamente bajo; en promedio, más bajo que en otros campos. Este escepticismo no tiene como única razón la novedad de los DDSS, que dificulta su asimilación como en su día ocurrió con otras muchas facilidades tecnológicas que se fueron poniendo a disposición del sector de la Salud y que el tiempo, más o menos rápidamente, ha acreditado. También tiene que ver con el hecho de que el diagnóstico es una responsabilidad del médico, por lo que cuesta delegarla. También con la humana tendencia a considerar que los razonamientos propios son excelentes. Ambas cosas apuntan a un habitual defecto de los DDSS: la carencia de explicaciones, en términos comprensibles, de las sugerencias suministradas. Únicamente los algoritmos del tipo Sistema Experto (compuestos de reglas) o Árboles llevan implícitas explicaciones del tipo “si… entonces…”; lamentablemente, tales familias de métodos suelen ofrecer muy bajas prestaciones. De otro lado, resulta evidente que el especialista se relaciona con el paciente, de modo que recibe una importante cantidad de información a la que el DDSS no tiene acceso. Por ello, lo mejor sería que cada DDSS pudiese personalizarse para cada especialista, teniendo también en cuenta la actuación de éste. Tal integración no constituye un problema fácil, pero el asunto se complica aún más al tener en cuenta que la actuación del especialista va modificándose a lo largo del tiempo por su aprendizaje (incluida la experiencia): lo que evidencia la necesidad de que el DDSS personalizado pueda acomodarse en “tiempo real” a los cambios de actuación de su usuario. A mi juicio, estas tres cuestiones –explicaciones de tipo narrativo, personalización y adaptación en “tiempo real” –son los tres principales desafíos (en términos técnicos y no sicosociológicos) que los DDSS han de superar para lograr el éxito. Como una Presentación no es lugar para extenderse en demasía, me limitaré a decir que ya se dan pasos para proporcionar explicaciones– curiosamente, más largos en el negocio de sistemas de recomendaciones–, para diseñar algoritmos que tengan en cuenta el comportamiento de un decisor externo, y para diseñar métodos de entrenamiento de máquinas de decisión que supongan mejoras paso a paso. - iii - MEDICAL DECISION SUPPORT SYSTEMS Discutidos los principales obstáculos actuales para alcanzar una extendida y provechosa implantación de los DDSS, diré que en las páginas que siguen, resultado de un meritorio esfuerzo –que agradezco personalmente– de dos estudiantes de Ingeniería de Telecomunicación becados por la Cátedra Telefónica-UCIIIM, Dña. Beatriz Blázquez Valles y D. Raúl Varela Izquierdo, se presenta un amplio resumen de técnicas empleadas en DDSS y sus resultados en un significativo conjunto de campos de aplicación concreta. Sin ser exhaustivo –se seguirá ampliando–, el estudio revela otra curiosa característica del desarrollo de los DDSS y de los trabajos dirigidos a ese fin: la mayor parte de los algoritmos analizados dentro de los actuales, tipo máquina de decisión, corresponden a los diseños más antiguos; sólo las máquinas de núcleos se han hecho un pequeño sitio, y casi no hay rastro de las que hoy en día se consideran las mejores opciones -¡incluso por su facilidad para generar explicaciones!–, los conjuntos de máquinas. Como se ve, las dificultades para la implantación de los DDSS tienen efectos dañinos retroalimentados: su concepción y diseño no despiertan el debido interés entre los investigadores del Aprendizaje Máquina y de los llamados Sistemas Inteligentes. Naturalmente, creo que esta retroalimentación puede resultar nefasta para que los DDSS y su empleo progresen y todos recibamos el beneficio esperable de ello. De modo que concluiré estas líneas ofreciendo la colaboración del Grupo de Gestión y Procesamiento de la Información, cuyos miembros, destacados investigadores, me distinguen con su confianza para que lo dirija, a todos quienes deseen impulsar el trabajo de I+D+i en las líneas que alientan el avance de estos sistemas. Aníbal R. Figueiras Vidal MEDICAL DECISION SUPPORT SYSTEMS Página | 1 TABLA DE CONTENIDOS INTRODUCCIÓN ................................................................................................................ 2 TABLA DE APLICACIONES .................................................................................................. 5 9 CÁNCER DE MAMA ............................................................................................................ 5 9 ENFERMEDADES CARDIOVASCULARES............................................................................ 10 9 ENFERMEDADES TIROIDEAS............................................................................................ 15 9 PARKINSON...................................................................................................................... 18 9 LEUCEMIA........................................................................................................................ 20 9 ALZHEIMER ...................................................................................................................... 22 9 CÁNCER DE PRÓSTATA .................................................................................................... 24 9 CÁNCER DE CUELLO DE ÚTERO ....................................................................................... 25 9 CÁNCER DE PULMÓN ...................................................................................................... 26 9 CÁNCER DE RIÑÓN .......................................................................................................... 27 9 HEPATITIS ........................................................................................................................ 28 9 LUMBALGIA ..................................................................................................................... 29 9 LINFOMAS........................................................................................................................ 30 ANEXO: GLOSARIO DE ACRÓNIMOS Y ABREVIATURAS .................................................. 31 REFERENCIAS .................................................................................................................. 33 MEDICAL DECISION SUPPORT SYSTEMS Página | 2 INTRODUCCIÓN El proceso de diagnosis [1] es un proceso cognitivo complejo que incluye una variedad de tipos diferentes de tareas para la resolución de problemas que están involucrados en el proceso de razonamiento médico. Además, los facultativos deben seguir los progresos en la investigación clínica e incorporar cada vez mayor cantidad de nuevos conocimientos sobre la diagnosis de las enfermedades. Los sistemas de ayuda a la decisión clínica (CDSS) han sido reconocidos como instrumentos importantes para ayudar a los expertos en la recopilación de conocimientos y datos relevantes, tomar decisiones y gestionar acciones médicas con mayor eficacia, para así lograr en la práctica errores pequeños, un mayor nivel de atención y una reducción de costes [2]. Los CDSSs pueden proporcionar herramientas para la gestión de la información (por ejemplo, la recuperación y almacenamiento de datos), para centrar la atención (por ejemplo, alertas y recordatorios), y para proporcionar recomendaciones específicas para cada paciente [3]. Los DSSs de diagnosis (DDSS) [4] asisten al médico en una o más etapas de las que componen el proceso de diagnóstico clínico. Se han venido desarrollando desde la década de 1970 para distintos rangos de enfermedades y síntomas [5-14]; algunos sistemas tienen por objeto cubrir amplios dominios médicos, mientras que otros sistemas se centran en problemas específicos (por ejemplo, el DDSS de Dombal para el diagnóstico diferencial del dolor abdominal [15]). El desarrollo de DDSSs plantea difíciles retos. A pesar de estos desafíos, varios estudios de evaluación han demostrado que los DDSSs son fiables y precisos [11, 13, 16-20]. Sin embargo, son relativamente pocos los que se utilizan en la actualidad [8, 10-14], y la tasa de uso en la práctica clínica rutinaria es baja. Parte de la dificultad en su incorporación puede estar asociada con la falta de integración en el proceso de razonamiento implicado en el diagnóstico clínico. En prácticamente la totalidad de los DDSSs, el usuario introduce los datos sobre los síntomas, signos y resultados de las pruebas de laboratorio, y el sistema produce una lista de posibles diagnósticos, en orden de probabilidad. Algunos sistemas [16] guían al usuario con el proceso de diagnóstico, incorporando procesos de diagnóstico rule-in y rule-out en función de los resultados de las hipótesis en el conjunto de diagnosis diferencial. Otros sistemas [13, 14, 18] ofrecen servicios de apoyo a la decisión que el usuario puede invocar, como la prestación de un perfil de la enfermedad, centrando el diagnóstico en las características importantes, visualizando evidencias para un diagnóstico y obteniendo explicaciones de los resultados. La mayoría de los DDSS existentes los utilizan terapeutas noveles, o médicos experimentados para que les ayuden en el diagnóstico de los casos difíciles. En las últimas dos décadas, el uso de herramientas de inteligencia artificial ha sido ampliamente aceptado en aplicaciones médicas para apoyar más efectivamente el diagnóstico del paciente. Sobre todo, la aplicación con diversos tipos de máquinas de aprendizaje, tales como árboles de decisión (DTs), redes neuronales artificiales (ANNs), redes bayesianas (BNs) y máquinas de soporte vectorial (SVMs), se ha probado activamente para satisfacer las necesidades de apoyo clínico. En consecuencia, los CDSS han demostrado un gran potencial, y muchos métodos se han probado para una gran variedad de aplicaciones clínicas y médicas. MEDICAL DECISION SUPPORT SYSTEMS Página | 3 El propósito de los CDSSs es mejorar, no reemplazar, la capacidad de un médico en el complejo e intuitivo proceso de diagnóstico médico. Tradicionalmente, los CDSSs se basan en un mejor modelo único que aprende determinadas características fisiológicas de una enfermedad determinada y puede ser utilizado para diagnosticar a los pacientes que manifiestan estas características. La elección del modelo utilizado en un CDSS va desde simples métodos paramétricos, a través de los métodos no paramétricos, hasta diversas redes neuronales feedforward. Desafortunadamente, no existe una teoría disponible para guiar la selección del mejor modelo. La mayoría de CDSSs utilizan un único modelo que es el más exacto entre un conjunto limitado de modelos con un cierto rendimiento en las pruebas de validación cruzada. De hecho, investigaciones recientes sugieren que encontrar un único “mejor modelo” puede ser el enfoque equivocado [11,12]. Se ha informado de que la combinación de modelos únicos, denominados “aggregate predictors”, construidos a partir de versiones perturbadas de los conjuntos de aprendizaje, pueden tener un error significantemente menor que el del mejor predictor individual [12]. El uso de árboles de decisión es uno de los métodos más popularmente aplicados para CDSSs por su sencillez y capacidad de desarrollar reglas inductivas humanamente comprensibles. Muchos investigadores han empleado DTs para resolver diversos problemas biológicos, incluido el análisis de errores de diagnóstico [21], búsqueda de potenciales biomarcadores [22, 23] y clasificación de espectros de masa proteómica [24]. Las redes bayesianas son un modelo inferente basado en probabilidad, cada vez más utilizado en el ámbito médico como un método de representación del conocimiento para el razonamiento en condiciones de incertidumbre para una amplia gama de aplicaciones, incluyendo diagnóstico de enfermedad [25], consejo genético [26], desarrollo de sistemas expertos [27], modelado de redes genéticas [28] y diseño de sistemas de soporte de decisiones de emergencia [29]. Las redes neuronales se han aplicado también en los campos médicos y de diagnosis, más activamente como base de un método de soft computing para asistir al complejo y difuso proceso cognitivo de diagnosis. Muchos estudios han demostrado la idoneidad de las redes neuronales en el diseño de CDSSs y otras aplicaciones biomédicas, incluyendo diagnóstico de infarto de miocardio [30, 31], diferenciación de un surtido de datos de patología [32], CDSSs para la gestión de leucemia [33] y apoyo a la decisión quirúrgica [34], CDSSs para la detección de cáncer [35], evaluación de los pacientes con dolor torácico [36], toma de decisiones para el tipo de parto [37], diagnóstico de enfermedades del corazón [38], CDSSs para aplicaciones farmacéuticas [39], desarrollo de CDSS para el diagnóstico ginecológico [40] y clasificación de señales biológicas [41]. Las máquinas de soporte vectorial son una nueva y prometedora técnica de clasificación y regresión propuesta por Vapnik y sus compañeros de trabajo [42, 43]. Las SVMs, desarrolladas en la teoría del aprendizaje estadístico, están recibiendo un creciente interés por parte de los investigadores de biomedicina. No están sólo teóricamente bien fundadas, sino que también son mejores en aplicaciones prácticas. Para los sistemas clínicos, médicos, de apoyo a la decisión y dominios biológicos, las SVMs se han aplicado con éxito en una amplia variedad de ámbitos, incluyendo CDSSs para el diagnóstico de la infección tuberculosa [44], clasificación de tumores [45], MEDICAL DECISION SUPPORT SYSTEMS Página | 4 detección de infarto de miocardio [46], descubrimiento de biomarcadores [47] y diagnóstico de cáncer [48]. Además de los enfoques basados en modelos simples, las máquinas de aprendizaje híbridas también han tratado de aumentar el rendimiento de los métodos convencionales de modelos únicos y superar las debilidades inherentes a cualquier método simple. Muchos enfoques de modelo híbrido han sido propuestos, incluyendo un sistema experto híbrido para decisión ante crisis epilépticas mediante una ANN y un método de lógica difusa [49], una ANN con un DT para el desarrollo de un sistema inteligente de apoyo a la decisión [50], y una SVM con una ANN para la clasificación de electromiogramas [51]. Recientemente se ha propuesto un nuevo método SVM en combinación con DT para generar reglas comprensibles por los humanos y aliviar las dificultades de comprensión que se derivan de la característica de caja negra de las SVMs en segmentos de predicción transmembrana [52]. Su enfoque alcanzó una exactitud de predicción del 93% con reglas de predicción comprensibles y con valores de confianza de más del 90%. MEDICAL DECISION SUPPORT SYSTEMS Página | 5 TABLA DE APLICACIONES En este apartado vamos a centrarnos en algunas dolencias y explicar brevemente los métodos más usados en el desarrollo de CDSSs para su diagnóstico, pronóstico y seguimiento. Las primeras enfermedades que aparecen han sido estudiadas más en detalle. Este es el caso del cáncer de mama, las enfermedades cardiovasculares y las enfermedades tiroideas. 9 CÁNCER DE MAMA El cáncer de mama es uno de los más comunes, tercero a nivel mundial y el más frecuente entre las mujeres de todo el mundo, aun así, es de los más curables si se detecta a tiempo. La mayoría de los países desarrollados han visto como aumentaba su incidencia en los últimos 20 años. Un factor clave en la supervivencia de las personas afectadas por esta enfermedad es la detección del problema en una fase temprana. Algunos de los primeros CDSSs utilizados usaban modelos paramétricos sencillos como LDA y LogR. Pero el alto coste de un mal diagnóstico, en general en cualquier enfermedad pero en particular en el caso del cáncer, han motivado una intensa búsqueda de algoritmos más precisos incluyendo métodos no paramétricos como el algoritmo de los k vecinos más próximos (K-NN), la estimación por núcleos de densidad de probabilidad (KD) o ventanas de Parzen, redes neuronales como MLP y RBF, y árboles de clasificación y regresión (CART); aunque, como ya comentamos en la introducción, se está tendiendo a utilizar modelos más complejos compuestos a su vez por varios modelos sencillos de los anteriormente mencionados. Precisamente en [53] se realiza un estudio para investigar el potencial de diversas estrategias de selección, de entre una población de 24 modelos de clasificación, con el fin de crear un modelo compuesto formado a su vez por varios modelos sencillos para aumentar la detección precoz y el correcto diagnóstico del cáncer de mama. Se estudia en este artículo el aumento de la precisión en el diagnóstico de modelos complejos que incluyen a su vez diversos algoritmos o modelos más simples, como son, en este caso, LDA, LogR, MLP, RBF, CART, K-NN y KD. Para realizar dicho estudio se utilizan dos conjuntos de datos. El primero consiste en un registro de citologías mamarias (699 registros de aspiraciones con aguja fina, CAAF). Los datos se han obtenido de la base de datos de pacientes con cáncer de mama de la Universidad de Wisconsin (WBCD). Se trata de una base de datos muy utilizada entre los científicos que estudian esta enfermedad y su diagnóstico. Nueve variables miden propiedades de las células y se usan para clasificar el caso como benigno o maligno. Las variables son: 1. Grosor de la masa o grupo de células 2. Uniformidad del tamaño de la masa de células 3. Uniformidad de la forma de la masa de células 4. Adhesión marginal 5. Tamaño individual de la célula 6. Núcleo desnudo 7. Cromatina blanda 8. Nucleoli normal 9. Mitosis El segundo conjunto es un registro de datos de pronóstico provenientes de visitas de seguimiento e incluyen sólo los casos más invasivos de cáncer de mama sin evidencia Página | 6 MEDICAL DECISION SUPPORT SYSTEMS de metástasis en el momento del diagnóstico. Treinta rasgos, obtenidos de imágenes digitalizadas de diversas aspiraciones mamarias, describen las características de los núcleos de las células presentes en la imagen. Estos datos se utilizan con diferentes modelos simples con el fin de demostrar que es más preciso el diagnóstico si proviene de un conjunto de modelos sencillos (ensemble models) que de un único modelo simple. Para ello se utilizan cuatro configuraciones específicas de cada uno de los tres algoritmos de redes neuronales usados (MLP, MoE y RBF) y cuatro configuraciones también para el algoritmo K-NN con un rango de 3 a 11 vecinos. Para el caso de KD se aplican densidades de 1.0 a 7.0. Y por último dos diseños diferentes también para CART. De esta forma se tienen los 24 modelos diferentes con los que se realiza el estudio. La configuración exacta de cada modelo se puede ver en el apéndice del artículo [53]. Son muchos los estudios sobre DDSSs para el diagnóstico del cáncer de mama basados, en general, en algoritmos sencillos. Explicamos a continuación alguno de ellos. Las redes neuronales han sido ampliamente utilizadas en el desarrollo de programas computerizados para el diagnóstico de esta dolencia. Existen multitud de artículos al respecto. Como ejemplo, comentaremos el caso de [54], donde se diseña una red neuronal. Los objetivos del estudio son: reducir el número de casos de tumores benignos enviados a biopsia; minimizar la dependencia de la salida de la ANN de la exactitud de la interpretación de los expertos, la cual depende de factores como la experiencia del experto, el tiempo de interpretación o el criterio usado para la extracción de los datos; probar la capacidad del sistema de reconocer nuevos ejemplos como un sistema experto; y comparar el diagnóstico realizado por la ANN con la de los radiólogos expertos sobre la benignidad o malignidad del tumor. Para ello utiliza una ANN de tres capas feedforward y un algoritmo de entrenamiento de retropropagación. Los datos del estudio se obtienen de resonancias magnéticas (MR). Los hallazgos radiológicos se clasifican en características como las siguientes: tamaño, forma y margen de la lesión, mejora de la homogeneidad, tipo de curva “tiempo-intensidad”, etc. La estructura de la ANN diseñada consiste en 3 capas, la primera contiene 14 parámetros de entrada, la segunda es la capa oculta y está formada por 5 nodos; y la última capa está formada por un solo elemento que toma el valor 1 si el tumor es maligno y el 0 si es benigno. Tras realizar el estudio de la red neuronal diseñada se compararon los resultados con los obtenidos por los expertos, obteniendo los siguientes valores, donde el grupo A es un conjunto de radiólogos expertos (con un año o más de experiencia), el grupo B está formado por radiólogos con poca experiencia (con menos de un año de experiencia) en este campo, y el grupo A + B es el total de radiólogos implicados en el estudio: Parámetro Grupo A + B Grupo A Grupo B ANN Sensibilidad (%) Especificidad (%) Precisión (%) Nº de casos sin diagnóstico Casos mal clasificados (%) 87 54 79 13 20 95 71 91 4 11 78 37 67 21 30 97 62 89 0 11 Como vemos, la sensibilidad y la precisión de la ANN es mayor que la de los radiólogos. MEDICAL DECISION SUPPORT SYSTEMS Página | 7 Pasamos ahora a otro tipo de métodos como son los no paramétricos, más concretamente el algoritmo de K-NN. Vemos como en el caso de [55] se utiliza la base de datos de la Universidad de Wisconsin nuevamente. Cada una de las muestras está formada por las diez peculiaridades contenidas en dicha base de datos, los nueve rasgos comentados anteriormente más un identificador del paciente. Menos al identificador del paciente, al resto de atributos se le asigna un valor del 1 al 10. De forma que 1 es lo más próximo a un tumor benigno y 10 a uno maligno. Se realizan pruebas variando el valor de k desde 1 hasta 15. Los resultados de clasificación fluctúan entre el 99.12% y el 98.02%, obteniendo el mejor resultado para k igual a 1. Otro ejemplo de la utilización de este método para el diagnóstico del cáncer de pecho es [56]. En él se describe el diseño de un algoritmo genético con el fin de editar conjuntos para la formación de clasificadores K-NN, centrándose en la selección de la función objetivo a minimizar y en los distintos parámetros del algoritmo genético como, por ejemplo, las técnicas de cruce y de mutación. Tres son las mejoras propuestas en el proceso de edición mediante algoritmos genéticos: el uso del error cuadrado medio (MSE) de la función objetivo, la aplicación de un crossover en clúster, y un rápido sistema de mutación inteligente. El coste computacional después del entrenamiento y la tasa de error de clasificación se consideran en el estudio. Para llevar a cabo el experimento se dividió la base de datos en tres conjuntos, el de entrenamiento, el de validación y el de prueba. Se probaron diferentes clasificadores K-NN con valores de k de 1 a 50. El valor de k=3 fue el que mejores resultados obtuvo, con una tasa de error media del 1.4% Seguimos con el método K-NN. En [57] podemos ver una variante de este algoritmo, el weighted K-NN (wK-NN). Esta ampliación se basa en la idea de que, aquellas observaciones que estén dentro del conjunto de aprendizaje y particularmente cerca de la nueva observación (y, x), deben tener un mayor peso en la decisión que aquellos vecinos que estén muy lejos de (y, x). Esto no ocurre en la versión original del algoritmo, en la cual aquellos vecinos considerados cercanos tienen el mismo peso. Los resultados obtenidos están en torno al 3.5% para la tasa de error de clasificación. En [58] podemos ver otra variación de dicho método. Se propone una nueva generalización del algoritmo, rank K-NN (rK-NN), con datos multivariante, para el diagnóstico del cáncer de mama. Se estudian las prestaciones de esta regla en dos bases de datos conocidas y se comparan los resultados con el algoritmo convencional K-NN. La tasa de error media para rK-NN es del 6%, mientras que para el algoritmo convencional se obtiene un valor de 7.3%. Comentamos ahora otros métodos muy utilizados en el diagnóstico de esta enfermedad, las redes bayesianas. En [59] se desarrolla una BN. Se utilizan mamografías. Las mamografías suelen consistir en cuatro imágenes, dos de cada pecho, una denominada mediolateral-oblicua (MLO) y otra craneocaudal (CC). La norma es que una lesión, zona afectada por un tumor, debe ser observada en ambas imágenes. Aun así, la mayoría de los sistemas CAD sólo son capaces de analizar una imagen independiente, por lo que la correlación en las características de la lesión en ambas imágenes se ignora y el diagnóstico del cáncer puede verse afectado. De lo que tratan en este estudio es de desarrollar un sistema capaz de explorar varias imágenes a la vez con el fin de mejorar el proceso de diagnóstico, a través de una red bayesiana de dos pasos. Se comparan los resultados del modelo diseñado, analizando las dos imágenes a la vez (denominado Multiview), y del modelo simple, analizando las imágenes por separado (denominado SV-CAD). El análisis comparativo se realiza mediante las curvas ROC MEDICAL DECISION SUPPORT SYSTEMS Página | 8 (Receiver Operating Characteristics) y el valor AUC (Area Under the Curve), que pueden verse en la siguiente figura: Fig. 1. Curvas ROC de las imágenes MLO y CC El p-valor obtenido en el caso de imágenes MLO fue de 0.000 y 0.035 en el caso de imágenes CC. Hablamos por último de DDSSs basados en SVM para diagnosticar este cáncer. Utilizamos para ello las referencias [60] y [61]. En la primera se propone un diagnóstico basado en un método de máquinas de vectores de soporte combinado con selección de rasgos. Los experimentos se llevaron a cabo con diferentes test de entrenamiento mediante la base de datos WBCD. Los resultados del método se evalúan mediante la precisión de clasificación, especificidad, sensibilidad, valores positivos y negativos predichos, curvas ROC y matriz de confusión. Los problemas a los que tuvieron que enfrentarse fueron: cómo elegir la función núcleo (la cual finalmente se decidió que fuera de tipo RBF), cómo elegir el conjunto de rasgos óptimos de entrada (que, tras el estudio, se establece en cinco de las nueve características), y cómo establecer los mejores parámetros del núcleo. Obtienen una precisión del 99.51%, un valor muy elevado. Con respecto a la segunda referencia, [61], el estudio se lleva a cabo utilizando LS-SVM y de nuevo la base de datos WBCD. La principal diferencia entre LS-SVM y SVM es que el primero utiliza un coste lineal para entrenar la máquina mientras que el segundo utiliza uno cuadrático. La robustez del algoritmo se examina de nuevo mediante la precisión de clasificación, el análisis de especificidad y sensibilidad, métodos de validación cruzada del tipo k-fold (k-fold cross-validation method) con un valor de k=10, y mediante la matriz de confusión. La precisión obtenida en este caso fue de 98.53%, la cual es bastante prometedora. En ambos casos la especificidad, sensibilidad y precisión del algoritmo se calcula, a partir del número de falsos positivos (FP) y negativos (FN) y verdaderos positivos (TP) y negativos (TN), como sigue: Página | 9 MEDICAL DECISION SUPPORT SYSTEMS Y la matriz de confusión es la siguiente: Valor predicho Valor real POSITIVO NEGATIVO POSITIVO TP FP NEGATIVO FN TN Como vemos, el cáncer de mama es una de las enfermedades que más se estudia e investiga en el campo de los CDSSs. Existe una bibliografía muy extensa al respecto. Aquí hemos tratado de resumir brevemente alguno de los métodos y algoritmos más usados para tal fin. MEDICAL DECISION SUPPORT SYSTEMS Página | 10 9 ENFERMEDADES CARDIOVASCULARES Las enfermedades cardiovasculares se deben a trastornos del corazón y los vasos sanguíneos, entre ellos las cardiopatías coronarias (ataques cardiacos), las enfermedades cerebrovasculares (apoplejía), el aumento de la tensión arterial (hipertensión), las vasculopatías periféricas, las cardiopatías reumáticas, las cardiopatías congénitas y la insuficiencia cardiaca. Las estadísticas han demostrado de manera consistente que las enfermedades cardíacas son una de las principales causas de muertes en EE.UU. [62] y en todo el mundo [63]. Sin embargo, se pueden salvar muchas vidas si se toma rápidamente una precisa decisión sobre el diagnóstico de pacientes que sufren distintos tipos de enfermedades del corazón, después de lo cual se puede seguir un tratamiento adecuado inmediatamente. Muchos factores pueden complicar su diagnóstico, ya que es un proceso cognitivo complejo y difuso, a menudo retrasando la decisión correcta del mismo. Por ejemplo, los síntomas clínicos; las manifestaciones funcionales y patológicas de las enfermedades cardíacas están asociadas con muchos otros órganos humanos aparte del corazón, y muy a menudo las enfermedades del corazón pueden presentar diversos síndromes. Al mismo tiempo, los diferentes tipos de enfermedades del corazón pueden tener síntomas similares. Para reducir el tiempo de diagnóstico y mejorar la exactitud del mismo, desarrollar potentes y fiables sistemas de apoyo a la decisión médica se ha convertido en una cuestión demandada para apoyar el cada vez más complicado proceso de decisión de diagnóstico. Los métodos de soft computing, como las redes neuronales, han demostrado un gran potencial para ser aplicados en el desarrollo de CDSSs de enfermedades del corazón. Azuaje et al. [64] emplearon ANNs feed-forward para reconocer categorías de riesgo de cardiopatías basándose en gráficos de Poincaré originados a partir de electrocardiogramas de menos de diez minutos. Se ayudaron de un total de 127 sujetos asintomáticos masculinos de mediana edad, a los cuales sometieron a un electrocardiograma en reposo en decúbito supino a frecuencias respiratorias fijas. Un electrocardiograma mide la actividad eléctrica del corazón. Esta actividad es descrita por cinco ondas llamadas P, Q, R, S y T (Fig. 2a). La onda P (representa la depolarización auricular del corazón) está seguida por el complejo QRS (depolarización ventricular) y la onda T (repolarización ventricular). Un intervalo RR (Fig. 2b) refleja la longitud del periodo de tiempo entre puntas R de dos latidos consecutivos. Fig. 2. Construcción de un gráfico de Poincaré. (a) Complejo PQRST; (b) Electrocardiograma con tres intervalos RR; y (c) Gráfico de Poincaré con los intervalos. Página | 11 MEDICAL DECISION SUPPORT SYSTEMS El gráfico de Poincaré es un diagrama de dispersión de un intervalo RR del electrocardiograma (medido en milisegundos) contra el intervalo RR inmediatamente posterior a él. Por lo tanto, un gráfico de Poincaré da información relativa al comportamiento instantáneo del corazón latido a latido. La Fig. 2c ilustra la construcción de dicho gráfico a partir de una señal de electrocardiograma. Estos gráficos se han usado para determinar diferencias entre individuos sanos y otros con fallos cardiacos. La Fig. 3 muestra dos sujetos con diferente riesgo de enfermedad coronaria. El patrón de la Fig. 3a pertenece a un paciente con bajo riesgo, con una alta variabilidad de frecuencia cardiaca y media baja de la misma, y la Fig. 3b tendría alto riesgo, caracterizado por una baja variabilidad y frecuencia cardiaca elevada. Fig. 3. Patrones de gráfico de Poincaré. (a)Paciente con bajo riesgo; y (b) Paciente con alto riesgo. El formato bidimensional de la información representada por el gráfico de Poincaré se adapta al formato de la entrada de una ANN. Se realiza una codificación de los datos dividiendo el gráfico en cuadros con anchura Δt ms. El número de nodos de entrada de la red será, por tanto, el número de cuadros. En este experimento se usaron valores de entrada binarios (Fig. 4) y Fig. 4. Generación de entradas binarias. (a) Gráfico de Poincaré dividido en nueve cuadros con diez analógicos, ponderando cada cuadro en muestras; y (b) generación del vector de entrada. función del número de muestras que contiene. Para los experimentos, inicialmente, se utilizaron tres niveles de riesgo para el nivel de salida de la red, a saber, high, medium y low. También se implementó una aplicación con cinco categorías con los valores de salida very high, high, medium, low and very low. Se fueron modificando las unidades que componían cada capa, así como se alternó el uso de una sola capa oculta con dos. Los resultados de los casos correctamente clasificados fueron: Nº de entradas High Medium Low 144 576 1024 4/9 5/9 6/9 6/9 5/9 3/9 4/9 3/9 1/9 Nº de entradas Very high High Medium Low Very low 144 576 0/5 1/5 1/4 2/4 5/9 7/9 1/5 0/5 1/4 0/4 MEDICAL DECISION SUPPORT SYSTEMS Página | 12 Este trabajo muestra la utilidad de las redes neuronales detectando riesgos de cardiopatías en medidas de variabilidad a corto plazo de frecuencia cardiaca. Los resultados obtenidos de estos experimentos indican que, aún basado en un conjunto de datos relativamente pequeño, un gráfico de Poincaré codificado puede producir resultados útiles. Por otro lado, Tkacz et al. [65] muestran cómo las redes neuronales wavelet (WNN) pueden ser aplicadas para diagnosticar y clasificar la enfermedad arterial coronaria en diferentes niveles. El procedimiento experimental desarrollado consiste en un conjunto de 89 pacientes con uno o varios bloqueos en la arteria coronaria. Se registra durante 5 minutos la señal de variabilidad de la frecuencia cardiaca (HRV) de cada uno de ellos, los cuales han sido previamente clasificados por un experimentado cardiólogo respecto a la estimación del número de bloqueos que tienen. Implementan una capa adicional en la estructura de la ANN que hace el rol de clasificador mediante la transformada wavelet (WT), para la extracción de algunos rasgos de la señal HRV que resulten más característicos y más significativos para el problema de clasificación, los cuales se entregan al proceso de aprendizaje. Los métodos actuales de diagnóstico son en su mayoría invasivos, suelen producir un alto estrés en los pacientes. Es por esto que el uso de un método como el propuesto, no invasivo debido al uso de la HRV, resulta interesante al lograr aumentar la precisión del diagnóstico a la vez que minimiza las molestias para el paciente. Para el diagnóstico de cardiopatías congénitas, Reategui et al. [66] proponen un modelo de integración de razonamiento basado en casos con ANNs. Este modelo representa una nueva aproximación para integrar el razonamiento basado en casos (CBR) con una red neuronal en sistemas de diagnóstico. Cuando se resuelve un nuevo problema, la red neuronal se usa para formular hipótesis y guiar al módulo CBR en la búsqueda de casos previos similares que den soporte a alguna hipótesis. El conocimiento adquirido por la red se interpreta y mapea en descriptores simbólicos de diagnosis, los cuales se guardan y los utiliza el sistema para determinar si la respuesta final es creíble y para construir las explicaciones para el razonamiento llevado a cabo. A diferencia de otras arquitecturas conocidas, este sistema no conserva los casos como parte integrante de la red (Fig. 5). Fig. 5. Arquitectura de la combinación de NN y CBR. MEDICAL DECISION SUPPORT SYSTEMS Página | 13 El modelo NN-CBR se ha usado en el desarrollo de un sistema de diagnóstico de cardiopatías congénitas (CHD). El sistema ha sido evaluado usando dos bases de datos con un total de 214 casos CHD. Este sistema híbrido es capaz de resolver problemas que una red neuronal con un buen nivel de precisión no puede. Diferentes tipos de información están contenidos en cada capa de la red neuronal: 9 Salida Æ contiene nodos que representan las diferentes hipótesis de diagnóstico. 9 Entrada Æ contiene nodos que representan evidencias tales como síntomas, resultados de pruebas, o cualquier otra información que mantenga la hipótesis de diagnóstico. 9 Intermedia Æ especifica diferentes combinaciones de evidencia que pueden conducir a una hipótesis en particular. Los descriptores de diagnosis se crean y mantienen acorde al conocimiento almacenado en la red neuronal, conservando una descripción inteligible del conocimiento representado en la red y definiendo un esquema de clasificación para los atributos observados más importantes. Este esquema de clasificación se utiliza para consultas, para confirmar o refutar el resultado final y para construir las explicaciones. Tsai y Watanabe [67] utilizaron el razonamiento difuso optimizado por un algoritmo genético (GA) para la clasificación de las enfermedades de miocardio a partir de imágenes de ultrasonidos. Su objetivo era, mediante una técnica computerizada, dar una segunda opinión a los médicos para reducir los posibles errores derivados de la subjetividad de los diagnósticos de los mismos y así incrementar la precisión de estos diagnósticos. Para ello, se apoyaban en imágenes de ultrasonidos del corazón (ecocardiográficas), importantes medios no invasivos de la cardiología clínica. Hacían uso de funciones de pertenencia con distribución gaussiana (GDMFs), construidas a partir de los rasgos inherentes de la textura en las imágenes de ultrasonidos. Los coeficientes actúan como un conjunto de parámetros para ajustar la magnitud de las desviaciones típicas de las GDMFs empleadas. Se determinan los coeficientes óptimos a través de un proceso de entrenamiento usando el GA. El clasificador difuso basado en GA se emplea para discriminar dos conjuntos de imágenes ecocardiográficas, a saber, casos normales y anómalos, diagnosticados por un médico altamente capacitado. Los experimentos arrojaron unos resultados muy prometedores, alcanzando una tasa media de clasificación del 96%, lo que indica que el método tiene utilidad potencial para el diagnóstico, asistido por ordenador, de las enfermedades de miocardio. Un sistema basado en MLP entrenado con un algoritmo BP mejorado, desarrollado por Yan et al. [68], consigue diferenciar entre las cinco enfermedades cardiacas más comunes que son hipertensión, enfermedad coronaria, valvulopatía reumática, insuficiencia cardíaca derecha (chronic cor pulmonale) y cardiopatía congénita [69]. La capa de entrada del sistema incluye 40 variables de entrada. Estas variables se dividen en cuatro categorías: (a) información básica del paciente, incluye edad y sexo; (b) síntomas (14 factores en total); (c) historia clínica (5 factores en total); y (d) MEDICAL DECISION SUPPORT SYSTEMS Página | 14 exámenes físicos y resultados de laboratorio (19 factores en total). Estas variables se codifican utilizando los siguientes esquemas: (i) las variables numéricas, tales como la edad y la presión, sanguínea se normalizan en el intervalo (0,1); (ii) las variables con dos atributos independientes, como el sexo y el retorno venoso del cuello, se codifican con valores binarios (0,1); (iii) las variables con tres atributos independientes, tales como el soplo diastólico y las grabaciones del electrocardiograma (ECG), se codifican usando valores ternarios (-1, 0, 1); (iv) el resto de variables son codificadas usando las escalas ordinales de tres valores, con -1 representando la ausencia de atributo, 1 la presencia más grande, y 0.5 el nivel intermedio de las variables. El número de nodos en la capa oculta se determina a través de un proceso de aprendizaje en cascada. Cada uno de los 5 nodos en la capa de salida corresponde a una de las enfermedades del corazón de interés. En el sistema, los datos que faltan de un paciente se manejan mediante el método de imputación de la media. Además, se utiliza un algoritmo mejorado de retropropagación para entrenar el sistema. Un total de 352 historias clínicas recogidas de pacientes que sufren alguna de las cinco enfermedades se utilizan para entrenar y probar el sistema. En particular, tres métodos de evaluación, validación cruzada, validación holdout y bootstraping, se aplican para evaluar la generalización del sistema. Los resultados muestran que el sistema de apoyo a la decisión basado en MLP propuesto puede lograr un diagnóstico con una precisión muy alta (> 90%) demostrando su utilidad en el soporte del proceso de decisión clínica de las enfermedades del corazón. MEDICAL DECISION SUPPORT SYSTEMS Página | 15 9 ENFERMEDADES TIROIDEAS La tiroides es una glándula pequeña en forma de mariposa, localizada justo por debajo de la nuez. Esta glándula tiene un papel muy importante, ya que controla el metabolismo del organismo, o lo que es lo mismo, la velocidad a la que el organismo utiliza la energía. Esto lo realiza a través de la síntesis de hormonas tiroideas (principalmente tiroxina (T4) y triiodotironina, (T3)), que viajan a través del torrente sanguíneo a todas las partes del organismo. Estas hormonas tiroideas ordenan a las células del organismo la velocidad a la que deben utilizar la energía y sintetizar proteínas. Además, la glándula tiroides también sintetiza calcitonina, una hormona que contribuye a la regulación de los niveles de calcio en sangre inhibiendo la reabsorción ósea y aumentando la excreción de calcio a través de los riñones. Las enfermedades tiroideas básicamente son trastornos que afectan a la cantidad de hormonas tiroideas producidas. En algunos casos, la síntesis es insuficiente, conduciendo al hipotiroidismo y a un enlentecimiento del ritmo de las funciones del organismo, apareciendo síntomas como aumento de peso, sequedad de piel, estreñimiento, intolerancia al frío, inflamación general, pérdida de pelo, fatiga, y períodos menstruales irregulares (en las mujeres). La forma más grave de hipotiroidismo, conocida como mixedema, puede conducir a insuficiencia cardíaca, convulsiones y coma. En los niños, el hipotiroidismo puede provocar un retraso del crecimiento y del desarrollo sexual normal, así como retraso mental. Al existir un tratamiento eficaz, su detección precoz minimiza posibles complicaciones, y es por ello por lo que es una de las enfermedades que forma parte de las pruebas de cribado neonatal. El enfoque convencional para construir un sistema experto requería de la formulación de normas por las que los datos de entrada pudieran ser analizados. La formulación de tales reglas era muy difícil con grandes conjuntos de datos de entrada. Ante esta dificultad, se han aplicado ANNs como una alternativa al sistema convencional de sistemas expertos basados en reglas. Sharpe et al. [70] estudiaron los beneficios potenciales del uso de ANNs para el diagnóstico de las afecciones tiroideas. Los datos que utilizaron contenían 392 casos que se clasificaron de acuerdo a la función tiroidea y a 19 categorías clínicas (hipotiroidismo primario, enfermedad de Graves, adenoma tóxico, bocio nodular tóxico,…). Todos los casos presentan un conjunto completo de resultados de seis ensayos de laboratorio (tiroxina total, tiroxina libre, triyodotironina, la prueba de captación de triyodotironina, tirotropina y la globulina fijadora de tiroxina). Este conjunto de datos se dividió en subconjuntos utilizados para la formación de las redes y para las pruebas de su rendimiento; las pruebas de subconjuntos contenían diversas proporciones de casos con diagnóstico ruidoso para imitar situaciones de diagnóstico de la vida real. Utilizaron un MLP diseñada con dos algoritmos de aprendizaje, a saber, backpropagation y cuantificación de aprendizaje, para la clasificación funcional de las enfermedades de la tiroides (hipotiroidismo, eutiroidismo e hipertiroidismo). La correcta asignación de los casos en sus subconjuntos de datos de prueba fue 96.499.7%. Otro estudio posterior [71] se ocupo de una clasificación más simplista de estas enfermedades, pero su principal propósito era estudiar cuán robusto es el rendimiento de los MLP en la predicción de enfermedades tiroideas en términos de variabilidad de la muestra. Su clasificación trataba de determinar si un paciente tiene un funcionamiento MEDICAL DECISION SUPPORT SYSTEMS Página | 16 normal de la tiroides, un funcionamiento mermado de la tiroides (hipotiroidismo) o una tiroides más activa de lo normal (hipertiroidismo). El conjunto de datos utilizado tenía 7200 casos, con 3772 como muestra de entrenamiento y 3428 casos de prueba. La clase hipertiroidismo representaba el 2,3% (166 casos) de los datos, la clase hipotiroidismo el 5,1% (368 casos) de las observaciones, mientras que el grupo normal el restante 92,6% (6.666 casos). Este conjunto de datos altamente desequilibrado resultaba un problema muy difícil para los métodos de clasificación tradicionales. Para cada uno de los 7200 casos, tenían 21 atributos, 15 binarios y 6 continuos, utilizados para determinar a cuál de las tres clases pertenecía el paciente, y que formaban los nodos de entrada a la red. Estos atributos representaban información sobre los pacientes tales como edad, sexo, condición de salud, y los resultados de varios exámenes médicos. Se usaban tres nodos de salida binaria, correspondientes a las tres clases (normal, hipotiroidismo, hipertiroidismo). Se probó un número variable de capas ocultas, encontrando que el uso de 10 nodos ocultos proporcionaba los mejores resultados para el conjunto de muestras de prueba en términos de MSE y de acierto de clasificación. Se utilizó un algoritmo de entrenamiento más eficiente que el algoritmo típico de backpropagation, un método de entrenamiento más rápido llamado RPROP (Resilient backPROPagation, retropropagación con resiliencia). El principio básico del algoritmo es eliminar el efecto nocivo de la magnitud de la derivada parcial en el tamaño de paso de cada peso y por lo tanto, ofrecer una búsqueda de la solución más eficiente. Encontraron que el algoritmo RPROP converge entre 100 y 500 iteraciones en cuestión de segundos mientras que el de backpropagation necesita de 6000 a 70000 iteraciones y varias horas de ejecución. Los resultados daban un tasa de clasificación total correcta del 98.16% haciendo uso de este método. Erol et al. [72] realizaron un estudio que investigaba un MLP y una RBFNN y su utilidad para la clasificación estructural de las enfermedades tiroideas. Se utilizó un conjunto de datos de 487 pacientes con enfermedad de la tiroides para crear, entrenar y probar las redes neuronales correspondientes. Se realizaron a cada uno de los pacientes medidas séricas de T4, T3 y TSH (hormona estimulante de la tiroides) como pruebas funcionales y USG tiroidea (ultrasonografía) como ensayo estructural. La clasificación estructural de este conjunto de datos (entre estos rasgos: dos lóbulos normales, multinodular, uni-nodular, lóbulos ampliados y difusos, lóbulos pequeños) se realizó por medio de dos médicos expertos y los resultados se introdujeron en las redes neuronales. Los resultados experimentales mostraron que las predicciones de ambos modelos de redes neuronales eran muy satisfactorias para el aprendizaje de los conjuntos de datos. En cuanto a los datos de evaluación, el modelo RBFNN superaba al correspondiente modelo MLP. Este estudio demostraba la utilidad de un modelo ANN para la clasificación estructural de las enfermedades de la tiroides. Un estudio muy reciente [73] utiliza un método denominado sistema automático de diagnosis basado en la glándula tiroidea (ADSTG, Automatic Diagnosis System based on Thyroid Gland). El conjunto de datos del que hace uso contiene, entre otras, las siguientes variables: tiroxina sérica total medida por el método de desplazamiento isotópico, prueba de captación de resina T3, triyodotironina sérica total medida por radioinmunoanálisis, TSH basal, etc. Este sistema automático incluye tres etapas: Página | 17 MEDICAL DECISION SUPPORT SYSTEMS 1. Reducción de rasgos. Se utiliza el Análisis de Componentes Principales (PCA) para sintetizar la información, reduciendo la dimensión (número de variables) con el requisito de perder la menor cantidad de información posible. Glándula tiroidea Reducción de datos Conjunto de datos PCA Clasificación Clasificador LS-SVM con parámetros óptimos Evaluación de rendimiento Espacio de decisión k-fold Cross Validation Method 1. Función hiper 2. Función hipo 3. Función normal Fig. 6. Diagrama de bloques del método ADSTG. 2. Clasificación. El clasificador LS-SVM tiene como objetivo principal encontrar un hiperplano óptimo que separe tres tipos de diagnósticos sobre el funcionamiento de la tiroides (normal, hipotiroidismo y hipertiroidismo) usando la distancia euclídea al punto más cercano. Tiene dos parámetros de ajuste que son la anchura de los núcleos gaussianos (σ) y el factor de regularización (C), optimizados para el método ADSTG. 3. Evaluación del funcionamiento. La evaluación del método se realiza a través de la precisión que logra en la clasificación de los datos en las distintas categorías de diagnosis. Para ello, se utiliza el método k-fold cross-validation que minimiza el sesgo asociado a la toma de muestras al azar para el entrenamiento. Para lograr este objetivo, en primer lugar, todos los datos se divide aleatoriamente en k subconjuntos mutuamente excluyentes y de aproximadamente el mismo tamaño. El algoritmo de clasificación entrenado es probado k veces. Uno de los subconjuntos se toma como datos de prueba y las restantes se suman para formar los datos de entrenamiento, en cada caso. Por lo que existen k diferentes resultados de las pruebas para cada configuración entrenamientotest. El promedio de estos resultados da las prestaciones del algoritmo. Este método es usado con un valor de k=10. El método ADSTG propuesto obtuvo una precisión de clasificación el diagnóstico de enfermedades de la tiroides de un 93,77%. MEDICAL DECISION SUPPORT SYSTEMS Página | 18 9 PARKINSON La enfermedad de Parkinson (PD) es un trastorno neurodegenerativo de carácter progresivo. Se produce por la degeneración celular de la sustancia negra del mesencéfalo y la disfunción de los circuitos neuronales relacionados con el control de los movimientos corporales. Los síntomas más típicos de la enfermedad son la bradicinesia (lentitud de los movimientos voluntarios), acinesia (ausencia de movimiento), la rigidez muscular y el temblor, si bien suelen coexistir otros síntomas tanto sensitivos como vegetativos, cognitivos y afectivos. Es un trastorno propio de personas de edad avanzada, aunque existen formas de inicio juvenil. Aproximadamente un 1% de la población de más de 55 años se ve afectada por esta enfermedad. Se trata de una enfermedad que no tiene cura, pero existen medicamentos que producen un alivio significativo de los síntomas, especialmente si se administra en etapas tempranas de la enfermedad. De ahí la importancia, una vez más, de un rápido diagnóstico. Existen diversos estudios sobre sistemas automáticos o semi-automáticos para el diagnóstico de la enfermedad, basado en síntomas y métodos muy diferentes. Comentamos a continuación alguno de ellos. Las imágenes [123I]-FP-CIT constituyen un método relativamente reciente de diagnóstico. Se inyecta una sustancia de trazado por vía intravenosa y se viaja hasta el cerebro por medio de la circulación sanguínea. Allí, transcurridas unas tres horas, se produce un equilibrio entre receptores libres y ligados. Es entonces cuando se toman imágenes tridimensionales del cerebro por medio de una cámara gamma. La unión de la sustancia de trazado en los ganglios basales y otras áreas del cerebro se evalúa, habitualmente, de forma manual. El principal objetivo de [74] es, por un lado, elaborar un método automático de cuantificación y clasificación de imágenes [123I]-FP-CIT y, por otro, comparar la precisión de dicho método con el habitual, es decir, el manual. El estudio se realiza utilizando una base de datos de 89 pacientes que se encontraban en proceso de diagnóstico de la enfermedad por presentar algún síntoma de la misma. La edad media de los pacientes es de 68 años. El método de cuantificación y clasificación de las imágenes está constituido por tres pasos: segmentación de las imágenes en las regiones de interés, extracción de rasgos de dichas regiones y, finalmente, la clasificación de las imágenes. Los rasgos más importantes extraídos por el método son la intensidad media de los núcleos caudados (caudate nucleus) izquierdo y derecho y del putamen. La principal razón de dicha elección es que, durante la enfermedad, se observa una pérdida gradual de receptores, primero en el putamen y después en los núcleos caudados, con un gradiente anterior-posterior considerable. Para la clasificación se utilizan SVMs ya que la distribución subyacente es desconocida. En el estudio se prueba con tres diferentes núcleos para las SVM, un núcleo polinómico de grado 3, un núcleo gaussiano y un núcleo lineal, dando los tres resultados satisfactorios. Pero existen otros métodos de diagnóstico de esta enfermedad que están basados en otros síntomas. Como ejemplo mencionaremos [75], en donde se realiza una comparación entre varios métodos de diagnóstico basados en las disfunciones en el habla causadas por la enfermedad. Disfonía es un término muy amplio que designa todo trastorno de la voz cuando se altera la calidad de ésta en cualquier grado exceptuando el total, en cuyo caso se denomina afonía. Es uno de los síntomas de PD. Muchos de los métodos utilizados actualmente para evaluar la enfermedad de Parkinson se basan generalmente en la experiencia humana. Existen, en la literatura de la enfermedad, MEDICAL DECISION SUPPORT SYSTEMS Página | 19 muchos estudios sobre la medición del habla. Se registra la voz utilizando un micrófono, y las señales son posteriormente analizadas mediante métodos de medición diseñados para detectar ciertas propiedades de la voz. En el caso que nos ocupa, el estudio se realiza utilizando una base de datos que contiene rasgos de personas sanas y enfermas. Se compone de 23 columnas y 197 filas, que contienen medidas biomédicas de la voz. El principal objetivo es distinguir las señales pertenecientes a personas sanas de las de los pacientes afectados por la enfermedad. Para implementar el algoritmo se utilizaron cuatro clasificadores diferentes: regresión (concretamente LogR), una ANN, una red DMNeural (utilizada para fijar un modelo no-lineal aditivo que usa componentes principales como entradas para predecir una variable objetivo binaria o de intervalo) y un árbol de decisión. La red neuronal es un MLP, con algoritmo de aprendizaje backpropagation, una única capa oculta con 10 neuronas y una sigmoide como función de transferencia para las capas oculta y de salida. Fig. 7. Métodos aplicados para el diagnóstico de PD El clasificador neuronal fue el que obtuvo los mejores resultados, con un 92.9% de precisión de clasificación; seguido por la regresión logística con un 88.6%. MEDICAL DECISION SUPPORT SYSTEMS Página | 20 9 LEUCEMIA La leucemia o leucosis es un grupo de enfermedades malignas de la médula ósea, caracterizadas por un aumento anormal de células sanguíneas. Leucemia es un término que cubre un amplio espectro de enfermedades. Según el tipo celular proliferado, las leucemias serán granulocíticas, linfocíticas o monocíticas, y según el predominio de afección (si es medular o linfático) se clasificarán en mieloides o linfoides. También según la evolución y grado de madurez celular se dividirán en agudas (células muy jóvenes) o crónicas (células más diferenciadas). Existen diversos estudios que hacen uso de los DSSs para facilitar la diagnosis y la clasificación de los distintos tipos de leucemias. Entre ellos, encontramos un ejemplo de la utilización de un sistema de apoyo a expertos en el diagnóstico de pacientes con leucemia [76]. El modelo propuesto integra varios algoritmos cooperativos caracterizados por su eficiencia para el procesamiento de datos, filtrado, clasificación y extracción de conocimiento a partir de matrices exón. Dichas matrices son superficies sólidas a las cuales se unen una serie de exones (regiones de un gen que no son separadas durante el proceso de splicing y, por tanto, se mantienen en el ácido ribonucleico mensajero maduro) y se utilizan para averiguar la expresión de genes, monitorizándose los niveles de miles de ellos de forma simultánea. El proceso de discriminar entre las patologías que implican la sangre periférica, médula ósea y ganglios linfáticos comienza tradicionalmente con una evaluación morfológica subjetiva de los materiales celulares vistos mediante microscopio de luz. Las sutiles diferencias visibles exhibidas por algunos linfomas malignos y la leucemia, sin embargo, dan lugar a un importante número de falsos negativos durante la evaluación microscópica por técnicos médicos. Foran et al. [77] han desarrollado un prototipo de un sistema distribuido de apoyo a la decisión clínica para diferenciar entre neoplasias hematológicas. El sistema consta de dos componentes principales, un sistema telemicroscópico distribuido y un repositorio inteligente de imágenes. El sistema híbrido permite a los individuos situados en diferentes lugares de investigación clínica llevar a cabo consultas interactivas y obtener soporte de decisiones asistido por computadora. El sistema sugiere el diagnóstico más probable basado en la mayoría lógica de los disponibles y se utilizó para discriminar entre los tres trastornos linfoproliferativos y las células sanas. El sistema proporcionó la clasificación correcta en más del 83% de los casos estudiados. La leucemia linfoblástica aguda (LLA) es la neoplasia maligna más frecuente en la infancia, lo que representa casi un tercio de todos los cánceres pediátricos. En la actualidad, el tratamiento de la LLA pediátrica se centra en adaptar la intensidad de la terapia aplicada a un riesgo de recaída del paciente, que está relacionado con el tipo de leucemia que tiene el paciente. Por lo tanto, el diagnóstico preciso y correcto de los subtipos de leucemia diferentes se convierte en un importante primer paso en el proceso de tratamiento. Tung et al. [78] proponen la utilización de una red neuronal difusa autoorganizativa con inferencia difusa para la clasificación de todos los subtipos utilizando datos de expresión génica. La tasa de acierto en la clasificación se encuentra por encima del 90%. Varios estudios demuestran que la clasificación del cáncer se puede realizar con gran precisión, sensibilidad y especificidad a través de microarrays basados en la expresión génica de perfiles usando ANNs. Huang et al. [79] llevaron a cabo un amplio estudio para investigar la capacidad de las redes neuronales probabilísticas (PNN) MEDICAL DECISION SUPPORT SYSTEMS Página | 21 asociadas a un método de selección de rasgos (un estadístico de señal a ruido) en la aplicación de la clasificación del cáncer. El estadístico de señal a ruido, el cual representa la correlación con el prototipo de clase, se utiliza para seleccionar los marcadores genéticos y ajustar la dimensión de las muestras de datos para el PNN. Los resultados experimentales muestran que la asociación de la red neuronal probabilística con el estadístico de señal a ruido puede conseguir mejores resultados de clasificación para dos tipos de leucemias agudas y cinco categorías de tumores embrionarios del sistema nervioso central con una velocidad de cómputo satisfactoria. Además, el análisis del estadístico señal a ruido proporciona genes candidatos para estudios futuros para entender el proceso de la enfermedad y la identificación de posibles objetivos para la intervención terapéutica. A pesar de varias recomendaciones para la normalización de la citometría (análisis de las características de células) de flujo multiparamétrica (MFC); el número, la especificidad y las combinaciones de los reactivos utilizados por los laboratorios para la diagnosis y clasificación de las leucemias agudas son todavía muy diversos. Por otra parte, la actual interpretación diagnóstica de las lecturas de la citometría de flujo se ve influenciada de forma arbitraria por la experiencia individual y el conocimiento. Ratei et al. [80] analizaron muestras de médula ósea de 155 pacientes, de los cuales 79 tenían leucemia mieloide aguda, 29 leucemia linfoblástica con precursor de células B, 12 leucemia linfoblástica aguda con precursor de células T y 35 no tenían enfermedad. Se compararon los resultados de un panel de exploración de mínimo cuatro colores e inmunofenotipaje de MFC con el diagnóstico real, utilizando análisis discriminante. El objetivo primero de dicho análisis era encontrar las dimensiones en las que los grupos mencionados eran diferentes, además de definir la especificidad. Se logró una clasificación correcta de las muestras en el 97,2% de los casos. Esto demostraba que el análisis de la función discriminante se puede utilizar como un DSS para la interpretación de lecturas de citometría de flujo. MEDICAL DECISION SUPPORT SYSTEMS Página | 22 9 ALZHEIMER La enfermedad de Alzheimer (AD), también denominada mal de Alzheimer, o demencia senil de tipo Alzheimer, es una enfermedad neurodegenerativa que se manifiesta como deterioro cognitivo y trastornos conductuales. Se caracteriza en su forma típica por una pérdida progresiva de la memoria y de otras capacidades mentales, a medida que las células nerviosas (neuronas) mueren y diferentes zonas del cerebro se atrofian. La enfermedad suele tener una duración media aproximada después del diagnóstico de 10 años, aunque esto puede variar en proporción directa con la severidad de la enfermedad en el momento del diagnóstico. Las técnicas de imagen aplicadas al cerebro, tales como imágenes PET y SPECT, se usan comúnmente como herramienta de diagnóstico de AD. Ambas técnicas son de tipo no invasivo y ofrecen imágenes tridimensionales de ciertas zonas del cuerpo. Son estas técnicas los que se utilizan en [81] para desarrollar un sistema CAD completo con la finalidad de diagnosticar el Alzheimer. Para ello se utilizan clasificadores SVM basados en imágenes PET y SPECT de la región cerebral. Para llevar a cabo la extracción de rasgos se construye en primer lugar una máscara binaria que selecciona los voxels de interés y descarta el resto. Esta tarea se realiza tomando los voxels cuyo promedio de intensidad supere el 50% del valor máximo. Después se aplica dicha máscara a las imágenes originales de forma que las zonas irrelevantes quedan descartadas. La imagen cerebral obtenida en dicho proceso se divide en componentes que serán los vectores de entrada del SVM. Estas componentes o regiones son denominadas regiones de interés (ROI). Cada componente será utilizada para entrenar un clasificador individual que emitirá un valor sobre el estado del paciente. La decisión final será tomada según los componentes más relevantes de mayor valor. En la figura siguiente se muestra un esquema general del proceso de clasificación. Fig. 8. Esquema general del clasificador SVM mediante imágenes PET y SPECT MEDICAL DECISION SUPPORT SYSTEMS Página | 23 Los mismos autores del estudio anterior tratan de mejorar en [82] la precisión del sistema de diagnóstico implementado combinando los SVM con árboles de clasificación y núcleos lineales. Para ello utilizan un conjunto de 79 imágenes SPECT tomadas con una cámara gamma. Tras realizar primero los mismos pasos que en el caso anterior, aplicar una máscara binaria y separar en componentes la imagen, se construye un árbol de clasificación que indicará qué secuencia de componentes es óptima para la tarea de clasificación. Este sistema se puede ver también como un procedimiento para seleccionar ROIs de manera automática. Utilizando árboles de clasificación obtienen un 90% de precisión frente al 84% conseguido sólo con las SVM. Otro ejemplo, esta vez usando ANNs, es [83], donde se procesan señales relacionadas con los movimientos de las manos como respuesta a una estimulación magnética transcraneal (TMS) medidas con un electromiógrafo. Primero se realiza un análisis tiempo-frecuencia con el objetivo de identificar las variables principales de las señales que caracterizan ciertas enfermedades mentales, entre ellas el Alzheimer. Estas variables se procesan después mediante una ANN para clasificar la respuesta y dar un diagnóstico. Las variables que tenían una baja correlación cruzada entre los valores tomados antes y después de la estimulación en pacientes enfermos de demencia y que muestran una alta correlación para personas sanas fueron las siguientes: latencia, amplitud, módulo máximo y mínimo de la FFT, módulo mínimo de la trasnformada Hilbert y máxima correlación cruzada de la transformada Wavelet. La diferencia entre los valores de estas variables con respecto al mismo ISI (Inter-Stimulus time Interval) antes y después de la estimulación repetitiva se dan como entradas a un MLP que consta de seis entradas y dos salidas. Se comprueba que una capa oculta de 20 neuronas es suficiente para generalizar a partir de los ejemplos aprendidos. Las neuronas de salida clasifican los casos según las cuatro clases siguientes: sin enfermedad, Alzheimer, demencia mixta y demencia vascular subcortical isquémica (SIVD). El método desarrollado es comparado finalmente con uno basado en lógica difusa, arrojando los siguientes resultados: Patología Ninguna Alzheimer SIVD Demencia mixta Precisión MLP 90% 92.7% 95% 87% Lógica difusa 90% 92.5% 92.5% 90% El último ejemplo que vamos a comentar sobre esta enfermedad es [84], donde se desarrolla un sistema de detección temprana del Alzheimer mediante imágenes SPECT pero basado en un modelo de regresión de mínimos cuadrados parciales (PLS) y un predictor de tipo random forest (RF). Los resultados experimentales muestran que el sistema combinado PLS-RF obtiene un error de generalización que converge a un cierto valor (0.05) a medida que se incrementa el número de árboles del RF. Los resultados se comparan con un análisis de componentes principales en cuyo caso el valor al que converge el error de generalización es mayor (0.15) MEDICAL DECISION SUPPORT SYSTEMS Página | 24 9 CÁNCER DE PRÓSTATA El cáncer de próstata es el que se desarrolla en uno de los órganos glandulares del sistema reproductor masculino llamado próstata. Su detección se lleva a cabo principalmente por la detección del PSA (Prostatic Specific Antigen) en la sangre. El PSA es una sustancia proteica sintetizada por las células de la próstata y su función es la disolución del coágulo seminal. Es una proteína de síntesis exclusiva en la próstata. Una pequeñísima parte de este PSA pasa a la circulación sanguínea de los hombres enfermos y es precisamente eso lo que se mide para el diagnóstico, pronóstico y seguimiento. Pero el PSA es un marcador tumoral imperfecto por su escasa sensibilidad (35% de falsos negativos) y por su falta de especificidad, ya que sus niveles pueden verse afectados por muchos factores. Existen estudios sobre el diagnóstico del cáncer de próstata mediante métodos basados en ANNs, más concretamente mediante MLP, y regresión logística (LogR), que reducen significativamente el porcentaje de falsos negativos [85]. También se han desarrollado métodos basados en redes bayesianas causales para el diagnóstico de este tipo de cáncer. Es el caso del departamento de Inteligencia Artificial de la Universidad Nacional de Educación a Distancia de Madrid [86]. Han desarrollado una herramienta que ayuda al médico, especialmente de medicina general, a realizar un diagnóstico diferencial entre las posibles enfermedades de la próstata basado en sus probabilidades, ya que los síntomas del cáncer de próstata son muy parecidos a los de la hiperplasia prostática benigna (HPB) o de otros problemas de la misma, por lo que es fácil confundirlos. Para ello han construido un grafo cuyo primer nodo es el diagnóstico de cáncer de próstata y a partir de él comienzan a identificarse los factores de riesgo, signos, síntomas y pruebas directamente relacionadas con la enfermedad, además de otras enfermedades que podrían dar lugar a confusión con el cáncer. De forma que la red evoluciona desde un modelo sólo cualitativo (grafo de la red) hasta un modelo más refinado tras discretizar variables, analizar el impacto de los hallazgos, refinar probabilidades, etc. MEDICAL DECISION SUPPORT SYSTEMS Página | 25 9 CÁNCER DE CUELLO DE ÚTERO El cáncer cervical o carcinoma del cuello uterino incluye las neoplasias malignas que se desarrollan en la porción fibromuscular inferior del útero. Se trata del segundo tipo de cáncer más común en mujeres, y en países en vías de desarrollo es el más frecuente, diagnosticándose más de 400.000 casos nuevos cada año. Un cáncer cervical incipiente rara vez muestra síntomas, por lo que es fundamental la realización sistemática (anual) de la prueba Papanicolaou. Sin embargo, se estima que un tercio de las mujeres que mueren de esta enfermedad lo hacen porque no se detectó con precisión y en una fase lo suficientemente temprana para un tratamiento exitoso. Una explicación a esto es que la prueba Papanicolaou produce un alto porcentaje de falsos negativos. Esto puede ser debido a que, aunque un frotis registra entre 50.000 y 300.000 células, el indicativo de un cáncer de cuello de útero puede estar limitado a 12 células o menos, y la identificación de estas células en medio de unos cuantos miles es una tarea complicada. Con el fin de mejorar el diagnóstico de esta enfermedad se han estudiado y desarrollado métodos con ANNs, utilizando principalmente MLP entrenados con retropropagación [85]. Es el caso del sistema PAPNET que utiliza una arquitectura de dos niveles con diferentes grados de resolución de clasificación inicial y final. El primer nivel filtra los residuos y otros segmentos de la imagen no deseados, mientras que el segundo emplea redes especializadas para identificación de células únicas y la clasificación. En [87] se presenta otra ANN para la clasificación de células cancerígenas del cuello uterino, obtenidas a partir del test Papanicolaou, pero basándose esta vez en MMRBF (Median M-type Radial Basis Function). El epitelio escamoso se compone de 4 capas de células: las células basales, parabasales, intermedias y superficiales. La neoplasia intraepitelial cervical (CIN), también conocida como displasia, tiene el potencial de convertirse en cáncer cervical invasivo. La displasia se clasifica en tres fases de severidad, CIN 1 (displasia leve), CIN 2 (displasia moderada) y CIN 3 (displasia grave). En un análisis microscópico de la prueba de Papanicolaou, las células del cuello uterino se pueden dividir en varias categorías clasificadas por la apariencia de las células, especialmente en el núcleo celular. El núcleo de una célula puede presentar cambios significativos cuando la célula se ve afectada por una enfermedad, por lo que la identificación y cuantificación de estos cambios contribuyen en la discriminación de las células normales y anormales en dicha prueba. Para entrenar las redes y obtener los parámetros adecuados, se utilizaron 78 imágenes de células del cuello uterino: 25 normales, 3 CIN 1 (displasia leve), 25 CIN 2 (displasia moderada), 20 CIN 3 (displasia grave), y 5 con CIS (carcinoma-in-situ) con enfermedad invasiva. Los pasos que se realizan para segmentar la imagen son los siguientes: a) leer la imagen; b) detectar toda la célula, mediante el uso de una máscara de gradiente binario se detectan los bordes de la imagen; c) dilatar la imagen, para eliminar las brechas en las líneas que la rodean; d) cubrir huecos interiores; e) eliminar objetos conectados en la frontera; y f) suavizar la célula, con el fin de hacer que la célula segmentada posea un aspecto natural. Después de la segmentación se procede a la extracción de rasgos. Los parámetros numéricos obtenidos en este caso son: área, perímetro y circularidad del núcleo y del citoplasma, relación entre ambas áreas y valores máximo y mínimo de claridad o luminosidad del núcleo. Se obtuvo una tasa de error del 23% para el conjunto CIN3, 83% de sensibilidad y un 100% de especificidad. MEDICAL DECISION SUPPORT SYSTEMS Página | 26 9 CÁNCER DE PULMÓN El cáncer de pulmón es una de las enfermedades más graves y uno de los cánceres con mayor incidencia en el ser humano, responsable de los mayores índices de mortalidad oncológica a nivel mundial. Es la primera causa de mortalidad por cáncer en el varón y la tercera, después del de colon y mama, en la mujer. El diagnóstico temprano del cáncer de pulmón es el principal condicionante para el éxito en su tratamiento. En estadios tempranos, el cáncer de pulmón puede, en alrededor del 20% de los casos, ser tratado mediante resección quirúrgica con éxito de curación. Sin embargo, debido a su virulencia y a la dificultad para su detección precoz, en la mayoría de los casos de diagnóstico donde ya existe metástasis, el cáncer de pulmón presenta, junto con el cáncer de hígado, páncreas y esófago, los peores pronósticos, con una esperanza de vida promedio de aproximadamente 8 meses. La mayor parte de los CDSS desarrollados para esta enfermedad son DSS que utilizan interpretación automática de imágenes. En [88] se utilizan SVMs para diagnosticar tumores en la zona pulmonar mediante imágenes PET/CT. La tomografía por emisión de positrones (PET) es una moderna técnica en medicina nuclear para medir y cuantificar procesos bioquímicos de manera no invasiva. En este caso utilizan el isótopo F-18, con una vida media de 110 minutos. La imagen PET muestra el metabolismo de la sustancia de trazado utilizada, FDG. Las zonas con tumor pueden ser detectadas en este caso porque tienen un consumo de la sustancia de trazado mayor en comparación con las zonas normales, sin tumor. A las zonas sospechosas de tratarse de tumores se les denomina hot spots. Algunos de los rasgos que se examinan y clasifican en este caso mediante la SVM son el número total de hot spots encontrados, volumen del mayor hot spot, valor del SUV del hot spot con mayor intensidad media, etc. La mejor tasa de clasificación obtenida fue de 95.2%. También encontramos una ANN para mejorar la exactitud con la que se detecta el estado de los ganglios en el cáncer pulmonar de células no-pequeñas, NSCLC, en [89], por medio de imágenes F-18 FDG-PET. En este caso utilizan un MLP con un algoritmo de retropropagación formado por tres capas. La salida de la red será el estado quirúrgico patológico de los nodos. Como parámetros de entrada utilizaron el tamaño en centímetros del tumor primario, el valor del SUV máximo de dicho tumor y el valor del SUV máximo corregido (PVCmaxSUV). La ANN predijo correctamente el 87.3% de los casos. Otros trabajos que podemos encontrar relacionados con el tema son Host et al. [90], que describe métodos para la interpretación automática grammagramas pulmonares, Ericsson et al. [91], utiliza SVMs para la interpretación automática de imágenes para el diagnóstico. Otros estudios consiguen detectar automáticamente posibles tumores en imágenes PET/CT y realizar un diagnóstico para el cáncer de pulmón con la ayuda de máquinas de aprendizaje, concretamente ANNs y SVM [92]. El mejor resultado obtenido fue una curva ROC con un 89% de área, obtenida para una ANN con siete rasgos y dos clases de salida, presencia y ausencia de cáncer. MEDICAL DECISION SUPPORT SYSTEMS Página | 27 9 CÁNCER DE RIÑÓN Aunque el cáncer de riñón supone sólo el 3% del total de todos los casos de cáncer, su tasa de supervivencia continua siendo muy baja. Aun así, es cada vez más frecuente, sobre todo en los países desarrollados, que la detección de las masas tumorales en el riñón se realice en una fase más temprana que antes. Esto es debido en gran parte a los avances tecnológicos relativamente recientes en el uso de técnicas de imagen. A la vez, se está generando una gran cantidad de información al respecto, por lo que la necesidad de mejorar los métodos de análisis de datos está creciendo, así como la creación de nuevas formas de presentar los datos para que la información resulte más útil. Uno de los objetivos más importantes de las investigaciones relacionadas con este campo es proporcionar a los médicos una herramienta que les ayude a decidir si se debe operar a un paciente de inmediato o no. Para los enfermos de cáncer de riñón esta decisión es muy importante, ya que las personas que pierden sus funciones renales necesitan diálisis de por vida. En [93] han trabajado en el diseño de un CDSS que pueda ayudar a los médicos en el complejo proceso del diagnóstico y en las complicadas decisiones que se deben tomar cuando se está tratando con pacientes de cáncer de riñón. Se centran en los casos en los que la herramienta a utilizar son imágenes CT. En este proceso, la identificación de rasgos es crucial. Para ello se utiliza, entre otras técnicas, un clasificador bayesiano para cuantificar el grado en que una región se asemeja a una función de interés, basándose en un subconjunto de propiedades generales de dicha región. El clasificador fue diseñado en términos de las siguientes características de la región: su área, el valor máximo de gris, el valor medio de gris y una relación denominada “elongatedness” que se define como la relación entre la longitud y la anchura del rectángulo mínimo de la región. Los autores comentan en el artículo que el clasificador arrojó buenos resultados y, aunque no aportan datos numéricos que lo corroboren, en la siguiente figura se puede apreciar la identificación automática de las costillas en una imagen CT: Fig. 9. Identificación automática de las costillas en una imagen abdominal CT utilizando el algoritmo diseñado MEDICAL DECISION SUPPORT SYSTEMS Página | 28 9 HEPATITIS La hepatitis es una afección o enfermedad inflamatoria que afecta al hígado. Su causa puede ser infecciosa (viral, bacteriana, etc.), inmunológica (por autoanticuerpos) o tóxica (por ejemplo por alcohol, venenos o fármacos). También es considerada, dependiendo de su etiología, una enfermedad de transmisión sexual. Hay virus específicos para la hepatitis (virus hepatotropos), es decir, aquéllos que sólo provocan hepatitis. Existen muchos: virus A, B, C, D, E, F, G, dando lugar cada uno a un tipo de hepatitis. Los más importantes son los virus A, B, C y, en menor medida, el D y el E, siendo los últimos, F y G, los menos estudiados. Al igual que en los casos anteriores, existen múltiples algoritmos de clasificación empleados para desarrollar sistemas de diagnóstico automático para esta enfermedad, enfocados a la hepatitis en global, o enfocado más concretamente en alguno sus seis tipos conocidos. En [94] se desarrolla un sistema de diagnóstico automático basado en LDA y ANFIS (Adaptative Network based on Fuzzy Inference System). Los tipos de hepatitis que se tienen en cuenta en este caso son los más frecuentes, A, B y C. En la base de datos utilizada para el estudio existen 19 atributos (que tras la primera fase -LDA- se reducirán a 8 ); estos son: edad, sexo, esteroides, antivirales, fatiga, malestar, anorexia, hígado grande e hígado duro, bazo palpable, arañas vasculares, ascitis, varices, bilirrubina, fosfatasa alcalina, SGOT (Serum Fig. 10. Diagrama de bloques del sistema diagnóstico automático LDA-ANFIS Glutamic Oxaloacetic Transaminase), albúmina, tiempo de protrombina e histología. En la segunda fase se realiza una clasificación por medio de un sistema ANFIS de cinco capas, ocho entradas, una salida y 256 reglas de tipo if-then. Se obtiene una precisión en la clasificación de 64.16%. En [95], se utilizan los mismos 19 parámetros de entrada que en el caso anterior pero utilizando ANNs, concretamente tres: MLP, RBF y CSFNN (Conic Section Function Neural Network). La precisión de clasificación media obtenida es de 80.775% para el MLP, 85% en el caso de RBF y 90% para la red CSFNN. También podemos encontrar trabajos que se centran en el diagnóstico concreto de un tipo de hepatitis, como es el caso de [96], donde se desarrolla un sistema experto para el diagnóstico de la hepatitis C; además se compara el sistema implementado con otros DSSs ya existentes para esta enfermedad concreta. En este caso, algunas de las variables de entrada utilizadas son la edad y el sexo, alcoholismo, existencia de tatuajes en el paciente o transfusiones de sangre, uso de drogas intravenosas, histología y otros métodos de monitorización, etc. Se utiliza una ANN de tres capas, la cual usa una función de activación sigmoidal. Se obtuvo un error RMS de clasificación de 0.079. de MEDICAL DECISION SUPPORT SYSTEMS Página | 29 9 LUMBALGIA Lumbalgia es el término por el que se conoce el dolor de la parte inferior de la espalda (LBP, Low Back Pain), en la zona lumbar, causado por un síndrome músculoesquelético, es decir, trastornos relacionados con las vértebras lumbares y las estructuras de los tejidos blandos como músculos, ligamentos, nervios y discos intervertebrales. Se origina por distintas causas, siendo las más comunes el estrés, el sobreesfuerzo físico y las malas posturas. En una pequeña proporción de personas esta condición puede volverse crónica. Estudios poblacionales muestran que el dolor de espalda afecta a la mayoría de los adultos en algún momento en su vida y representa más casos de bajas laborales por enfermedad y de discapacidad que cualquier otro problema médico. A esto hay que añadir que existe una baja cantidad de pacientes con lumbalgia que obtienen un diagnóstico preciso de su problema con algún grado de certeza; muchos de ellos reciben cuidados que no son apropiados o, al menos, no son óptimos. Se han desarrollado diversos métodos que tratan de ayudar desde hace tiempo en el diagnóstico de la enfermedad, como por ejemplo, el implementado por Graham et al. [97], que utilizaban clasificadores bayesianos para la evaluación de los resultados electromiográficos en el diagnóstico clínico de las radiculopatías compresivas, pérdida o disminución de la función sensitiva o motora de una raíz nerviosa por compresión. En esta misma dirección, existen más trabajos, como el llevado a cabo por Lin et al. [98] que diseñaron, implementaron y evaluaron un DSS basado en la web que empleaba un marco intuitivo y fácil de usar para evaluar la información del paciente y recomendar un diagnóstico. Un método algo diferente a los anteriores, basado en MLPs, trata de establecer una clasificación de las distintas dolencias de la zona lumbar [99]. Se utilizó un conjunto de datos, hallazgos físicos y clínicos, de 198 casos reales que obtuvieron de cuestionarios de pacientes. En este estudio, la red MLP era completamente conectada, progresiva, con 92 neuronas de entrada binarias codificadas correspondientes a 39 atributos del paciente, 10 neuronas en la capa oculta y 3 neuronas en la capa de salida, cada uno representando una categoría de diagnóstico (simple dolor de espalda, dolor de raíz y enfermedad de comportamiento anormal). La red se entrenó con 99 casos, usando funciones de activación sigmoidales y retropropagación. La red MLP con mejor generalización fue encontrada en 1100 ciclos cuando el conjunto de entrenamiento se clasificaba correctamente en el 97% de los casos. MEDICAL DECISION SUPPORT SYSTEMS Página | 30 9 LINFOMAS Linfoma es un término muy amplio que abarca una gran variedad de cánceres del sistema linfático. Se diferencian por el tipo de célula que se multiplica y por la forma en que el cáncer se presenta. Los dos grupos principales de linfoma en los seres humanos son la enfermedad de Hodgkin y los linfomas No-Hodgkin. Es muy importante obtener un diagnóstico exacto para asegurarse de si se trata de un linfoma o no y de qué tipo, y luego determinar los tratamientos que serán más efectivos para la condición del paciente. El linfoma folicular es uno de los linfomas No-Hodgkin más comunes. En la identificación de este tipo de linfomas se basa el trabajo realizado en [100] mediante la búsqueda de folículos en imágenes microscópicas. El sistema propuesto realiza una distinción entre los píxeles que pertenecen al contorno del folículo y los que no. Después estos rasgos serán utilizados para el aprendizaje supervisado mediante un Autómata Celular (CA), con el objetivo de obtener un DSS para la clasificación de los contornos del folículo. La precisión obtenida en media fue del 93.1% para el conjunto de prueba, concretamente, se obtuvo un 90.7% de precisión para aquellos píxeles pertenecientes al contorno y un 95.5% para los que no pertenecían al mismo. Mediante la introducción, uso y manejo de herramientas de base genómica, la investigación sobre las alteraciones genéticas, que están en el origen de enfermedades tan comunes como el cáncer, han sufrido una revolución técnica comparable a la incorporación del microscopio en los laboratorios. Ahora, estudiar la relación gen-enfermedad no está basado en analizar un gen único y sus efectos sino en analizar el comportamiento de miles de genes de forma simultánea. Estos sistemas, denominados genéricamente como matrices, arrays, microarrays o biochips, están cambiando la forma de plantear problemas y extraer conclusiones de los experimentos, ya que nos ofrecen una foto compleja del conjunto del genoma. Este sistema de microarrays, aplicado al problema que nos ocupa, se utiliza en [101]. La mayoría de los análisis de la enorme cantidad de información proporcionada por estos chips se ha basado en técnicas de clustering y de otros procedimientos estadísticos estándar. Estos métodos, en particular los relacionados con el pronóstico de pacientes con cáncer, han sido por lo general insuficientes en la obtención de los subconjuntos de genes necesarios para una buena clasificación. Es por ello que en este estudio se realiza un análisis mediante otro tipo de métodos, como son las ANNs, de los datos obtenidos a partir de un biochip. Su objetivo fue comprobar si la estrategia, usando redes, de entrenamiento, prueba y diferenciación en conjuntos reducidos de genes podría producir algún resultado útil con respecto al pronóstico sobre una base individual. Se entrenaron más de 130 redes para este estudio. Inicialmente se aleccionó una red para recibir los datos del microarray con un total de 4026 genes de 40 pacientes. Esta red tenía 12.078 neuronas de entrada, 100 neuronas en la capa intermedia y una única neurona de salida. Tras realizar un proceso de optimización de la red se obtuvo el conjunto de 34 genes final para entrenar una red de 6 neuronas en la capa intermedia. Los resultados con que concluye el estudio son muy prometedores puesto que han sido capaces de predecir la supervivencia a largo plazo de los pacientes con una precisión del 100%. MEDICAL DECISION SUPPORT SYSTEMS Página | 31 ANEXO: GLOSARIO DE ACRÓNIMOS Y ABREVIATURAS AD Alzheimer Disease ADSTG Automatic Diagnosis System based on Thyroid Gland ANFIS Adaptative Network based on Fuzzy Inference System ANN Artificial Neural Network AUC Area Under the Curve BN Bayesian Network BP Back Propagation CAAF Citología por Aspiración con Aguja Fina CAD Computer Aided Diagnosis CART Classification And Regression Tree CBR Case-Based Reasoning CC CraneoCaudal CDSS Clinical Decision Support System CHD Congenital Heart Desease CSFNN Conic Section Function Neural Network CT Computer Tomography DSS Decision Support System DDSS Diagnosis Decision Support System DT Decision Tree ECG ElectroCardioGram FDG Fluorodeoxyglucose FFT Fast Fourier Transform GA Genetic Algorithm GDMF Gaussian-Distributed Membership Function HRV Heart Rate Variability ISI Inter-Stimulus time Interval KD Kernel Density K-NN K Nearest Neighbour K-RNN K Rank Nearest Neighbour LBP Low Back Pain LDA Linear Discriminant Analysis LLA Leucemia linfoblástica aguda MEDICAL DECISION SUPPORT SYSTEMS LS-SVM Least Square Support Vector Machine LogR Logistic Regression MFC Multiparametric Flow Cytometry MLO Medio-Lateral Oblicua MLP MultiLayer Perceptron MoE Mixtured of Experts MR Magnetic Resonance MSE Mean Square Error NSCLC Non-Small Cell Lung Cancer PCA Principal Component Analysis PD Parkinson Disease PET Possitron Emission Tomography PLS Partial Least Squared PNN Probabilistic Neural Network RBF Radial Basis Function RF Random Forest RK-NN Rank K Nearest Neighbour ROC Receiver Operating Characteristic ROI Region Of Interest RPROP Resilient backPROPagation SGOT Serum Glutamic Oxaloacetic Transaminase SIVD Subcortical Ischemic Vascular Dementia SPECT Single Photon Emission Computed Tomography SUV Standardized Uptake Value SVM Support Vector Machine TMS Transcranial Magnetic Stimulation TSH Thyroid-Stimulating Hormone USG Ultrasonography WBCD Wisconsin Breast Cancer Dataset WK-NN Weighted K Nearest Neighbour WNN Wavelet Neural Network WT Wavelet Transform Página | 32 MEDICAL DECISION SUPPORT SYSTEMS Página | 33 REFERENCIAS En las referencias se indica el tipo de documento, utilizando: (A) si se trata de un artículo de revista académica (journal), (Cn) si es una conferencia, (Co) para coloquios, (Cu) cursos, (S) si se trata de un simposio, (L) si es un libro, (CL) si se trata de un capítulo de un libro, (T) en el caso de las tesis doctorales y (RE) si es un recurso electrónico. Las referencias principales en las que se ha basado la realización de esta memoria están marcadas con un punto negro tras el indicador de tipo de documento. [1] (A) ● Denekamp Y, Peleg M. TiMeDDx--a multi-phase anchor-based diagnostic decision-support model. Journal of Biomedical Informatics. 2010; 43(1): 111-124. [2] (L) Institute of Medicine. Crossing the quality chasm: a new health system for the 21st century. National Academy Press. 2001. [3] (CL) Musen MA, Shahar Y, Shortliffe EH. Chapter 16: Clinical decisionsupport systems. In: Shortliffe EH, Perreault LE, Wiederhold G, Fagan LM, editors. Medical informatics: Computer applications in health care and biomedicine. New York: Springer. 2001: 573–609. [4] (CL) Miller RA, Geissbuhler AG. Chapter 5: Diagnostic decision support systems. In: Berner ES, editor. Clinical Decision Support Systems: Theory and practice. Springer. 2007: 99–125. [5] (A) Shortliffe EH, Axline SG, Buchanan BG, Merigan TC, Cohen SN. An artificial intelligence program to advice physicians regarding antimicrobial therapy. Computers and Biomedical Research. 1973; 6(6): 544–560. [6] (A) Eshelman L, Ehret D, McDermott J, Tan M. MOLE: A tenacious knowledge acquisition tool. International Journal of Man-Machine Studies. 1987; 26(1):41–54. [7] (A) Miller R, Masarie FE, Myers JD. Quick Medical Reference (QMR) for diagnostic assistance. MD Computing. 1986; 3(5): 34–48. [8] (CL) Ramnarayan P, Kulkarni G, Tomlinson A, Britto J. ISABEL: a novel Internet delivered clinical decision support system. In: Bryant J, editor. Current perspectives in healthcare computing. Harrogate, UK. 2004: 245–254. [9] (A) Shwe M, Cooper G. An empirical analysis of likelihood-weighting simulation on a large, multiply-connected medical belief network. Computers and Biomedical Research. 1991; 24(5): 453–475. [10] (RE) Logic Medical Systems. PAIRS (Physician Assistant Artificial Intelligence Reference System); 2007. Disponible en: http://cyberdoc.freewebspace.com/ , accedido: 15.12.09. [11] (A) Lincoln MJ, Turner CW, Haug PJ, Warner HR, Williamson JW, Bouhaddou O, et al. Iliad training enhances medical students’ diagnostic skills. Journal of Medical Systems. 1991; 15(1): 93–110. [12] (A) Edberg SC. Global Infectious Diseases and Epidemiology Network (GIDEON): a world wide Web-based program for diagnosis and informatics in infectious diseases. Clinical Infectious Diseases. 2005; 40(1): 123–126. MEDICAL DECISION SUPPORT SYSTEMS Página | 34 [13] (S) Barnett GO, Famiglietti KT, Kim RJ, Hoffer EP, Feldman MJ. DXplain on the Internet. Proceedings of the American Medical Informatics Association Symposium. 1998: 607–611. [14] (S) Weed LL, Hertzberg RY. The use and construction of problemknowledge couplers, the knowledge coupler editor, knowledge networks, and the problem-oriented medical record for the microcomputer. Proceedings of the Annual Symposium on Computer Applications in Medical Care. 1983: 831–6. [15] (A) de Dombal FT. Computer-aided diagnosis and decision-making in the acute abdomen. Journal of the Royal College of Physicians of London. 1975; 9(3): 211–218. [16] (A) Miller RA, Pople HE, Myers JD. Internist-1, an experimental computerbased diagnostic consultant for general internal medicine. The New England journal of medicine. 1982; 307(8): 468–76. [17] (S) Aliferis CF, Cooper GF, Bankowitz R. A temporal analysis of QMR: abstracted temporal representation and reasoning and initial assessment of diagnostic performance trade-offs. Proceedings of the Annual Symposium on Computer Application in Medical Care. 1994: 709–15. [18] (A) Lemaire JB, Schaefer JP, Martin LA, Faris P, Ainslie MD, Hull RD. Effectiveness of the quick medical reference as a diagnostic tool. Canadian Medical Association Journal. 1999; 161(6): 725–728. [19] (A) Friedman CP, Elstein AS, Wolf FM, Murphy GC, Franz TM, Heckerling PS, et al. Enhancement of clinicians’ diagnostic reasoning by computer-based consultation: a multisite study of 2 systems. Journal of the American Medical Association. 1999; 282(19): 1851–1856. Erratum in: Journal of the American Medical Association. 2001; 285(23): 2979. [20] (A) Waxman HS, Worley WE. Computer-assisted adult medical diagnosis: subject review and evaluation of a new microcomputer-based system. Medicine (Baltimore). 1990; 69(3): 125–136. [21] (A) Murphy CK. Identifying diagnostic errors with induced decision trees. Medical Decision Making. 2001; 21(5): 368–375. [22] (A) Qu Y, Adam BL, Yasui Y, Ward MD, Cazares LH, Schellhammer PF, et al. Boosted decision tree analysis of surface-enhanced laser desorption/ionization mass spectral serum profiles discriminates prostate cancer from noncancer patients. Clinical Chemistry. 2002; 48(10): 1835–1843. [23] (A) Won Y, Song H, Kang TW, Kim J, Han B, Lee S. Pattern analysis of serum proteome distinguishes renal cell carcinoma from other urologic diseases and healthy persons. Proteomics. 2003; 3(12): 2310–2316. [24] (A) Geurts P, Fillet M, de Seny D, Meuwis MA, Malaise M, Merville MP, et al. Proteomic mass spectra classification using decision tree based ensemble methods. Bioinformatics. 2005; 21(14): 3138–3145. [25] (A) Balla JI, Iansek R, Elstein A. Bayesian diagnosis in presence of preexisting disease. Lancet. 1985; 325(8424): 326–329. [26] (A) Harris NL. Probabilistic belief networks for genetic counseling. Computer Methods and Programs in Biomedicine. 1990; 32(1): 37–44. MEDICAL DECISION SUPPORT SYSTEMS Página | 35 [27] (A) Stockwell DRB. LBS: Bayesian learning system for rapid expert system development. Expert Systems with Applications. 1993; 6(2): 137–147. [28] (A) Liu TF, Sung WK, Mittal A. Model gene network by semi-fixed Bayesian network. Expert Systems with Applications. 2006; 30(1): 42–49. [29] (A) Sadeghi S, Barzi A, Sadeghi N, King B. A Bayesian model for triage decision support. International Journal of Medical Informatics. 2006; 75(5): 403– 411. [30] (A) Baxt WG. Use of an artificial neural network for data analysis in clinical decision making: The diagnosis of acute coronary occlusion. Neural Computing. 1990; 2(4): 480–489. [31] (A) Baxt WG. Application of artificial neural networks to clinical medicine. Lancet. 1995; 346(8983): 1135–1138. [32] (A) Dybowski R, Gant V. Artificial neural networks in pathology and medical laboratories. Lancet. 1995; 346(8984): 1203–1207. [33] (A) Chae YM, Park KE, Park KS, Bae MY. Development of medical decision support system for Leukemia management. Expert Systems with Applications. 1998; 15: 309–315. [34] (A) Li YC, Liu L, Chiu WT, Jian WS. Neural network modeling for surgical decisions on traumatic brain injury patients. K2000; 57(1): 1–9. [35] (A) West D, West V. Model selection for a medical diagnostic decision support system: A breast cancer detection case. Artificial Intelligence in Medicine. 2000; 20(3): 183–204. [36] (A) Ellenius J, Groth T. Transferability of neural network-based decision support algorithms for early assessment of chest-pain patients. International Journal of Medical Informatics. 2000; 60(1): 1–20. [37] (A) MacDowell M, Somoza E, Rothe K, Fry R, Brady K, Bocklet A. Understanding birthing mode decision making using artificial neural networks. Medical Decision Making. 2001; 21(6): 433–443. [38] (A) Türkoglu I, Arslan A, Ilkay E. An expert system for diagnosis of the heart valve diseases. Expert Systems with Applications. 2002; 23(3): 229–236. [39] (A) Mendyk A, Jachowicz R. Neural network as a decision support system in the development of pharmaceutical formulation – focus on solid dispersions. Expert Systems with Applications. 2005; 28(2): 285–294. [40] (A) Mangalampalli A, Mangalampalli SM, Chakravarthy R, Jain AK. A neural network based clinical decision-support system for efficient diagnosis and fuzzy-based prescription of gynecological diseases using homoeopathic medicinal system. Expert Systems with Applications. 2006; 30(1): 109–116. [41] (A) Güven A, Kara S. Classification of electro-oculogram signals using artificial neural network. Expert Systems with Applications. 2006; 31(1): 199– 205. [42] (A) Cortes C, Vapnik V. Support-vector networks. Machine Learning. 1995; 20(3): 237–297. MEDICAL DECISION SUPPORT SYSTEMS Página | 36 [43] (L) Vapnik V. The Nature of Statistical Learning Theory. New York: Springer-Verlag. 1995. [44] (Cu) Veropoulos K, Cristianini N, Campbell C. The application of support vector machines to medical decision support: A Case Study. Proceedings of the European Coordinating Committee for Artificial Intelligence advanced course on artificial intelligence. 1999. [45] (Cn) Schubert F, Müller J, Fritz B, Lichter P, Eils R. Understanding the classification of tumors with a support vector machine: A case-based explanation scheme. Proceedings of the German Conference on Bioinformatics. 2003: 123– 127. [46] (A) Conforti D, Guido R. Kernel-based support vector machine classifiers for early detection of myocardial infarction. Optimization Methods and Software. 2005; 20(2–3): 401–413. [47] (A) Prados J, Kalousis A, Sanchez JC, Allard L, Carrette O, Hilario M. Mining mass spectra for diagnosis and biomarker discovery of cerebral accidents. Proteomics. 2004; 4(8): 2320–2332. [48] (A) Majumder SK, Ghosh N, Gupta PK. Support vector machine for optical diagnosis of cancer. Journal of Biomedical Optics. 2005; 10(2): 24–34. [49] (A) Brasil LM, de Azevedo FM, Barreto JM. Hybrid expert system for decision supporting in the medical area: Complexity and cognitive computing. International Journal of Medical Informatics. 2001; 63(1–2): 19–30. [50] (A) Tung KY, Huang IC, Chen SL, Shih CT. Mining the Generation Xers’ job attitudes by artificial neural network and decision tree – Empirical evidence in Taiwan. Expert Systems with Applications. 2005; 29(4): 783–794. [51] (A) Güler NF, Koc S. Use of support vector machines and neural network in diagnosis of neuromuscular disorders. Journal of Medical Systems. 2005; 29(3): 271–284. [52] (A) He J, Hu HJ, Harrison R., Tai PC, Pan Y. Transmembrane segments prediction and understanding using support vector machine and decision tree. Expert Systems with Applications. 2006; 30(1): 64–72. [53] (A) ● West D, Mangiameli P, Rampal R, West V. Ensemble strategies for a medical diagnostic decision support system: A breast cancer diagnosis application. European Journal of Operational Research. 2003; 162(2): 532-51. [54] (A) ● Abdolmaleki P, Buadu L, Naderimansh H. Feature extraction and classification of breast cancer on dynamic magnetic resonance imaging using artificial neural network. Cancer Letters. 2001; 171(2): 183-191. [55] (A) ● Sarkar M, Leong T. Application of K-nearest neighbors algorithm on breast cancer diagnosis problem. Journal of the American Medical Informatics Association. 2000: 759-763. [56] (A) ● Gil-Pita R, Yao X. Using a genetic algorithm for editing k-nearest neighbor classifiers. Intelligent Data Engineering and Automated Learning. 2007; 4881: 1141-1150. MEDICAL DECISION SUPPORT SYSTEMS Página | 37 [57] (S) ● Hechenbichler K, Schliep K. Weighted k-Nearest-Neighbor Techniques and Ordinal Classification. Discussion Paper 399, Sonderforschungsbereich 386. 2004. [58] (A) ● Bagui SC, Pal K, Pal NR. Breast cancer detection using rank nearest neighbor classification rules. Pattern Recognition. 2001; 36(1): 25-34. [59] (Cn) ● Velikova MV, Lucas PJF, Ferreira N, Samulski M, Karssemeijer N. A decision support system for breast cancer detection in screening programs. Proceedings of the 18th European Conference on Artificial Intelligence. 2008: 658–662. [60] (A) ● Akay M. Support vector machines combined with feature selection for breast cancer diagnosis. Expert Systems with Applications. 2009; 36(2): 32403247. [61] (A) ● Polat K, Gunes S. Breast cancer diagnosis using least square support vector machine. Digital signal processing. 2007; 17(4): 694-701. [62] (RE) Centers for Disease Control and Prevention. The Power of Prevention. Chronic disease… the public health challenge of the 21st century; 2009. Accedido: 21.12.09. http://www.cdc.gov/chronicdisease/pdf/2009-Power-ofPrevention.pdf [63] (RE) Organización Mundial de la Salud, WHO’s report 2009, accedido: 21.12.09. http://www.who.int/topics/cardiovascular_diseases/es/index.html [64] (A) ● Azuaje F, Dubitzky W, Lopes P, Black N, Adamson K, Wu X, et al. Predicting coronary disease risk based on short-term RR interval measurements: A neural network approach. Artificial Intelligence in Medicine. 1999; 15(3): 275297. [65] (Cn) ● Tkacz EJ, Kostka P. An application of wavelet neural network for classification of patients with coronary artery disease based on HRV analysis. Proceedings of the 22nd Annual International Conference of the IEEE, Engineering in Medicine and Biology Society. 2000; 2: 1391–1393. [66] (A) ● Reategui EB, Campbell JA, Leao BF. Combining a neural network with case-based reasoning in a diagnostic system. Artificial Intelligence in Medicine. 1997; 9(1): 5-27. [67] (A) ● Tsai DY, Watanabe S. A method for optimization of fuzzy reasoning by genetic algorithms and its application to discrimination of myocardial heart disease. IEEE Transactions on Nuclear Science. 1999; 46(6): 2239-2246. [68] (A) ● Yan H, Jiang Y, Zheng J, Peng C, Li Q. A multilayer perceptron-based medical decision support system for heart disease diagnosis. Expert Systems with Applications. 2006; 30(2): 272-281. [69] (L) Fuster, V., Alexander, R. W., & O’Rourke, R. A. Hurst’s the heart. 2001. USA: McGraw Hill Professional. [70] (A) ● Sharpe P, Solberg H, Rootwelt K, Yearworth M. Artificial Neural Networks in Diagnosis of Thyroid-Function from In-Vitro Laboratory Tests. Clinical Chemistry. 1993; 39(11): 2248-2253. [71] (A) ● Zhang G, Berardi VL. An investigation of neural networks in thyroid function diagnosis. Health Care Management Science. 1998; 1(1): 29-37. MEDICAL DECISION SUPPORT SYSTEMS Página | 38 [72] (A) ● Erol R, Ogulata S, Sahin C, Alparslan Z. A Radial Basis Function Neural Network (RBFNN) approach for structural classification of thyroid diseases. Journal of medical systems. 2008; 32(3): 215-220. [73] (A) ● Dogantekin E, Dogantekin A, Avci D. An automatic diagnosis system based on thyroid gland: ADSTG. Expert Systems with Applications. 2010; 37(9): 6368-6372. [74] (A) ● Ericsson A, Lonsdale MN, Astrom K, Edenbrandt L, Friberg L. Decision Support System for the Diagnosis of Parkinson’s Disease. Image Analysis. 2005; 3540: 740-749. [75] (A) ● Das R. A comparison of multiple classification methods for diagnosis of Parkinson disease. Expert Systems with Applications. 2010; 37(2): 1568-1572. [76] (A) ● Corchado JM, De Paz JF, Rodríguez S, Bajo J. Model of experts for decision support in the diagnosis of leukemia patients. Artificial Intelligence in Medicine. 2009; 46(3): 179-200. [77] (A) ● Foran DJ, Comaniciu D, Meer P, Goodell LA. Computer-assisted discrimination among malignant lymphomas and leukemia using immunophenotyping, intelligent image repositories, and telemicroscopy. IEEE transactions on information technology in biomedicine. 2000; 4(4): 265-273. [78] (A) ● Tung WL, Quek C. GenSo-FDSS: A neural-fuzzy decision support system for pediatric ALL cancer subtype identification using gene expression data. Artificial Intelligence in Medicine. 2005; 33(1): 61-88. [79] (A) ● Huang CJ, Liao WC. Application of Probabilistic Neural Networks to the Class Prediction of Leukemia and Embryonal Tumor of Central Nervous System. Neural Processing Letters. 2004; 19(3): 211-226. [80] (A) ● Ratei R, Karawajew L, Lacombe F, Jagoda K, Poeta GD, Kraan J, et al. Discriminant function analysis as decision support system for the diagnosis of acute leukemia with a minimal four color screening panel and multiparameter flow cytometry immunophenotyping. Leukemia. 2007; 21(6): 1204-1211. [81] (Cn) ● Álvarez I, López M, Gorriz JM, Ramírez J, Salas-González D, Puntonet CG, et al. Automatic classification system for the diagnosis of Alzheimer disease using component-based SVM aggregations. Proceedings of the 15th International Conference on Advances in Neuro-Information Processing. 2009; 2: 402-409. [82] (Cn) ● Salas-González D, Gorriz JM, Ramírez J, López M, Álvarez I, Segovia F, et al. Computer aided diagnosis of Alzheimer disease using support vector machines and classification trees. Proceedings of the 15th International Conference on Advances in Neuro-Information Processing. 2009; 5507: 418-425. [83] (A) ● Faro A, Giordano D, Pennisi M, Scarciofalo G, Spampinato C, Tramontana F. Transcranial magnetic stimulation (TMS) to evaluate and classify mental diseases using neural networks. Artificial Intelligence in Medicine. 2005: 310-314. [84] (A) ● Ramírez J, Gorriz JM, Segovia F, Chaves R, Salas-González D, López M, et al. Computer aided diagnosis system for the Alzheimer's disease based on partial least squares and random forest SPECT image classification. Neuroscience letters. 2010; 472(2): 99-103. MEDICAL DECISION SUPPORT SYSTEMS Página | 39 [85] (A) ● Lisboa PJ. A review of evidence of health benefit from artificial neural networks in medical intervention. Neural Networks. 2002; 15(1): 11-39. [86] (T) ● Lacave C. Explicación en redes bayesianas causales. Aplicaciones médicas. Ph.D. thesis, Departamento de Inteligencia artificial de la Universidad Nacional de Educación a Distancia. 2002. [87] (Cn) ● Gómez-Mayorga ME, Gallegos-Funes, FJ, De la Rosa Vázquez JM, Cruz-Santiago R, Ponomaryov V. Diagnosis of Cervical Cancer Using the Median M-Type Radial Basis Function (MMRBF) Neural Network. Proceedings of the Mexican International Conference on Artificial Intelligence. 2009; 5845: 258-267. [88] (A) ● Dimitrakopoulou-Strauss A, Hoffmann M, Bergner R, Uppenkamp M, Eisenhut M, Pan L, et al. Prediction of short-term survival in patients with advanced nonsmall cell lung cancer following chemotherapy based on 2-Deoxy-2[F-18]fluoro-D-glucose-positron emission tomography: A feasibility study. Molecular imaging and biology. 2007; 9(5): 308-317.. [89] (A) ● Vesselle H, Turcotte E, Wiens L, Haynor D. Application of a neural network to improve nodal staging accuracy with F-18-FDG PET in non-small cell lung cancer. The Journal of Nuclear Medicine. 2003; 44(12): 1918-1926. [90] (A) ● Holst H, Mare K, Jarund A, Astrom K, Evander E, Tagil K, et al. An independent evaluation of a new method for automated interpretation of lung scintigrams using artificial neural networks. European Journal of Nuclear Medicine. 2001; 28(1): 33-38. [91] (T) ● Ericsson A. Automatic Shape Modeling and Applications in Medical Imaging. Ph.D. thesis, Centre for Mathematical Sciences, Lund University, 2003. [92] (T) ● Jakobson D., Olofsson F. Decision support system for lung cancer using PET/CT images. Ph.D. thesis, Centre for Mathematical Sciences, Lund University, 2004. [93] (Cn) ● Golodetz S, Voiculescu I, Cameron S. Progress on a decision-support system for abdominal CT scans. Proceedings of the 2nd Conference on Human System interactions. 2009: 113-116. [94] (A) ● Dogantekin E, Dogantekin A, Avci D. An automatic diagnosis system based on thyroid gland: ADSTG. Expert Systems with Applications. 2010; 37(9): 6368-6372. [95] (Cn) ● Ozyilmaz L, Yildirim T. Artificial neural networks for diagnosis of hepatitis disease. Proceedings of the International Joint Conference on Neural Networks. 2003; 1: 586. [96] (Cn) ● Jajoo R, Mital D, Haque S, Srinivasan S. Prediction of hepatitis C using artificial neural network. Proceedings of the 7th International Conference on Control, Automation, Robotics and Vision. 2002; 3: 1545. [97] (Cn) ● Graham JH, Espinosa A. Computer assisted analysis of electromyographic data in diagnosis of low back pain. Proceedings of the IEEE International Conference on Systems, Man and Cybernetics. 1989: 1118-1123. [98] (A) ● Lin L, Hu P, Sheng O. A decision support system for lower back pain diagnosis: Uncertainty management and clinical evaluations. Decision Support Systems. 2006; 42(2): 1152-1169. MEDICAL DECISION SUPPORT SYSTEMS Página | 40 [99] (Co) ● Vaughn ML, Cavill SJ, Taylor SJ, Foy MA, Fogg AJB. Interpretation and knowledge discovery from a MLP network that performs low back pain classification. IEEE Colloquium on Knowledge Discovery and Data Mining. 1998: 1-4. [100] (A) ● Povalej P, Verlic M, Kokol P, Sanchez JL, Sigut JF. Identifying Lymphoma in Microscopy Images with Classificational Cellular Automata. Proceedings of the 19th IEEE International Symposium on Computer-Based Medical Systems. 2006: 309-314. [101] (A) ● O'Neill M, Li S. Neural network analysis of lymphoma microarray data: Prognosis and diagnosis near-perfect. BioMed Central Bioinformatics. 2003; 4: 13.