diagnosis decision support systems

Anuncio
 DIAGNOSIS DECISION SUPPORT SYSTEMS Beatriz Blázquez Valles, Raúl Varela Izquierdo Presentación: Aníbal R. Figueiras Vidal
Grupo de Gestión y Procesamiento de Información Departamento de Teoría de la Señal y Comunicaciones Universidad Carlos III de Madrid Avda. de la Universidad 30, 28911 Leganés, España Trabajo parcialmente financiado por la Cátedra Telefónica‐UCIIIM, Sección de Sistemas para la Ayuda a la Toma de Decisiones Junio, 2010 MEDICAL DECISION SUPPORT SYSTEMS
-i-
PRESENTACIÓN
Los humanos nos encontramos ininterrumpidamente en situaciones ante las que
hay que tomar una decisión; algunas veces, las consecuencias de hacerlo son, o pueden
ser, importantes. Y si bien es verdad, como sostiene Gerd Gigerenzer, que, por razones
evolutivas, nos encontramos razonablemente bien preparados para resolver estos
problemas en casos sobre los que la vida diaria nos ha permitido ganar cierto
conocimiento, no es menos cierto que en otros, aquéllos que no nos resultan familiares,
cometemos serios errores, fundamentalmente debidos a nuestras limitaciones intrínsecas
–procesamos la información bajo restricciones de frugalidad y rapidez–, pero también a
un defectuoso manejo de principios lógicos y probabilísticos y de una mala apreciación
de los riesgos derivados de cada elección.
Las limitaciones arriba enunciadas también afectan en diversos grados a los
expertos en su ejercicio profesional; muy particularmente ante problemas difíciles con
numerosos datos, y de forma más severa a quienes tienen un conocimiento poco
profundo de las leyes probabilísticas. Por ello –y no sólo para bisoños o para compensar
distracciones– se han venido desarrollando herramientas y sistemas de ayuda a la toma
de decisiones, que denominaremos a partir de aquí, por razones de brevedad y
confiando en que el lector evitará confusiones por esta equívoca adopción, como DSS
(“Decision Support Systems”).
En el ámbito de la Salud, especialmente relevante desde esta perspectiva por la
gravedad de gran parte de los riesgos que se presentan, los DSS han aparecido en
muchas formas y para muy variadas aplicaciones. Los DSS para el diagnóstico, DDSS
(“Diagnostic DSS”), son una importante clase de ellos; en su versión más radical, se
trata de un paquete algorítmico que lee datos relativos a un paciente y emite sugerencias
de posibles diagnósticos, generalmente cualificadas.
Pues bien: aunque la evidencia señala que los compromisos precisión–
sensibilidad que proporcionan estos DDSS se muestran frecuentemente ventajosos hasta
con respecto a los que supone la actuación de expertos reconocidos, el nivel de
MEDICAL DECISION SUPPORT SYSTEMS
- ii -
aceptación de los DDSS por los agentes que intervienen (especialistas, gestores, e
incluso pacientes cuando tienen acceso) es extraordinariamente bajo; en promedio, más
bajo que en otros campos.
Este escepticismo no tiene como única razón la novedad de los DDSS, que
dificulta su asimilación como en su día ocurrió con otras muchas facilidades
tecnológicas que se fueron poniendo a disposición del sector de la Salud y que el
tiempo, más o menos rápidamente, ha acreditado. También tiene que ver con el hecho
de que el diagnóstico es una responsabilidad del médico, por lo que cuesta delegarla.
También con la humana tendencia a considerar que los razonamientos propios son
excelentes. Ambas cosas apuntan a un habitual defecto de los DDSS: la carencia de
explicaciones, en términos comprensibles, de las sugerencias suministradas.
Únicamente los algoritmos del tipo Sistema Experto (compuestos de reglas) o Árboles
llevan implícitas explicaciones del tipo “si… entonces…”; lamentablemente, tales
familias de métodos suelen ofrecer muy bajas prestaciones.
De otro lado, resulta evidente que el especialista se relaciona con el paciente, de
modo que recibe una importante cantidad de información a la que el DDSS no tiene
acceso. Por ello, lo mejor sería que cada DDSS pudiese personalizarse para cada
especialista, teniendo también en cuenta la actuación de éste. Tal integración no
constituye un problema fácil, pero el asunto se complica aún más al tener en cuenta que
la actuación del especialista va modificándose a lo largo del tiempo por su aprendizaje
(incluida la experiencia): lo que evidencia la necesidad de que el DDSS personalizado
pueda acomodarse en “tiempo real” a los cambios de actuación de su usuario.
A mi juicio, estas tres cuestiones –explicaciones de tipo narrativo,
personalización y adaptación en “tiempo real” –son los tres principales desafíos (en
términos técnicos y no sicosociológicos) que los DDSS han de superar para lograr el
éxito. Como una Presentación no es lugar para extenderse en demasía, me limitaré a
decir que ya se dan pasos para proporcionar explicaciones– curiosamente, más largos en
el negocio de sistemas de recomendaciones–, para diseñar algoritmos que tengan en
cuenta el comportamiento de un decisor externo, y para diseñar métodos de
entrenamiento de máquinas de decisión que supongan mejoras paso a paso.
- iii -
MEDICAL DECISION SUPPORT SYSTEMS
Discutidos los principales obstáculos actuales para alcanzar una extendida y
provechosa implantación de los DDSS, diré que en las páginas que siguen, resultado de
un meritorio esfuerzo –que agradezco personalmente– de dos estudiantes de Ingeniería
de Telecomunicación becados por la Cátedra Telefónica-UCIIIM, Dña. Beatriz
Blázquez Valles y D. Raúl Varela Izquierdo, se presenta un amplio resumen de técnicas
empleadas en DDSS y sus resultados en un significativo conjunto de campos de
aplicación concreta. Sin ser exhaustivo –se seguirá ampliando–, el estudio revela otra
curiosa característica del desarrollo de los DDSS y de los trabajos dirigidos a ese fin: la
mayor parte de los algoritmos analizados dentro de los actuales, tipo máquina de
decisión, corresponden a los diseños más antiguos; sólo las máquinas de núcleos se han
hecho un pequeño sitio, y casi no hay rastro de las que hoy en día se consideran las
mejores opciones -¡incluso por su facilidad para generar explicaciones!–, los conjuntos
de máquinas. Como se ve, las dificultades para la implantación de los DDSS tienen
efectos dañinos retroalimentados: su concepción y diseño no despiertan el debido
interés entre los investigadores del Aprendizaje Máquina y de los llamados Sistemas
Inteligentes.
Naturalmente, creo que esta retroalimentación puede resultar nefasta para que
los DDSS y su empleo progresen y todos recibamos el beneficio esperable de ello. De
modo que concluiré estas líneas ofreciendo la colaboración del Grupo de Gestión y
Procesamiento de la Información, cuyos miembros, destacados investigadores, me
distinguen con su confianza para que lo dirija, a todos quienes deseen impulsar el
trabajo de I+D+i en las líneas que alientan el avance de estos sistemas.
Aníbal R. Figueiras Vidal
MEDICAL DECISION SUPPORT SYSTEMS
Página | 1
TABLA DE CONTENIDOS
INTRODUCCIÓN ................................................................................................................ 2 TABLA DE APLICACIONES .................................................................................................. 5 9 CÁNCER DE MAMA ............................................................................................................ 5 9 ENFERMEDADES CARDIOVASCULARES............................................................................ 10 9 ENFERMEDADES TIROIDEAS............................................................................................ 15 9 PARKINSON...................................................................................................................... 18 9 LEUCEMIA........................................................................................................................ 20 9 ALZHEIMER ...................................................................................................................... 22 9 CÁNCER DE PRÓSTATA .................................................................................................... 24 9 CÁNCER DE CUELLO DE ÚTERO ....................................................................................... 25 9 CÁNCER DE PULMÓN ...................................................................................................... 26 9 CÁNCER DE RIÑÓN .......................................................................................................... 27 9 HEPATITIS ........................................................................................................................ 28 9 LUMBALGIA ..................................................................................................................... 29 9 LINFOMAS........................................................................................................................ 30 ANEXO: GLOSARIO DE ACRÓNIMOS Y ABREVIATURAS .................................................. 31 REFERENCIAS .................................................................................................................. 33 MEDICAL DECISION SUPPORT SYSTEMS
Página | 2
INTRODUCCIÓN
El proceso de diagnosis [1] es un proceso cognitivo complejo que incluye una
variedad de tipos diferentes de tareas para la resolución de problemas que están
involucrados en el proceso de razonamiento médico. Además, los facultativos deben
seguir los progresos en la investigación clínica e incorporar cada vez mayor cantidad de
nuevos conocimientos sobre la diagnosis de las enfermedades. Los sistemas de ayuda a
la decisión clínica (CDSS) han sido reconocidos como instrumentos importantes para
ayudar a los expertos en la recopilación de conocimientos y datos relevantes, tomar
decisiones y gestionar acciones médicas con mayor eficacia, para así lograr en la
práctica errores pequeños, un mayor nivel de atención y una reducción de costes [2].
Los CDSSs pueden proporcionar herramientas para la gestión de la información (por
ejemplo, la recuperación y almacenamiento de datos), para centrar la atención (por
ejemplo, alertas y recordatorios), y para proporcionar recomendaciones específicas para
cada paciente [3].
Los DSSs de diagnosis (DDSS) [4] asisten al médico en una o más etapas de las
que componen el proceso de diagnóstico clínico. Se han venido desarrollando desde la
década de 1970 para distintos rangos de enfermedades y síntomas [5-14]; algunos
sistemas tienen por objeto cubrir amplios dominios médicos, mientras que otros
sistemas se centran en problemas específicos (por ejemplo, el DDSS de Dombal para el
diagnóstico diferencial del dolor abdominal [15]). El desarrollo de DDSSs plantea
difíciles retos. A pesar de estos desafíos, varios estudios de evaluación han demostrado
que los DDSSs son fiables y precisos [11, 13, 16-20]. Sin embargo, son relativamente
pocos los que se utilizan en la actualidad [8, 10-14], y la tasa de uso en la práctica
clínica rutinaria es baja. Parte de la dificultad en su incorporación puede estar asociada
con la falta de integración en el proceso de razonamiento implicado en el diagnóstico
clínico.
En prácticamente la totalidad de los DDSSs, el usuario introduce los datos sobre
los síntomas, signos y resultados de las pruebas de laboratorio, y el sistema produce una
lista de posibles diagnósticos, en orden de probabilidad. Algunos sistemas [16] guían al
usuario con el proceso de diagnóstico, incorporando procesos de diagnóstico rule-in y
rule-out en función de los resultados de las hipótesis en el conjunto de diagnosis
diferencial. Otros sistemas [13, 14, 18] ofrecen servicios de apoyo a la decisión que el
usuario puede invocar, como la prestación de un perfil de la enfermedad, centrando el
diagnóstico en las características importantes, visualizando evidencias para un
diagnóstico y obteniendo explicaciones de los resultados. La mayoría de los DDSS
existentes los utilizan terapeutas noveles, o médicos experimentados para que les
ayuden en el diagnóstico de los casos difíciles.
En las últimas dos décadas, el uso de herramientas de inteligencia artificial ha
sido ampliamente aceptado en aplicaciones médicas para apoyar más efectivamente el
diagnóstico del paciente. Sobre todo, la aplicación con diversos tipos de máquinas de
aprendizaje, tales como árboles de decisión (DTs), redes neuronales artificiales (ANNs),
redes bayesianas (BNs) y máquinas de soporte vectorial (SVMs), se ha probado
activamente para satisfacer las necesidades de apoyo clínico. En consecuencia, los
CDSS han demostrado un gran potencial, y muchos métodos se han probado para una
gran variedad de aplicaciones clínicas y médicas.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 3
El propósito de los CDSSs es mejorar, no reemplazar, la capacidad de un médico
en el complejo e intuitivo proceso de diagnóstico médico.
Tradicionalmente, los CDSSs se basan en un mejor modelo único que aprende
determinadas características fisiológicas de una enfermedad determinada y puede ser
utilizado para diagnosticar a los pacientes que manifiestan estas características. La
elección del modelo utilizado en un CDSS va desde simples métodos paramétricos, a
través de los métodos no paramétricos, hasta diversas redes neuronales feedforward.
Desafortunadamente, no existe una teoría disponible para guiar la selección del mejor
modelo. La mayoría de CDSSs utilizan un único modelo que es el más exacto entre un
conjunto limitado de modelos con un cierto rendimiento en las pruebas de validación
cruzada. De hecho, investigaciones recientes sugieren que encontrar un único “mejor
modelo” puede ser el enfoque equivocado [11,12]. Se ha informado de que la
combinación de modelos únicos, denominados “aggregate predictors”, construidos a
partir de versiones perturbadas de los conjuntos de aprendizaje, pueden tener un error
significantemente menor que el del mejor predictor individual [12].
El uso de árboles de decisión es uno de los métodos más popularmente aplicados
para CDSSs por su sencillez y capacidad de desarrollar reglas inductivas humanamente
comprensibles. Muchos investigadores han empleado DTs para resolver diversos
problemas biológicos, incluido el análisis de errores de diagnóstico [21], búsqueda de
potenciales biomarcadores [22, 23] y clasificación de espectros de masa proteómica
[24].
Las redes bayesianas son un modelo inferente basado en probabilidad, cada vez
más utilizado en el ámbito médico como un método de representación del conocimiento
para el razonamiento en condiciones de incertidumbre para una amplia gama de
aplicaciones, incluyendo diagnóstico de enfermedad [25], consejo genético [26],
desarrollo de sistemas expertos [27], modelado de redes genéticas [28] y diseño de
sistemas de soporte de decisiones de emergencia [29].
Las redes neuronales se han aplicado también en los campos médicos y de
diagnosis, más activamente como base de un método de soft computing para asistir al
complejo y difuso proceso cognitivo de diagnosis. Muchos estudios han demostrado la
idoneidad de las redes neuronales en el diseño de CDSSs y otras aplicaciones
biomédicas, incluyendo diagnóstico de infarto de miocardio [30, 31], diferenciación de
un surtido de datos de patología [32], CDSSs para la gestión de leucemia [33] y apoyo a
la decisión quirúrgica [34], CDSSs para la detección de cáncer [35], evaluación de los
pacientes con dolor torácico [36], toma de decisiones para el tipo de parto [37],
diagnóstico de enfermedades del corazón [38], CDSSs para aplicaciones farmacéuticas
[39], desarrollo de CDSS para el diagnóstico ginecológico [40] y clasificación de
señales biológicas [41].
Las máquinas de soporte vectorial son una nueva y prometedora técnica de
clasificación y regresión propuesta por Vapnik y sus compañeros de trabajo [42, 43].
Las SVMs, desarrolladas en la teoría del aprendizaje estadístico, están recibiendo un
creciente interés por parte de los investigadores de biomedicina. No están sólo
teóricamente bien fundadas, sino que también son mejores en aplicaciones prácticas.
Para los sistemas clínicos, médicos, de apoyo a la decisión y dominios biológicos, las
SVMs se han aplicado con éxito en una amplia variedad de ámbitos, incluyendo CDSSs
para el diagnóstico de la infección tuberculosa [44], clasificación de tumores [45],
MEDICAL DECISION SUPPORT SYSTEMS
Página | 4
detección de infarto de miocardio [46], descubrimiento de biomarcadores [47] y
diagnóstico de cáncer [48].
Además de los enfoques basados en modelos simples, las máquinas de
aprendizaje híbridas también han tratado de aumentar el rendimiento de los métodos
convencionales de modelos únicos y superar las debilidades inherentes a cualquier
método simple. Muchos enfoques de modelo híbrido han sido propuestos, incluyendo
un sistema experto híbrido para decisión ante crisis epilépticas mediante una ANN y un
método de lógica difusa [49], una ANN con un DT para el desarrollo de un sistema
inteligente de apoyo a la decisión [50], y una SVM con una ANN para la clasificación
de electromiogramas [51].
Recientemente se ha propuesto un nuevo método SVM en combinación con DT
para generar reglas comprensibles por los humanos y aliviar las dificultades de
comprensión que se derivan de la característica de caja negra de las SVMs en segmentos
de predicción transmembrana [52]. Su enfoque alcanzó una exactitud de predicción del
93% con reglas de predicción comprensibles y con valores de confianza de más del
90%.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 5
TABLA DE APLICACIONES
En este apartado vamos a centrarnos en algunas dolencias y explicar brevemente
los métodos más usados en el desarrollo de CDSSs para su diagnóstico, pronóstico y
seguimiento. Las primeras enfermedades que aparecen han sido estudiadas más en
detalle. Este es el caso del cáncer de mama, las enfermedades cardiovasculares y las
enfermedades tiroideas.
9 CÁNCER DE MAMA
El cáncer de mama es uno de los más comunes, tercero a nivel mundial y el más
frecuente entre las mujeres de todo el mundo, aun así, es de los más curables si se
detecta a tiempo. La mayoría de los países desarrollados han visto como aumentaba su
incidencia en los últimos 20 años. Un factor clave en la supervivencia de las personas
afectadas por esta enfermedad es la detección del problema en una fase temprana.
Algunos de los primeros CDSSs utilizados usaban modelos paramétricos
sencillos como LDA y LogR. Pero el alto coste de un mal diagnóstico, en general en
cualquier enfermedad pero en particular en el caso del cáncer, han motivado una intensa
búsqueda de algoritmos más precisos incluyendo métodos no paramétricos como el
algoritmo de los k vecinos más próximos (K-NN), la estimación por núcleos de
densidad de probabilidad (KD) o ventanas de Parzen, redes neuronales como MLP y
RBF, y árboles de clasificación y regresión (CART); aunque, como ya comentamos en
la introducción, se está tendiendo a utilizar modelos más complejos compuestos a su
vez por varios modelos sencillos de los anteriormente mencionados.
Precisamente en [53] se realiza un estudio para investigar el potencial de
diversas estrategias de selección, de entre una población de 24 modelos de clasificación,
con el fin de crear un modelo compuesto formado a su vez por varios modelos sencillos
para aumentar la detección precoz y el correcto diagnóstico del cáncer de mama. Se
estudia en este artículo el aumento de la precisión en el diagnóstico de modelos
complejos que incluyen a su vez diversos algoritmos o modelos más simples, como son,
en este caso, LDA, LogR, MLP, RBF, CART, K-NN y KD. Para realizar dicho estudio
se utilizan dos conjuntos de datos. El primero consiste en un registro de citologías
mamarias (699 registros de aspiraciones con aguja fina, CAAF). Los datos se han
obtenido de la base de datos de pacientes con cáncer de mama de la Universidad de
Wisconsin (WBCD). Se trata de una base de datos muy utilizada entre los científicos
que estudian esta enfermedad y su diagnóstico. Nueve variables miden propiedades de
las células y se usan para clasificar el caso como benigno o maligno. Las variables son:
1. Grosor de la masa o grupo de células
2. Uniformidad del tamaño de la masa de células
3. Uniformidad de la forma de la masa de células
4. Adhesión marginal
5. Tamaño individual de la célula
6. Núcleo desnudo
7. Cromatina blanda
8. Nucleoli normal
9. Mitosis
El segundo conjunto es un registro de datos de pronóstico provenientes de visitas de
seguimiento e incluyen sólo los casos más invasivos de cáncer de mama sin evidencia
Página | 6
MEDICAL DECISION SUPPORT SYSTEMS
de metástasis en el momento del diagnóstico. Treinta rasgos, obtenidos de imágenes
digitalizadas de diversas aspiraciones mamarias, describen las características de los
núcleos de las células presentes en la imagen. Estos datos se utilizan con diferentes
modelos simples con el fin de demostrar que es más preciso el diagnóstico si proviene
de un conjunto de modelos sencillos (ensemble models) que de un único modelo simple.
Para ello se utilizan cuatro configuraciones específicas de cada uno de los tres
algoritmos de redes neuronales usados (MLP, MoE y RBF) y cuatro configuraciones
también para el algoritmo K-NN con un rango de 3 a 11 vecinos. Para el caso de KD se
aplican densidades de 1.0 a 7.0. Y por último dos diseños diferentes también para
CART. De esta forma se tienen los 24 modelos diferentes con los que se realiza el
estudio. La configuración exacta de cada modelo se puede ver en el apéndice del
artículo [53].
Son muchos los estudios sobre DDSSs para el diagnóstico del cáncer de mama
basados, en general, en algoritmos sencillos. Explicamos a continuación alguno de ellos.
Las redes neuronales han sido ampliamente utilizadas en el desarrollo de
programas computerizados para el diagnóstico de esta dolencia. Existen multitud de
artículos al respecto. Como ejemplo, comentaremos el caso de [54], donde se diseña una
red neuronal. Los objetivos del estudio son: reducir el número de casos de tumores
benignos enviados a biopsia; minimizar la dependencia de la salida de la ANN de la
exactitud de la interpretación de los expertos, la cual depende de factores como la
experiencia del experto, el tiempo de interpretación o el criterio usado para la
extracción de los datos; probar la capacidad del sistema de reconocer nuevos ejemplos
como un sistema experto; y comparar el diagnóstico realizado por la ANN con la de los
radiólogos expertos sobre la benignidad o malignidad del tumor. Para ello utiliza una
ANN de tres capas feedforward y un algoritmo de entrenamiento de retropropagación.
Los datos del estudio se obtienen de resonancias magnéticas (MR). Los hallazgos
radiológicos se clasifican en características como las siguientes: tamaño, forma y
margen de la lesión, mejora de la homogeneidad, tipo de curva “tiempo-intensidad”, etc.
La estructura de la ANN diseñada consiste en 3 capas, la primera contiene 14
parámetros de entrada, la segunda es la capa oculta y está formada por 5 nodos; y la
última capa está formada por un solo elemento que toma el valor 1 si el tumor es
maligno y el 0 si es benigno. Tras realizar el estudio de la red neuronal diseñada se
compararon los resultados con los obtenidos por los expertos, obteniendo los siguientes
valores, donde el grupo A es un conjunto de radiólogos expertos (con un año o más de
experiencia), el grupo B está formado por radiólogos con poca experiencia (con menos
de un año de experiencia) en este campo, y el grupo A + B es el total de radiólogos
implicados en el estudio:
Parámetro
Grupo A + B
Grupo A
Grupo B
ANN
Sensibilidad (%)
Especificidad (%)
Precisión (%)
Nº de casos sin diagnóstico
Casos mal clasificados (%)
87
54
79
13
20
95
71
91
4
11
78
37
67
21
30
97
62
89
0
11
Como vemos, la sensibilidad y la precisión de la ANN es mayor que la de los
radiólogos.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 7
Pasamos ahora a otro tipo de métodos como son los no paramétricos, más
concretamente el algoritmo de K-NN. Vemos como en el caso de [55] se utiliza la base
de datos de la Universidad de Wisconsin nuevamente. Cada una de las muestras está
formada por las diez peculiaridades contenidas en dicha base de datos, los nueve rasgos
comentados anteriormente más un identificador del paciente. Menos al identificador del
paciente, al resto de atributos se le asigna un valor del 1 al 10. De forma que 1 es lo más
próximo a un tumor benigno y 10 a uno maligno. Se realizan pruebas variando el valor
de k desde 1 hasta 15. Los resultados de clasificación fluctúan entre el 99.12% y el
98.02%, obteniendo el mejor resultado para k igual a 1.
Otro ejemplo de la utilización de este método para el diagnóstico del cáncer de
pecho es [56]. En él se describe el diseño de un algoritmo genético con el fin de editar
conjuntos para la formación de clasificadores K-NN, centrándose en la selección de la
función objetivo a minimizar y en los distintos parámetros del algoritmo genético como,
por ejemplo, las técnicas de cruce y de mutación. Tres son las mejoras propuestas en el
proceso de edición mediante algoritmos genéticos: el uso del error cuadrado medio
(MSE) de la función objetivo, la aplicación de un crossover en clúster, y un rápido
sistema de mutación inteligente. El coste computacional después del entrenamiento y la
tasa de error de clasificación se consideran en el estudio. Para llevar a cabo el
experimento se dividió la base de datos en tres conjuntos, el de entrenamiento, el de
validación y el de prueba. Se probaron diferentes clasificadores K-NN con valores de k
de 1 a 50. El valor de k=3 fue el que mejores resultados obtuvo, con una tasa de error
media del 1.4%
Seguimos con el método K-NN. En [57] podemos ver una variante de este
algoritmo, el weighted K-NN (wK-NN). Esta ampliación se basa en la idea de que,
aquellas observaciones que estén dentro del conjunto de aprendizaje y particularmente
cerca de la nueva observación (y, x), deben tener un mayor peso en la decisión que
aquellos vecinos que estén muy lejos de (y, x). Esto no ocurre en la versión original del
algoritmo, en la cual aquellos vecinos considerados cercanos tienen el mismo peso. Los
resultados obtenidos están en torno al 3.5% para la tasa de error de clasificación. En
[58] podemos ver otra variación de dicho método. Se propone una nueva generalización
del algoritmo, rank K-NN (rK-NN), con datos multivariante, para el diagnóstico del
cáncer de mama. Se estudian las prestaciones de esta regla en dos bases de datos
conocidas y se comparan los resultados con el algoritmo convencional K-NN. La tasa de
error media para rK-NN es del 6%, mientras que para el algoritmo convencional se
obtiene un valor de 7.3%.
Comentamos ahora otros métodos muy utilizados en el diagnóstico de esta
enfermedad, las redes bayesianas. En [59] se desarrolla una BN. Se utilizan
mamografías. Las mamografías suelen consistir en cuatro imágenes, dos de cada pecho,
una denominada mediolateral-oblicua (MLO) y otra craneocaudal (CC). La norma es
que una lesión, zona afectada por un tumor, debe ser observada en ambas imágenes.
Aun así, la mayoría de los sistemas CAD sólo son capaces de analizar una imagen
independiente, por lo que la correlación en las características de la lesión en ambas
imágenes se ignora y el diagnóstico del cáncer puede verse afectado. De lo que tratan en
este estudio es de desarrollar un sistema capaz de explorar varias imágenes a la vez con
el fin de mejorar el proceso de diagnóstico, a través de una red bayesiana de dos pasos.
Se comparan los resultados del modelo diseñado, analizando las dos imágenes a la vez
(denominado Multiview), y del modelo simple, analizando las imágenes por separado
(denominado SV-CAD). El análisis comparativo se realiza mediante las curvas ROC
MEDICAL DECISION SUPPORT SYSTEMS
Página | 8
(Receiver Operating Characteristics) y el valor AUC (Area Under the Curve), que
pueden verse en la siguiente figura:
Fig. 1. Curvas ROC de las imágenes MLO y CC
El p-valor obtenido en el caso de imágenes MLO fue de 0.000 y 0.035 en el caso
de imágenes CC.
Hablamos por último de DDSSs basados en SVM para diagnosticar este cáncer.
Utilizamos para ello las referencias [60] y [61]. En la primera se propone un diagnóstico
basado en un método de máquinas de vectores de soporte combinado con selección de
rasgos. Los experimentos se llevaron a cabo con diferentes test de entrenamiento
mediante la base de datos WBCD. Los resultados del método se evalúan mediante la
precisión de clasificación, especificidad, sensibilidad, valores positivos y negativos
predichos, curvas ROC y matriz de confusión. Los problemas a los que tuvieron que
enfrentarse fueron: cómo elegir la función núcleo (la cual finalmente se decidió que
fuera de tipo RBF), cómo elegir el conjunto de rasgos óptimos de entrada (que, tras el
estudio, se establece en cinco de las nueve características), y cómo establecer los
mejores parámetros del núcleo. Obtienen una precisión del 99.51%, un valor muy
elevado. Con respecto a la segunda referencia, [61], el estudio se lleva a cabo utilizando
LS-SVM y de nuevo la base de datos WBCD. La principal diferencia entre LS-SVM y
SVM es que el primero utiliza un coste lineal para entrenar la máquina mientras que el
segundo utiliza uno cuadrático. La robustez del algoritmo se examina de nuevo
mediante la precisión de clasificación, el análisis de especificidad y sensibilidad,
métodos de validación cruzada del tipo k-fold (k-fold cross-validation method) con un
valor de k=10, y mediante la matriz de confusión. La precisión obtenida en este caso fue
de 98.53%, la cual es bastante prometedora. En ambos casos la especificidad,
sensibilidad y precisión del algoritmo se calcula, a partir del número de falsos positivos
(FP) y negativos (FN) y verdaderos positivos (TP) y negativos (TN), como sigue:
Página | 9
MEDICAL DECISION SUPPORT SYSTEMS
Y la matriz de confusión es la siguiente:
Valor predicho
Valor real
POSITIVO
NEGATIVO
POSITIVO
TP
FP
NEGATIVO
FN
TN
Como vemos, el cáncer de mama es una de las enfermedades que más se estudia
e investiga en el campo de los CDSSs. Existe una bibliografía muy extensa al respecto.
Aquí hemos tratado de resumir brevemente alguno de los métodos y algoritmos más
usados para tal fin.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 10
9 ENFERMEDADES CARDIOVASCULARES
Las enfermedades cardiovasculares se deben a trastornos del corazón y los vasos
sanguíneos, entre ellos las cardiopatías coronarias (ataques cardiacos), las enfermedades
cerebrovasculares (apoplejía), el aumento de la tensión arterial (hipertensión), las
vasculopatías periféricas, las cardiopatías reumáticas, las cardiopatías congénitas y la
insuficiencia cardiaca. Las estadísticas han demostrado de manera consistente que las
enfermedades cardíacas son una de las principales causas de muertes en EE.UU. [62] y
en todo el mundo [63]. Sin embargo, se pueden salvar muchas vidas si se toma
rápidamente una precisa decisión sobre el diagnóstico de pacientes que sufren distintos
tipos de enfermedades del corazón, después de lo cual se puede seguir un tratamiento
adecuado inmediatamente.
Muchos factores pueden complicar su diagnóstico, ya que es un proceso
cognitivo complejo y difuso, a menudo retrasando la decisión correcta del mismo. Por
ejemplo, los síntomas clínicos; las manifestaciones funcionales y patológicas de las
enfermedades cardíacas están asociadas con muchos otros órganos humanos aparte del
corazón, y muy a menudo las enfermedades del corazón pueden presentar diversos
síndromes. Al mismo tiempo, los diferentes tipos de enfermedades del corazón pueden
tener síntomas similares. Para reducir el tiempo de diagnóstico y mejorar la exactitud
del mismo, desarrollar potentes y fiables sistemas de apoyo a la decisión médica se ha
convertido en una cuestión demandada para apoyar el cada vez más complicado proceso
de decisión de diagnóstico.
Los métodos de soft computing, como las redes neuronales, han demostrado un
gran potencial para ser aplicados en el desarrollo de CDSSs de enfermedades del
corazón. Azuaje et al. [64] emplearon ANNs feed-forward para reconocer categorías de
riesgo de cardiopatías basándose en gráficos de Poincaré originados a partir de
electrocardiogramas de menos de diez minutos. Se ayudaron de un total de 127 sujetos
asintomáticos masculinos de mediana edad, a los cuales sometieron a un
electrocardiograma en reposo en decúbito supino a frecuencias respiratorias fijas.
Un electrocardiograma
mide la actividad eléctrica del
corazón. Esta actividad es
descrita por cinco ondas
llamadas P, Q, R, S y T (Fig.
2a). La onda P (representa la
depolarización auricular del
corazón) está seguida por el
complejo QRS (depolarización
ventricular) y la onda T
(repolarización
ventricular).
Un intervalo RR (Fig. 2b)
refleja la longitud del periodo
de tiempo entre puntas R de
dos latidos consecutivos.
Fig. 2. Construcción de un gráfico de Poincaré. (a) Complejo PQRST; (b)
Electrocardiograma con tres intervalos RR; y (c) Gráfico de Poincaré con los
intervalos.
Página | 11
MEDICAL DECISION SUPPORT SYSTEMS
El gráfico de Poincaré es un
diagrama de dispersión de un intervalo RR
del
electrocardiograma
(medido
en
milisegundos) contra el intervalo RR
inmediatamente posterior a él. Por lo tanto,
un gráfico de Poincaré da información
relativa al comportamiento instantáneo del
corazón latido a latido. La Fig. 2c ilustra la
construcción de dicho gráfico a partir de una
señal de electrocardiograma. Estos gráficos
se han usado para determinar diferencias
entre individuos sanos y otros con fallos
cardiacos. La Fig. 3 muestra dos sujetos con
diferente riesgo de enfermedad coronaria. El
patrón de la Fig. 3a pertenece a un paciente
con bajo riesgo, con una alta variabilidad de
frecuencia cardiaca y media baja de la
misma, y la Fig. 3b tendría alto riesgo,
caracterizado por una baja variabilidad y
frecuencia cardiaca elevada.
Fig. 3. Patrones de gráfico de Poincaré. (a)Paciente
con bajo riesgo; y (b) Paciente con alto riesgo.
El formato bidimensional de la
información representada por el gráfico de
Poincaré se adapta al formato de la entrada de
una ANN. Se realiza una codificación de los
datos dividiendo el gráfico en cuadros con anchura Δt ms. El número de nodos de
entrada de la red será, por tanto, el número de cuadros. En este experimento se usaron
valores de entrada binarios (Fig. 4) y Fig. 4. Generación de entradas binarias. (a) Gráfico
de Poincaré dividido en nueve cuadros con diez
analógicos, ponderando cada cuadro en
muestras; y (b) generación del vector de entrada.
función del número de muestras que contiene.
Para los experimentos, inicialmente, se utilizaron tres niveles de riesgo para el
nivel de salida de la red, a saber, high, medium y low. También se implementó una
aplicación con cinco categorías con los valores de salida very high, high, medium, low
and very low. Se fueron modificando las unidades que componían cada capa, así como
se alternó el uso de una sola capa oculta con dos. Los resultados de los casos
correctamente clasificados fueron:
Nº de entradas
High
Medium
Low
144
576
1024
4/9
5/9
6/9
6/9
5/9
3/9
4/9
3/9
1/9
Nº de entradas
Very high
High
Medium
Low
Very low
144
576
0/5
1/5
1/4
2/4
5/9
7/9
1/5
0/5
1/4
0/4
MEDICAL DECISION SUPPORT SYSTEMS
Página | 12
Este trabajo muestra la utilidad de las redes neuronales detectando riesgos de
cardiopatías en medidas de variabilidad a corto plazo de frecuencia cardiaca. Los
resultados obtenidos de estos experimentos indican que, aún basado en un conjunto de
datos relativamente pequeño, un gráfico de Poincaré codificado puede producir
resultados útiles.
Por otro lado, Tkacz et al. [65] muestran cómo las redes neuronales wavelet
(WNN) pueden ser aplicadas para diagnosticar y clasificar la enfermedad arterial
coronaria en diferentes niveles.
El procedimiento experimental desarrollado consiste en un conjunto de 89
pacientes con uno o varios bloqueos en la arteria coronaria. Se registra durante 5
minutos la señal de variabilidad de la frecuencia cardiaca (HRV) de cada uno de ellos,
los cuales han sido previamente clasificados por un experimentado cardiólogo respecto
a la estimación del número de bloqueos que tienen.
Implementan una capa adicional en la estructura de la ANN que hace el rol de
clasificador mediante la transformada wavelet (WT), para la extracción de algunos
rasgos de la señal HRV que resulten más característicos y más significativos para el
problema de clasificación, los cuales se entregan al proceso de aprendizaje.
Los métodos actuales de diagnóstico son en su mayoría invasivos, suelen
producir un alto estrés en los pacientes. Es por esto que el uso de un método como el
propuesto, no invasivo debido al uso de la HRV, resulta interesante al lograr aumentar
la precisión del diagnóstico a la vez que minimiza las molestias para el paciente.
Para el diagnóstico de cardiopatías congénitas, Reategui et al. [66] proponen un
modelo de integración de razonamiento basado en casos con ANNs. Este modelo
representa una nueva aproximación para integrar el razonamiento basado en casos
(CBR) con una red neuronal en sistemas de diagnóstico. Cuando se resuelve un nuevo
problema, la red neuronal se usa para formular hipótesis y guiar al módulo CBR en la
búsqueda de casos previos similares que den soporte a alguna hipótesis. El
conocimiento adquirido por la red se interpreta y mapea en descriptores simbólicos de
diagnosis, los cuales se guardan y los utiliza el sistema para determinar si la respuesta
final es creíble y para construir las explicaciones para el razonamiento llevado a cabo. A
diferencia de otras arquitecturas conocidas, este sistema no conserva los casos como
parte integrante de la red (Fig. 5).
Fig. 5. Arquitectura de la combinación de NN y CBR.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 13
El modelo NN-CBR se ha usado en el desarrollo de un sistema de diagnóstico de
cardiopatías congénitas (CHD). El sistema ha sido evaluado usando dos bases de datos
con un total de 214 casos CHD. Este sistema híbrido es capaz de resolver problemas
que una red neuronal con un buen nivel de precisión no puede.
Diferentes tipos de información están contenidos en cada capa de la red
neuronal:
9 Salida Æ contiene nodos que representan las diferentes hipótesis de
diagnóstico.
9 Entrada Æ contiene nodos que representan evidencias tales como síntomas,
resultados de pruebas, o cualquier otra información que mantenga la
hipótesis de diagnóstico.
9 Intermedia Æ especifica diferentes combinaciones de evidencia que pueden
conducir a una hipótesis en particular.
Los descriptores de diagnosis se crean y mantienen acorde al conocimiento
almacenado en la red neuronal, conservando una descripción inteligible del
conocimiento representado en la red y definiendo un esquema de clasificación para los
atributos observados más importantes. Este esquema de clasificación se utiliza para
consultas, para confirmar o refutar el resultado final y para construir las explicaciones.
Tsai y Watanabe [67] utilizaron el razonamiento difuso optimizado por un
algoritmo genético (GA) para la clasificación de las enfermedades de miocardio a partir
de imágenes de ultrasonidos. Su objetivo era, mediante una técnica computerizada, dar
una segunda opinión a los médicos para reducir los posibles errores derivados de la
subjetividad de los diagnósticos de los mismos y así incrementar la precisión de estos
diagnósticos. Para ello, se apoyaban en imágenes de ultrasonidos del corazón
(ecocardiográficas), importantes medios no invasivos de la cardiología clínica.
Hacían uso de funciones de pertenencia con distribución gaussiana (GDMFs),
construidas a partir de los rasgos inherentes de la textura en las imágenes de
ultrasonidos. Los coeficientes actúan como un conjunto de parámetros para ajustar la
magnitud de las desviaciones típicas de las GDMFs empleadas. Se determinan los
coeficientes óptimos a través de un proceso de entrenamiento usando el GA. El
clasificador difuso basado en GA se emplea para discriminar dos conjuntos de imágenes
ecocardiográficas, a saber, casos normales y anómalos, diagnosticados por un médico
altamente capacitado.
Los experimentos arrojaron unos resultados muy prometedores, alcanzando una
tasa media de clasificación del 96%, lo que indica que el método tiene utilidad potencial
para el diagnóstico, asistido por ordenador, de las enfermedades de miocardio.
Un sistema basado en MLP entrenado con un algoritmo BP mejorado,
desarrollado por Yan et al. [68], consigue diferenciar entre las cinco enfermedades
cardiacas más comunes que son hipertensión, enfermedad coronaria, valvulopatía
reumática, insuficiencia cardíaca derecha (chronic cor pulmonale) y cardiopatía
congénita [69].
La capa de entrada del sistema incluye 40 variables de entrada. Estas variables
se dividen en cuatro categorías: (a) información básica del paciente, incluye edad y
sexo; (b) síntomas (14 factores en total); (c) historia clínica (5 factores en total); y (d)
MEDICAL DECISION SUPPORT SYSTEMS
Página | 14
exámenes físicos y resultados de laboratorio (19 factores en total). Estas variables se
codifican utilizando los siguientes esquemas: (i) las variables numéricas, tales como la
edad y la presión, sanguínea se normalizan en el intervalo (0,1); (ii) las variables con
dos atributos independientes, como el sexo y el retorno venoso del cuello, se codifican
con valores binarios (0,1); (iii) las variables con tres atributos independientes, tales
como el soplo diastólico y las grabaciones del electrocardiograma (ECG), se codifican
usando valores ternarios (-1, 0, 1); (iv) el resto de variables son codificadas usando las
escalas ordinales de tres valores, con -1 representando la ausencia de atributo, 1 la
presencia más grande, y 0.5 el nivel intermedio de las variables. El número de nodos en
la capa oculta se determina a través de un proceso de aprendizaje en cascada. Cada uno
de los 5 nodos en la capa de salida corresponde a una de las enfermedades del corazón
de interés.
En el sistema, los datos que faltan de un paciente se manejan mediante el método
de imputación de la media. Además, se utiliza un algoritmo mejorado de
retropropagación para entrenar el sistema. Un total de 352 historias clínicas recogidas
de pacientes que sufren alguna de las cinco enfermedades se utilizan para entrenar y
probar el sistema. En particular, tres métodos de evaluación, validación cruzada,
validación holdout y bootstraping, se aplican para evaluar la generalización del sistema.
Los resultados muestran que el sistema de apoyo a la decisión basado en MLP
propuesto puede lograr un diagnóstico con una precisión muy alta (> 90%)
demostrando su utilidad en el soporte del proceso de decisión clínica de las
enfermedades del corazón.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 15
9 ENFERMEDADES TIROIDEAS
La tiroides es una glándula pequeña en forma de mariposa, localizada justo por
debajo de la nuez. Esta glándula tiene un papel muy importante, ya que controla el
metabolismo del organismo, o lo que es lo mismo, la velocidad a la que el organismo
utiliza la energía. Esto lo realiza a través de la síntesis de hormonas tiroideas
(principalmente tiroxina (T4) y triiodotironina, (T3)), que viajan a través del torrente
sanguíneo a todas las partes del organismo. Estas hormonas tiroideas ordenan a las
células del organismo la velocidad a la que deben utilizar la energía y sintetizar
proteínas. Además, la glándula tiroides también sintetiza calcitonina, una hormona que
contribuye a la regulación de los niveles de calcio en sangre
inhibiendo la reabsorción ósea y aumentando la excreción de calcio a través de los
riñones. Las enfermedades tiroideas básicamente son trastornos que afectan a la
cantidad de hormonas tiroideas producidas. En algunos casos, la síntesis es insuficiente,
conduciendo al hipotiroidismo y a un enlentecimiento del ritmo de las funciones del
organismo, apareciendo síntomas como aumento de peso, sequedad de piel,
estreñimiento, intolerancia al frío, inflamación general, pérdida de pelo, fatiga,
y períodos menstruales irregulares (en las mujeres). La forma más grave de
hipotiroidismo, conocida como mixedema, puede conducir a insuficiencia cardíaca,
convulsiones y coma. En los niños, el hipotiroidismo puede provocar un retraso del
crecimiento y del desarrollo sexual normal, así como retraso mental. Al existir un
tratamiento eficaz, su detección precoz minimiza posibles complicaciones, y es por ello
por lo que es una de las enfermedades que forma parte de las pruebas de cribado
neonatal.
El enfoque convencional para construir un sistema experto requería de la
formulación de normas por las que los datos de entrada pudieran ser analizados. La
formulación de tales reglas era muy difícil con grandes conjuntos de datos de entrada.
Ante esta dificultad, se han aplicado ANNs como una alternativa al sistema
convencional de sistemas expertos basados en reglas.
Sharpe et al. [70] estudiaron los beneficios potenciales del uso de ANNs para el
diagnóstico de las afecciones tiroideas. Los datos que utilizaron contenían 392 casos
que se clasificaron de acuerdo a la función tiroidea y a 19 categorías clínicas
(hipotiroidismo primario, enfermedad de Graves, adenoma tóxico, bocio nodular
tóxico,…). Todos los casos presentan un conjunto completo de resultados de seis
ensayos de laboratorio (tiroxina total, tiroxina libre, triyodotironina, la prueba de
captación de triyodotironina, tirotropina y la globulina fijadora de tiroxina). Este
conjunto de datos se dividió en subconjuntos utilizados para la formación de las redes y
para las pruebas de su rendimiento; las pruebas de subconjuntos contenían diversas
proporciones de casos con diagnóstico ruidoso para imitar situaciones de diagnóstico de
la vida real. Utilizaron un MLP diseñada con dos algoritmos de aprendizaje, a saber,
backpropagation y cuantificación de aprendizaje, para la clasificación funcional de las
enfermedades de la tiroides (hipotiroidismo, eutiroidismo e hipertiroidismo). La
correcta asignación de los casos en sus subconjuntos de datos de prueba fue 96.499.7%.
Otro estudio posterior [71] se ocupo de una clasificación más simplista de estas
enfermedades, pero su principal propósito era estudiar cuán robusto es el rendimiento de
los MLP en la predicción de enfermedades tiroideas en términos de variabilidad de la
muestra. Su clasificación trataba de determinar si un paciente tiene un funcionamiento
MEDICAL DECISION SUPPORT SYSTEMS
Página | 16
normal de la tiroides, un funcionamiento mermado de la tiroides (hipotiroidismo) o una
tiroides más activa de lo normal (hipertiroidismo). El conjunto de datos utilizado tenía
7200 casos, con 3772 como muestra de entrenamiento y 3428 casos de prueba. La clase
hipertiroidismo representaba el 2,3% (166 casos) de los datos, la clase hipotiroidismo el
5,1% (368 casos) de las observaciones, mientras que el grupo normal el restante 92,6%
(6.666 casos). Este conjunto de datos altamente desequilibrado resultaba un problema
muy difícil para los métodos de clasificación tradicionales. Para cada uno de los 7200
casos, tenían 21 atributos, 15 binarios y 6 continuos, utilizados para determinar a cuál
de las tres clases pertenecía el paciente, y que formaban los nodos de entrada a la red.
Estos atributos representaban información sobre los pacientes tales como edad, sexo,
condición de salud, y los resultados de varios exámenes médicos. Se usaban tres nodos
de salida binaria, correspondientes a las tres clases (normal, hipotiroidismo,
hipertiroidismo). Se probó un número variable de capas ocultas, encontrando que el uso
de 10 nodos ocultos proporcionaba los mejores resultados para el conjunto de muestras
de prueba en términos de MSE y de acierto de clasificación. Se utilizó un algoritmo de
entrenamiento más eficiente que el algoritmo típico de backpropagation, un método de
entrenamiento más rápido llamado RPROP (Resilient backPROPagation,
retropropagación con resiliencia). El principio básico del algoritmo es eliminar el efecto
nocivo de la magnitud de la derivada parcial en el tamaño de paso de cada peso y por lo
tanto, ofrecer una búsqueda de la solución más eficiente. Encontraron que el algoritmo
RPROP converge entre 100 y 500 iteraciones en cuestión de segundos mientras que el
de backpropagation necesita de 6000 a 70000 iteraciones y varias horas de ejecución.
Los resultados daban un tasa de clasificación total correcta del 98.16% haciendo uso de
este método.
Erol et al. [72] realizaron un estudio que investigaba un MLP y una RBFNN y su
utilidad para la clasificación estructural de las enfermedades tiroideas. Se utilizó un
conjunto de datos de 487 pacientes con enfermedad de la tiroides para crear, entrenar y
probar las redes neuronales correspondientes. Se realizaron a cada uno de los pacientes
medidas séricas de T4, T3 y TSH (hormona estimulante de la tiroides) como pruebas
funcionales y USG tiroidea (ultrasonografía) como ensayo estructural. La clasificación
estructural de este conjunto de datos (entre estos rasgos: dos lóbulos normales, multinodular, uni-nodular, lóbulos ampliados y difusos, lóbulos pequeños) se realizó por
medio de dos médicos expertos y los resultados se introdujeron en las redes neuronales.
Los resultados experimentales mostraron que las predicciones de ambos modelos de
redes neuronales eran muy satisfactorias para el aprendizaje de los conjuntos de datos.
En cuanto a los datos de evaluación, el modelo RBFNN superaba al correspondiente
modelo MLP. Este estudio demostraba la utilidad de un modelo ANN para la
clasificación estructural de las enfermedades de la tiroides.
Un estudio muy reciente [73] utiliza un método denominado sistema automático
de diagnosis basado en la glándula tiroidea (ADSTG, Automatic Diagnosis System
based on Thyroid Gland). El conjunto de datos del que hace uso contiene, entre otras,
las siguientes variables: tiroxina sérica total medida por el método de desplazamiento
isotópico, prueba de captación de resina T3, triyodotironina sérica total medida por
radioinmunoanálisis, TSH basal, etc. Este sistema automático incluye tres etapas:
Página | 17
MEDICAL DECISION SUPPORT SYSTEMS
1.
Reducción de rasgos.
Se utiliza el Análisis de Componentes Principales (PCA) para sintetizar
la información, reduciendo la dimensión (número de variables) con el
requisito de perder la menor cantidad de información posible.
Glándula tiroidea
Reducción de datos
Conjunto de datos
PCA
Clasificación
Clasificador LS-SVM con
parámetros óptimos
Evaluación de
rendimiento
Espacio de decisión
k-fold Cross Validation
Method
1. Función hiper
2. Función hipo
3. Función normal
Fig. 6. Diagrama de bloques del método ADSTG.
2.
Clasificación.
El clasificador LS-SVM tiene como objetivo principal encontrar un
hiperplano óptimo que separe tres tipos de diagnósticos sobre el
funcionamiento de la tiroides (normal, hipotiroidismo y hipertiroidismo)
usando la distancia euclídea al punto más cercano. Tiene dos parámetros de
ajuste que son la anchura de los núcleos gaussianos (σ) y el factor de
regularización (C), optimizados para el método ADSTG.
3.
Evaluación del funcionamiento.
La evaluación del método se realiza a través de la precisión que logra en
la clasificación de los datos en las distintas categorías de diagnosis. Para
ello, se utiliza el método k-fold cross-validation que minimiza el sesgo
asociado a la toma de muestras al azar para el entrenamiento. Para lograr
este objetivo, en primer lugar, todos los datos se divide aleatoriamente en k
subconjuntos mutuamente excluyentes y de aproximadamente el mismo
tamaño. El algoritmo de clasificación entrenado es probado k veces. Uno de
los subconjuntos se toma como datos de prueba y las restantes se suman
para formar los datos de entrenamiento, en cada caso. Por lo que existen k
diferentes resultados de las pruebas para cada configuración entrenamientotest. El promedio de estos resultados da las prestaciones del algoritmo. Este
método es usado con un valor de k=10.
El método ADSTG propuesto obtuvo una precisión de clasificación el
diagnóstico de enfermedades de la tiroides de un 93,77%.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 18
9 PARKINSON
La enfermedad de Parkinson (PD) es un trastorno neurodegenerativo de carácter
progresivo. Se produce por la degeneración celular de la sustancia negra del
mesencéfalo y la disfunción de los circuitos neuronales relacionados con el control de
los movimientos corporales. Los síntomas más típicos de la enfermedad son la
bradicinesia (lentitud de los movimientos voluntarios), acinesia (ausencia de
movimiento), la rigidez muscular y el temblor, si bien suelen coexistir otros síntomas
tanto sensitivos como vegetativos, cognitivos y afectivos. Es un trastorno propio de
personas de edad avanzada, aunque existen formas de inicio juvenil. Aproximadamente
un 1% de la población de más de 55 años se ve afectada por esta enfermedad.
Se trata de una enfermedad que no tiene cura, pero existen medicamentos que
producen un alivio significativo de los síntomas, especialmente si se administra en
etapas tempranas de la enfermedad. De ahí la importancia, una vez más, de un rápido
diagnóstico.
Existen diversos estudios sobre sistemas automáticos o semi-automáticos para el
diagnóstico de la enfermedad, basado en síntomas y métodos muy diferentes.
Comentamos a continuación alguno de ellos.
Las imágenes [123I]-FP-CIT constituyen un método relativamente reciente de
diagnóstico. Se inyecta una sustancia de trazado por vía intravenosa y se viaja hasta el
cerebro por medio de la circulación sanguínea. Allí, transcurridas unas tres horas, se
produce un equilibrio entre receptores libres y ligados. Es entonces cuando se toman
imágenes tridimensionales del cerebro por medio de una cámara gamma. La unión de la
sustancia de trazado en los ganglios basales y otras áreas del cerebro se evalúa,
habitualmente, de forma manual. El principal objetivo de [74] es, por un lado, elaborar
un método automático de cuantificación y clasificación de imágenes [123I]-FP-CIT y,
por otro, comparar la precisión de dicho método con el habitual, es decir, el manual. El
estudio se realiza utilizando una base de datos de 89 pacientes que se encontraban en
proceso de diagnóstico de la enfermedad por presentar algún síntoma de la misma. La
edad media de los pacientes es de 68 años. El método de cuantificación y clasificación
de las imágenes está constituido por tres pasos: segmentación de las imágenes en las
regiones de interés, extracción de rasgos de dichas regiones y, finalmente, la
clasificación de las imágenes. Los rasgos más importantes extraídos por el método son
la intensidad media de los núcleos caudados (caudate nucleus) izquierdo y derecho y
del putamen. La principal razón de dicha elección es que, durante la enfermedad, se
observa una pérdida gradual de receptores, primero en el putamen y después en los
núcleos caudados, con un gradiente anterior-posterior considerable. Para la clasificación
se utilizan SVMs ya que la distribución subyacente es desconocida. En el estudio se
prueba con tres diferentes núcleos para las SVM, un núcleo polinómico de grado 3, un
núcleo gaussiano y un núcleo lineal, dando los tres resultados satisfactorios.
Pero existen otros métodos de diagnóstico de esta enfermedad que están basados
en otros síntomas. Como ejemplo mencionaremos [75], en donde se realiza una
comparación entre varios métodos de diagnóstico basados en las disfunciones en el
habla causadas por la enfermedad. Disfonía es un término muy amplio que designa todo
trastorno de la voz cuando se altera la calidad de ésta en cualquier grado exceptuando el
total, en cuyo caso se denomina afonía. Es uno de los síntomas de PD. Muchos de los
métodos utilizados actualmente para evaluar la enfermedad de Parkinson se basan
generalmente en la experiencia humana. Existen, en la literatura de la enfermedad,
MEDICAL DECISION SUPPORT SYSTEMS
Página | 19
muchos estudios sobre la medición del habla. Se registra la voz utilizando un
micrófono, y las señales son posteriormente analizadas mediante métodos de medición
diseñados para detectar ciertas propiedades de la voz. En el caso que nos ocupa, el
estudio se realiza utilizando una base de datos que contiene rasgos de personas sanas y
enfermas. Se compone de 23 columnas y 197 filas, que contienen medidas biomédicas
de la voz. El principal objetivo es distinguir las señales pertenecientes a personas sanas
de las de los pacientes afectados por la enfermedad. Para implementar el algoritmo se
utilizaron cuatro clasificadores diferentes: regresión (concretamente LogR), una ANN,
una red DMNeural (utilizada para fijar un modelo no-lineal aditivo que usa
componentes principales como entradas para predecir una variable objetivo binaria o de
intervalo) y un árbol de decisión. La red neuronal es un MLP, con algoritmo de
aprendizaje backpropagation, una única capa oculta con 10 neuronas y una sigmoide
como función de transferencia para las capas oculta y de salida.
Fig. 7. Métodos aplicados para el diagnóstico de PD
El clasificador neuronal fue el que obtuvo los mejores resultados, con un 92.9%
de precisión de clasificación; seguido por la regresión logística con un 88.6%.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 20
9 LEUCEMIA
La leucemia o leucosis es un grupo de enfermedades malignas de la médula
ósea, caracterizadas por un aumento anormal de células sanguíneas. Leucemia es un
término que cubre un amplio espectro de enfermedades. Según el tipo celular
proliferado, las leucemias serán granulocíticas, linfocíticas o monocíticas, y según el
predominio de afección (si es medular o linfático) se clasificarán en mieloides o
linfoides. También según la evolución y grado de madurez celular se dividirán en
agudas (células muy jóvenes) o crónicas (células más diferenciadas).
Existen diversos estudios que hacen uso de los DSSs para facilitar la diagnosis y
la clasificación de los distintos tipos de leucemias. Entre ellos, encontramos un ejemplo
de la utilización de un sistema de apoyo a expertos en el diagnóstico de pacientes con
leucemia [76]. El modelo propuesto integra varios algoritmos cooperativos
caracterizados por su eficiencia para el procesamiento de datos, filtrado, clasificación y
extracción de conocimiento a partir de matrices exón. Dichas matrices son superficies
sólidas a las cuales se unen una serie de exones (regiones de un gen que no son
separadas durante el proceso de splicing y, por tanto, se mantienen en el ácido
ribonucleico mensajero maduro) y se utilizan para averiguar la expresión de genes,
monitorizándose los niveles de miles de ellos de forma simultánea.
El proceso de discriminar entre las patologías que implican la sangre periférica,
médula ósea y ganglios linfáticos comienza tradicionalmente con una evaluación
morfológica subjetiva de los materiales celulares vistos mediante microscopio de luz.
Las sutiles diferencias visibles exhibidas por algunos linfomas malignos y la leucemia,
sin embargo, dan lugar a un importante número de falsos negativos durante la
evaluación microscópica por técnicos médicos. Foran et al. [77] han desarrollado un
prototipo de un sistema distribuido de apoyo a la decisión clínica para diferenciar entre
neoplasias hematológicas. El sistema consta de dos componentes principales, un sistema
telemicroscópico distribuido y un repositorio inteligente de imágenes. El sistema
híbrido permite a los individuos situados en diferentes lugares de investigación clínica
llevar a cabo consultas interactivas y obtener soporte de decisiones asistido por
computadora. El sistema sugiere el diagnóstico más probable basado en la mayoría
lógica de los disponibles y se utilizó para discriminar entre los tres trastornos
linfoproliferativos y las células sanas. El sistema proporcionó la clasificación correcta
en más del 83% de los casos estudiados.
La leucemia linfoblástica aguda (LLA) es la neoplasia maligna más frecuente en
la infancia, lo que representa casi un tercio de todos los cánceres pediátricos. En la
actualidad, el tratamiento de la LLA pediátrica se centra en adaptar la intensidad de la
terapia aplicada a un riesgo de recaída del paciente, que está relacionado con el tipo de
leucemia que tiene el paciente. Por lo tanto, el diagnóstico preciso y correcto de los
subtipos de leucemia diferentes se convierte en un importante primer paso en el proceso
de tratamiento. Tung et al. [78] proponen la utilización de una red neuronal difusa autoorganizativa con inferencia difusa para la clasificación de todos los subtipos utilizando
datos de expresión génica. La tasa de acierto en la clasificación se encuentra por encima
del 90%.
Varios estudios demuestran que la clasificación del cáncer se puede realizar con
gran precisión, sensibilidad y especificidad a través de microarrays basados en la
expresión génica de perfiles usando ANNs. Huang et al. [79] llevaron a cabo un amplio
estudio para investigar la capacidad de las redes neuronales probabilísticas (PNN)
MEDICAL DECISION SUPPORT SYSTEMS
Página | 21
asociadas a un método de selección de rasgos (un estadístico de señal a ruido) en la
aplicación de la clasificación del cáncer. El estadístico de señal a ruido, el cual
representa la correlación con el prototipo de clase, se utiliza para seleccionar los
marcadores genéticos y ajustar la dimensión de las muestras de datos para el PNN. Los
resultados experimentales muestran que la asociación de la red neuronal probabilística
con el estadístico de señal a ruido puede conseguir mejores resultados de clasificación
para dos tipos de leucemias agudas y cinco categorías de tumores embrionarios del
sistema nervioso central con una velocidad de cómputo satisfactoria. Además, el
análisis del estadístico señal a ruido proporciona genes candidatos para estudios futuros
para entender el proceso de la enfermedad y la identificación de posibles objetivos para
la intervención terapéutica.
A pesar de varias recomendaciones para la normalización de la citometría
(análisis de las características de células) de flujo multiparamétrica (MFC); el número,
la especificidad y las combinaciones de los reactivos utilizados por los laboratorios para
la diagnosis y clasificación de las leucemias agudas son todavía muy diversos. Por otra
parte, la actual interpretación diagnóstica de las lecturas de la citometría de flujo se ve
influenciada de forma arbitraria por la experiencia individual y el conocimiento. Ratei et
al. [80] analizaron muestras de médula ósea de 155 pacientes, de los cuales 79 tenían
leucemia mieloide aguda, 29 leucemia linfoblástica con precursor de células B, 12
leucemia linfoblástica aguda con precursor de células T y 35 no tenían enfermedad. Se
compararon los resultados de un panel de exploración de mínimo cuatro colores e
inmunofenotipaje de MFC con el diagnóstico real, utilizando análisis discriminante. El
objetivo primero de dicho análisis era encontrar las dimensiones en las que los grupos
mencionados eran diferentes, además de definir la especificidad. Se logró una
clasificación correcta de las muestras en el 97,2% de los casos. Esto demostraba que el
análisis de la función discriminante se puede utilizar como un DSS para la
interpretación de lecturas de citometría de flujo.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 22
9 ALZHEIMER
La enfermedad de Alzheimer (AD), también denominada mal de Alzheimer, o
demencia senil de tipo Alzheimer, es una enfermedad neurodegenerativa que se
manifiesta como deterioro cognitivo y trastornos conductuales. Se caracteriza en su
forma típica por una pérdida progresiva de la memoria y de otras capacidades mentales,
a medida que las células nerviosas (neuronas) mueren y diferentes zonas del cerebro se
atrofian. La enfermedad suele tener una duración media aproximada después del
diagnóstico de 10 años, aunque esto puede variar en proporción directa con la severidad
de la enfermedad en el momento del diagnóstico.
Las técnicas de imagen aplicadas al cerebro, tales como imágenes PET y
SPECT, se usan comúnmente como herramienta de diagnóstico de AD. Ambas técnicas
son de tipo no invasivo y ofrecen imágenes tridimensionales de ciertas zonas del
cuerpo. Son estas técnicas los que se utilizan en [81] para desarrollar un sistema CAD
completo con la finalidad de diagnosticar el Alzheimer. Para ello se utilizan
clasificadores SVM basados en imágenes PET y SPECT de la región cerebral. Para
llevar a cabo la extracción de rasgos se construye en primer lugar una máscara binaria
que selecciona los voxels de interés y descarta el resto. Esta tarea se realiza tomando los
voxels cuyo promedio de intensidad supere el 50% del valor máximo. Después se aplica
dicha máscara a las imágenes originales de forma que las zonas irrelevantes quedan
descartadas. La imagen cerebral obtenida en dicho proceso se divide en componentes
que serán los vectores de entrada del SVM. Estas componentes o regiones son
denominadas regiones de interés (ROI). Cada componente será utilizada para entrenar
un clasificador individual que emitirá un valor sobre el estado del paciente. La decisión
final será tomada según los componentes más relevantes de mayor valor. En la figura
siguiente se muestra un esquema general del proceso de clasificación.
Fig. 8. Esquema general del clasificador SVM mediante imágenes PET y SPECT
MEDICAL DECISION SUPPORT SYSTEMS
Página | 23
Los mismos autores del estudio anterior tratan de mejorar en [82] la precisión
del sistema de diagnóstico implementado combinando los SVM con árboles de
clasificación y núcleos lineales. Para ello utilizan un conjunto de 79 imágenes SPECT
tomadas con una cámara gamma. Tras realizar primero los mismos pasos que en el caso
anterior, aplicar una máscara binaria y separar en componentes la imagen, se construye
un árbol de clasificación que indicará qué secuencia de componentes es óptima para la
tarea de clasificación. Este sistema se puede ver también como un procedimiento para
seleccionar ROIs de manera automática. Utilizando árboles de clasificación obtienen un
90% de precisión frente al 84% conseguido sólo con las SVM.
Otro ejemplo, esta vez usando ANNs, es [83], donde se procesan señales
relacionadas con los movimientos de las manos como respuesta a una estimulación
magnética transcraneal (TMS) medidas con un electromiógrafo. Primero se realiza un
análisis tiempo-frecuencia con el objetivo de identificar las variables principales de las
señales que caracterizan ciertas enfermedades mentales, entre ellas el Alzheimer. Estas
variables se procesan después mediante una ANN para clasificar la respuesta y dar un
diagnóstico. Las variables que tenían una baja correlación cruzada entre los valores
tomados antes y después de la estimulación en pacientes enfermos de demencia y que
muestran una alta correlación para personas sanas fueron las siguientes: latencia,
amplitud, módulo máximo y mínimo de la FFT, módulo mínimo de la trasnformada
Hilbert y máxima correlación cruzada de la transformada Wavelet. La diferencia entre
los valores de estas variables con respecto al mismo ISI (Inter-Stimulus time Interval)
antes y después de la estimulación repetitiva se dan como entradas a un MLP que consta
de seis entradas y dos salidas. Se comprueba que una capa oculta de 20 neuronas es
suficiente para generalizar a partir de los ejemplos aprendidos. Las neuronas de salida
clasifican los casos según las cuatro clases siguientes: sin enfermedad, Alzheimer,
demencia mixta y demencia vascular subcortical isquémica (SIVD). El método
desarrollado es comparado finalmente con uno basado en lógica difusa, arrojando los
siguientes resultados:
Patología
Ninguna
Alzheimer
SIVD
Demencia mixta
Precisión
MLP
90%
92.7%
95%
87%
Lógica difusa
90%
92.5%
92.5%
90%
El último ejemplo que vamos a comentar sobre esta enfermedad es [84], donde
se desarrolla un sistema de detección temprana del Alzheimer mediante imágenes
SPECT pero basado en un modelo de regresión de mínimos cuadrados parciales (PLS) y
un predictor de tipo random forest (RF). Los resultados experimentales muestran que el
sistema combinado PLS-RF obtiene un error de generalización que converge a un cierto
valor (0.05) a medida que se incrementa el número de árboles del RF. Los resultados se
comparan con un análisis de componentes principales en cuyo caso el valor al que
converge el error de generalización es mayor (0.15)
MEDICAL DECISION SUPPORT SYSTEMS
Página | 24
9 CÁNCER DE PRÓSTATA
El cáncer de próstata es el que se desarrolla en uno de los órganos glandulares
del sistema reproductor masculino llamado próstata. Su detección se lleva a cabo
principalmente por la detección del PSA (Prostatic Specific Antigen) en la sangre. El
PSA es una sustancia proteica sintetizada por las células de la próstata y su función es la
disolución del coágulo seminal. Es una proteína de síntesis exclusiva en la próstata. Una
pequeñísima parte de este PSA pasa a la circulación sanguínea de los hombres enfermos
y es precisamente eso lo que se mide para el diagnóstico, pronóstico y seguimiento.
Pero el PSA es un marcador tumoral imperfecto por su escasa sensibilidad (35% de
falsos negativos) y por su falta de especificidad, ya que sus niveles pueden verse
afectados por muchos factores.
Existen estudios sobre el diagnóstico del cáncer de próstata mediante métodos
basados en ANNs, más concretamente mediante MLP, y regresión logística (LogR), que
reducen significativamente el porcentaje de falsos negativos [85]. También se han
desarrollado métodos basados en redes bayesianas causales para el diagnóstico de este
tipo de cáncer. Es el caso del departamento de Inteligencia Artificial de la Universidad
Nacional de Educación a Distancia de Madrid [86]. Han desarrollado una herramienta
que ayuda al médico, especialmente de medicina general, a realizar un diagnóstico
diferencial entre las posibles enfermedades de la próstata basado en sus probabilidades,
ya que los síntomas del cáncer de próstata son muy parecidos a los de la hiperplasia
prostática benigna (HPB) o de otros problemas de la misma, por lo que es fácil
confundirlos. Para ello han construido un grafo cuyo primer nodo es el diagnóstico de
cáncer de próstata y a partir de él comienzan a identificarse los factores de riesgo,
signos, síntomas y pruebas directamente relacionadas con la enfermedad, además de
otras enfermedades que podrían dar lugar a confusión con el cáncer. De forma que la
red evoluciona desde un modelo sólo cualitativo (grafo de la red) hasta un modelo más
refinado tras discretizar variables, analizar el impacto de los hallazgos, refinar
probabilidades, etc.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 25
9 CÁNCER DE CUELLO DE ÚTERO
El cáncer cervical o carcinoma del cuello uterino incluye las neoplasias malignas
que se desarrollan en la porción fibromuscular inferior del útero. Se trata del segundo
tipo de cáncer más común en mujeres, y en países en vías de desarrollo es el más
frecuente, diagnosticándose más de 400.000 casos nuevos cada año.
Un cáncer cervical incipiente rara vez muestra síntomas, por lo que es
fundamental la realización sistemática (anual) de la prueba Papanicolaou. Sin embargo,
se estima que un tercio de las mujeres que mueren de esta enfermedad lo hacen porque
no se detectó con precisión y en una fase lo suficientemente temprana para un
tratamiento exitoso. Una explicación a esto es que la prueba Papanicolaou produce un
alto porcentaje de falsos negativos. Esto puede ser debido a que, aunque un frotis
registra entre 50.000 y 300.000 células, el indicativo de un cáncer de cuello de útero
puede estar limitado a 12 células o menos, y la identificación de estas células en medio
de unos cuantos miles es una tarea complicada.
Con el fin de mejorar el diagnóstico de esta enfermedad se han estudiado y
desarrollado métodos con ANNs, utilizando principalmente MLP entrenados con
retropropagación [85]. Es el caso del sistema PAPNET que utiliza una arquitectura de
dos niveles con diferentes grados de resolución de clasificación inicial y final. El
primer nivel filtra los residuos y otros segmentos de la imagen no deseados, mientras
que el segundo emplea redes especializadas para identificación de células únicas y la
clasificación.
En [87] se presenta otra ANN para la clasificación de células cancerígenas del
cuello uterino, obtenidas a partir del test Papanicolaou, pero basándose esta vez en
MMRBF (Median M-type Radial Basis Function). El epitelio escamoso se compone de
4 capas de células: las células basales, parabasales, intermedias y superficiales. La
neoplasia intraepitelial cervical (CIN), también conocida como displasia, tiene el
potencial de convertirse en cáncer cervical invasivo. La displasia se clasifica en tres
fases de severidad, CIN 1 (displasia leve), CIN 2 (displasia moderada) y CIN 3
(displasia grave). En un análisis microscópico de la prueba de Papanicolaou, las células
del cuello uterino se pueden dividir en varias categorías clasificadas por la apariencia de
las células, especialmente en el núcleo celular. El núcleo de una célula puede presentar
cambios significativos cuando la célula se ve afectada por una enfermedad, por lo que la
identificación y cuantificación de estos cambios contribuyen en la discriminación de las
células normales y anormales en dicha prueba. Para entrenar las redes y obtener los
parámetros adecuados, se utilizaron 78 imágenes de células del cuello uterino: 25
normales, 3 CIN 1 (displasia leve), 25 CIN 2 (displasia moderada), 20 CIN 3 (displasia
grave), y 5 con CIS (carcinoma-in-situ) con enfermedad invasiva. Los pasos que se
realizan para segmentar la imagen son los siguientes: a) leer la imagen; b) detectar toda
la célula, mediante el uso de una máscara de gradiente binario se detectan los bordes de
la imagen; c) dilatar la imagen, para eliminar las brechas en las líneas que la rodean; d)
cubrir huecos interiores; e) eliminar objetos conectados en la frontera; y f) suavizar la
célula, con el fin de hacer que la célula segmentada posea un aspecto natural. Después
de la segmentación se procede a la extracción de rasgos. Los parámetros numéricos
obtenidos en este caso son: área, perímetro y circularidad del núcleo y del citoplasma,
relación entre ambas áreas y valores máximo y mínimo de claridad o luminosidad del
núcleo. Se obtuvo una tasa de error del 23% para el conjunto CIN3, 83% de sensibilidad
y un 100% de especificidad.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 26
9 CÁNCER DE PULMÓN
El cáncer de pulmón es una de las enfermedades más graves y uno de los
cánceres con mayor incidencia en el ser humano, responsable de los mayores índices de
mortalidad oncológica a nivel mundial. Es la primera causa de mortalidad por cáncer en
el varón y la tercera, después del de colon y mama, en la mujer.
El diagnóstico temprano del cáncer de pulmón es el principal condicionante para
el éxito en su tratamiento. En estadios tempranos, el cáncer de pulmón puede, en
alrededor del 20% de los casos, ser tratado mediante resección quirúrgica con éxito de
curación. Sin embargo, debido a su virulencia y a la dificultad para su detección precoz,
en la mayoría de los casos de diagnóstico donde ya existe metástasis, el cáncer de
pulmón presenta, junto con el cáncer de hígado, páncreas y esófago, los peores
pronósticos, con una esperanza de vida promedio de aproximadamente 8 meses.
La mayor parte de los CDSS desarrollados para esta enfermedad son DSS que
utilizan interpretación automática de imágenes.
En [88] se utilizan SVMs para diagnosticar tumores en la zona pulmonar
mediante imágenes PET/CT. La tomografía por emisión de positrones (PET) es una
moderna técnica en medicina nuclear para medir y cuantificar procesos bioquímicos de
manera no invasiva. En este caso utilizan el isótopo F-18, con una vida media de 110
minutos. La imagen PET muestra el metabolismo de la sustancia de trazado utilizada,
FDG. Las zonas con tumor pueden ser detectadas en este caso porque tienen un
consumo de la sustancia de trazado mayor en comparación con las zonas normales, sin
tumor. A las zonas sospechosas de tratarse de tumores se les denomina hot spots.
Algunos de los rasgos que se examinan y clasifican en este caso mediante la SVM son
el número total de hot spots encontrados, volumen del mayor hot spot, valor del SUV
del hot spot con mayor intensidad media, etc. La mejor tasa de clasificación obtenida
fue de 95.2%.
También encontramos una ANN para mejorar la exactitud con la que se detecta
el estado de los ganglios en el cáncer pulmonar de células no-pequeñas, NSCLC, en
[89], por medio de imágenes F-18 FDG-PET. En este caso utilizan un MLP con un
algoritmo de retropropagación formado por tres capas. La salida de la red será el estado
quirúrgico patológico de los nodos. Como parámetros de entrada utilizaron el tamaño
en centímetros del tumor primario, el valor del SUV máximo de dicho tumor y el valor
del SUV máximo corregido (PVCmaxSUV). La ANN predijo correctamente el 87.3%
de los casos.
Otros trabajos que podemos encontrar relacionados con el tema son Host et al.
[90], que describe métodos para la interpretación automática grammagramas
pulmonares, Ericsson et al. [91], utiliza SVMs para la interpretación automática de
imágenes para el diagnóstico. Otros estudios consiguen detectar automáticamente
posibles tumores en imágenes PET/CT y realizar un diagnóstico para el cáncer de
pulmón con la ayuda de máquinas de aprendizaje, concretamente ANNs y SVM [92]. El
mejor resultado obtenido fue una curva ROC con un 89% de área, obtenida para una
ANN con siete rasgos y dos clases de salida, presencia y ausencia de cáncer.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 27
9 CÁNCER DE RIÑÓN
Aunque el cáncer de riñón supone sólo el 3% del total de todos los casos de
cáncer, su tasa de supervivencia continua siendo muy baja. Aun así, es cada vez más
frecuente, sobre todo en los países desarrollados, que la detección de las masas
tumorales en el riñón se realice en una fase más temprana que antes. Esto es debido en
gran parte a los avances tecnológicos relativamente recientes en el uso de técnicas de
imagen. A la vez, se está generando una gran cantidad de información al respecto, por lo
que la necesidad de mejorar los métodos de análisis de datos está creciendo, así como la
creación de nuevas formas de presentar los datos para que la información resulte más
útil.
Uno de los objetivos más importantes de las investigaciones relacionadas con
este campo es proporcionar a los médicos una herramienta que les ayude a decidir si se
debe operar a un paciente de inmediato o no. Para los enfermos de cáncer de riñón esta
decisión es muy importante, ya que las personas que pierden sus funciones renales
necesitan diálisis de por vida.
En [93] han trabajado en el diseño de un CDSS que pueda ayudar a los médicos
en el complejo proceso del diagnóstico y en las complicadas decisiones que se deben
tomar cuando se está tratando con pacientes de cáncer de riñón. Se centran en los casos
en los que la herramienta a utilizar son imágenes CT. En este proceso, la identificación
de rasgos es crucial. Para ello se utiliza, entre otras técnicas, un clasificador bayesiano
para cuantificar el grado en que una región se asemeja a una función de interés,
basándose en un subconjunto de propiedades generales de dicha región. El clasificador
fue diseñado en términos de las siguientes características de la región: su área, el valor
máximo de gris, el valor medio de gris y una relación denominada “elongatedness” que
se define como la relación entre la longitud y la anchura del rectángulo mínimo de la
región. Los autores comentan en el artículo que el clasificador arrojó buenos resultados
y, aunque no aportan datos numéricos que lo corroboren, en la siguiente figura se puede
apreciar la identificación automática de las costillas en una imagen CT:
Fig. 9. Identificación automática de las costillas en una imagen abdominal CT utilizando el algoritmo
diseñado
MEDICAL DECISION SUPPORT SYSTEMS
Página | 28
9 HEPATITIS
La hepatitis es una afección o enfermedad inflamatoria que afecta al hígado. Su
causa puede ser infecciosa (viral, bacteriana, etc.), inmunológica (por autoanticuerpos) o
tóxica (por ejemplo por alcohol, venenos o fármacos). También es considerada,
dependiendo de su etiología, una enfermedad de transmisión sexual.
Hay virus específicos para la hepatitis (virus hepatotropos), es decir, aquéllos
que sólo provocan hepatitis. Existen muchos: virus A, B, C, D, E, F, G, dando lugar
cada uno a un tipo de hepatitis. Los más importantes son los virus A, B, C y, en menor
medida, el D y el E, siendo los últimos, F y G, los menos estudiados.
Al igual que en los casos anteriores, existen
múltiples algoritmos de clasificación empleados
para desarrollar sistemas de diagnóstico automático
para esta enfermedad, enfocados a la hepatitis en
global, o enfocado más concretamente en alguno
sus seis tipos conocidos. En [94] se desarrolla un
sistema de diagnóstico automático basado en LDA
y ANFIS (Adaptative Network based on Fuzzy
Inference System). Los tipos de hepatitis que se
tienen en cuenta en este caso son los más
frecuentes, A, B y C. En la base de datos utilizada
para el estudio existen 19 atributos (que tras la
primera fase -LDA- se reducirán a 8 ); estos son:
edad, sexo, esteroides, antivirales, fatiga, malestar,
anorexia, hígado grande e hígado duro, bazo
palpable, arañas vasculares, ascitis, varices,
bilirrubina, fosfatasa alcalina, SGOT (Serum Fig. 10. Diagrama de bloques del sistema
diagnóstico automático LDA-ANFIS
Glutamic Oxaloacetic Transaminase), albúmina,
tiempo de protrombina e histología. En la segunda
fase se realiza una clasificación por medio de un sistema ANFIS de cinco capas, ocho
entradas, una salida y 256 reglas de tipo if-then. Se obtiene una precisión en la
clasificación de 64.16%.
En [95], se utilizan los mismos 19 parámetros de entrada que en el caso anterior
pero utilizando ANNs, concretamente tres: MLP, RBF y CSFNN (Conic Section
Function Neural Network). La precisión de clasificación media obtenida es de 80.775%
para el MLP, 85% en el caso de RBF y 90% para la red CSFNN.
También podemos encontrar trabajos que se centran en el diagnóstico concreto
de un tipo de hepatitis, como es el caso de [96], donde se desarrolla un sistema experto
para el diagnóstico de la hepatitis C; además se compara el sistema implementado con
otros DSSs ya existentes para esta enfermedad concreta. En este caso, algunas de las
variables de entrada utilizadas son la edad y el sexo, alcoholismo, existencia de tatuajes
en el paciente o transfusiones de sangre, uso de drogas intravenosas, histología y otros
métodos de monitorización, etc. Se utiliza una ANN de tres capas, la cual usa una
función de activación sigmoidal. Se obtuvo un error RMS de clasificación de 0.079.
de
MEDICAL DECISION SUPPORT SYSTEMS
Página | 29
9 LUMBALGIA
Lumbalgia es el término por el que se conoce el dolor de la parte inferior de la
espalda (LBP, Low Back Pain), en la zona lumbar, causado por un síndrome
músculoesquelético, es decir, trastornos relacionados con las vértebras lumbares y las
estructuras de los tejidos blandos como músculos, ligamentos, nervios y discos
intervertebrales. Se origina por distintas causas, siendo las más comunes el estrés, el
sobreesfuerzo físico y las malas posturas. En una pequeña proporción de personas esta
condición puede volverse crónica. Estudios poblacionales muestran que el dolor de
espalda afecta a la mayoría de los adultos en algún momento en su vida y representa
más casos de bajas laborales por enfermedad y de discapacidad que cualquier otro
problema médico. A esto hay que añadir que existe una baja cantidad de pacientes con
lumbalgia que obtienen un diagnóstico preciso de su problema con algún grado de
certeza; muchos de ellos reciben cuidados que no son apropiados o, al menos, no son
óptimos.
Se han desarrollado diversos métodos que tratan de ayudar desde hace tiempo en
el diagnóstico de la enfermedad, como por ejemplo, el implementado por Graham et al.
[97], que utilizaban clasificadores bayesianos para la evaluación de los resultados
electromiográficos en el diagnóstico clínico de las radiculopatías compresivas, pérdida o
disminución de la función sensitiva o motora de una raíz nerviosa por compresión. En
esta misma dirección, existen más trabajos, como el llevado a cabo por Lin et al. [98]
que diseñaron, implementaron y evaluaron un DSS basado en la web que empleaba un
marco intuitivo y fácil de usar para evaluar la información del paciente y recomendar un
diagnóstico.
Un método algo diferente a los anteriores, basado en MLPs, trata de establecer
una clasificación de las distintas dolencias de la zona lumbar [99]. Se utilizó un
conjunto de datos, hallazgos físicos y clínicos, de 198 casos reales que obtuvieron de
cuestionarios de pacientes. En este estudio, la red MLP era completamente conectada,
progresiva, con 92 neuronas de entrada binarias codificadas correspondientes a 39
atributos del paciente, 10 neuronas en la capa oculta y 3 neuronas en la capa de salida,
cada uno representando una categoría de diagnóstico (simple dolor de espalda, dolor de
raíz y enfermedad de comportamiento anormal). La red se entrenó con 99 casos, usando
funciones de activación sigmoidales y retropropagación. La red MLP con mejor
generalización fue encontrada en 1100 ciclos cuando el conjunto de entrenamiento se
clasificaba correctamente en el 97% de los casos.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 30
9 LINFOMAS
Linfoma es un término muy amplio que abarca una gran variedad de cánceres
del sistema linfático. Se diferencian por el tipo de célula que se multiplica y por la
forma en que el cáncer se presenta. Los dos grupos principales de linfoma en los seres
humanos son la enfermedad de Hodgkin y los linfomas No-Hodgkin. Es muy
importante obtener un diagnóstico exacto para asegurarse de si se trata de un linfoma o
no y de qué tipo, y luego determinar los tratamientos que serán más efectivos para la
condición del paciente.
El linfoma folicular es uno de los linfomas No-Hodgkin más comunes. En la
identificación de este tipo de linfomas se basa el trabajo realizado en [100] mediante la
búsqueda de folículos en imágenes microscópicas. El sistema propuesto realiza una
distinción entre los píxeles que pertenecen al contorno del folículo y los que no.
Después estos rasgos serán utilizados para el aprendizaje supervisado mediante un
Autómata Celular (CA), con el objetivo de obtener un DSS para la clasificación de los
contornos del folículo. La precisión obtenida en media fue del 93.1% para el conjunto
de prueba, concretamente, se obtuvo un 90.7% de precisión para aquellos píxeles
pertenecientes al contorno y un 95.5% para los que no pertenecían al mismo.
Mediante la introducción, uso y manejo de herramientas de base genómica, la
investigación sobre las alteraciones genéticas, que están en el origen de enfermedades
tan comunes como el cáncer, han sufrido una revolución técnica comparable a la
incorporación del microscopio en los laboratorios. Ahora, estudiar la relación
gen-enfermedad no está basado en analizar un gen único y sus efectos sino en analizar
el comportamiento de miles de genes de forma simultánea. Estos sistemas, denominados
genéricamente como matrices, arrays, microarrays o biochips, están cambiando la forma
de plantear problemas y extraer conclusiones de los experimentos, ya que nos ofrecen
una foto compleja del conjunto del genoma. Este sistema de microarrays, aplicado al
problema que nos ocupa, se utiliza en [101]. La mayoría de los análisis de la enorme
cantidad de información proporcionada por estos chips se ha basado en técnicas de
clustering y de otros procedimientos estadísticos estándar. Estos métodos, en particular
los relacionados con el pronóstico de pacientes con cáncer, han sido por lo general
insuficientes en la obtención de los subconjuntos de genes necesarios para una buena
clasificación. Es por ello que en este estudio se realiza un análisis mediante otro tipo de
métodos, como son las ANNs, de los datos obtenidos a partir de un biochip. Su objetivo
fue comprobar si la estrategia, usando redes, de entrenamiento, prueba y diferenciación
en conjuntos reducidos de genes podría producir algún resultado útil con respecto al
pronóstico sobre una base individual. Se entrenaron más de 130 redes para este estudio.
Inicialmente se aleccionó una red para recibir los datos del microarray con un total de
4026 genes de 40 pacientes. Esta red tenía 12.078 neuronas de entrada, 100 neuronas en
la capa intermedia y una única neurona de salida. Tras realizar un proceso de
optimización de la red se obtuvo el conjunto de 34 genes final para entrenar una red de
6 neuronas en la capa intermedia. Los resultados con que concluye el estudio son muy
prometedores puesto que han sido capaces de predecir la supervivencia a largo plazo de
los pacientes con una precisión del 100%.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 31
ANEXO: GLOSARIO DE ACRÓNIMOS Y ABREVIATURAS
AD
Alzheimer Disease
ADSTG
Automatic Diagnosis System based on Thyroid Gland
ANFIS
Adaptative Network based on Fuzzy Inference System
ANN
Artificial Neural Network
AUC
Area Under the Curve
BN
Bayesian Network
BP
Back Propagation
CAAF
Citología por Aspiración con Aguja Fina
CAD
Computer Aided Diagnosis
CART
Classification And Regression Tree
CBR
Case-Based Reasoning
CC
CraneoCaudal
CDSS
Clinical Decision Support System
CHD
Congenital Heart Desease
CSFNN
Conic Section Function Neural Network
CT
Computer Tomography
DSS
Decision Support System
DDSS
Diagnosis Decision Support System
DT
Decision Tree
ECG
ElectroCardioGram
FDG
Fluorodeoxyglucose
FFT
Fast Fourier Transform
GA
Genetic Algorithm
GDMF
Gaussian-Distributed Membership Function
HRV
Heart Rate Variability
ISI
Inter-Stimulus time Interval
KD
Kernel Density
K-NN
K Nearest Neighbour
K-RNN
K Rank Nearest Neighbour
LBP
Low Back Pain
LDA
Linear Discriminant Analysis
LLA
Leucemia linfoblástica aguda
MEDICAL DECISION SUPPORT SYSTEMS
LS-SVM
Least Square Support Vector Machine
LogR
Logistic Regression
MFC
Multiparametric Flow Cytometry
MLO
Medio-Lateral Oblicua
MLP
MultiLayer Perceptron
MoE
Mixtured of Experts
MR
Magnetic Resonance
MSE
Mean Square Error
NSCLC
Non-Small Cell Lung Cancer
PCA
Principal Component Analysis
PD
Parkinson Disease
PET
Possitron Emission Tomography
PLS
Partial Least Squared
PNN
Probabilistic Neural Network
RBF
Radial Basis Function
RF
Random Forest
RK-NN
Rank K Nearest Neighbour
ROC
Receiver Operating Characteristic
ROI
Region Of Interest
RPROP
Resilient backPROPagation
SGOT
Serum Glutamic Oxaloacetic Transaminase
SIVD
Subcortical Ischemic Vascular Dementia
SPECT
Single Photon Emission Computed Tomography
SUV
Standardized Uptake Value
SVM
Support Vector Machine
TMS
Transcranial Magnetic Stimulation
TSH
Thyroid-Stimulating Hormone
USG
Ultrasonography
WBCD
Wisconsin Breast Cancer Dataset
WK-NN
Weighted K Nearest Neighbour
WNN
Wavelet Neural Network
WT
Wavelet Transform
Página | 32
MEDICAL DECISION SUPPORT SYSTEMS
Página | 33
REFERENCIAS
En las referencias se indica el tipo de documento, utilizando: (A) si se trata de un
artículo de revista académica (journal), (Cn) si es una conferencia, (Co) para coloquios,
(Cu) cursos, (S) si se trata de un simposio, (L) si es un libro, (CL) si se trata de un
capítulo de un libro, (T) en el caso de las tesis doctorales y (RE) si es un recurso
electrónico. Las referencias principales en las que se ha basado la realización de esta
memoria están marcadas con un punto negro tras el indicador de tipo de documento.
[1]
(A) ● Denekamp Y, Peleg M. TiMeDDx--a multi-phase anchor-based
diagnostic decision-support model. Journal of Biomedical Informatics. 2010;
43(1): 111-124.
[2]
(L)
Institute of Medicine. Crossing the quality chasm: a new health system
for the 21st century. National Academy Press. 2001.
[3]
(CL)
Musen MA, Shahar Y, Shortliffe EH. Chapter 16: Clinical decisionsupport systems. In: Shortliffe EH, Perreault LE, Wiederhold G, Fagan LM,
editors. Medical informatics: Computer applications in health care and
biomedicine. New York: Springer. 2001: 573–609.
[4]
(CL)
Miller RA, Geissbuhler AG. Chapter 5: Diagnostic decision support
systems. In: Berner ES, editor. Clinical Decision Support Systems: Theory and
practice. Springer. 2007: 99–125.
[5]
(A)
Shortliffe EH, Axline SG, Buchanan BG, Merigan TC, Cohen SN. An
artificial intelligence program to advice physicians regarding antimicrobial
therapy. Computers and Biomedical Research. 1973; 6(6): 544–560.
[6]
(A)
Eshelman L, Ehret D, McDermott J, Tan M. MOLE: A tenacious
knowledge acquisition tool. International Journal of Man-Machine Studies. 1987;
26(1):41–54.
[7]
(A)
Miller R, Masarie FE, Myers JD. Quick Medical Reference (QMR) for
diagnostic assistance. MD Computing. 1986; 3(5): 34–48.
[8]
(CL)
Ramnarayan P, Kulkarni G, Tomlinson A, Britto J. ISABEL: a novel
Internet delivered clinical decision support system. In: Bryant J, editor. Current
perspectives in healthcare computing. Harrogate, UK. 2004: 245–254.
[9]
(A)
Shwe M, Cooper G. An empirical analysis of likelihood-weighting
simulation on a large, multiply-connected medical belief network. Computers and
Biomedical Research. 1991; 24(5): 453–475.
[10] (RE)
Logic Medical Systems. PAIRS (Physician Assistant Artificial
Intelligence
Reference
System);
2007.
Disponible
en:
http://cyberdoc.freewebspace.com/ , accedido: 15.12.09.
[11] (A)
Lincoln MJ, Turner CW, Haug PJ, Warner HR, Williamson JW,
Bouhaddou O, et al. Iliad training enhances medical students’ diagnostic skills.
Journal of Medical Systems. 1991; 15(1): 93–110.
[12] (A)
Edberg SC. Global Infectious Diseases and Epidemiology Network
(GIDEON): a world wide Web-based program for diagnosis and informatics in
infectious diseases. Clinical Infectious Diseases. 2005; 40(1): 123–126.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 34
[13] (S)
Barnett GO, Famiglietti KT, Kim RJ, Hoffer EP, Feldman MJ. DXplain
on the Internet. Proceedings of the American Medical Informatics Association
Symposium. 1998: 607–611.
[14] (S)
Weed LL, Hertzberg RY. The use and construction of problemknowledge couplers, the knowledge coupler editor, knowledge networks, and the
problem-oriented medical record for the microcomputer. Proceedings of the
Annual Symposium on Computer Applications in Medical Care. 1983: 831–6.
[15] (A)
de Dombal FT. Computer-aided diagnosis and decision-making in the
acute abdomen. Journal of the Royal College of Physicians of London. 1975; 9(3):
211–218.
[16] (A)
Miller RA, Pople HE, Myers JD. Internist-1, an experimental computerbased diagnostic consultant for general internal medicine. The New England
journal of medicine. 1982; 307(8): 468–76.
[17] (S)
Aliferis CF, Cooper GF, Bankowitz R. A temporal analysis of QMR:
abstracted temporal representation and reasoning and initial assessment of
diagnostic performance trade-offs. Proceedings of the Annual Symposium on
Computer Application in Medical Care. 1994: 709–15.
[18] (A)
Lemaire JB, Schaefer JP, Martin LA, Faris P, Ainslie MD, Hull RD.
Effectiveness of the quick medical reference as a diagnostic tool. Canadian
Medical Association Journal. 1999; 161(6): 725–728.
[19] (A)
Friedman CP, Elstein AS, Wolf FM, Murphy GC, Franz TM, Heckerling
PS, et al. Enhancement of clinicians’ diagnostic reasoning by computer-based
consultation: a multisite study of 2 systems. Journal of the American Medical
Association. 1999; 282(19): 1851–1856. Erratum in: Journal of the American
Medical Association. 2001; 285(23): 2979.
[20] (A)
Waxman HS, Worley WE. Computer-assisted adult medical diagnosis:
subject review and evaluation of a new microcomputer-based system. Medicine
(Baltimore). 1990; 69(3): 125–136.
[21] (A)
Murphy CK. Identifying diagnostic errors with induced decision trees.
Medical Decision Making. 2001; 21(5): 368–375.
[22] (A)
Qu Y, Adam BL, Yasui Y, Ward MD, Cazares LH, Schellhammer PF, et
al. Boosted decision tree analysis of surface-enhanced laser desorption/ionization
mass spectral serum profiles discriminates prostate cancer from noncancer
patients. Clinical Chemistry. 2002; 48(10): 1835–1843.
[23] (A)
Won Y, Song H, Kang TW, Kim J, Han B, Lee S. Pattern analysis of
serum proteome distinguishes renal cell carcinoma from other urologic diseases
and healthy persons. Proteomics. 2003; 3(12): 2310–2316.
[24] (A)
Geurts P, Fillet M, de Seny D, Meuwis MA, Malaise M, Merville MP, et
al. Proteomic mass spectra classification using decision tree based ensemble
methods. Bioinformatics. 2005; 21(14): 3138–3145.
[25] (A)
Balla JI, Iansek R, Elstein A. Bayesian diagnosis in presence of
preexisting disease. Lancet. 1985; 325(8424): 326–329.
[26] (A)
Harris NL. Probabilistic belief networks for genetic counseling.
Computer Methods and Programs in Biomedicine. 1990; 32(1): 37–44.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 35
[27] (A)
Stockwell DRB. LBS: Bayesian learning system for rapid expert system
development. Expert Systems with Applications. 1993; 6(2): 137–147.
[28] (A)
Liu TF, Sung WK, Mittal A. Model gene network by semi-fixed
Bayesian network. Expert Systems with Applications. 2006; 30(1): 42–49.
[29] (A)
Sadeghi S, Barzi A, Sadeghi N, King B. A Bayesian model for triage
decision support. International Journal of Medical Informatics. 2006; 75(5): 403–
411.
[30] (A)
Baxt WG. Use of an artificial neural network for data analysis in clinical
decision making: The diagnosis of acute coronary occlusion. Neural Computing.
1990; 2(4): 480–489.
[31] (A)
Baxt WG. Application of artificial neural networks to clinical medicine.
Lancet. 1995; 346(8983): 1135–1138.
[32] (A)
Dybowski R, Gant V. Artificial neural networks in pathology and
medical laboratories. Lancet. 1995; 346(8984): 1203–1207.
[33] (A)
Chae YM, Park KE, Park KS, Bae MY. Development of medical
decision support system for Leukemia management. Expert Systems with
Applications. 1998; 15: 309–315.
[34] (A)
Li YC, Liu L, Chiu WT, Jian WS. Neural network modeling for surgical
decisions on traumatic brain injury patients. K2000; 57(1): 1–9.
[35] (A)
West D, West V. Model selection for a medical diagnostic decision
support system: A breast cancer detection case. Artificial Intelligence in
Medicine. 2000; 20(3): 183–204.
[36] (A)
Ellenius J, Groth T. Transferability of neural network-based decision
support algorithms for early assessment of chest-pain patients. International
Journal of Medical Informatics. 2000; 60(1): 1–20.
[37] (A)
MacDowell M, Somoza E, Rothe K, Fry R, Brady K, Bocklet A.
Understanding birthing mode decision making using artificial neural networks.
Medical Decision Making. 2001; 21(6): 433–443.
[38] (A)
Türkoglu I, Arslan A, Ilkay E. An expert system for diagnosis of the
heart valve diseases. Expert Systems with Applications. 2002; 23(3): 229–236.
[39] (A)
Mendyk A, Jachowicz R. Neural network as a decision support system in
the development of pharmaceutical formulation – focus on solid dispersions.
Expert Systems with Applications. 2005; 28(2): 285–294.
[40] (A)
Mangalampalli A, Mangalampalli SM, Chakravarthy R, Jain AK. A
neural network based clinical decision-support system for efficient diagnosis and
fuzzy-based prescription of gynecological diseases using homoeopathic medicinal
system. Expert Systems with Applications. 2006; 30(1): 109–116.
[41] (A)
Güven A, Kara S. Classification of electro-oculogram signals using
artificial neural network. Expert Systems with Applications. 2006; 31(1): 199–
205.
[42] (A)
Cortes C, Vapnik V. Support-vector networks. Machine Learning. 1995;
20(3): 237–297.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 36
[43] (L)
Vapnik V. The Nature of Statistical Learning Theory. New York:
Springer-Verlag. 1995.
[44] (Cu)
Veropoulos K, Cristianini N, Campbell C. The application of support
vector machines to medical decision support: A Case Study. Proceedings of the
European Coordinating Committee for Artificial Intelligence advanced course on
artificial intelligence. 1999.
[45] (Cn)
Schubert F, Müller J, Fritz B, Lichter P, Eils R. Understanding the
classification of tumors with a support vector machine: A case-based explanation
scheme. Proceedings of the German Conference on Bioinformatics. 2003: 123–
127.
[46] (A)
Conforti D, Guido R. Kernel-based support vector machine classifiers for
early detection of myocardial infarction. Optimization Methods and Software.
2005; 20(2–3): 401–413.
[47] (A)
Prados J, Kalousis A, Sanchez JC, Allard L, Carrette O, Hilario M.
Mining mass spectra for diagnosis and biomarker discovery of cerebral accidents.
Proteomics. 2004; 4(8): 2320–2332.
[48] (A)
Majumder SK, Ghosh N, Gupta PK. Support vector machine for optical
diagnosis of cancer. Journal of Biomedical Optics. 2005; 10(2): 24–34.
[49] (A)
Brasil LM, de Azevedo FM, Barreto JM. Hybrid expert system for
decision supporting in the medical area: Complexity and cognitive computing.
International Journal of Medical Informatics. 2001; 63(1–2): 19–30.
[50] (A)
Tung KY, Huang IC, Chen SL, Shih CT. Mining the Generation Xers’
job attitudes by artificial neural network and decision tree – Empirical evidence in
Taiwan. Expert Systems with Applications. 2005; 29(4): 783–794.
[51] (A)
Güler NF, Koc S. Use of support vector machines and neural network in
diagnosis of neuromuscular disorders. Journal of Medical Systems. 2005; 29(3):
271–284.
[52] (A)
He J, Hu HJ, Harrison R., Tai PC, Pan Y. Transmembrane segments
prediction and understanding using support vector machine and decision tree.
Expert Systems with Applications. 2006; 30(1): 64–72.
[53] (A) ● West D, Mangiameli P, Rampal R, West V. Ensemble strategies for a
medical diagnostic decision support system: A breast cancer diagnosis
application. European Journal of Operational Research. 2003; 162(2): 532-51.
[54] (A) ● Abdolmaleki P, Buadu L, Naderimansh H. Feature extraction and
classification of breast cancer on dynamic magnetic resonance imaging using
artificial neural network. Cancer Letters. 2001; 171(2): 183-191.
[55] (A) ● Sarkar M, Leong T. Application of K-nearest neighbors algorithm on
breast cancer diagnosis problem. Journal of the American Medical Informatics
Association. 2000: 759-763.
[56] (A) ● Gil-Pita R, Yao X. Using a genetic algorithm for editing k-nearest
neighbor classifiers. Intelligent Data Engineering and Automated Learning. 2007;
4881: 1141-1150.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 37
[57] (S) ● Hechenbichler K, Schliep K. Weighted k-Nearest-Neighbor Techniques
and Ordinal Classification. Discussion Paper 399, Sonderforschungsbereich 386.
2004.
[58] (A) ● Bagui SC, Pal K, Pal NR. Breast cancer detection using rank nearest
neighbor classification rules. Pattern Recognition. 2001; 36(1): 25-34.
[59] (Cn) ● Velikova MV, Lucas PJF, Ferreira N, Samulski M, Karssemeijer N. A
decision support system for breast cancer detection in screening programs.
Proceedings of the 18th European Conference on Artificial Intelligence. 2008:
658–662.
[60] (A) ● Akay M. Support vector machines combined with feature selection for
breast cancer diagnosis. Expert Systems with Applications. 2009; 36(2): 32403247.
[61] (A) ● Polat K, Gunes S. Breast cancer diagnosis using least square support
vector machine. Digital signal processing. 2007; 17(4): 694-701.
[62] (RE)
Centers for Disease Control and Prevention. The Power of Prevention.
Chronic disease… the public health challenge of the 21st century; 2009.
Accedido: 21.12.09. http://www.cdc.gov/chronicdisease/pdf/2009-Power-ofPrevention.pdf
[63] (RE)
Organización Mundial de la Salud, WHO’s report 2009, accedido:
21.12.09. http://www.who.int/topics/cardiovascular_diseases/es/index.html
[64] (A) ● Azuaje F, Dubitzky W, Lopes P, Black N, Adamson K, Wu X, et al.
Predicting coronary disease risk based on short-term RR interval measurements:
A neural network approach. Artificial Intelligence in Medicine. 1999; 15(3): 275297.
[65] (Cn) ● Tkacz EJ, Kostka P. An application of wavelet neural network for
classification of patients with coronary artery disease based on HRV analysis.
Proceedings of the 22nd Annual International Conference of the IEEE,
Engineering in Medicine and Biology Society. 2000; 2: 1391–1393.
[66] (A) ● Reategui EB, Campbell JA, Leao BF. Combining a neural network with
case-based reasoning in a diagnostic system. Artificial Intelligence in Medicine.
1997; 9(1): 5-27.
[67] (A) ● Tsai DY, Watanabe S. A method for optimization of fuzzy reasoning by
genetic algorithms and its application to discrimination of myocardial heart
disease. IEEE Transactions on Nuclear Science. 1999; 46(6): 2239-2246.
[68] (A) ● Yan H, Jiang Y, Zheng J, Peng C, Li Q. A multilayer perceptron-based
medical decision support system for heart disease diagnosis. Expert Systems with
Applications. 2006; 30(2): 272-281.
[69] (L)
Fuster, V., Alexander, R. W., & O’Rourke, R. A. Hurst’s the heart. 2001.
USA: McGraw Hill Professional.
[70] (A) ● Sharpe P, Solberg H, Rootwelt K, Yearworth M. Artificial Neural
Networks in Diagnosis of Thyroid-Function from In-Vitro Laboratory Tests.
Clinical Chemistry. 1993; 39(11): 2248-2253.
[71] (A) ● Zhang G, Berardi VL. An investigation of neural networks in thyroid
function diagnosis. Health Care Management Science. 1998; 1(1): 29-37.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 38
[72] (A) ● Erol R, Ogulata S, Sahin C, Alparslan Z. A Radial Basis Function Neural
Network (RBFNN) approach for structural classification of thyroid diseases.
Journal of medical systems. 2008; 32(3): 215-220.
[73] (A) ● Dogantekin E, Dogantekin A, Avci D. An automatic diagnosis system
based on thyroid gland: ADSTG. Expert Systems with Applications. 2010; 37(9):
6368-6372.
[74] (A) ● Ericsson A, Lonsdale MN, Astrom K, Edenbrandt L, Friberg L. Decision
Support System for the Diagnosis of Parkinson’s Disease. Image Analysis. 2005;
3540: 740-749.
[75] (A) ● Das R. A comparison of multiple classification methods for diagnosis of
Parkinson disease. Expert Systems with Applications. 2010; 37(2): 1568-1572.
[76] (A) ● Corchado JM, De Paz JF, Rodríguez S, Bajo J. Model of experts for
decision support in the diagnosis of leukemia patients. Artificial Intelligence in
Medicine. 2009; 46(3): 179-200.
[77] (A) ● Foran DJ, Comaniciu D, Meer P, Goodell LA. Computer-assisted
discrimination among malignant lymphomas and leukemia using
immunophenotyping, intelligent image repositories, and telemicroscopy. IEEE
transactions on information technology in biomedicine. 2000; 4(4): 265-273.
[78] (A) ● Tung WL, Quek C. GenSo-FDSS: A neural-fuzzy decision support
system for pediatric ALL cancer subtype identification using gene expression
data. Artificial Intelligence in Medicine. 2005; 33(1): 61-88.
[79] (A) ● Huang CJ, Liao WC. Application of Probabilistic Neural Networks to the
Class Prediction of Leukemia and Embryonal Tumor of Central Nervous System.
Neural Processing Letters. 2004; 19(3): 211-226.
[80] (A) ● Ratei R, Karawajew L, Lacombe F, Jagoda K, Poeta GD, Kraan J, et al.
Discriminant function analysis as decision support system for the diagnosis of
acute leukemia with a minimal four color screening panel and multiparameter
flow cytometry immunophenotyping. Leukemia. 2007; 21(6): 1204-1211.
[81] (Cn) ● Álvarez I, López M, Gorriz JM, Ramírez J, Salas-González D, Puntonet
CG, et al. Automatic classification system for the diagnosis of Alzheimer disease
using component-based SVM aggregations. Proceedings of the 15th International
Conference on Advances in Neuro-Information Processing. 2009; 2: 402-409.
[82] (Cn) ● Salas-González D, Gorriz JM, Ramírez J, López M, Álvarez I, Segovia F,
et al. Computer aided diagnosis of Alzheimer disease using support vector
machines and classification trees. Proceedings of the 15th International
Conference on Advances in Neuro-Information Processing. 2009; 5507: 418-425.
[83] (A) ● Faro A, Giordano D, Pennisi M, Scarciofalo G, Spampinato C,
Tramontana F. Transcranial magnetic stimulation (TMS) to evaluate and classify
mental diseases using neural networks. Artificial Intelligence in Medicine. 2005:
310-314.
[84] (A) ● Ramírez J, Gorriz JM, Segovia F, Chaves R, Salas-González D, López
M, et al. Computer aided diagnosis system for the Alzheimer's disease based on
partial least squares and random forest SPECT image classification. Neuroscience
letters. 2010; 472(2): 99-103.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 39
[85] (A) ● Lisboa PJ. A review of evidence of health benefit from artificial neural
networks in medical intervention. Neural Networks. 2002; 15(1): 11-39.
[86] (T) ● Lacave C. Explicación en redes bayesianas causales. Aplicaciones
médicas. Ph.D. thesis, Departamento de Inteligencia artificial de la Universidad
Nacional de Educación a Distancia. 2002.
[87] (Cn) ● Gómez-Mayorga ME, Gallegos-Funes, FJ, De la Rosa Vázquez JM,
Cruz-Santiago R, Ponomaryov V. Diagnosis of Cervical Cancer Using the Median
M-Type Radial Basis Function (MMRBF) Neural Network. Proceedings of the
Mexican International Conference on Artificial Intelligence. 2009; 5845: 258-267.
[88] (A) ● Dimitrakopoulou-Strauss A, Hoffmann M, Bergner R, Uppenkamp M,
Eisenhut M, Pan L, et al. Prediction of short-term survival in patients with
advanced nonsmall cell lung cancer following chemotherapy based on 2-Deoxy-2[F-18]fluoro-D-glucose-positron emission tomography: A feasibility study.
Molecular imaging and biology. 2007; 9(5): 308-317..
[89] (A) ● Vesselle H, Turcotte E, Wiens L, Haynor D. Application of a neural
network to improve nodal staging accuracy with F-18-FDG PET in non-small cell
lung cancer. The Journal of Nuclear Medicine. 2003; 44(12): 1918-1926.
[90] (A) ● Holst H, Mare K, Jarund A, Astrom K, Evander E, Tagil K, et al. An
independent evaluation of a new method for automated interpretation of lung
scintigrams using artificial neural networks. European Journal of Nuclear
Medicine. 2001; 28(1): 33-38.
[91] (T) ● Ericsson A. Automatic Shape Modeling and Applications in Medical
Imaging. Ph.D. thesis, Centre for Mathematical Sciences, Lund University, 2003.
[92] (T) ● Jakobson D., Olofsson F. Decision support system for lung cancer using
PET/CT images. Ph.D. thesis, Centre for Mathematical Sciences, Lund
University, 2004.
[93] (Cn) ● Golodetz S, Voiculescu I, Cameron S. Progress on a decision-support
system for abdominal CT scans. Proceedings of the 2nd Conference on Human
System interactions. 2009: 113-116.
[94] (A) ● Dogantekin E, Dogantekin A, Avci D. An automatic diagnosis system
based on thyroid gland: ADSTG. Expert Systems with Applications. 2010; 37(9):
6368-6372.
[95] (Cn) ● Ozyilmaz L, Yildirim T. Artificial neural networks for diagnosis of
hepatitis disease. Proceedings of the International Joint Conference on Neural
Networks. 2003; 1: 586.
[96] (Cn) ● Jajoo R, Mital D, Haque S, Srinivasan S. Prediction of hepatitis C using
artificial neural network. Proceedings of the 7th International Conference on
Control, Automation, Robotics and Vision. 2002; 3: 1545.
[97] (Cn) ● Graham JH, Espinosa A. Computer assisted analysis of
electromyographic data in diagnosis of low back pain. Proceedings of the IEEE
International Conference on Systems, Man and Cybernetics. 1989: 1118-1123.
[98] (A) ● Lin L, Hu P, Sheng O. A decision support system for lower back pain
diagnosis: Uncertainty management and clinical evaluations. Decision Support
Systems. 2006; 42(2): 1152-1169.
MEDICAL DECISION SUPPORT SYSTEMS
Página | 40
[99] (Co) ● Vaughn ML, Cavill SJ, Taylor SJ, Foy MA, Fogg AJB. Interpretation
and knowledge discovery from a MLP network that performs low back pain
classification. IEEE Colloquium on Knowledge Discovery and Data Mining.
1998: 1-4.
[100] (A) ● Povalej P, Verlic M, Kokol P, Sanchez JL, Sigut JF. Identifying
Lymphoma in Microscopy Images with Classificational Cellular Automata.
Proceedings of the 19th IEEE International Symposium on Computer-Based
Medical Systems. 2006: 309-314.
[101] (A) ● O'Neill M, Li S. Neural network analysis of lymphoma microarray data:
Prognosis and diagnosis near-perfect. BioMed Central Bioinformatics. 2003; 4:
13.
Descargar