Volver Trabajo publicado en www.ilustrados.com La mayor Comunidad de difusión del conocimiento “Propuesta metodológica sobre la resolución de problemas Biomédicos que conducen a la distribución Ji-cuadrado”. Lic. Profesor Asistente Lorenzo Pérez Milanés Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta” Las Tunas Cuba E-mail: [email protected] [email protected] Resumen Introducción Desarrollo Bibliografía Datos del autor Ir a “Propuesta” Este artículo está dirigido fundamentalmente a los profesionales de la Salud y en especial a los estudiantes de 2do. Año de la carrera de Medicina, Estomatología y Enfermería de la Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta” de Las Tunas, los cuales reciben las asignaturas de Informática Médica II y Informática e Investigación III en la que se aborda la problemática de la resolución de problemas biomédicos que conducen a la distribución Ji-cuadrado en el marco de la Estadística Inferencial. En el mismo se presentan algunas valoraciones teóricas sobre el tema y una propuesta metodológica con una serie de pasos lógicos para realizar las pruebas de hipótesis que utilizan este modelo, así como algunas indicaciones en el uso del procesador Statgraphics versión 2,1 en Inglés para el cálculo y análisis de los resultados . Además este material puede ser también útil a otros profesionales que aborden la Estadística Inferencial en general. Regresar En el desarrollo de los métodos estadísticos modernos las primeras técnicas de inferencia que aparecieron fueron las que hicieron buen número de suposiciones acerca de la naturaleza de la población de la que obtuvieron los datos. Puesto que los valores de población son “parámetros” estas técnicas estadísticas son llamadas “paramétricas”. Una técnica de inferencia, como ya hemos visto, puede basarse en la suposición de que los datos se sacaron de una población distribuida normalmente. Tales técnicas nos conducen a conclusiones que tienen limitaciones, por lo que más recientemente se han desarrollado gran número de técnicas de inferencia que no hacen suposiciones numerosas ni severas acerca de los parámetros. Estas “distribuciones libres” o “técnicas no paramétricas” permiten sacar conclusiones a las que hay que hacer menor reserva. Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no pueden cuantificarse mediante cantidades numéricas, entre las que el investigador esté interesado en determinar posibles relaciones. Ejemplos de este tipo de variables pueden ser las complicaciones tras una intervención quirúrgica, el sexo, el nivel socio-cultural, etc. En este caso tendríamos, a lo sumo, las observaciones agrupadas en forma de frecuencia, dependiendo de las modalidades que presente cada paciente en cada una de las variables, por los que los métodos estudiados en los capítulos anteriores no serían aplicables. La experiencia nos ha conducido a tener en cuenta el fracaso que experimentan los principiantes y estudiantes en el proceso de resolución de problemas que conducen a la distribución x2 y en especial en la realización de pruebas de hipótesis por numerosos factores como, prestar su atención solamente en las habilidades computacionales, en el quehacer metodológico o en la rama descriptiva de la Estadística como ciencia. Para la Estadística Inferencial ha quedado el papel de “oveja negra” por razones diversas, que incluyen desde la complejidad de su contenido hasta la predisposición a impartirla por predominio de personal docente no afín a la especialidad; la realidad es que hay que buscar un enfoque de mayor acierto para la docencia de esta temática en el contexto de los nuevos paradigmas de creación, difusión y utilización del conocimiento, y los apuntes que se proponen es un elemento a considerar en este sentido. Regresar Test o contraste Ji-cuadrado En general este tipo de tests consisten en tomar una muestra y observar si hay diferencia significativa entre las frecuencias “observadas” y las especificadas por la ley teórica del modelo que se contrasta, también denominadas frecuencias “esperadas”. Esta prueba 2 puede ser utilizada en forma útil en relación con la compatibilidad de frecuencia observada y esperadas (caso de haber independencia) en tablas de dos sentidos o “tablas de contingencia” ( Es un contraste para determinar la dependencia o independencia de caracteres cualitativos). Estas tablas se construyen generalmente con objeto de estudiar la relación entre las dos variables de clasificación. Por medio de la prueba 2 es posible probar la hipótesis de que las dos variables son independientes. La fórmula a utilizar para calcular 2 será la siguiente: r (1) 2 = k Donde: ( Qij – Eij)2 / Eij k: número de columnas. i=1 j=1 r: “ “ filas. Qij: Frecuencias absolutas observadas de casos clasificados en la fila i de la columna j. Eij : Frecuencias absolutas de casos esperados conforme a Ho para ser clasificados en la fila i de la columna j. Para encontrar la frecuencia esperada para cada casilla, se multiplican los dos totales marginales de una casilla particular y dividimos el producto por el número total de casos “ n “. Regresar Continuar Ejemplo: A B Total a *12 32 44 b 22 14 36 c 9 6 15 Total 43 52 95 J i i Tabla que muestra las frecuencias observadas en cada casilla a partir de la cual determinaremos las frecuencias esperadas. * Frecuencia esperada de la casilla situada en la primera fila y primera columna. E11= ( 44)(43) / 95 = 19.9 , n = 95 Si las frecuencias observadas están estrechamente de acuerdo con las frecuencias esperadas, las diferencias ( Qij –Eij )serán por supuesto pequeñas y consecuentemente el valor 2 será pequeño. Con un valor pequeño de este estadígrafo “ no podemos rechazar la hipótesis de nulidad” que supone independientes entre si a los dos conjuntos de características. Si hay una o varias diferencias grandes, el valor de 2 también será grande. Tanto mayor es 2 tanto más probable es que los dos grupos difieran con respecto a las clasificaciones. Puede mostrarse que la distribución muestral de 2 , definida por la fórmula antes expuesta, se aproxima a la distribución Chi-cuadrado con el valor: gl = ( r-1)(k-1) donde gl son los grados de libertad. Las probabilidades asociadas con diferentes valores de Chi-cuadrado se encuentran en la tabla de valores de 2. Si un valor calculado de este estadígrafo es mayor que el dado en la tabla en un nivel de significación prefijado-en un gl en particular, se rechaza Ho a ese nivel de significación. Regresar Continuar Nótese que hay una distribución muestral diferente para cada valor de gl, es decir, la significación de cualquier valor particular de 2 depende del número de grados de libertad en los datos con los que ha sido calculado. Los grados de libertad para una tabla r x k pueden hallarse con : gl = (r-1)(k-1) , donde : r: número de clasificaciones(filas). K: número de grupos(columnas). ¿ Tendrá limitaciones este test ?....¿ Qué pasará si gl = 1 ?. Después de haber analizado los elementos teóricos anteriores aparecen gravitando alrededor del tema que nos ocupa, las siguientes interrogantes: ¿ Cuándo tendríamos que realizar una prueba Ji-cuadrado ?,¿ Cómo se hace este tipo de prueba ?, ¿ Cuáles serían los pasos a seguir para tener éxito en la realización de la misma ?, ¿ Qué tendríamos que hacer en cada paso ?, en fin para responder a estas y a otras interrogantes que puedan surgir les proponemos a continuación una “metodología” de resolución de problemas biomédicos que conducen a estas pruebas de hipótesis. La misma esta constituida por una serie de pasos lógicos que recomendamos seguir y que han sido extraídos de la experiencia que hemos acumulado en la impartición y en el trabajo metodológico a la Estadística Inferencial por parte del colectivo docente, así como de resultados en la aplicación de exámenes y técnicas cualitativas para conocer el grado de aceptación y satisfacción de esta metodología en los estudiantes con el propósito de facilitar y guiar a los mismos en la obtención del éxito de estos tests. Hemos querido presentarle a continuación la “metodología” con los pasos que sugerimos seguir para realizar la prueba y en los que se podrán apreciar vínculos que nos mostraran, a través de un ejemplo concreto, que debe hacerse en cada uno de ellos, así como su contenido. Regresar Continuar Volver I. Identificar la distribución Ji-cuadrado en el problema biomédico. II. Buscar el valor tabulado de X2 según y los grados de libertad. III. Planteamiento de las hipótesis nula y alternativa, el nivel de significación y los grados de libertad. IV. Calculo del estadígrafo X2 con el procesador estadístico. V. Análisis e interpretación de los resultados. VI. Toma de decisión. Regresar Paso 1 Supongamos que deseamos probar si existe independencia entre el tipo de dieta ingerida por los adolescentes en cierta región durante determinado período y la cantidad de caries y se toma una muestra de 95 adolescentes. Los resultados se plantean a continuación( o sea, frecuencia absoluta Oij ). Tipos de dietas A B Total 1-2 12 32 44 3-5 22 14 36 6 ó más 9 6 15 Total 43 52 95 Cantidad de caries Después de leer el problema varias veces debemos identificar el tipo de prueba de hipótesis, para ello debemos darnos cuenta que en el problema clasifican dos variables cualitativas y ordinales(tipos de dietas y cantidad de caries), pero además se quiere saber la dependencia entre ambas en una muestra que es lo suficiente grande( n 30 ), de manera que estos elementos son suficientes para saber que estamos en presencia de una prueba no paramétrica o Ji-cuadrado. Regresar Paso 2 Tabla 2 gl .05 .01 1 3.84 6.63 2 5.99 9.21 3 7.81 11.34 4 9.49 13.28 5 11.07 15.09 6 12.59 16.81 En la tabla se puede observar que para un gl = 2 el valor de xt2 es 9.21 Regresar Paso 3 La hipótesis de nulidad supone que el tipo de dieta es un factor independiente del número de caries, por tanto, la hipótesis de nulidad y la hipótesis alternativa se expresan: Ho : Existen independientes. H1: No existen independientes. Tomaremos un nivel de significación = 0.01 El criterio de decisión será: Rechazar Ho si el valor de 2 obtenido mediante la fórmula es mayor que el tabulado t2 ( 2 t2 ). Este punto crítico t2 se obtiene en la tabla 2 para gl = (3-1)(2-1) = 2 ,el cual constituye el paso 2. Aceptar Ho si 2 t2 En nuestro caso t2 = 9,21 Regresar Paso 4 Procesador Paso 1: Selección de la escala de medición de la variable Seleccionamos...Describe...Categorical Data..Contingency Tables.. del menú y hacemos clic. Regresar Continuar Paso 2: Seleccionar las variables en la base de datos DATA.- nombre de las variables que contienen los datos que se quieren analizar. Hacemos clic en OK Regresar Continuar Paso 3: Seleccionar la opción para realizar la tabulación de la variable Seleccionamos el botón Tabular options de la barra de herramientas y hacemos clic. Regresar Continuar Paso 4: Selección de la prueba Seleccionamos...Chi-Square Tests de la caja de diálogo y hacemos clic en el botón OK Regresar Continuar Paso 5: Extraer los resultados obtenidos para efectuar el análisis e interpretación que se plantea en el punto V de la metodología Como se observa en los resultados para un gl = 2 el valor del estadígrafo x2 es 10.71 y el P-valor = 0.0047 Regresar Paso 5 Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos con el procesador y teniendo en cuenta los diferentes aspectos del paso 2 es que se hacen los análisis e interpretaciones finales del problema. De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes: Utilizando el nivel de significación = 0.01 y los grados de libertad dados por el número de filas y columnas de la tabla de frecuencias observadas se obtuvo que el valor tabulado de t2 es de 9.21 y a partir del procesador el valor 2 que corresponde a la fórmula (1), resultando ser 10.71, de manera que si hacemos las comparaciones pertinentes de acuerdo al criterio de decisión podemos ver que 10.71 9.21 y tendremos que rechazar la hipótesis nula Ho, es decir, que “rechazamos” que exista independencia entre la dieta administrada y la cantidad de caries en esos pacientes Si no hubiéramos utilizado el procesador tendríamos que haber calculado las frecuencias esperadas dadas por la tabla: Tipos deBdietasTotal A 0-2 19.9 24.1 44 3-5 16.3 19.7 36 6 ó más 6.8 8.2 15 Total 43 52 95 Cantidad de caries. y haber calculado por la fórmula (1) a 2 que por los datos de la tabla es el siguiente: 2 = (12-19.9)2 / 19.9 + (32-24.1)2 / 24.1 + .........+ (6-8.2)2 / 8.2 = 3.14 +2.59 +.........+ 0.59 2 = 10.67 10.67 que el punto crítico 9.21 que aparece en la tabla, podemos rechazar la hipótesis de nulidad a un nivel de significación de 0.01, es decir, que rechazamos que exista independencia entre la dieta administrada y la cantidad de caries en esos pacientes. Regresar Paso 6 Es en este paso donde usted debe decidir si a los resultados de la prueba de hipótesis los toma, los deja o se abstiene de ellos, en fin todo lo que hicimos antes fue para “DECIDIR”. Regresar Limitaciones La muestra de tamaño n debe ser suficientemente grande, de modo que ninguna de las frecuencias esperadas Eij sea menor que 1 y no más del 20 % de los mismos sea menor que 5. Corrección de Yates ( si gl = 1 ) Cuando los resultados para una distribución continua se aplican a datos discretos, se deben hacer correcciones para la continuidad. La corrección consiste en rescribir a la ecuación (1): r (1) 2 = k ( Oij – Eij)2 / Eij i=1 j=1 2 (corregida) = ( Q1-E1-0.5)2/E1 + (Q2-E2-0.5)2/E2 + ........+(Qn-En-0.5)2/En Esta corrección se debe hacer cuando gl = 1 ( un solo grado de libertad). En muestras grandes la corrección conduce a los mismos resultados que sin efectuar la corrección. Regresar 1. Cursos de Maestrías. Metodología de la Investigación, Promoción y Educación para la salud. [en CDROM User Guide]. ENSAP. Versión 1,0 La Habana, 2004. 2. Freund E. John. Estadística Elemental Moderna. Edición Revolucionaria. La Habana. 1987. 3. Colectivo de autores. Laboratorio de Estadística Matemática II. Editorial Félix Varela, la Habana,2004. 4. Guerra Bustillo W. Caridad y otros. Estadística. Editorial Félix Varela, la Habana,2004. 5. Oliva G. Leonardo, O´Farril M. Esperanza. Bioestadística y Computación, quía de estudio. Edit. Pueblo y Educación. La Habana. 1988. 6. Oliva G. Leonardo y otros. Bioestadística. Cuaderno de ejercicios. Edit. Pueblo y Educación. La Habana. 1988. 7. Colectivo de autores. Bioestadística y Computación. Editorial Pueblo y Educación. La Habana,1987. Regresar Lic. Profesor Asistente Lorenzo Pérez Milanés Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta” Las Tunas Cuba E-mail: [email protected] [email protected] Regresar