Test Estadística Test Estadística 1. 1) 2) 3) 4) 5) 2. 3. 2) 3) 4) 5) Señale cuál de las siguientes es una variable cuantitativa discreta: Glucemia basal. Sexo. Número de camas. Color de pelo. Respuesta a tratamiento analgésico. 6. 1) 1) 2) 3) 4) 5) 2) 3) 4) 5) En nueve familias estudiadas, el número de hijos por familia era de 4, 6, 2, 2, 4, 3, 2, 1, 7. La media, la mediana y moda de hijos por familia es: 7. 1) 2) 3) 4) 5) 4. 3,4; 2; 3 3; 3,4; 2 3; 3; 2 2; 3,5; 3 3,4; 3; 2 1) 2) 3) 4) 5) Si se suman el número de procesos catarrales de cada individuo estudiado y se divide entre 50 se obtendrá 1. La mitad de los sujetos estudiados han tenido dos o más catarros durante ese año. La muestra estudiada no es homogénea. Es posible que alguno de los sujetos estudiados haya presentado un número elevado de catarros. En la muestra estudiada lo más frecuente es haber tenido más de un proceso catarral durante ese año. 4) 5) 8. Se emplea para comparar la variabilidad relativa de diferentes distribuciones. Se aplica partiendo del problema de que las desviaciones típicas no son comparables directamente. Puede decirse que los valores no son homogéneos si la desviación típica supone más de un tercio de la media. El coeficiente de variación permite comparar la variabilidad relativa de dos muestras. No puede utilizarse para comparar dos muestras expresadas en distintas unidades. La media es igual a la moda, y ésta, igual a la mediana. El 50% de las observaciones son mayores que la moda. Aproximadamente el 68% de las observaciones caen dentro de ±1 desviación estándar de la media. El número de observaciones entre 0 y 1 desviación estándar de la media es el mismo que entre 1 y 2 desviaciones estándar de la media. El valor que más se repite es la media. En una determinada muestra estudiamos la glucemia, llegando a la conclusión de que 120 corresponde al percentil 80: 1) 2) 3) 4) 5) 9. 5. Moda. Percentil 50. Rango. Mediana. Todas las siguientes afirmaciones con respecto a la distribución normal son cier­tas, excepto: 1) 2) 3) Se han estudiado el número de procesos catarrales por año en 20 sujetos de edades comprendidas entre los 18 y los 55 años. Se informa de que la mediana es 1. ¿Cuál de las siguientes afirmaciones le parece correcta? 1.ª vuelta Distancia Respecto al coeficiente de variación, una de las siguientes afirmaciones es FALSA: ¿Cuál de las siguientes es una variable cualitativa? Duración del sangrado menstrual. Número de familias numerosas/1.000 habitantes. Escala de Glasgow. Consumo diario de cigarrillos. Colesterol sérico. 1.ª vuelta Distancia El 80% de la población tiene una glucemia mayor de 120. El 20% de la muestra tiene una glucemia de 120 o superior. El 20% de la muestra tiene una glucemia superior a 120. El 80% de la muestra tiene una glucemia igual a 120. La mediana es 80. ¿Cuál de los siguientes parámetros es de dispersión? Si quisiera realizar un estudio y tuviera que trabajar con una muestra sesgada, ¿que parámetros utilizaría? 1) 1) Media aritmética. Tamaño muestral, mediana, rango intercuartílico. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 1 Test Estadística 2) 3) 4) 5) Media, moda, mediana. Coeficiente de variación de Pearson. Tamaño muestral, media, desviación típica. Media, varianza y moda. 1) 2) 3) 4) 5) 1.ª vuelta Distancia 196 - 204 180 - 220 160 - 240 198 - 202 170 - 230 10. Respecto a la mediana, señale la respuesta INCORRECTA: 1) 2) 3) 4) 5) Es una medida de tendencia central. Es útil es muestras grandes y homogéneas. No siempre es un valor de la muestra. Divide al conjunto de datos en partes iguales. En una distribución normal es el valor que más se repite. 11. Le informan de que la TAD media de un grupo de adolescentes con anorexia nerviosa es de 60 mm de Hg con una desviación estándar de 5. Es cierto: 1) 2) 3) 4) 5) La TAD media de las personas que padecen anorexia nerviosa es 60. La TAD media de las personas que padecen anorexia nerviosa es 60, con una probabilidad de equivocarnos con esta afirmación menor al 5%. La TAD media de las personas que padecen anorexia nerviosa estará entre 50 y 70, con una probabilidad de equivocarnos con esta afirmación menor al 5%. La TAD media de las personas que participaron en este estudio estará entre 50 y 70, con una probabilidad de equivocarnos con esta afirmación menor al 5%. El 68% de las personas que participaron en este estudio tienen una TAD entre 55 y 65. 15. En una muestra de 100 pacientes se ha observado que un tratamiento produce una disminución media de la colesterolemia de 2 mmol/l, con un error estándar de la media de 0,5 mmol/l. ¿Cuál de las siguientes afirmaciones es correcta? 1) 2) 3) 4) 5) 16. En relación con la inferencia estadística es FALSO: 1) 2) 3) 4) 5) 12. Se ha estudiado una muestra de 100 personas, obteniéndose una glucemia basal media de 80 mg/ml, con una desviación estándar de 10 mg/ml. La glucemia basal media de la población será: 1) 2) 3) 4) 5) 80 ± 2 mg/ml. 80 ± 20 mg/ml. 80 ± 2 mg/ml, p <0,05. 80 ± 2 mg/ml, p <0,01. 80 ± 3 mg/ml, p <0,01. 13. Leemos en un artículo publicado que la frecuencia cardíaca media de los varones fumadores es de 70 ± 5 lpm, con p <0,05. Esto significa: 1) 2) 3) 4) 5) La probabilidad de que la frecuencia cardíaca media obtenida en la muestra no sea 70 lpm es menor de 0,01. El 95% de los sujetos muestreados está entre 60 y 80 lpm. La probabilidad de que la frecuencia cardíaca media de los varones fumadores esté entre 65 y 75 lpm es menor de 0,05. La probabilidad de que la frecuencia cardíaca media de los varones fumadores no esté entre 65 y 75 lpm es menor de 0,05. Se tiene un 95% de confianza de que el verdadero valor poblacional está entre 60 y 80 lpm. 14. En una muestra de 100 niños se encuentra una colesterolemia media de 200 mg/dl. Usted ha leído que en la población pediátrica la colesterolemia media es 196 - 204, p < 0,05. Señale qué intervalo incluye al 95% de los niños de su muestra: El 95% de los sujetos disminuyeron entre 1,5 y 2,5 mmol/l.­ El 95% de los sujetos disminuyeron entre 1 y 3 mmol/l. ­­­­­­­­ Se tiene un 95% de confianza de que el verdadero descenso se sitúe entre 1,5 y 2,5 mmol/l. Se tiene un 95% de confianza de que el verdadero descenso se sitúe entre 1 y 3 mmol/l. El 95% de los pacientes con hipercolesterolemia conseguirán descensos entre 1 y 3 mmol/l a ese grado de significación. Consiste en estimar un parámetro poblacional a partir de un dato muestral. La precisión de los resultados depende principalmente del valor del parámetro estudiado en la muestra. Es necesario conocer el tamaño muestral. Si el tamaño muestral aumenta 4 veces, el error estándar de la media se reduce a la mitad. El IC del 99% se calcula con la media muestral +/- el resultado de multiplicar el error estándar de la media por 2,57. 17. Se ha obtenido que en el intervalo (175-225), está incluido el 68% central de una muestra de diabéticos. Si el tamaño muestral es 100 y la media 200, calcule un intervalo en el que se incluya el verdadero valor medio poblacional con una probabilidad del 95%: 1) 2) 3) 4) 5) 197,5-202,5 195-205 150-250 199,5-200,5 175-225 18. En una muestra de 100 mujeres, la media de peso fue de 65 kg con un error estándar de 0,5 kg. ¿Cuál es el intervalo de confianza del 95% para la media poblacional? 1) 2) 3) 4) 5) 60 - 70 55 - 75 64 - 66 63 - 67 62 - 68 19. En una revista médica se publica un artículo en el que se afirma que el colesterol medio de los pacientes obesos mayores de 45 años es 260 ± 10 mg/dl, p < 0,05. Esto significa que: 1) La probabilidad de que el colesterol medio obtenido en la muestra no sea 260 es menor de 0,05. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 2 Test Estadística 1.ª vuelta Distancia El 95% de los sujetos muestreados tiene una colesterolemia entre 240 y 280 mg/dl. La probabilidad de que el colesterol medio de los pacientes obesos mayores de 45 años no esté entre 250 y 270 es menor del 5%. La probabilidad de que el verdadero valor medio poblacional esté entre 240 y 280 es del 95%. El 95% de los sujetos muestreados tiene un colesterol entre 250 y 270. diferencia es significativa, p < 0,05; lo que se debe interpretar como que: 20. En una muestra de 37 pacientes se realiza determinación de la uricemia, obteniéndose una media de 7 y una desviación estándar de 1. La estimación de la media poblacional (p < 0,05) será: 26. Se efectuó un estudio para valorar un nuevo procedimiento quirúrgico planeado para disminuir la frecuencia de complicaciones posoperatorias. La frecuencia de complicaciones fue del 40% en 25 pacientes sometidos al nuevo procedimiento, y del 60% en 20 pacientes en quienes se practicó el procedimiento antiguo. La diferencia no es estadísticamente significativa. Cabe deducir: 2) 3) 4) 5) 1) 2) 3) 4) 5) 7±2 7±1 7 ± 0,16 7 ± 0,32 7 2) No se rechaza la hipótesis alternativa, siendo cierta. Se rechaza la hipótesis alternativa, siendo cierta. No se rechaza la hipótesis nula, siendo cierta. Se rechaza la hipótesis nula, siendo cierta. Se clasifica a un enfermo como tal. 22. En un contraste de hipótesis, la probabilidad de aceptar la hipótesis nula, siendo falsa es: 1) 2) 3) 4) 5) 5) 1) 21. El error alfa o tipo I es: 1) 2) 3) 4) 5) 1) 2) 3) 4) 3) 4) 5) 1) 5) 23. La capacidad de un test de encontrar diferencias, cuando en realidad las hay: 1) 2) 3) 4) 5) 1) 2) 3) 4) 5) Se rechaza la hipótesis nula. La diferencia es estadísticamente significativa. La diferencia se debe al azar. La diferencia es compatible con la hipótesis nula. La situación laboral no influye en los niveles de glucemia basal. 25. Al tratar una artritis psoriásica con azatioprina, mejora el 60% de los pacientes; la 6-mercaptopurina mejora a un 55%. La CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid El nuevo tratamiento es, sin ninguna duda, mejor que el antiguo. Si p < 0,05, el resultado no es significativo. El nuevo tratamiento es un 95% más eficaz que el usual. Si los dos tratamientos fueran iguales, resultados como los obtenidos o diferencias aún mayores ocurrirían con una probabilidad menor del 5%. No existe la suficiente evidencia como para decir que ambos tratamientos son diferentes. 28. Indique cuál de las siguientes afirmaciones en relación al contraste de hipótesis le parece FALSA : Es imprescindible. Es el error tipo I. Es el error tipo II. Es el poder o potencia del test. Es generalmente de 0,05. 24. Se compara la diferencia entre la media de glucemia basal de dos grupos de personas, unos con trabajo estable y otros en situación de desempleo. En el análisis estadístico se obtiene un valor de la “p” de 0,4. La interpretación correcta del resultado es: 1) 2) 3) 4) 5) El nuevo procedimiento es eficaz para disminuir las complicaciones posoperatorias. El nuevo procedimiento es ineficaz para disminuir las complicaciones posoperatorias. La muestra está sesgada. El resultado carece de relevancia clínica. No existe la suficiente evidencia para decir que ambos procedimientos son diferentes. 27. Al comparar dos fármacos hipoglucemiantes, observamos que el nuevo es significativamente mejor que el usual ­­­­­­­­­(p < 0,05). Indique la correcta: 2) 3) 4) Es la decisión correcta. Es el error tipo II o beta. Es la potencia del test. Es el error tipo I o alfa. Es nula siempre. Con azatioprina mejorarán el 60% de tus pacientes. La azatioprina es en un 95% mejor que la 6-mercaptopurina. El nivel de significación es del 1%. Hay diferencias entre los dos tratamientos, a ese nivel de significación. No se puede concluir nada. Si los resultados de un estudio son estadísticamente significativos, por convención, se acepta rechazar la Ho. Un resultado estadísticamente significativo no demuestra asociación causal. Si se ha rechazado la Ho es poco probable cometer un error tipo II. El poder estadístico mínimo con el que se debe afrontar un ensayo clínico es del 80%. El valor máximo admitido de error alfa para establecer diferencias mediante contraste de hipótesis en trabajos científicos es del 5%. 29. El resultado de un contraste de hipótesis no es estadísticamente significativo. Indique la FALSA: 1) 2) No puede rechazarse la hipótesis nula. La probabilidad de que el resultado sea explicable por el azar es mayor del 5%. • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 3 Test Estadística 3) 4) 5) Podría haberse conseguido un resultado estadísticamente significativo con un tamaño muestral mayor. No hay diferencias. Las diferencias no exceden lo atribuible al azar. 30. Se quiere comparar un nuevo tratamiento con otro convencional, para lo que se realiza un contraste de hipótesis, fijando un error alfa del 1% y un error beta del 3%. ¿Cuál es la probabilidad de que, existiendo las diferencias, éstas se detecten? 1) 2) 3) 4) 5) 90% 95% 97% 98% 99% 31. Un estudio epidemiológico longitudinal concluye que existe una asociación estadísticamente significativa entre un factor de riesgo y determinada enfermedad con un nivel de significación p < 0,05. ¿Cuál es la conclusión correcta? 1) 2) 3) 4) 5) En caso de no existir diferencias entre expuestos y no expuestos al factor de riesgo, la probabilidad de observar por azar los resultados obtenidos es menor del 5%. Concluimos que existe asociación real, ya que se ha demostrado asociación estadísticamente significativa. Hasta el 95% de los expuestos al factor de riesgo desarrollará la enfermedad. La asociación no es estadísticamente significativa. Se confirma relación de causalidad entre el factor de riesgo y la enfermedad estudiada. 32. Una de las siguientes afirmaciones sobre el contraste de hipótesis es FALSA: 1) 2) 3) 4) 5) El valor p es el nivel de significación estadística especificado para el estudio. El valor “p” corresponde a la probabilidad alfa de cometer un error tipo I. La capacidad del test de detectar diferencias cuando éstas existen aumenta con el aumento del tamaño muestral. Un error tipo I consiste en aceptar la hipótesis nula cuando es falsa. Los valores de “p” mayores a 5% no indican que la diferencia sea obligatoriamente debida al azar. 33. Se comparan dos tratamientos para el control de la hiperuricemia. Antes de comenzar el estudio se establece un nivel crítico del 1%. Se obtiene una “p” de 0,03; indique el enunciado cierto: 1) 2) 3) 4) 5) El poder con el que se afrontó el estudio fue del 99%. Los resultados son significativos. Se consideran significativos resultados con “p” menor al 1%. La probabilidad de cometer un error alfa en este estudio era muy alta. La probabilidad de cometer un error beta en este estudio era muy alta. 34. Se someten a un estudio comparativo la ticlopidina y la aspirina en cuanto a capacidad para disminuir el riesgo de sufrir ACVA; la ticlopidina parece mostrarse más eficaz que la aspirina. Sin 1.ª vuelta Distancia embargo, la diferencia no resulta estadísticamente significativa en el contraste de hipótesis para p < 0,05. Usted afirma que: 1) 2) 3) 4) 5) No hay diferencia de eficacia entre aspirina y ticlopidina. La ticlopidina es un 5% más eficaz que la aspirina. La probabilidad de que las diferencias observadas se deban al azar es menor del 5%. Es posible que aumentando el tamaño de la muestra obtengamos diferencias significativas para el mismo nivel de significación. Las diferencias entre ticlopidina y aspirina exceden lo atribuible al azar. 35. Para calcular el número mínimo de sujetos que es necesario incluir en un estudio sobre la prevalencia de un problema de salud se han de realizar las siguientes asunciones, EXCEPTO: 1) 2) 3) 4) 5) Proporción de sujetos que se espera encontrar con el problema de salud. La confianza con la que se quiere dar el IC. Grado de seguridad deseado. Error tipo II. La precisión con que se quiere dar el resultado. 36. Se analizan los resultados de dos ensayos clínicos que comparan antiagregantes frente a placebo. En el primero se contrasta A frente a placebo (ictus A: 10%, placebo 40%, p = 0,001). En el segundo se contrasta B frente a placebo (ictus B: 2%, placebo 50%, p = 0,04). Señale la correcta: 1) 2) 3) 4) 5) El valor de la “p” demuestra que A es mejor que B. Como la “p” de B es menor, la eficacia es menor que A. El fármaco A es menos eficaz. Como los dos son significativos, se puede decir que la eficacia es similar. La probabilidad de que el azar explique las diferencias con el azar es menor para el fármaco B. 37. La prueba estadística adecuada para comparar las medias de tensión arterial entre un grupo de fumadores, uno de exfumadores, y otro de personas que nunca han fumado es: 1) 2) 3) 4) 5) t de Student para datos independientes. t de Student para datos apareados. Análisis de la varianza. Chi-cuadrado. Coeficiente de correlación de Pearson. 38. ¿Qué test estadístico debemos utilizar para comparar la presencia cualitativa del antígeno de superficie de la hepatitis B en estudiantes de Medicina y Odontología? 1) 2) 3) 4) 5) t de Student. Test de McNemar. ANOVA. Chi-cuadrado. Test de Friedman. 39. Se comparan tres tratamientos en cuanto a eficacia en la reducción del número de lesiones de acné en pacientes adolescentes de 14 a 16 años. ¿Qué tipo de test estadístico aplicaremos? CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 4 Test Estadística 1) 2) 3) 4) 5) 1) 2) 3) 4) t de Student. ANOVA. Regresión lineal. Chi-cuadrado. Coeficiente de correlación de Spear­man. 5) 40. Para comparar la tensión arterial dias­tólica en dos muestras de mujeres, embarazadas y no embarazadas, el test más apropiado es: 1) 2) 3) 4) 5) Chi-cuadrado. Regresión lineal. Test exacto de Fisher. t de Student. Test de Wilcoxon. 41. Se pretende establecer una ecuación, mediante la que pueda predecirse el tiempo de reproducción, en base al conocimiento del fotoperíodo (número de horas de luz/día). ¿Qué tipo de test utilizaremos? 1) 2) 3) 4) 5) Coeficiente de correlación. Análisis de regresión. Test exacto de Fisher. t de Student para muestras independientes. Test de Friedman. 42. Un coeficiente de correlación de Pearson de -1 indica: 1) 2) 3) 4) 5) No hay correlación. Existe una débil correlación. Existe una fuerte correlación. Al aumentar los valores de la variable x, aumentan los valores de la variable y. Al disminuir los valores de la variable x, disminuyen los valores de la variable y. 43. Son datos apareados: 1) 2) 3) 4) 5) Tensión arterial en mujeres, frente a tensión arterial en hombres. Tiroxina en una muestra pequeña, frente a tiroxina en una muestra grande. Aclaramiento de creatinina en una muestra, frente a aclaramiento de creatinina en la población de la que ha sido extraída la muestra. Glucemia antes de comer, frente a glucemia después de comer. Talla en hombres frente a talla en mujeres. 44. Para comparar el descenso medio en la carga viral del VIH que se observa al emplear indinavir y saquinavir, se utiliza: 1) 2) 3) 4) 5) Chi-cuadrado. t de Student. Correlación de Pearson. Test de Spearman. ANOVA. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Son menos potentes que las paramétricas. Son útiles en muestras pequeñas. Son útiles en el caso de variables ordinales. Requieren ciertas asunciones sobre la distribución de las variables en la población. Pueden utilizarse para comparar variables de tipo cuantitativo. 46. ¿Qué prueba estadística de las siguientes usaría para comparar el resultado (curación/no curación) de tres tratamientos distintos? 1) 2) 3) 4) 5) ANOVA. Test de Spearman. t de Student. Chi-cuadrado. Test de Wilcoxon. 47. Una muestra de 25 pacientes nefrópatas se somete a determinación cuantitativa de ADN viral (VHB), antes y después de ser sometidos a hemodiálisis. ¿Qué test emplearía para comparar los resultados obtenidos? 1) 2) 3) 4) 5) t de Student para datos apareados. t de Student para datos independientes. Correlación de Pearson. Test de la U de Mann-Whitney. Test de Wilcoxon. 48. El propósito de un estudio fue identificar el coeficiente de correlación r entre tamaño de las neoplasias retroperitoneales primarias y el número de síntomas. Se analizaron en 46 casos de NRP su coeficiente de correlación r entre tamaño y número de síntomas mediante un estudio retrospectivo, comparativo y observacional. El coeficiente de correlación r entre el tamaño de las NRP y el número de síntomas fue de 0.32 (p=0.02). La asociación de los 3 síntomas más frecuentes encontrados en nuestro estudio, fue más frecuente en el grupo de sarcomas que en los no sarcomas con una Chi-cuadrado de 4,06 (Chi-crítica 3,84), p < 0.05 y odds ratio 7,5 (a favor de los sarcomas). De las siguientes afirmaciones, es cierta: 1) 2) 3) 4) 5) 45. ¿Cuál de las siguientes afirmaciones sobre las pruebas estadísticas no paramétricas es falsa? 1.ª vuelta Distancia Se trata de un estudio de cohortes concurrentes. La probabilidad de que la asociación encontrada entre el tamaño de la neoplasia retroperitoneal y el número de síntomas sea debida al azar es demasiado alta (32%) para considerar los resultados estadísticamente significativos. Los resultados de este estudio sugieren una débil correlación negativa entre el tamaño de la neoplasia retroperitoneal y el número de síntomas. Los resultados de este estudio sugieren que, a mayor tamaño de la neoplasia retroperitoneal, el número de síntomas es mayor. No hay asociación entre el tipo de tumor retroperitoneal y la presencia de los tres síntomas más frecuentes. 49. Para saber si hay diferencias significativas en la gravedad de la UVI de tres hospitales, se compara el test de Glasgow en las diferentes instituciones. Señale qué test estadístico emplearía con este propósito: • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 5 Estadística 1) 2) 3) 4) 5) Test 1.ª vuelta Distancia ANOVA. Test multivariante. Kruskal-Wallis. Chi-cuadrado Wilcoxon. 50. Es una prueba de contraste de hipótesis útil para establecer relación entre una variable cualitativa y otra cuantitativa: 1) 2) 3) 4) 5) Distribución t de Student. Análisis de regresión. Corrección de Yates. Test de Mann-Whitney. Prueba de Spearman. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 6 Estadística Comentarios de Test a distancia 1.ª vuelta Comentarios de Test a distancia 1.ª vuelta Estadística Pregunta 1.- R: 3 Los estudios estadísticos pretenden llegar a conocer a la población a partir de un análisis de una muestra de individuos. Lo que se estudia acerca de cada individuo de la muestra es lo que se llama carácter o variable; es decir, se trata de una característica observable en los individuos. El color de los ojos, el estado civil, el número de hijos, las pulsaciones por minuto, la talla o la velocidad de sedimentación constituyen ejemplos de variables. Las variables cuantitativas son aquellas que pueden medirse, cuantificarse o expresarse de forma numérica; las variables que no pueden cuantificarse numéricamente reciben el nombre de variables cualitativas; estas variables, por lo tanto, toman valores no numéricos. Dentro de las opciones, hay dos variables cuantitativas: la glucemia y el número de camas. Cuando entre dos categorías cualquiera de una variable, podemos interponer otra (por ej., entre 80 y 81 mg/dl de glucemia, tenemos 80,5) la variable es continua. El número de camas por el contrario es discreta. VARIABLE Cualitativa Cuantitativa SUBTIPO EJEMPLO Nominal dicotómica Sexo Nominal no dicotómica Raza Ordinal Nivel socioeconómico Discreta N.º episodicos de asma/semana Continua Uricemia Pregunta 1. Tipos de variables. Pregunta 2.- R: 3 Duración del sangrado menstrual, número de familias numerosas/1.000 habitantes, consumo diario de cigarrillos y colesterol sérico son variables en las que se asignan números a cada una de las categorías posibles y, lo que es más importante, en las que dichos guarismos tienen valor matemático, es decir, fumar 20 cigarillos es el doble que fumar 10. Sin embargo, hay ciertas variables en las que, aunque utilicemos números para las distintas categorías, estos números carecen de valor matemático. Un ejemplo de estas variables es la escala de Glasgow. Esta escala se utiliza para la exploración del coma o del traumatismo craneoencefálico y en ella se consideran tres parámetros: respuesta motora, ocular y verbal. Según el estado del paciente, se asignan unos puntos a cada parámetro, obteniéndose un resultado final que va de 3, que se considera una situación muy grave, a 15, que sería una situación de normalidad. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Pero si te das cuenta, estos números no aportan un valor matemático (7 no significa “doble” peor pronóstico que 14), sino que son tan sólo una manera arbitraria de aproximarnos con números a categorías cualitativas (desde normalidad a coma profundo). Esta variable, la escala de Glasgow, por lo tanto, es cualitativa, y como las categorías de esta variable tienen una manera lógica de ordenarse (de 3 a 15), se denomina cualitativa ordinal, a diferencia de otras variables cualitativas (por ej., el color de pelo) que no pueden ser ordenadas de un modo lógico y se denominan nominales. Pregunta 3.- R: 5 El primer escalón dentro de la estadística es el descriptivo. En esta fase se realiza la recogida de la información, que debe ser posteriormente ordenada, resumida y presentada de una forma comprensible que permita pasar posteriormente a la segunda fase, que es el análisis de los datos. Dentro del apartado de estadística descriptiva nos encontramos con las medidas de centralización que se mencionan en esta pregunta: la media, la mediana y la moda. La media se obtiene sumando todos los valores numéricos observados y dividiendo el resultado por el número de observaciones. Es la medida de centralización más empleada. Recuerda que es muy sensible a las observaciones atípicas. En este caso: 31, que es la suma total, entre 9, que es el número de observaciones, da 3,4. La mediana sólo emplea el valor central de la serie (es decir, el que deja a cada lado, la misma proporción de la muestra); sin embargo, se afecta menos por observaciones atípicas (por ejemplo, errores de medida). En este caso, es 3. La moda es el dato que más se repite en una serie, puede no ser un valor único, a diferencia de los otros dos parámetros. En este caso, es 2. Pregunta 4.- R: 4 Las medidas de centralización informan sobre alrededor de qué valores se agrupan los datos observados; son la media, la mediana y la moda. La medida de centralización más utilizada es la media aritmética, si bien, en ciertas circunstancias, es mejor utilizar la mediana. Es preferible el uso de la mediana como medida de centralización en los siguientes casos: • Mediciones atípicas. • Errores de medición. • Muestra no homogénea. • Distribución asimétrica. En el estudio que nos plantean, el dato de centralización aportado es la mediana, por lo que es de suponer que estamos bajo alguno de los supuestos anteriores. • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 1 Estadística La opción 3 (“La muestra estudiada no es homogénea”) es falsa porque no sabemos con seguridad cuál ha sido el motivo para calcular la mediana en vez de la media. De todas las opciones, la que encaja con todo lo expuesto es la 4 (“Es posible que alguno de los sujetos estudiados haya presentado un número elevado de catarros”), es decir, es posible que hayan aparecido observaciones atípicas y, por eso, haya sido preferible el cálculo de la mediana. Pregunta 5.- R: 4 El concepto de dispersión implica “cuánto están de separados los datos con respecto al dato central (a la media)”, por tanto, se puede calcular como la suma de las diferencias con la media de los datos. Hay que tomar los valores absolutos, ya que, puesto que hay unos datos mayores que la media y otros menores, el sumatorio de las diferencias daría cero si no se emplease esta argucia matemática. Posteriormente se divide la suma total entre el número de individuos de la muestra, para que sea comparable con otras dispersiones en otras series con distinto número de individuos. Así se obtiene la desviación media de los datos con respecto a su media aritmética. Avanzando un poco más, podemos, a partir de la desviación media, obtener un mejor índice de dispersión: si en vez de trabajar con valores absolutos, elevamos al cuadrado las diferencias, también nos deshacemos de los números negativos, y pasamos a trabajar con “áreas” en vez de segmentos (las diferencias se elevan al cuadrado); hemos obtenido la varianza, que es una excelente medida de dispersión. El problema de la varianza es que sus unidades son las mismas que las de los datos pero elevadas al cuadrado, lo cual es matemáticamente incómodo, por ello se obtiene la raíz cuadrada positiva del resultado de la varianza para manejarse más cómodamente; a este valor se le llama desviación típica, y es el mejor índice de dispersión. El rango o recorrido es la media de dispersión más elemental. Su interés es muy relativo, ya que utiliza solamente dos datos de la serie (el primero y el último), que son, precisamente, los menos representativos, puesto que son los valores extremos o más raros de la variable. MEDIDA DE CENTRALIZACIÓN MEDIDA DE DISPERSIÓN Distribución homogénea Media Desviación típica o estándar Distribución asimétrica Mediana Rango intercuartílico Rango Pregunta 5. Formas de medida. Pregunta 6.- R: 5 El coeficiente de variación es adimensional, debido a que representa el porcentaje de la desviación estándar sobre la media. Su utilidad está en que sirve para comparar la variabilidad de dos o más distribuciones, estén expresadas en las mismas o en diferentes unidades. Por tanto, la opción 5 es la falsa. La forma de comparar dos desviaciones típicas de muestras diferentes se hace mediante el coeficiente de variación, que considera cada desviación en relación a la muestra de la que procede, es decir, en relación (división) a la media de la muestra. Mediante la relación, se obtiene una medida adimensional que puede compararse con la de otra muestra. Después de hablar de las medidas de dispersión surge la pregunta “¿Cuándo se puede decir que una distribución es concentrada o dispersa?, ¿a partir de qué valor de la desviación típica?”. En general, para distribuciones biológicas de datos, sin valores negativos, se pueden considerar concentradas aquellas cuya desviación típica no excede 1/3 del valor de la media. Desviaciones superiores a la mitad de la media se traducen en dispersiones excesivas. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Comentarios de Test a distancia 1.ª vuelta Pregunta 7.- R: 4 La distribución normal sigue una forma de campana en la que el valor central es la media y también la mediana (puesto que la campana es simétrica) y la moda (puesto que en ese punto la curva tiene su máxima altura). Entre ± 1 desviación estándar se encuentra el 68% de las observaciones y entre ± 2 desviaciones estándar están el 95% de las observaciones. Por tanto, entre 1 y 2 desviaciones estándar se encuentran el 27% (95-68), por lo que la opción 4 es incorrecta. El resto de opciones resumen una serie de características que debes conocer sobre la curva de Gauss. Pregunta 7. Distribución normal. Pregunta 8.- R: 3 Los percentiles son parámetros de posición que dividen el conjunto de las observaciones en 100 partes iguales. El percentil (Pc) 80 nos indica que el 80% de nuestras observaciones serán menor o igual a su valor (en esta pregunta 120), o lo que es lo mismo, el 20% de las observaciones serán mayor a 120 (respuesta 3 correcta). El percentil 50 equivale a lo mismo que la mediana. Pregunta 9.- R: 1 Los parámetros que definen a una muestra son su tamaño, una medida de tendencia central y una de dispersión. Las más utilizadas son la media y la desviación típica, sin embargo, nos especifican que tenemos una muestra SESGADA, es decir, heterogénea o asimétrica, por eso preferimos usar la mediana y, por lo tanto, el rango intercuartílico. Pregunta 10.- R: 2 La mediana es una medida de tendencia central cuya principal utilidad es en muestras heterogéneas, ya que elimina los valores extremos. Recuerda que en las distribuciones normales, la media, la moda y la mediana son iguales, por eso la respuesta 5, aunque es la definición de la moda, es correcta. Pregunta 11.- R: 5 En los estudios estadísticos se escoge una muestra pequeña de la población y sobre ella se realizan todas las mediciones; estos resultados son ciertos para el 100% de la muestra, es decir, que en la muestra no se aporta ninguna probabilidad de error porque conoces a todos los individuos de la misma. Por eso es falsa la opción 4 y correcta la opción 5 (“El 68% de las personas que participaron en este estudio tienen una TAD entre 55 y 65”). Observa que en esta formulación, que hace referencia a la muestra, no se da probabilidad de error (p). • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 2 Estadística Una vez expuestos los resultados de tu estudio, se deben generalizar o inferir a la población; durante este proceso hay que aceptar que la muestra, por muy representativa que sea, nunca va a ser idéntica a la población y, por tanto, la generalización va a tener que asociar una probabilidad de que en el intervalo de confianza estimado NO se encuentre la verdadera medida del parámetro estimado (el valor que se obtendría si se calculase con toda la población). Como ves, siempre que acompañando a un intervalo vaya una “p” podemos deducir que se trata de un intervalo de confianza que, con con una probabilidad dada, contendrá al verdadero parámetro en la población. Con los datos que aportan en esta pregunta (media y desviación estándar) no se puede calcular el intervalo de confianza, ya que falta el tamaño muestral. Pregunta 12.- R: 3 En esta pregunta nos están pidiendo un intervalo en el que con una confianza determinada (95% o 99%) esté la media poblacional de glucemia, por lo que las dos primeras opciones NO pueden ser correctas, ya que al estimar un parámetro en la población (en este caso una media) hay que aportar la probabilidad de que en ese intervalo no esté el valor poblacional (la “p”). Como dos de las opciones tienen una p < 0,01, calcularemos en primer lugar el intervalo de confianza del 99% y, en caso de que NO coincida con estas dos opciones, marcaremos la opción 3. IC 99% = X + – 2,6 DS Pregunta 14.- R: 3 Es importante darse cuenta de que en esta pregunta, aunque nos dan algunos datos poblacionales, lo que se pide es un intervalo que comprenda al 95% de una muestra. Este intervalo (que NO se llama de confianza), si la variable sigue una distribución normal (en caso de que este dato no lo aporten, como ocurre casi siempre en el MIR, se asume que es así) se calcula: X ± 2 x DS Del enunciado, extraemos que la media es 200 mg/dl y el dato que nos falta es la desviación típica. Para determinar la desviación típica es necesario darse cuenta de que en el cálculo del dato poblacional que nos aporta el enunciado (el intervalo de confianza del 95%) está la desviación típica. IC 95% = X + – 2 DS n-1 Aplicando la fórmula: IC 95% = 200 + – 2 DS 100 (Date cuenta de que generalmente al tamaño muestral NO se le resta uno, ya que la diferencia del resultado es mínima y el cálculo de la raíz cuadrada es mucho más sencillo). Sustituimos el IC 95% por los valores que nos dan en el enunciado de la pregunta: n-1 Aplicando la fórmula: IC 99% = 80 + – 2,6 Comentarios de Test a distancia 1.ª vuelta DS 10 196 - 204 = 200 + – 2 100 100 IC 99% = 80 + – 2,6 Si desarrollamos esta ecuación (eligiendo el límite superior o el inferior del IC), tenemos: Como vemos, el resultado NO coincide con las dos últimas opciones, por lo que la correcta es la tercera: IC 95% = 80 + – 2 10 204 - 200 = 2 (DS/10) 4 = 2 DS / 10 40 = 2 DS; DS = 20 100 De cara al cálculo del intervalo de confianza, en el MIR, si la raíz cuadrada del tamaño muestral es un número entero (por ejemplo, raíz de 100), se suele redondear y no se resta 1. Pregunta 13.- R: 4 La clave de esta pregunta es tener claro qué es un intervalo de confianza y cómo se expresa. Un intervalo de confianza es una horquilla de dos valores entre los que hay una probabilidad dada de que se encuentre el valor poblacional de determinada medida (una media, una prevalencia). Los intervalos de confianza se pueden dar desarrollados (por ejemplo, 65-75 lpm, p < 0,05) o sintéticos (por ejemplo, 70 ± 5 lpm, p < 0,05). Lo más importante es darse cuenta de que en el enunciado de esta pregunta YA nos dan el intervalo de confianza (en el 5 está comprendido 2 x error estándar de la media), por lo que la probabilidad de que la media de frecuencia cardíaca en la población NO esté en ese intervalo que nos dan es menor del 5%, que es lo que dice la opción 4. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Ahora que ya tenemos la desviación típica, podemos calcular el intervalo de la muestra por el que nos preguntaban: X ± 2 x DS Aplicación de la fórmula: 200 ± 2 x 20 = 200 ± 40 = 160 - 240 Pregunta 15.- R: 4 Con los datos que aporta el enunciado (tamaño muestral, media y error estándar de la media), podemos calcular la desviación típica, por lo que, de todas la opciones, puede ser cierta alguna que hable de la muestra (cuyos intervalos se calculan con la media y la desviación típica) o de la población (cuyos intervalos de confianza se calculan con la media y el error estándar de la media). • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 3 Estadística Ya que nos dan el error estándar de la media, lo más fácil es calcular primero el IC 95% y, en caso de que no coincida con las opciones que hablan de la población (la 3 y la 4), desarrollar después el intervalo que incluye el 95% de la muestra y comprobar con cuál de las opciones que se refieren a la muestra (opciones 1 y 2) coincide. IC 95% = X ± 2 x EEM Comentarios de Test a distancia 1.ª vuelta Nos dicen que el 68% de la muestra está comprendido entre 175 y 225, por lo que: X ± DS = 175 - 225 200 ± DS = 175 - 225 Desarrollando esta ecuación, obtendremos que la DS es 25. Ahora sólo tenemos que retomar la fórmula del IC 95%: Aplicación de la fórmula: IC 95% = 200 ± 2 (DS/10) IC 95% = 200 ± 2 (25/10) IC 95% = 200 ± 2 x 2,5 IC 95% = 200 ± 5 IC 95% = 195 - 205 IC 95% = 2 ± 2 x 0,5 IC 95% = 2 ± 1 Es decir, que se tiene un 95% de confianza de que el verdadero descenso medio se sitúe entre 1 y 3 mmol/l, que es lo que dice la opción 4). Pregunta 16.- R: 2 La inferencia estadística o estimación de parámetros consiste en estimar un parámetro poblacional a partir de un dato de la muestra que ha sido estudiada. La precisión de los resultados de un estudio no depende principalmente del valor del parámetro estudiado en la muestra, sino del tamaño muestral. Dicho de otro modo, que el intervalo de confianza quede más o menos estrecho no depende de que la media me haya salido 80 o 120, sino de que tenga 30 o 300 personas en el estudio. Así que la opción FALSA es la 2. En la fórmula del error estándar de la media (EEM), la desviación típica está en el numerador y el tamaño muestral en el denominador. Para reducir el EEM, no podemos actuar sobre el numerador, ya que la desviación típica es una característica que depende de la variable que estamos midiendo. Lo que sí podemos hacer es aumentar el denominador, es decir el tamaño muestral, de modo que al aumentar el tamaño muestral cuatro veces (como está dentro de una raíz cuadrada), conseguimos disminuir el EEM a la mitad. De modo que si un intervalo de confianza es demasiado amplio y queremos reducirlo (esto es, ganar en precisión), deberemos aumentar el tamaño muestral. Recuerda que aunque calculamos el IC del 99% con la media muestral +/- eem x 3, en realidad es una“licencia”matemática que nos permitimos, el valor real es media muestra -/- eem x 2,57 como dice la respuesta 5, pero es mucho más fácil multiplicarlo por 3 (eso no quiere decir que lo apliques así si tienes que calcularlo, sólo que conozcas el concepto). De la misma manera, el IC del 95% lo calculamos con la media muestral +/eem x 2, pero el valor real es media muestral +/- eem x 1,96. Pregunta 17.- R: 2 En esta pregunta nos piden un intervalo que incluya con una probabilidad del 95% la verdadera media poblacional, es decir, el intervalo de confianza del 95%: IC 95% = X + – 2 DS n-1 Aplicación de la fórmula: IC 95% = 200 + – 2 DS Pregunta 18.- R: 3 En esta pregunta nos piden el intervalo de confianza del 95%, y tenemos que andar con mucho ojo porque podemos confundirnos si creemos que en el enunciado nos están dando el tamaño muestral, la media y la desviación estándar, es decir, los datos más habituales con que nos piden un IC. DS 196 - 204 = 200 + – 2 100 Sin embargo, en esta pregunta no nos hablan de desviación estándar o típica sino de error estándar, y por eso para el cálculo del intervalo de confianza no tenemos que dividir 0,5 entre la raíz de 100, ya que 0,5 ya es el error estándar. Así que el IC 95% será: IC 95% = 65 ± 2 x 0,5 IC 95% = 64 - 66 Recuerda que en la muestra no se da probabilidad de error, así que ERROR estándar de la media tiene que ser un dato de dispersión poblacional. Pregunta 19.- R: 3 Para contestar a esta pregunta hay que tener claro que 260 ± 10 con una p < 0,05 no puede ser otra cosa que el intervalo de confianza del 95% (recuerda que en la muestra no hablamos de confianza y no se aporta probabilidad de equivocarnos, es decir, la “p”) y que en el 10 ya está incluido 2 x EEM. Si nos ha quedado claro lo anterior, la probabilidad de que en ese intervalo NO esté la verdadera media poblacional de colesterol será del 5%, que es lo que dice la opción correcta (la 3). Si te das cuenta, con los datos que aporta el enunciado (NO nos dan tamaño muestral, por lo que NO podemos calcular la desviación típica a partir del intervalo de confianza), NO podemos calcular intervalos de la muestra, por lo que aquellas opciones que hablen de la muestra (1, 2 y 5) serán falsas. Pregunta 20.- R: 4 En esta pregunta nos piden el intervalo de confianza del 95% y nos aportan todos los datos necesarios para su cálculo: 100 IC 95% = 200 ± 2 (DS/10) DS Para su cálculo nos falta la desviación estándar, que no nos la dan directamente, pero que la podemos buscar en un dato de la muestra. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid 196 - 204 = 200 + – 2 100 • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 4 Estadística Aplicación de la fórmula (aquí sí restamos 1 al tamaño muestral, ya que en este caso facilita el cálculo): 1 IC 95%= 7 + – 2 36 IC 95% = 7 ± 2 (1/6) IC 95% = 7 ± 0,32 Pregunta 21.- R: 4 Cuando se comparan dos muestras o grupos (por ejemplo, dos grupos de personas sometidos a dos tratamientos distintos), incluso aunque entre estos dos grupos no hubiera diferencia, al medir en ellos una variable resultado (por ejemplo, respuesta o no a un analgésico o disminución de la TA con una antihipertensivo) es muy poco probable que el promedio de la variable resultado de ambos grupos sea exactamente el mismo. Para entender en qué consiste el contraste de hipótesis, deberemos partir del anterior razonamiento: “en caso de que ambos grupos sean iguales, se pueden obtener pequeñas diferencias en la variable resultado que se deben a la variabilidad del muestreo”. En contraste de hipótesis, al supuesto de que ambos grupos o muestras provienen de una población homogénea (es decir, de que son iguales o de que no hay diferencias entre ellos), lo llamamos hipótesis nula (Ho) y las diferencias que se deben al muestreo son diferencias que se pueden explicar por el azar. Por lo tanto, podríamos repetir el anterior argumento con otros términos: “en caso de que la Ho sea cierta, se pueden obtener pequeñas diferencias en la variable resultado que se deben al azar”. ¿Y en qué consiste el contraste de hipótesis? Consiste en establecer si las diferencias que se han obtenido entre los dos grupos son probablemente debidas al azar (a la variabilidad en el muestreo) y, por lo tanto, no podremos refutar la hipótesis nula o si, por el contrario, las diferencias obtenidas son demasiado grandes y la probabilidad de que se deban al azar es pequeña y, por tanto, rechazaremos la Ho y diremos que las diferencias son compatibles con la hipótesis alternativa (H1), que es aquella que sostiene que ambos grupos son distintos. Lo más importante de todo es darse cuenta de que, cuando rechazamos la Ho, no estamos completamente seguros de que las diferencias encontradas no se deban al azar. Lo que ocurre es que, como la probabilidad de que se deban al azar es tan pequeña, nos inclinamos a pensar que la que es cierta es la H1. ¿Y qué parámetro estadístico es el que determina cuál es la probabilidad de que la diferencia obtenida se deba al azar? El grado de significación (la “p”). Proponemos un ejemplo para la comprensión de uno de los conceptos más importantes de la Estadística y del bloque de Estadística en el examen MIR. Para comparar la TAD de los hombres y las mujeres, se recluta a 10 mujeres y 10 hombres sin HTA y se les toma la TAD. Se calcula la media aritmética de ambos grupos, y el resultado es: X de TAD en hombres: 80 X de TAD en mujeres: 63 Según estos resultados, estaríamos tentados a decir que la TAD es distinta en hombres y en mujeres, pero ANTES de afirmar dicha diferencia, deberemos preguntarnos: ¿estas diferencias encontradas no se deberán a la variabilidad que deriva de trabajar con muestras en vez de con toda la población de mujeres y hombres? Imaginamos que se calcula el grado de significación y se obtiene un 3%, es decir, la probabilidad de que estos resultados (la diferencia obtenida en nuestro estudio) se deba al azar es muy pequeña, por lo que tendremos CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Comentarios de Test a distancia 1.ª vuelta suficiente evidencia para rechazar la hipótesis nula y decir que entre los dos grupos hay diferencias. Pero, ¿es posible que habiendo dicho que la TAD en hombres es distinta a la de mujeres nos hayamos equivocado? Efectivamente, la probabilidad de que hayamos rechazado la Ho y fuese cierta (lo que se denomina error tipo I), coincide con la probabilidad de que las diferencias encontradas se deban al azar (es decir, que NO haya diferencias), esto es, el grado de significación. Por lo que, recapitulando: siempre que rechazamos la hipótesis nula, deberemos aportar la probabilidad de que nos equivoquemos, es decir, de cometer un error tipo I: la “p”. Pregunta 22.- R: 2 En el caso de que la hipótesis nula fuese falsa (esto es, si en realidad hubiese diferencias) y el grado de significación obtenido no fuera tan pequeño como el nivel mínimo exigido en Estadística (5%), NO podremos rechazar esa hipótesis nula, aunque sea falsa. A ésto, en contraste de hipótesis, se le denomina error tipo II. Es importante insistir en que cuando no se tiene suficiente evidencia para rechazar la Ho, no por ello se dice que sea cierta. REALIDAD RESULTADOS DEL TEST EXISTE DIFERENCIA Ho falsa NO EXISTE DIFERENCIA Ho cierta Hay diferencias significativas Rechazo Ho 1-beta Poder estadístico o potencia del test Error tipo I o error alfa No hay diferencias significativas No rechazo Ho Error tipo II o error beta 1-alfa Pregunta 22. Contraste de hipótesis. Pregunta 23.- R: 4 El poder o potencia estadística es la capacidad de demostrar las diferencias en caso de ser ciertas (esto es, rechazar la hipótesis nula siendo falsa ésta y siendo cierta la alternativa). En el caso de que la hipótesis nula fuese falsa (esto es, si en realidad hubiese diferencias), nos podemos encontrar con dos situaciones: • No rechazamos la Ho: error tipo II. • Rechazamos la Ho: poder estadístico. Como puedes ver, el poder estadístico es el complementario del error tipo II, es decir, si antes de arrancar un estudio, aceptamos un error tipo II del 10%, sabremos que la probabilidad de demostrar diferencias, en caso de haberlas, será del 90%. Pregunta 24.- R: 4 Cuando se comparan dos grupos con alguna característica que los diferencia (en este caso, la situación laboral) tratamos de demostrar que la diferencia que se obtiene en la variable resultado (en este caso, la glucemia basal) no se debe al azar, es decir, que es muy raro que se pueda explicar tan sólo por el hecho de la variabilidad normal de las personas. Si al comparar dos medias nos encontramos que la probabilidad de que las diferencias halladas puedan deberse al azar es del 40% (p=0,4), podremos decir: • Los resultados NO son significativos. • No hemos obtenido suficiente evidencia para rechazar la Ho. • La probabilidad de que esos resultados (esas diferencias) puedan deberse a variaciones en el muestreo es bastante alta, por lo que • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 5 Estadística • posiblemente NO haya verdaderas diferencias, es decir, los resultados son compatibles con la hipótesis nula (opción 4 correcta). Es POSIBLE que se haya cometido un error tipo II y, quizás, si aumentásemos el tamaño muestral los resultados serían significativos. Recuerda que si los resultados del estudio son NO significativos no podemos afirmar que la hipótesis nula sea falsa, es decir, que NUNCA valdrá una opción como la 5 (“La situación laboral no influye en los niveles de glucemia basal”) que afirme que no hay diferencias, ni otra en la que se afirme de manera tajante que los resultados se deben al azar (la opción 3 es falsa por ésto), ya que no estamos seguros de que los resultados se deban al azar (siempre es posible que se haya cometido un error tipo II). Por tanto, si la “p” es NO significativa, lo mejor es buscar una opción que diga:“No se ha obtenido evidencia de que los dos grupos de estudio sean distintos”. Dicho en palabras más sencillas: “No he demostrado nada”. Pregunta 25.- R: 4 Incluso si la eficacia de la azatioprina y la 6-mercaptopurina fuese igual (Ho cierta), es rarísimo que el porcentaje de respuesta sea exactamente igual en dos grupos de personas; lo que tenemos que decidir es si las diferencias observadas (60% de mejora con azatioprina y 55% con 6-mercaptopurina) se pueden deber al azar; la respuesta a esta pregunta es el grado de significación, que en este caso es menos del 5%, por lo que podremos decir que hay diferencias entre esos dos tratamientos (rechazaremos la Ho), con una probabilidad de equivocarnos (es decir, de que se deban al azar) menor del 5%, que es lo que dice la opción 4. Pregunta 26.- R: 5 Nos encontramos con dos grupos de pacientes que, sometidos a distintos procedimientos quirúrgicos, presentan un porcentaje de complicaciones distinto, que desde el punto de vista clínico es importante. Lo que hay que establecer es con qué probabilidad estas diferencias pueden ser explicadas por el azar; en el enunciado no nos lo dan directamente, pero la probabilidad de que el azar explique las diferencias debe de ser mayor del 5%, ya que nos dicen que la diferencia no es estadísticamente significativa. Es importante recalcar que, cuando no se tiene suficiente evidencia para rechazar la Ho, no por ello se dice que sea cierta, por eso lo único que podremos decir es que no existe evidencia para decir que ambos tratamientos son diferentes (opción 5 correcta), pero NO podremos aseverar que los dos tratamientos son iguales. Pregunta 27.- R: 4 Pongamos un ejemplo que podría ser el del enunciado de esta pregunta: en 35 personas tratadas con el hipoglucemiante A se consigue como media una reducción de la glucemia de 45 mg/dl y en 35 personas tratadas con el hipoglucemiante B se consigue como media una reducción de la glucemia de 60 mg/dl. En el contraste de hipótesis se calcula cuál es la probabilidad de encontrar estos resultados si los dos tratamientos fuesen iguales y se obtiene un grado de significación del 2%. Trasladado a cómo está formulada la pregunta, si los dos tratamientos fuesen iguales (si la Ho fuese cierta), resultados como los obtenidos o diferencias aún mayores (en nuestro ejemplo, diferencias mayores a 60-45), ocurrirían con una probabilidad menor del 5% (en nuestro caso con una probabilidad del 2%), que es lo que dice la opción 4. Pregunta 28.- R: 3 Si los resultados de un estudio son estadísticamente significativos, por convención, se acepta rechazar la Ho, esto es, se afirma que es poco probable que sea cierta en base a las diferencias observadas entre los distintos grupos estudiados. Pero a pesar de haberse encontrado una CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Comentarios de Test a distancia 1.ª vuelta diferencia elevada (resultado estadísticamente significativo), eso no indica que haya una asociación causal. Es importante que entiendas que si rechazamos la Ho el único error que tiene cabida en esta situación es que, aunque la hemos rechazado, fuera cierta, es decir, un error tipo I o alfa, por lo que no es poco probable cometer un error tipo II, es imposible cometer un error de este tipo (la opción 3 es FALSA). El poder estadístico mínimo con el que se debe afrontar un ensayo clínico (como dice la opción 4) es del 80 %, ya que si se hace con un poder inferior se está poniendo en cierto riesgo a un grupo de personas cuando la probabilidad de encontrar diferencias, si las hay, es pequeña y eso no es éticamente aceptable. El valor máximo admitido de error alfa para establecer diferencias mediante contraste de hipótesis en trabajos científicos es del 5%; el otro valor habitualmente utilizado (más estricto) es el 1%. Dicho de otro modo, los niveles críticos que se manejan en estudios epidemiológicos son el 5% y el 1%. Pregunta 29.- R: 4 Cuando el grado de significación obtenido es mayor que el nivel crítico fijado (habitualmente el 5%), la probabilidad de que las diferencias observadas sean debidas al azar es demasiado alta (fíjate que “demasiado alta” puede ser un 6%), por lo que no tenemos suficiente evidencia para rechazar la hipótesis nula. No rechazar la hipótesis nula NO significa que sea cierta (es más, un grado de significación cercano al 5% sugiere que hay diferencias, pero que éstas pueden deberse al azar con una probabilidad no tan baja como la exigida), por lo que NO podremos decir que no haya diferencias (opción 4 falsa). Pregunta 30.- R: 3 La probabilidad de que existiendo diferencias (es decir, de que siendo falsa la hipótesis nula), se detecten, o lo que es lo mismo, se obtenga suficiente evidencia para rechazar la hipótesis nula, es la potencia estadística. La probabilidad de que habiendo diferencias NO se demuestren es el error tipo II, por lo que: Error tipo II + Poder Estadístico = 1 Como el error tipo II y el poder estadístico son complementarios, si la probabilidad de cometer un error beta es del 3%, la probabilidad de detectar las diferencias será del 97% (como dice la opción 3). Pregunta 31.- R: 1 Pongamos un ejemplo para su mejor comprensión. Se realiza un estudio longitudinal en el que se selecciona un grupo de personas expuestas a HTA y otro grupo de personas que no presentan este factor de estudio; se siguen durante 2 años a todas las personas participantes y se detecta una incidencia de ACV entre las personas que padecen HTA de 80 por cada 1.000 personas y entre las que no tienen HTA de 40 por cada 1.000 personas. ¿Estas diferencias encontradas se pueden deber al azar, a la variabilidad en el muestreo? La respuesta hay que buscarla en el grado de significación, que en este caso es menor al 5%, por lo que en caso de que no hubiese una asociación entre el factor estudiado (la HTA) y la enfermedad (los ACV) la probabilidad de haber encontrado estos resultados sería menor del 5% (opción 1 correcta). NO se confirma relación de causalidad entre el factor de riesgo y la enfermedad estudiada, ya que para ello se tienen que cumplir una serie de criterios de causalidad que en esta pregunta NO se mencionan. • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 6 Estadística Pregunta 32.- R: 4 Un error tipo I consiste en rechazar la hipótesis nula cuando en realidad es cierta (opción 4 falsa). La probabilidad de que rechacemos la Ho y sea cierta coincide con la probabilidad de que las diferencias encontradas se deban al azar (es decir, que NO haya diferencias), ésto es, el grado de significación. En otras palabras, decimos que la probabilidad de que las diferencias observadas se deban al azar es tan baja como para creer que hay verdaderas diferencias y en realidad, aunque era muy poco probable, las diferencias encontradas son debidas al azar. En los trabajos científicos sobre diferencias mediante contraste de hipótesis, se admite como valor máximo de error alfa (o lo que es lo mismo, valor máximo de “p”) el 5%. Si “p” es menor a 0,05 el resultado es estadísticamente significativo, por lo que es muy poco probable que las diferencias se deban al azar. Si “p” es mayor a 0,05 no existe suficiente evidencia para decir que ambos tratamientos son diferentes. Las diferencias pueden deberse al azar, con una probabilidad mayor al nivel de exigencia. Jamás podemos asegurar que las diferencias son por el azar, ya que éstas pueden ser debidas a, por ejemplo, haber tomado una muestra insuficiente para realizar las comparaciones. Si aumentamos el tamaño muestral aumenta la potencia del test (capacidad del test de detectar diferencias cuando existen en realidad). Pregunta 33.- R: 3 Antes de arrancar un estudio se establece el nivel de “p” a partir del que vamos a considerar nuestros resultados significativos (nivel crítico). Por lo tanto, si en este estudio el nivel crítico es del 1%, se consideran significativos resultados con “p” menor al 1%, que es lo que dice la opción 3. Si asocias la “p” con la probabilidad de cometer un error tipo I, comprenderás que estableceremos un nivel del 1% en aquellas situaciones en las que, antes de empezar a utilizar el fármaco, queremos asegurarnos de que las diferencias sean verdaderas, por ejemplo, cuando el fármaco investigado tiene importantes efectos secundarios. Por lo tanto, la probabilidad de cometer un error alfa en este estudio era baja (menor al 1%) y no alta como dice la opción 4. Lo que no podemos saber es la probabilidad de cometer un error beta, ya que en el enunciado no nos informan de la potencia estadística. Por eso mismo sabemos que es falsa la opción 1 (el poder con el que se afrontó el estudio fue del 99%). Resumiendo, los resultados de este estudio son no significativos porque establecimos un nivel crítico muy estricto (del 1%), quizás porque el nuevo medicamento (fármaco experimental) produce más efectos secundarios que el habitual. Pregunta 34.- R: 4 Aunque la “p” haya resultado no significativa (para el nivel crítico del 5%), no podemos decir que no haya diferencia de eficacia entre aspirina y ticlopidina (no sugerimos que la hipótesis nula sea cierta, simplemente no tenemos suficiente evidencia para decir que es falsa). Comentarios de Test a distancia 1.ª vuelta La “p” no tiene nada que ver con la magnitud de la eficacia, por lo que la opción que dice “la ticlopidina es un 5% más eficaz que la aspirina” es FALSA. La probabilidad de que las diferencias observadas se deban al azar NO es menor del 5% ya que la “p” no ha sido significativa. Las diferencias entre ticlopidina y aspirina NO exceden lo atribuible al azar, ya que ésto se puede decir cuando la “p” es menor al 5%. De todas las opciones es cierta la que dice que“es posible que aumentando el tamaño de la muestra obtengamos diferencias significativas para el mismo nivel de significación”, es decir, que aumentando el tamaño muestral (factor más importante de la potencia estadística) aumentamos la probabilidad de que se encuentren diferencias si las hay. Pregunta 35.- R: 4 Ante una pregunta MIR sobre tamaño muestral, primero debemos fijarnos en si se trata de un contraste de hipótesis o una estimación de parámetros. La diferencia más importante en ambos casos es que para un contraste de hipótesis se debe conocer el valor de beta, y para una estimación de parámetros no. En este caso se trata de una estimación de parámetros (estudio de prevalencia), por lo que la respuesta correcta es la 4). Pregunta 36.- R: 3 Un valor de “p” menor a 0,05 en un ensayo clínico nos da las siguientes informaciones: • Los resultados son estadísticamente significativos. • Se ha obtenido suficiente evidencia para rechazar la Ho (no existen diferencias entre los diferentes tratamientos) y, por tanto, aceptar la H1 (sí existen diferencias entre los tratamientos). • La probabilidad de cometer un error tipo I (o alfa) es la “p” obtenida, cuyo valor es la probabilidad de que en realidad no haya diferencias y yo diga que sí las hay. En este caso, la probabilidad de que el azar explique las diferencias es menor para el fármaco A, 0,001 frente a 0,04 (respuesta 5 falsa). En ambos ensayos (fármaco A frente placebo y fármaco B frente placebo), los resultados son significativos, pero la diferencia en el valor de “p” no indica mayor o menor eficacia (respuestas 1, 2 y 4 falsas). Para valorar la magnitud del efecto de ambos fármacos nos debemos fijar en los resultados de los ensayos. Con los datos que nos dan podemos calcular la reducción absoluta del riesgo (RAR) de sufrir un ictus en cada ensayo. Por tanto: • Fármaco A vs placebo: RAR = 40–10 = 30% • Fármaco B vs placebo: RAR = 50–2 = 48% Vemos que el fármaco B tiene un mayor RAR y, por tanto, podemos decir que es más eficaz (respuesta 3 correcta). Pregunta 37.- R: 3 Para contestar este tipo de preguntas lo más importante es encontrar las dos variables del estudio que nos propongan. VARIABLES Variable 1 TEST DE CONTRASTE DE HIPÓTESIS Variable 2 Datos independientes Datos Apareados Cualitativa Cualitativa Chi-cuadrado Mc Nemar Cualitatitva no dicotómica Cuantitativa T Student T student para datos apareados Cualitatitva no dicotómica Cuantitativa ANOVA (análisis de la varianza) Cualitativa Cuantitativa ANOVA para medidas repetidas Correlación Pearson Regresión Pregunta 37. Test paramétricos. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 7 Estadística En este caso, la variable predictora (V1) será: no haber fumado nunca, ser ex-fumador o fumador; vemos que se trata de una variable cualitativa que tiene más de dos categorías (variable cualitativa no dicotómica). La variable resultado (V2) será: la tensión arterial medida cuantitativamente. Con una variable predictora cualitativa de más de dos categorías y una variable resultado cuantitativa el test de contraste de hipótesis adecuado es el análisis de la varianza (ANOVA). La opción correcta es la 3. Pregunta 38.- R: 4 Se pretende determinar si existe asociación entre el tipo de carrera que se cursa y la presencia o no de antígeno de la superficie del virus de la hepatitis B, por lo que se aprecian las siguientes variables: • V1: carrera universitaria que se estudia: variable cualitativa que en nuestro estudio es dicotómica, ya que sólo tiene dos posibilidades (Medicina u Odontología). • V2: presencia o no del antígeno de superficie del VHB: también variable cualitativa dicotómica, ya que sólo tiene dos posibilidades (dar positivo para Ag VHB o dar negativo). El test de contraste de hipótesis adecuado para determinar si existe asociación o no (es decir, que las diferencias encontradas entre los dos grupos de estudiantes se puedan deber al azar) entre dos variables cualitativas (independientemente de que sean dicotómicas o no, aunque en este ejemplo lo sean ambas) es el test de Chi-cuadrado. La opción correcta es la 4. Comentarios de Test a distancia 1.ª vuelta Con una variable predictora cualitativa de dos categorías y una variable resultado cuantitativa, el test de contraste de hipótesis adecuado es la t de Student. La opción correcta es la 4. Pregunta 41.- R: 2 Aunque el enunciado de esta pregunta nos quede un poco confuso, debemos ser capaces de distinguir las siguientes variables: tiempo de reproducción y fotoperíodo. La primera es una variable cuantitativa (el tiempo) y la segunda también (número de horas de luz), por lo que disponemos de dos posibles test para trabajar: • Análisis de regresión. • Test de correlación. ¿Cuál es la clave para elegir uno o el otro? Cuando lo que nos están pidiendo es la ecuación que relaciona a las dos variables, dicho de otro modo, la fórmula que me permite decir cuánto valdrá la “y” en función de la “x” (por ejemplo, cuánto será el tiempo de reproducción si el fotoperíodo vale 6 horas) hay que hacer un análisis de regresión. La opción correcta es la 2. ¿Y cuándo se utiliza el test de correlación? El test de correlación de Pearson sirve para establecer, en dos variables que entre ellas siguen una relación lineal (la ecuación obtenida con el análisis de regresión es lineal, del tipo y = A+Bx), si la relación lineal es buena (la ecuación obtenida se ajusta bien a la realidad) o no (no es una buena ecuación para predecir “y” en función de “x”). Pregunta 39.- R: 2 Al buscar las dos variables de este estudio, tienes que darte cuenta de que la edad de las pacientes NO es una variable, simplemente nos están definiendo qué personas participan en el estudio, es decir, nos están dando los criterios de selección. Mediante los criterios de selección se define la población a la que se podrán extrapolar los resultados de nuestro estudio, que en este caso será a adolescentes de 14 a 16 años. Pregunta 42.- R: 3 Un coeficiente de correlación de Pearson de -1 indica que existe una fuerte correlación lineal entre las dos variables y que esta relación es negativa, es decir, que cuando aumenta una variable la otra disminuye y viceversa. La opción correcta es la 3. Recuerda que los valores del coeficiente de correlación oscilan de -1 a 1, y que cuanto más se acerca a -1 o a 1 la relación lineal será más fuerte, mientras que un coeficiente de correlación de 0 indica ausencia de relación lineal. El objetivo de este estudio es determinar si existen diferencias entre tres tratamientos en cuanto a la reducción del número de lesiones de acné, por lo que las variables serán: • Variable predictora: tratamiento utilizado (variable cualitativa de tres categorías). • Variable resultado: el número de lesiones que desaparecen (variable cuantitativa); el resultado lo podían haber expresado como variable dicotómica (mejora o no), pero en el enunciado nos dejan claro que van a cuantificar el resultado (“número de lesiones de acné”). Pregunta 43.- R: 4 Si se pretende estudiar si hay diferencia o no entre los niveles de glucosa en sangre en personas que no han comido y personas que ya han comido, el estudio se puede plantear de dos maneras: a) Cogemos a una muestra de personas y les extraemos una muestra de sangre antes de comer, y a otro grupo de personas distintas y les extraemos sangre después de que hayan comido. b) Cogemos a una muestra de personas y les extraemos una muestra de sangre antes de comer, y a ese mismo grupo de personas les extraemos sangre después de que hayan comido. Con una variable predictora cualitativa de más de dos categorías y una variable resultado cuantitativa, el test de contraste de hipótesis adecuado es el análisis de la varianza (ANOVA). La opción correcta es la 2. En ambos casos, las variables de estudio serían: • V1: no haber comido o haber comido (variable dicotómica). • V2: niveles de glucosa en sangre (variable cuantitativa). La única diferencia es que en el primer caso las muestras son independientes (dos grupos de personas distintas) y en el segundo hay una muestra pareada (se mide la V2 en las mismas personas antes y después de comer), por lo que utilizaríamos un test de t de Student para datos apareados, mientras que en el primer caso sería para datos independientes. La opción correcta es la 4. Pregunta 40.- R: 4 Imaginemos que tenemos un grupo de mujeres embarazadas a las que se les toma la TAD y se obtiene como resultado una media aritmética de 72 mm de Hg, y otro grupo de mujeres no gestantes a las que se les toma la TAD y se obtiene como resultado una media aritmética de 74 mm de Hg. Posiblemente esta diferencia se deba a la variabilidad en el muestreo (al azar), pero para poder hacer esta afirmación tendremos que hacer el test de contraste de hipótesis que corresponda con las variables de este estudio: • V1: estar o no embarazada (variable dicotómica). • V2: TAD (variable cuantitativa). CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid Pregunta 44.- R: 2 Se quiere establecer si hay diferencia entre el descenso de carga viral que se consigue con indinavir frente al obtenido con saquinavir, por lo que las variables de este estudio serán: • V1: tratamiento con indinavir o saquinavir (variable cualitativa dicotómica). • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 8 Estadística • V2: descenso en la carga viral (variable cuantitativa). Con una variable predictora cualitativa de dos categorías y una variable resultado cuantitativa, el test de contraste de hipótesis adecuado es la t de Student. La opción correcta es la 2. Pregunta 45.- R: 4 La mayoría de las preguntas de test de contraste de hipótesis en el MIR se refieren a test paramétricos, si bien debemos conocer cuándo no se pueden utilizar y es necesario elegir un test no paramétrico: • Cuando el tamaño muestral es pequeño (n < 30). • Cuando V1 y/o V2 sean variables ordinales. Los test no paramétricos son menos potentes que los paramétricos, por ello, siempre que sea posible se prefieren utilizar pruebas paramétricas. Las pruebas no paramétricas, a diferencia de las paramétricas, no requieren que las variables sigan una distribución normal, pueden usarse independientemente de cómo sea la distribución de las variables en la población (normal, binomial, etc.). La opción falsa es la 4. Pregunta 46.- R: 4 Si se están comparando tres tratamientos distintos, la variable predictora será el tipo de tratamiento (variable cualitativa de tres categorías). En este estudio, la variable resultado también es cualitativa (curación o no curación), por lo que el test de contraste de hipótesis que se debe utilizar será el de Chi-cuadrado. La opción correcta es la 4. Pregunta 47.- R: 5 Se pretende ver si hay una diferencia entre los niveles de ADN viral del VHB en pacientes nefrópatas antes de ser sometidos a hemodiálisis y después de esta intervención, por lo que las variables de este estudio son: • V1: no haber recibido todavía la hemodiálisis o haberla recibido ya. • V2: título de ADN viral del VHB. Vemos que la primera variable (dicotómica) es pareada, ya que la V2 se va a medir en los mismos pacientes (antes y después); la segunda variable es cuantitativa (nivel de ADN viral), por lo que el test paramétrico que le correspondería es el de la t de Student. Pero como el tamaño muestral es menor de 30, no nos valen los test paramétricos, por lo que tendremos que elegir el equivalente a la t de Student para datos apareados: el test de Wilcoxon. La opción correcta es la 5. El test de la U de Mann-Whitney y el test de Wilcoxon ambos son test no paramétricos para comparar una variable cualitativa dicotómica con una cuantitativa. La diferencia entre los dos es que el test de la U de MannWhitney se puede usar sólo en caso de datos independientes; el test de Wilcoxon sirve tanto para datos independientes como también apareados. Pregunta 48.- R: 4 Este enunciado parece complejo pero podemos resolver la pregunta sabiendo el significado del coeficiente de correlación “r”. Si se quiere Comentarios de Test a distancia 1.ª vuelta saber la manera de relacionarse de dos variables cuantitativas, podemos realizar dos tipos de análisis: • El análisis de correlación nos da el valor de el coeficiente de correlación de Pearson (r), que mide la intensidad de la relación lineal entre las dos variables cuantitativas. Este coeficiente “r” tiene las siguientes propiedades: - Varía de -1 a +1. Cuando r = 0 indica que no hay correlación lineal. A partir de +/- 0,7 existe una correlación fuerte. - Para r = +/-1, hay una relación perfecta entre “x” e “y” (todos los puntos están en una línea recta) - Un valor positivo de “r” indica que a medida que aumenta o disminuye una variable, lo hace la otra en la misma dirección. Si “r” es negativo indica que a medida que aumenta una variable disminuye la otra, y viceversa. • Cuando la correlación entre dos variables es fuerte, podrá hacerse un test de regresión lineal, que nos dará una ecuación que informa del tipo de relación: y = a + b.x. “a” y “b” son los coeficientes de regresión, el coeficiente a representa el punto en el que la línea corta el eje vertical (valor de y para x = 0). El coeficiente “b” es la pendiente de la recta que muestra la cantidad que cambia “y” por una unidad de cambio de “x”. En este estudio el coeficiente “r” entre tamaño de las NRP y el número de síntomas fue de 0,32 (p = 0,02). Indica, por tanto, una débil correlación positiva entre ambas variables, siendo esta correlación es estadísticamente significativa con p = 0,02 (no confundas el valor de “p” con el valor de “r”). La única respuesta correcta es la 4. Pregunta 49.- R: 3 Las variables en esta pregunta son: • V1: tres hospitales (variable cualitativa no dicotómica). • V2: gravedad de la UVI medida con el test de Glasgow (variable cualitativa ordinal). Siempre que tengamos una de la variables de tipo ordinal, debemos pensar en test no paramétricos (una variable ordinal equivale a una cuantitativa con n < 30). Por tanto, al tratarse de comparar una variable cualitativa no dicotómica y una variable ordinal, el test necesario será el de Kruskal-Wallis (respuesta 3). Pregunta 50.- R: 4 De todas las opciones citadas, la única prueba útil para establecer relación entre una variable cualitativa y otra cuantitativa es el test de Mann-Whitney, que se usa cuando la V1 es una variable dicotómica, la V2 es cuantitativa, las muestras son independientes y el tamaño muestral es menor de 30. La opción correcta es la 4. El test de la t de Student también es útil para establecer relación entre una variable cualitativa y otra cuantitativa, pero si lees con cuidado las opciones, te darás cuenta de que no está (la opción 1 es la distribución t de Student; no es un test de contraste de hipótesis). VARIABLES TEST DE CONTRASTE DE HIPÓTESIS Variable 1 Variable 2 Cualitativa Cualitativa Datos independientes Datos apareados Cualitatitva no dicotómica Cuantitativa U Mann-Whitney Wilckoxon Wilckoxon Cualitatitva no dicotómica Cuantitativa Kruskal-Wallis Friedman Cualitativa ordinal Cualitativa ordinal Test exacto de Fisher Rho Spearman Tau Kendall Pregunta 47. Test no paramétricos. CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: [email protected] • www. ctomedicina.com 9