Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] ESTADÍSTICA EN ANESTESIOLOGÍA: PRIMERA PARTE TUTORIAL DE LA SEMANA # 302 ENERO 30, 2014 Sameer Hanna-Juma Northampton Hospital NHS Trust, UK Correspondencia a: a [email protected] PREGUNTAS Antes de continuar intente contestar las siguientes preguntas. Las respuestas están al final del artículo. 1. En los siguientes enunciados diga cuales son verdaderos o falsos a. El error tipo I ocurre cuando hay una diferencia dada por el azar y que es debida a errores estadísticos en el diseño del estudio b. Los histogramas son útiles para demostrar la moda de distribución de un grupo de datos c. El error tipo II ocurre cuando existe una diferencia real que no es demostrada estadísticamente d. El promedio, la mediana, y la moda son iguales en una distribución normal e. Un gráfico de caja y bigotes (box y whisker) es utilizado para ilustrar datos con una distribución normal 2. En los siguientes enunciados diga cuales son verdaderos o falsos a. El error estándar del promedio (SEM) es una medición de la dispersión b. El NNT (número necesario a tratar) es el recíproco de la reducción del riesgo relativo c. El error estándar del promedio (SEM) disminuye cuando el tamaño de la muestra aumenta d. La reducción absoluta del riesgo es el porcentaje en el grupo intervenido menos el porcentaje del grupo control e. El tamaño de la muestra no afecta su intervalo de confianza INTRODUCCIÓN La estadística es la ciencia o la práctica de recolectar y analizar grandes cantidades de datos numéricos especialmente con el propósito de inferir proporciones en un todo (una población) a partir de una muestra representativa (diccionario Oxford). Este tutorial discutirán el conocimiento básico que subyacen la estadística en la práctica clínica e incluye los siguientes temas: Tipos de datos Recolección de datos Presentación de los datos Estadística inferencial TIPOS DE DATOS Los datos son observaciones recolectadas en conjunto viniendo un grupo de variables. Las variables son elementos, características o factores susceptibles de cambio. La primera fase en el manejo correcto de los datos es el reconocer qué tipo de dato es. Esto determina cómo se describen y el primer paso es decidir qué tipo de prueba estadística utilizar. Los dos tipos de datos principales son cuantitativos y cualitativos y la mayoría de los estudios tendrán combinaciones de ambos. Mientras que los datos cuantitativos son fáciles de utilizar y analizar y son relativamente confiables, los datos cualitativos proporcionan una descripción más profunda de la muestra. Datos cualitativos Estas son variables que no tienen un valor numérico. Habitualmente describen un significado y le dan el nombre o título a una variable. Nótese que el título dado una variable puede ser un número como el ASA1, por este título carece de valor numérico. Los datos cualitativos pueden ser ordinales o nominales, como se describe abajo. ATOTW 302 Estadística en Anestesia parte 1 1 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] Datos nominales (categóricos o de atributos) Datos ordinales (ordenados categóricamente por ranqueado) Las categorías no se superponen Las categorías están ordenadas de manera entendible Hay una magnitud intrínseca que no puede ser medida Comúnmente utilizada en encuestas y para analizar variables no numéricas Ejemplos incluyen la categoría ASA y las escalas categóricas de dolor Se llaman binarios si hay sólo dos categorías posibles como masculino o femenino No tienen un valor numérico Habitualmente se utilizan para describir características de la muestra Los ejemplos incluyen el grupo sanguíneo y el tipo de cirugía Nótese que las escalas categóricas de dolor donde: ausencia de dolor=0, dolor leve=1, dolor moderado=2, dolor severo=3, el dolor moderado es mayor que el dolor leve pero no es el doble. Datos cuantitativos Éstas son variables que son verdaderamente numéricas. Hay varios tipos de datos cuantitativos pero esto habitualmente no afecta la selección de la prueba estadística. Los datos cuantitativos pueden ser discretos o continuos como se describen abajo. Discretos Continuos Datos que varían en escalones finitos El ejemplo incluyen la escala de dolor numérica Datos medidos en un continuum El ejemplo incluyen la escala de dolor visual análoga Los datos continuos pueden ser de razón (ratio) o no. En una escala de razón la variable cero verdaderamente representa la ausencia de cantidad o característica y el cambio de una unidad tienen la misma interpretación en cualquier parte de la escala. Sin embargo en una escala que no es de razón, los cambios de la variable pueden ser no lineales en diferentes partes de la escala. RECOLECCIÓN DE DATOS Hay varios métodos para la recolección de datos. Las formas más comunes de muestreo datos son muestreo simple al azar y muestreo estratificado. Muestra simple al azar Una muestra verdaderamente al azar es una en la cual cualquier miembro de la población tiene la misma probabilidad de ser incluido en el estudio. Esta es la representación más realista de una población total, pero en la investigación médica es muy difícil lograr una verdadera muestra al azar. Por ejemplo si este está estudiando el efecto de la monitoría hemodinámica en el desenlace de una laparotomía de emergencia usted debería poder incluir cualquier paciente sometido a laparotomía emergencia. Muestra al azar estratificado La muestra al azar se divide en subgrupos llamados estratos. Éste es un intento de hacer que la muestra sea más representativa de la población y reducir el efecto de los factores de confusión. Por ejemplo en el estudio descrito arriba del grupo de muestreo se estratifica en dos subgrupos, fumadores y no fumadores. Después incluirá los pacientes al azar al grupo control sin dispositivos de monitoreo hemodinámica, y el grupo de tratamiento con el dispositivo. Esto eliminará el efecto del factor de confusión del tabaquismo sobre el desenlace posterior a la laparotomía en urgencias ya que habrá el mismo número en ambos grupos. Otros tipos de muestreo incluyen el muestreo por conglomerados, muestreo por estados múltiples, muestreo en bola de nieve y muestreo en fases múltiples. PRESENTACIÓN DE LOS DATOS Todos los estudios tienen grandes cantidades de datos sin procesar que son recolectados durante el periodo de estudio. Éstos datos pueden ser presentados de tres maneras: en tablas, gráficas, o forma numérica (estadística descriptiva). Cada forma de presentación tiene sus usos, ventajas y desventajas. ATOTW 302 Estadística en Anestesia parte 1 2 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] Presentación en tablas Las tablas de frecuencia y frecuencia acumulada son formas comunes de presentar los datos en la investigación clínica. Estos métodos pueden ser usados para presentar todos los tipos de variables nominales, ordinal es y datos cuantitativos. Para presentar datos continuos de esta manera se requiere organizarlos primero en grupos (intervalos). El ejemplo incluyen el puntaje ASA, y los grupos etarios en la población de su estudio. Una tabla de frecuencia relativa es otra manera presentar los mismos datos de arriba. En esta tabla los números serán reemplazados por porcentajes de los números totales de la muestra. Categoria ASA ASA 1 Frecuencia (# pacientes) n=390 60 ASA 2 230 ASA 3 65 ASA 4 ASA 5 32 3 Categoria etarea 20-40 Años 41-60 Años 61-80 Años 81-100 Años Categoria ASA ASA 1 ASA 2 ASA 3 ASA 4 ASA 5 Frecuencia (# pacientes) n=390 24 210 126 30 Frecuencia acumulada (# de pacientes) 24 234 360 390 Frecuencia relativa( %pacientes en cada categoria) n=390 15.3 58.9 16.6 8.2 0.77 Presentación con gráficas Las gráficas y diagramas son muy importantes especialmente cuando se presentan grandes cantidades de datos. Son herramientas visuales muy poderosas que resaltan las relaciones importantes entre las diferentes variables. En la estadística clínica los siguientes gráficos son frecuentemente utilizados: Gráficos circulares Los gráficos circulares son útiles para mostrar la proporción de los diferentes grupos que constituyen la muestra total del estudio. El círculo completo representa la muestra total mientras que el tamaño ocupado por cada uno de los grupos será proporcional a su número. Los gráficos circulares se utilizan para datos ordinales y nominales. Pueden ser útiles para resaltar los desbalances potenciales de la muestra del estudio y otros factores de confusión. El ejemplo de la figura 1 muestra los diferentes grupos quirúrgicos en un estudio de dispositivos de vía aérea supraglóticos empleados en la práctica clínica. ATOTW 302 Estadística en Anestesia parte 1 3 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] Gráficos de barras Los gráficos de barras se utilizan para comparar diferentes clases de datos. El eje X usualmente carece de dimensión mientras que el eje Y representa la frecuencia de cada clase cada clase puede representar un grupo único o puede ser subdividido en subgrupos. El ejemplo de la figura 2 muestra los mismos datos de arriba presentados en un gráfico de barras. Nótese que en el gráfico, en cada clase se muestran los subgrupos de género. Histograma Éste es un tipo de gráficos de barra especializado que permite proporcionar una presentación visual de los datos de intervalo. Los datos cuantitativos, en particular los datos continuos, se dividen en intervalos para integrarlos en las tablas de frecuencia. Los histogramas son muy útiles para mostrar la moda de la distribución de datos. Esto tendrán una gran relevancia en la selección de las pruebas estadísticas como se verá más adelante. Podemos ver claramente en el ejemplo de la figura 3 que los datos no tienen una distribución normal; de otra manera el centro de cada barra estaría dentro de la curva de distribución normal. En análisis estadístico en este caso es diferente de aquel donde los datos están distribuidos normalmente. Los histogramas son útiles para mostrar estadísticas descriptivas como el promedio, la moda y la desviación estándar. Curvas de frecuencia Éstos son muy similares a los histogramas pero sin las barras. Tienen un uso similar al de los histogramas pero con la ventaja de permitir comparar la distribución de dos o más grupos el mismo gráfico. En la figura 4 podemos comparar las tendencias de la presión arterial entre el grupo control y el grupo de estudio. Hay una disminución del número de pacientes con presión arterial superior a 140 mmHg en el grupo de estudio comparado al grupo control ATOTW 302 Estadística en Anestesia parte 1 4 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] Curvas de frecuencia acumulada (Ogive) Esta es una gráfica de la distribución acumulada que muestra los valores de los datos en el eje horizontal y ya sea las frecuencias acumuladas, las frecuencias relativas acumuladas o las frecuencias porcentuales acumuladas en el eje vertical. Este tipo de gráfica es útil para indicar la proporción de la muestra que está por debajo o por encima de cierto límite. Gráfico de correlación Éstas son utilizadas para determinar si existe una relación entre dos variables medidas. Pueden ser utilizadas para calcular estadísticamente la magnitud de la relación utilizando un coeficiente de correlación. El ejemplo en la figura 5 se muestra la relación entre la dosis de un relajante muscular nuevo (RM) en miligramos por kilo de peso y el tiempo necesario para la reaparición del tren de cuatro (TOF) en la muestra estudiada. Los datos muestran una relación directa entre el aumento de la dosis y el tiempo de recuperación del TOF. Los histogramas se utilizan comúnmente para identificar la moda de la distribución de los datos y poder seleccionar la prueba estadística apropiada. Los gráficos de correlación son una herramienta visual importante para mostrar el grado de correlación en análisis multivariable. Presentación numérica (estadística descriptiva) Aunque la estadística descriptiva se refiere a la presentación de datos de forma de tablas, gráficas y numéricas, en la investigación médica habitualmente se refiere a la presentación numérica de los datos. La meta de las estadísticas descriptivas es la de presentar un resumen comprensible de los datos más que extraer conclusiones acerca de la población total. Esto es esencial antes de decidir seleccionar las pruebas estadísticas para los análisis inferenciales. Cuando se utiliza la estadística descriptiva existe el riesgo de perder detalles importantes, a pesar del hecho que proveen un poderoso resumen que permite hacer comparaciones entre variables. Las estadísticas descriptivas pueden ser utilizados para análisis univariable o multivariable. Las tres características principales del análisis univariable son la distribución, tendencia central y mediciones de la dispersión. Distribución En el análisis estadístico médico la distribución normal (Gaussian) tiene gran importancia y es la distribución más común de los datos biológicos (estatura, peso, presión arterial) en sujetos sanos. Las ayudas visuales tales como los histogramas pueden ser utilizados para determinar la distribución de los datos, pero existen otras pruebas estadísticas formales para determinar si los datos están distribuidos normalmente como la prueba de Shapiro-Wilkes y prueba D’Agostino-Pearson. La distribución normal (paramétrica) se caracteriza por un pico único (unimodal) y una distribución simétrica de las variables a ambos lados de seguir todas las medidas de tendencia central (promedio, moda y mediana) son iguales en una distribución normal y están representados por el punto de máxima frecuencia. La dispersión de los datos es igual a ambos lados, lo que representa la desviación estándar (DE). Los parámetros promedio y desviación estándar describen plenamente la forma de la curva en la figura 6. ATOTW 302 Estadística en Anestesia parte 1 5 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] Figura 6. Curva de distribución normal. 68% de la población estará dentro de una desviación estándar del promedio, 95% estará dentro de las dos desviaciones estándar del promedio y el 99.7% estará dentro de las tres desviaciones estándar del promedio. La mayoría de los estudios médicos probabilísticos investigarán un promedio más o -2 desviaciones estándar (95% de la población) En los datos no paramétricos las variables no se distribuyen de manera igual alrededor del punto central de la tendencia. Los datos pueden ser aglomerados alrededor de un lado y dispersos en el otro lo que se llama asimetría estadística (figura 7). Los datos pueden tener más de un pico (multimodal). La kurtosis es otro término que describe el pico de la curva y en una distribución normal el valor de la kurtosis es cero. Una curva con un pico más agudo y una cola larga se llama positiva, mientras que una kurtosis negativa implica una distribución más amplia y aplanada. En estas situaciones en análisis estadístico debe ser utilizando pruebas estadísticas no paramétricas. En las situaciones donde el modo de distribución no es claro es mejor utilizar pruebas no paramétricas. Figura 7. Datos con una dispersión positiva. Note las posiciones diferentes de la moda, la mediana y el promedio. Tendencia central La tendencia central de una distribución es un estimativo del centro de la distribución de los valores. Las tres medidas de tendencia central son el promedio, la mediana y la moda: El promedio es simplemente la suma total de los valores dividido por el número de las variables (media aritmética). Se utiliza como una medida de la tendencia central de los datos paramétricos y no debe ser utilizada para reportar las tendencias centrales de datos ordinarios o nominales. La mediana es el valor de la mitad cuando todos los datos se organizan en orden numérico. Esto significa que el 50% los datos están por debajo y 50% por encima este valor. Éste valor es preferible para medir la tendencia central con datos no paramétricos ya que está menos afectada por los extremos que el promedio. La moda es el dato más frecuente de todos los valores. No es un buen indicador de la tendencia central pero es la única manera de ATOTW 302 Estadística en Anestesia parte 1 6 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] establecer la tendencia central en datos nominales y ordinales. Mediciones de la dispersión El rango es la medición más simple de la dispersión pero tiene un uso muy limitado. Es la diferencia entre el valor máximo y mínimo de los datos. La varianza y la desviación estándar (DE) son las principales mediciones de la dispersión en datos paramétricos. Éstas mediciones son más precisas porque incluyen todos los valores de la muestra en el cálculo. La varianza se calcula de la suma de las diferencias del cuadrado de cada valor contra la media dividida por el total de la población estudiada. Los valores están elevados al cuadrado porque de otra manera se cancelarían entre sí en una distribución normal porque habría iguales valores positivos y negativos. La DE es la raíz cuadrada de la varianza. Los percentiles (cuartiles) son la principal manera de medir la dispersión con datos no paramétricos. Los cuartiles se autodefinen, el primer cuartil tiene el 25% los datos por debajo, el segundo cuartil corresponde a la mediana y tiene el 50% de los datos por debajo, y el tercer cuartil tiene el 75% de los datos por debajo. Los percentiles usualmente se gráfica con el método de caja y bigotes (figura 8). La caja en este ejemplo representa el 50% de la muestra (el 50% tuvieron la recuperación del tren de 4 entre 42 y 50 minutos después de la administración del relajante muscular). Los bigotes representan los percentiles 10º y 90º, y las estrellas son los valores extremos (el 10% de la población tuvo un regreso del tren de cuatro a los 31 minutos mientras que el 90% tuvieron el regreso del tren de cuatro a los 58 minutos). Nótese que la mediana no está en el centro de la caja que evidencia una distribución no normal de los datos (un número igual de pacientes tuvo un regreso del TOF entre los 42 y 48 minutos y entre los 48 y 50 minutos). Figura 8. Gráfica de caja y “bigotes” ESTADÍSTICAS INFERENCIALES La inferencia es el proceso de derivar conclusiones lógicas a partir de premisas conocidas o que se presumen son verdaderas, y presupone que toda la población está representada por la muestra estudiada. Es importante comprender que hay un grado de presunción y esto lleva al concepto de la probabilidad. Las estadísticas inferenciales pueden ser descriptivas (la media de la muestra representa la media de la población total) o analítica (el estudio de las relaciones entre las diferentes variables en la muestra puede ser generalizado a la población total de interés). Por lo tanto los dos componentes básicos de la estadística inferencial son la muestra y la probabilidad. Muestra Esta es la porción de reclutamiento del estudio. Por ejemplo en el estudio acerca del efecto de la monitoria hemodinámica perioperatoria sobre los desenlaces de los pacientes sometidos a laparotomía de emergencia, los pacientes incluidos durante el período de estudio serán la muestra y todos los pacientes que requieran laparotomía emergencia serán la población. Es muy importante calcular el tamaño de la muestra antes de comenzar cualquier ensayo. Esto define el poder del estudio. Probabilidad Para cada uno de los eventos existe un número de desenlaces posibles. La probabilidad de cualquier desenlace oscila entre 0 (nunca) hasta 1 (siempre). En la investigación clínica la probabilidad (valor de P) es una parte esencial en la presentación de cualquier tipo de datos inferenciales. Esto es para garantizarle al lector que el resultado desenlace puede secundario en efecto de la variable estudiada y no simplemente por azar. Por lo que cuando un estudio presenta una diferencia entre los requerimientos de transfusión del grupo control y el grupo que recibió ácido tranexamico con un valor de P de 0. 01, significa que la probabilidad que esto ocurra por azar y no por el efecto del ácido tranexamico es muy baja (aunque no imposible). Otra manera de expresar la probabilidad de la ocurrencia de un evento en estadística médica es el de la razón de probabilidades (odds ratio) y riesgo relativo (risk ratio). ATOTW 302 Estadística en Anestesia parte 1 7 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] Razón de probabilidades (odds ratio) Los odds pueden ser definidas como la probabilidad de la ocurrencia de un evento. Por ejemplo en un grupo de 160 mujeres en trabajo de parto, 110 tienen un parto normal y 50 tienen una cesárea. Por lo tanto el odds de tener una cesárea es de 50:110 que es igual a 0. 45. Un concepto más importante comúnmente aplicado en la investigación clínica es el odds ratio. Este es utilizado para medir el efecto de alguna intervención sobre la probabilidad de que ocurra el evento. Un ejemplo es el odds ratio para parto normal en las mujeres que reciben analgesia peridural comparado al grupo control. En el grupo de parturientas con peridural 90 tienen un parto normal mientras que 60 se les hace una cesárea. Los odds son 60:90 igual a 0.66. El odds ratio de una paciente para tener una cesárea con analgesia peridural comparado al grupo control es por lo tanto 0.66:0.45 igual a 1.46. Un odds ratio de 1 significa que no hay diferencia significativa entre los dos grupos, mientras en este caso el odds ratio indica que la probabilidad de realizar cesárea es más probable cuando se utiliza analgesia peridural. Riesgo relativo El riesgo relativo es comúnmente utilizado los estudios epidemiológicos y es muy similar al odds ratio. Es importante entender que en los cálculos del riesgo relativo el denominador de la población total. Por ejemplo el riesgo de tener una cesárea en los grupos de arriba es de 50:160 igual a 0.312 comparado al odds de 0.45. En los grandes estudios epidemiológicos el riesgo relativo, la reducción absoluta del riesgo y la reducción relativa de riesgo son datos estadísticos que se utilizan para decidir la efectividad de una intervención en particular, así como las implicaciones económicas de introducir el tratamiento a toda una población (figura 9). El riesgo relativo no puede ser calculado en estudio de casos y controles, sin embargo el odds ratio puede dar un estimativo aproximado del riesgo relativo. Reducción absoluta del riesgo Reducción del riesgo relativo Número necesario a tratar La diferencia entre el riesgo de la ocurrencia un evento en el grupo tratamiento comparado al control Calculado por el porcentaje en el grupo intervenido menos el porcentaje en el grupo control Proporción por la cual una intervención reduce el riesgo de la ocurrencia de un evento Calculado por el porcentaje del grupo intervenido dividido por el porcentaje del grupo control Número de los pacientes que requieren el tratamiento para no lograr el beneficio de un (entre más pequeño más efectivos de tratamiento), y se calcula como el recíproco de la reducción absoluta del riesgo Figura 9. Diferencias entre la reducción absoluta del riesgo, reducción del riesgo relativo y el número necesario tartar La significancia de los valores descritos arriba debe ser evaluada dentro el contexto del estudio. En algunos estudios en particular, una gran muestra la población puede dar información imprecisa si sólo se calcula la reducción del riesgo relativo. Por ejemplo el riesgo de náusea y vómito postoperatorio posterior a la administración de un nuevo antiemético comparado al estándar de oro. Grupo A (control): 10 pacientes de 1000 vomitaron Grupo B (nuevo tratamiento): 5 pacientes de 1000 vomitaron La reducción absoluta del riesgo igual a 99.5% - 99% =0.5% mientras que la reducción del riesgo relativo es igual a 0.005:0.01= 0.5 o 50%. Algunos autores utilizarán la reducción del riesgo relativo para destacar la reducción del 50% de la náusea y vómito. Sin embargo si se calcula el número necesario tratar es igual a 100:0.5 = 200. Se requiere tratar 200 pacientes para reducir el riesgo de náusea y vómito en un solo paciente comparado al estándar de oro. Esto puede cambiar la percepción para usar este medicamento si se sabe que puede estar asociado con grandes costos o efectos colaterales como arritmias. La hipótesis nula y alternativa El análisis estadístico permite cuantificar lo robusto de la evidencia que apoya o refuta una teoría analizando las observaciones experimentales. En la estadística médica se asume que no hay diferencia en algunas variables entre los diferentes grupos hasta que se pruebe lo contrario. Esto se conoce como la hipótesis nula. La hipótesis alternativa es lo opuesto, y es habitualmente lo que genera mayor interés para el investigador. Esta presume que la diferencia es secundaria a un tratamiento particular o una intervención. El principal objetivo de la mayoría las las estadísticas es rechazar la hipótesis nula y soportar la hipótesis alterna. Tipos de error El tipo I ocurre cuando se rechaza de manera incorrecta la hipótesis nula y se conoce como el error . Esto significa que se encontró una diferencia estadísticamente significativa cuando en realidad no existe. El nivel de significancia es el valor de P que representa el menor valor de Para lo cual la hipótesis nula se rechazaría usualmente fijado en 0.05 (1 en 20 eventos) en la ATOTW 302 Estadística en Anestesia parte 1 8 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] estadística médica. El valor de P debe ser calculado y escrito en el trabajo de investigación pero no es suficiente decir si está por encima por debajo de 0.05. Por ejemplo si los estudios diferentes investigando la misma intervención tuvieran valores de P de 0.0051 y 0.049 respectivamente, en realidad tendrían resultados muy similares. Sin embargo se podrían malinterpretar si se reportaran como un valor de P<0.05 o P>0.05. El error tipo II ocurre cuando se acepta de manera inadecuada la hipótesis alternativa, esto se llama el error . Esto significa que no se encontró diferencia estadística cuando en realidad si existe. La causa más común de este error es un tamaño inadecuado de la muestra, por esos muy importante antes de empezar cualquier estudio calcular el tamaño de la muestra necesario para detectar una diferencia y por lo tanto evitar el riesgo del error tipo II. Esto se conoce como el poder del estudio. El poder del estudio de la probabilidad que va detectar una diferencia estadísticamente significativa si ésta existe. Se calcula como (1-). La mayoría de la investigación médica aceptan valor de de 0.2, y es improbable que una propuesta para un estudio sea aprobado sin un cálculo del poder. Tipo de pruebas estadísticas Es importante seleccionar la prueba estadística apropiada para cada tipo de datos. Hay una serie de pasos sistemáticos que deben seguirse para establecer la prueba apropiada para sus datos. Identificar si los datos son cualitativos o cuantitativos Para los datos cuantitativos determinan la forma de distribución Decidir cuántos grupos están siendo comparados Determinar si los datos están pareados o no Las características exactas de cada prueba no se discutirán en este artículo pero el proceso se describe en la figura 10. Figura 10. Método para seleccionar la prueba estadística apropiada Muestra y población Para entender con qué precisión la muestra estudiada representa la población de la cual fue tomada se utilizan otros conceptos estadísticos. Éstos incluyen el error estándar del promedio (SEM) y los intervalos de confianza (IC). El SEM no es una medida de la tendencia central o dispersión, sino que refleja que tan cerca es el promedio de su muestra al promedio de la población total. Se calcula con ecuación (SEM= SD/ n1/2). De esta ecuación es claro que entre mayor sea la muestra estudiada menor es el SEM y por lo tanto representa mejor a la población total. Esto ocurre porque una muestra mayor contendrá mayor información acerca del parámetro estudiado de la población, y por lo tanto permite realizar estimativos más precisos. El IC da un rango estimado de los valores que es probable que incluye un parámetro de una población desconocida calculado a partir de una muestra. El IC nos dice qué tan probable es el efecto medido en la muestra sea representativo de la población. Los factores que afectan el IC incluyen el tamaño de la muestra y la DE. Entre mayor sea el tamaño de la muestra ATOTW 302 Estadística en Anestesia parte 1 9 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE Inscríbase para recibir el Tutorial de la Semana semanalmente: [email protected] mayor es su representatividad de la población y más pequeño es el IC. Es muy importante entender que una muestra con un IC pueda no ser representativa de la población. Es particularmente importante anotar el IC en los estudios aleatorizados que comparan nuevos tratamientos contra el estándar de oro. Por ejemplo si un trabajo de investigación demostró un aumento de 20 mmHg de la presión arterial media con vasopresina comparado a noradrenalina en pacientes con shock séptico, con un IC de -5 hasta +45 mmHg, entonces la conclusión es que no hay una diferencia estadísticamente significativa en la población. Esto es porque basado en el IC el cambio predicho en la población de la presión arterial media podría ser cero, o inclusive disminuir 5 mmHg. El ejemplo de la figura 11 demuestra los intervalos de confianza en estudios acerca del efecto del ejercicio sobre la frecuencia cardiaca en reposo. Figura 11. Ilustración de los intervalos de confianza en estudios acerca del efecto del ejercicio sobre la frecuencia cardiaca en reposo. RESPUESTAS A LAS PREGUNTAS 1. 2. TTTTF FFTTF WEBLINKS http://www.cyclismo.org/tutorial/R/index.html http://www.stats.gla.ac.uk/steps/glossary/index.html http://en.wikipedia.org/wiki/Statistics REFERENCIAS Y LECTURAS ADICIONALES 1. 2. 3. 4. McCluskey A, Lalkhen A. Statistics A publication series from Continuous Education in Anaesthesia, Critical Care and Pain Management, Oxford University Press in 2007 Harris M, Taylor G. Medical Statistics Made Easy, 2nd Edition, Scion Publishing Ltd, 2008. Bowers D, Medical Statistics from Scratch an Introduction for Health Professionals, 2nd Edition, John Wiley & Sons Ltd, UK 2008. Spoors C, Kiff K. Oxford Specialty Training: Training in Anaesthesia, 1st Edition, Oxford University Press in 2010 ATOTW 302 Estadística en Anestesia parte 1 10 /10 Este trabajo se licencia por Creative Commons Attribution-NonCommercial 3.0 Unported License. Vea la licencia en: http://creativecommons.org/licenses/by-nc/3.0/ Traducido por la Sociedad Colombiana de Anestesiología y Reanimación SCARE