Combinación de pruebas de hipótesis independientes para

IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 Combinación de pruebas de hipótesis independientes para proporciones: un estudio de simulación Ehidy K. Garcı́a Cruza,# , Juan Carlos Correab,c , Jorge Iván Vélezb,d a Profesor Auxiliar, Escuela de Ingenierı́a Industrial, Universidad Pedagógica y Tecnológica de Colombia, Sogamoso, Boyacá. b Grupo de Investigación en Estadı́stica, Universidad Nacional de Colombia, Medellı́n, Colombia. c Profesor Asociado, Escuela de Estadı́stica, Universidad Nacional de Colombia, Medellı́n, Colombia. d Medical Genetics Branch, National Human Genome Research Institute, National Institutes of Health, Bethesda, MD, USA. # E-mail: [email protected] Resumen En el área biomédica, es frecuente encontrar estudios independientes enfocados a responder la misma pregunta de investigación. Los métodos metaanalı́ticos buscan combinar la información de dichos estudios con el fin de determinar si la unión de estos conduce al rechazo de una hipótesis nula común H0 . Uno de los métodos más utilizados y conocidos es la combinación de valores p; dentro de estos se encuentran los métodos de Fisher, Tippet, Liptak, Sidak, Simes y Stouffer. En este trabajo se presenta una breve descripción de estos métodos y se reportan los resultados de un estudio de simulación en el que se combinan pruebas de hipótesis independientes para proporciones. Finalmente, presentamos una aplicación en el que se comparan las frecuencias alélicas de casos y controles para ∼370,000 SNPs en ocho muestras independientes. Palabras Clave: Meta-análisis, método de Fisher, método de Stouffer, pruebas de hipótesis, prueba para proporciones. 1 IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 Combining independent proportion tests: A simulation study Ehidy K. Garcı́a Cruza,# , Juan Carlos Correab,c , Jorge Iván Vélezb,d a Auxiliar Professor, School of Industrial Engineering, Technological and Pedagogial University of Colombia, Sogamoso, Boyacá. b Research Group in Statistics, Department of Statistics, National University of Colombia at Medellı́n. c Associate Professor, Department of Statistics, National University of Colombia at Medellı́n. d Medical Genetics Branch, National Human Genome Research Institute, National Institutes of Health, Bethesda, MD, USA. # E-mail: [email protected] Abstract In biomedical research, it is often the case that several studies address the same research question. Meta-analytical methods are useful to combine information from these studies in order to determine whether the rejection of a common null hypothesis Ho is achieved. One of the most widely used and known method to accomplish this is the combination of p-values, with Fisher’s, Tippet’s, Liptak’s, Sidak’s, Simes’ and Stoufer’s method being utilized. We briefly describe these methods and present the results of a simulation study in which up to k independent proportion tests are combined. Finally, we present an application in which the allele frequencies of ∼370,000 SNPs are compared between cases and controls across eight independent samples. Keywords: Metanalysis, Fisher’s method, Stouffer’s method, hypothesis testing, proportion test. 2 IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 1. Introducción Consideremos k estudios independientes en los se realiza un procedimiento de pruebas de hipótesis de la forma Hi,0 : θi = θi,0 vs. Hi,1 : θi > θi,0 i = 1, 2, . . . , k (1) Si Ti y pi corresponden al estadı́stico de prueba y el valor p para el i-ésimo estudio, respectivamente, H0,i será rechazada si pi ≤ α, con α una probabilidad de error tipo I definida de antemano. Ahora, ¿es posible obtener una medida de resumen que tenga en cuenta los resultados obtenidos para cada uno de los k estudios?. El meta-análisis se puede definir como la identificación sistemática, valoración y sı́ntesis de información proveniente de k estudios independientes que intentan responder la misma pregunta de investigación [2]. Esta sı́ntesis, que implica la combinación de la evidencia proporcionada por cada estudio, tiene como objetivo obtener un estadı́stico que resuma toda la información obtenida en ellos a través de la verificación de una hipótesis nula común, analizando simultáneamente un mismo parámetro θ de interés. Esto, precisamente, responde la pregunta en el párrafo anterior. En investigaciones biomédicas, uno de los métodos más utilizados para obtener este estadı́stico de resumen es la combinación de valores p. Para su utilización, (i ) los k estudios deben ser independientes, (ii ) deben rechazar una hipótesis nula H0 común y (iii ) las pruebas de hipótesis realizadas deben ser unilaterales y en la misma dirección para los k estudios [10, 12]. El objetivo de esta metodologı́a es determinar el efecto unidireccional cuando se combina la información de los diferentes estudios utilizando los valores p. Observe que bajo el procedimiento de hipótesis (1), las condiciones (i )−(iii ) se satisfacen. Dentro de los métodos de combinación de valores p disponibles en la literatura, se encuentran el método de Fisher, Tippet, Liptak, Sidak, Simes y Stouffer. En este documento, estos métodos son revisados de manera breve. Adicionalmente, presentamos resultados parciales de un estudio de simulación en el que se combinan pruebas de hipótesis independientes para una y dos proporciones. Finalmente, presentamos una aplicación en el que se comparan las frecuencias alélicas de personas con y sin una determinada enfermedad para ∼ 370,000 polimorfismos de nucleótido simple (SNPs, en inglés) en ocho muestras independientes provenientes de igual número de poblaciones. 3 IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 2. 2.1. Métodos para la combinación de valores p Método de Fisher Este método es uno de los más frecuentemente utilizados en el campo biológico, y está fundamentado en la probabilidad de la transformación integral. Si Fi,0 es la función de distribución acumulada de Ti bajo Hi,0 , entonces Fi (Ti ) ∼ U (0, 1), por lo que pi ∼ U (0, 1). Por lo tanto, el estadı́stico CF = − log(pi ) ∼ Exponencial(1), i = 1, 2, . . . , k. El estadı́stico de prueba para el método de Fisher es χ2F = −2 k X ln(pi ) ∼ χ22k (2) i=1 La prueba de Fisher puede ser interpretada como la probabilidad de rechazar la hipótesis nula en al menos uno de los estudios de los k que hacen parte de la combinación. Sin embargo, la interpretación más adecuada consiste en indagar si la acumulación de información entre las pruebas sobre las hipótesis nula similares puede rechazar una hipótesis nula compartida [10]. Este método rechaza la hipótesis H0 común si P χ2F > χ22k < α. El principal inconveniente del método de Fisher es su sensibilidad valores-p pequeños [10], permitiendo el rechazo de la hipótesis nula en favor de la hipótesis alternativa unilateral. Otras desventajas del método de Fisher pueden encontrarse en [7] y [12]. 2.2. Método de Tippett Sea p(1) = min{p1 , p2 , . . . , pk }. El método de Tippet, conocido como min-P y basado en el método de Bonferroni, utiliza p(1) para combinar la información de los k estudios independientes. El estadı́stico de prueba está dado por: CT = k p(1) (3) y rechaza H0 cuando CT ≤ α. Este método es ligeramente conservativo bajo independencia, pero adquiere validez en presencia de correlación debido a la influencia de la desigualdad de Bonferroni. Wetsberg (1985) hace una comparación de los resultados de los métodos de Fisher y Tippett, y muestra que no debe haber inclinación particular por la selección de alguno de estos. Sin embargo, el autor sugiere que para elegir uno u otro método debe graficarse la potencia de ambos y, de acuerdo con un margen de error, realizar dicha elección. 4 IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 2.3. Método de Liptak Originalmente planteado por Liptak, dicho procedimiento requiere que los valores p sean unilaterales de la forma P −1 CL = P Φ (1 − pi ) para valores p de cola superior (4) CL = Φ−1 (pi ) para valores p de cola inferior 1 Puesto que bajo H0 , CL ∼ N (0, k), la prueba rechaza H0 cuando CL ≥ k 2 Φ−1 (1− 1 α) para una prueba de cola superior, o cuando CL ≥ k 2 Φ−1 (α) para una prueba de cola inferior. 2.4. Método de Sidak Es una prueba muy similar a la de Tippet, pero es exacta y no conservativa bajo supuestos de uniformidad e independencia. El estadı́stico de prueba es CS = 1 − 1 − p(1) N (5) y se rechaza H0 cuando CS ≤ α. Similar a como ocurrió con CT , el valor p de la prueba es exactamente CS . Una de las ventajas del método de Sidak es que resulta eficaz cuando existe correlación positiva entre los estudios [4]. 2.5. Método de Simes En algunos casos, los métodos presentados anteriormente pueden no ser suficientes porque excluyen información importante para la combinación al utilizar sólo uno de los valores (el más pequeño) para construir el estadı́stico de prueba. Para corregir este inconveniente Simes presenta una prueba, similar al de Tippet, en la que utiliza los valores p disponible en los k estudios. El estadı́stico de prueba en este caso está dado por: mı́n k · p(i) CI = (6) i i Puesto que CI ≤ CT , el método de Simes es uniformemente más potente que el método de Tippet. 2.6. Método de Stouffer Este método, también es conocido como Z - transformado, presenta la ventaja de tener una relación uno a uno con la distribución normal estándar, por lo que 5 IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 el valor p de una prueba unilateral puede reportarse en términos de una normal estándar [10]. El estadı́stico de prueba está dado por: Pk Zi √ CZ = i=1 (7) k Una de las ventajas de este método, por ejemplo frente al método de Fisher, es que elimina los efectos de asimetrı́a [10]. El método rechaza H0 si P (CZ > Z) < α, con Z ∼ N (0, 1). 2.7. Método de Stouffer ponderado El interés principal de este método radica en la selección óptima de los pesos asociados a cada estudio, de tal forma que aquellos estudios con menores valores p tengan una mayor contribución al estadı́stico de prueba. Idealmente, esta ponderación es proporcional al inverso a la varianza, lo que se traduce en la inversa del efecto del tamaño del estimador por cada estudio [10]. Si wi es el peso asociado al i-ésimo estudio, el estadı́stico de está dado por Pk i=1 wi Zi Zw = qP , k 2 w i=1 i w 1 + · · · + wk = 1 (8) La hipótesis nula es rechazada si P (Zw > Z) < α, con Z ∼ N (0, 1). 3. Resultados Desafortunadamente, al momento de escribir este reporte el estudio de simulación aún no habı́a finalizado. Sin embargo, los resultados de este estudio serán presentados durante la conferencia en el IX Coloquio Internacional de Estadı́stica. 4. Aplicación Consideremos k = 4 estudios independientes en los que se determinaron, para cada uno, las frecuencias alélicas de m = 365, 875 SNPs en un grupo de n = 50 personas con determinada enfermedad (casos) e igual número de personas sin ella (controles), todos residentes en los Estados Unidos. Dichas frecuencias corresponden al número de copias de un alelo especı́fico, dividido por el total de alelos en la muestra. Si f1,j es la frecuencia alélica del alelo A para el j-ésimo SNP (j = 1, 2, . . . , m) cuando se considera el i-ésimo grupo de personas (grupo 1: casos; grupo 2: controles), es de interés probar 6 IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 H0,j : f1,j = f2,j vs. Ha,j : f1,j > f2,j (9) para cada uno de los k estudios. Para un estudio particular, el estadı́stico de prueba asociado a (9) está dado por Tj2 = 2n (fˆ1,j − fˆ2,j )2 2 (1 − fˆ ) + fˆ2 (1 − fˆ ) fˆ1,j 1,j 1,j 2,j (10) con fˆ1,j y fˆ2,j corresponden a los estimadores de f1,j y f2,j , respectivamente. Bajo la hipótesis nula, Ti2 ∼ χ2(1) y el valor p para el j-ésimo SNP puede calcularse como pj = P Ti2 > χ2(1) . Nota: Por la sensibilidad y confidencialidad de la información, los resultados obtenidos sólo serán presentados durante el IX Coloquio Internacional de Estadı́stica. Referencias [1] Y. Benjamini and Y. Hochberg. (1997). Multiple hypothesis Testing with Weights. Board of the Foundation of the Scadinavian Journal of Statistics; 24(3); 407-418. [2] S. E. Brockwell and I. R. Gordon.(2001) A comparison of statistical methods for meta-analysis. Statistis in Medicine, 20; 825-840. [3] G. Casella and R.L. Berger (2001) . Statistical Inference, 2nd edition, Duxbury Advanced Series. [4] P. Westfall. (2005). Combining P-values. Enciclopedy of Biostatistics, John Wiley & Sons. [5] J. Hartung. (1987). A note on combining dependent test of significance, University of Dortmund, Germany. [6] J. T. Kost and M P. McDermott (2002). Combining dependent Pvalues.Statistics & Probability Letters; 60:183-190. [7] W. Rice (1990). A consensus combined P-value test and the family wide significance, Biometrics;46 (2):303-308. [8] R. Rosenthal. (1978). Combining Results dies.Psychological Bulletin; 85(1): 185-193. 7 of Independent Stu- IX Coloquio Internacional de Estadı́stica “Métodos Estadı́sticos Aplicados a Finanzas y Salud” Universidad Nacional de Colombia - Sede Medellı́n Medellı́n, Junio 29 a Julio 2 de 2012 [9] M. Westberg (1985). Combining Independent Statistical Tests.Journal of the Royal Statistical Society; 34(3):287-296. [10] M. C. Whitlock. (2005). Combining probability from independent tests: the weighted Z−method is superior to Fisher’s approach. J Evol Biol ;18(5):13681373. [11] P. H. Westfall and A. Krishenb. (2001). Optimally weighted, fixed sequence and gatekeeper multiple testing procedures, Journal of Statistical Planning and Inference; 99(1):25-40. [12] W. R. van Zwet and J. Oosterhoff. (1967). On the Combination of Independent Test Statistics. The Annals of Mathematical Statistics; 38(3):659-680. [13] M. Love. Combining p-values: Fisher’s method, sum of p-values, binomial [Consultado el 25/4/2012] URL = http://bit.ly/LLLGBk 8

Combinación de pruebas de hipótesis independientes para

Documentos relacionados

Productos

Apoyo

Combinación de pruebas de hipótesis independientes para

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib