/ JOSE M. DOFIENECH MASSONS No es l a uniformidad s i n o l a v a r i a b i l i d a d e l atributo fundamental q u e c a r a t e r i z a a l a n a t u r a l e z a . No es l a r i g i d e z s i n o e l q u i e n e s t á en l a b a s e d e l o s hechos p s i c o l 6 g i c o s o b i o l ó g i c o s . En l a n a t u r a l e z a , e l a z a r hace que l a v a r i a b i l i d a d ent r e l o s i n d i v i d u o s s e a l a r e g l a . La e s t a d l s t i c a e s e l Gnico i n s trumento matemdtico adeeuado p a r a a n a l i z a r d a t o s d e fenómenos c ~ ya c a r a c t e r í s t i c a fundamental e s l a v a r i a b i l i d a d . No e s p o s i b l e e s t u d i a r l a v a r i a b i l i d a d con un s o l o i n d i v i d u o . D e a h l que l a formulaci6n e s t a d í s t i c a d e un problema no pueda s e r una formulación a n i v e l i n d i v i d u a l s i n o que debe ser una f o r m u l a c i 6 n a n i v e l d e grupo. azar Lo61 d_isefios e ~ $ ~ t i J Aeaon e ~ p r ~ b l e m o a forrnriladsa w nivel de grupo. En canescuoricta, una v e s t r a t a d o i s estndfsticcríno~ t e l o s d a t o s o b t e n i d o s , l a s c o n c l u s i o n e s d e e s t o s d i s e ñ o s no pug d e n s e r c o n c l u s i o n e s a n i v e l i n d i v i d u a l s i n o que son c o n c l u s i o n e s a n i v e l d e grupo. E s t o q u i e r e d e c i r , por ejemplo, que si con un d i s e ñ o e x p e r i m e n t a l s e demuestra l a e u p e r i o r i d a d de un t r a t a miento X r e s p e c t o a o t r o t r a t a m i e n t o A, e l r e s u l t a d o que o b t e n dremos a l a p l i c a r e l t r a t a m i e n t o X a toda l a p o b l a c i ó n , en media, s e r d s u p e r i o r a l r e s u l t a d o que hubieramos obtenS4o a l a p l i c a r e l t r a t a m i e n t ~k a toda l a poblaci6n; s i n embargo para c i e r t o s individuos e l t r a t a m i e n t o A s e r d s u p e r i o r a l X. En este a r t E c u l o s e d e s a r r o l l a n dos problemas fundamentales que e s t u d i a l a e s t a d f s t i c a : l o s Problemas d e Estimay l o s Problemas d e Decisi6n. = Con f i n e s d i d s c t i d o s e s t e e s t u d i o s e p a r t i c u l a r i z a a c a r a c t e r e s c u a l i t a t i v o s . La Teorra d e l a Estimaci6n se desar r o l l a a p a r t i r d e l c a s o p a r t i c u l a r d e una proporcibn. La r f a d e l a Decisidn s e d e s a r r o l l a a p a r t i r d e l c a s o p a r t i c u l a r d e l a prueba d e comparaci8n d e una proporci6n observada a una proporcidn t e b r i c a . S i n embargo l a g e n e r a l i z a c i ó n a o t r o s c a s o s e e s inmediata. 11.'- CONCEPTO DE PROPORCION Veces en Sea un c i e r t o a s p e c t o 5 que se observa una muestra d e individuos. Se d e f i n e como progorci6n observad ~ d e i n d i v i d u o s con e l a s p e c t o &, a l c o c i e n t e : A l a proporci6n observada d e individuos d e l a muestra que no presentan e l a s p e c t o 5, s e l a designa por q, y v a l e r - qO= 1-P, (2) A l a verdadera proporci6n de individuos, d e l a poblac i 6 n o r i g e n d e l a muestra, qye p r e s e n t a e l a s p e c t o A, se l a de- s i g n a por E y a s u complemento a l se l o designa por 9 111.- CONCEPTO DE INTERVALO DE PROBABILIDAD 1-Q! Tanto p a r a l a T e o r f a d e l a Estimación como p a r a l a T e o r f a d e l a d e c i s i ó n es n e c e s a r i o r e s o l v e r e l s i g u i e n t e e i m p o r t a n t e problema d e p r e d i c c i ó n m e d i a n t e l a T e o r l a d e 1 a . P r o b a b i l i d a d : conocer e l i n t e r v a l o donde f l u c t u a n l a s p r o p o r c i o n e s E, o b s e r v a d a s en m u e s t r a s d e tamaño n_ p r o c e d e n t e s d e una poblacX6n c a r a c t e r i z a d a p o r una p r o p o r c i ó n E. blema . E l s i g u i e n t e experimento . p e r m i t e . r e s o l v e r d i c h o . . pro- Se t i e n e una poblacibri que c o n t i e n e una p r o p o r c i ó n conocida d e bolas blancas y e l r e s t o q = l - ~ son b o l a s n e g r a s . e Se e x t r a e un c o n j u n t o muy g r a n d e d e m u e s t r a s con gl b o l a s cada una ( m u e s t r a s d e tamaño III) y s e tabulan y represen- t a n graficamente e l conjunto d e l a s proporciones Observadas d e b o l a s b l a n c a s o b s e r v a d a s e n cada una de e s t a s m u e s t r a s . Eo Nuevamente se e x t r a e un c o n j u n t o muy g r a n d e d e muest r a s , a h o r a con r ~ ~ b o l a s cada una (n2 mayor que n ) y s e t a b u -1 l a n y representan graficamente e l conjunto de proporciones d e bolas balncas o b s e r v a d a s e n c a d a una d e e s t a s m u e s t r a s . E0 Y a s í sucesivamente se e x t r a e n c o n j u n t o s muy g r a n d e s d e m u e s t r a s p e r o cada vez compuestas d e un nGrnero de bolas mayor que l o s a n t e r i o r e s y se r e p r e s c n t o n g r a f l c a m e n t o e l conjunto d e proporciones d e b o l a s blancas o b s e r v a s a s en coda conjunto d e muestras. 5 La f i g u r a 1 i l u s t r a e s t a s r e p r e s e n t a c i o n e s g r s f i c a s par$ c o n j u n t o s d e m u e s t r a s de tamaño pl= 1 0 , n2=20 y ~1'40, cuondo e n l a p o b l a c i ó n o r i g e n d e e s t a s m u e s t r a s hay l a m i t a d d e b o l a s blancas y l a o t r a mitad d e b o l a s negras (g=q=0.5). La obseryac'i6n d e e s t a s r e p r e s e n t a c i o n e s g t d f i c a s permite sacar l a s s i g u i e n t e s conclusiones: a,- En todas las g r á f i c a s l a proporciones observa¿ae se agrupan E0 bolas blancas alrededor d e l v a l o r g i p r o ~ o r c i b nd e que c o n t i e n e l a poblacibn o r i g e n de l a s muestras). b.- Cuando aument? e l número d e b o l a s que hay en l a s muestras, l a s proporciones observadas están más agrupadas alrededor d e l v a l o r El conjunto d e proporciones observadas po es cada vez menos d i s p e r s o i medida que e l tamaño-2 de l a s rnueatras aumenta. e. E0 E s t e concepto d e d i s p e r s i d n se c u a n t i f i c a mediante e l f ~ d i c e g P ' llamado d e s v i a c i 6 n t i p o . ' Por ejemplo, si l a s muestras proceden d e una poblacion que c o n t i e n e una proporcidn p 0 . 5 d e b o l a s blancas y e l r e s t o c~=1-p=8.5 d e b o l a s negras, cuando n-10 l a desviaci6n t i p o d e l a s proporciones observadas v a l e : c.- S i l a s muestras son grandes, s e ve como e s t a s gráf i c a s s i n b t r i c a s alrededor de un e j e v e r t i c a l que pas a por e l v a l o r y t i e n e n l a misma forma d e "campana". La d i f e r e n c i a e n t r e e l l a s e s t á e n que l a s "campanas" son mas e s t r e c h a s a medida que correspondan a muestras mas grandes. E s t e único modelo que siguen t o d a s l a s g r a f i c a s rec>be e l nombre d e modelo o l e y normal. E s t a l e y ha s i d o e s tudiada por Laplace y Gauss, hace v a r i o s s i g l o s . Teorema PunUamental tral e, Se d e m e s t ~ . aque el d e s v i b e , a cada lodo d e l punto cenque deja d e n t r o e l 95% d e l a s proporciernes & observadas - Flirtiinc1611 de las proporciones po dc bola\ hinncas obscrvadaq coniirne una proporritin de botas bianws p =O5 en l a s muestras, s e o b t i e n e multipllcando e l v z ~ o rc o n s t a n t e zq -1.96 correspondiente. E s de- por l a desviacidn t i p o ty- P cir: E l d e s v i o 6? que d e j a d e n t r o el998 de l a s t i e n e multiplicando 52 Se =2.58 por dicha desviaci6n t i p o . Ob- En g e n e r a l e s t o s v a l o r e s c o n s t a n t e s s e simbalizan por g, -* En l a t a b l a 1 s e dan l o s v a l o r e s mas importantes de en funci6n d e * y en l a f i g u p 2 se i l u s t r a e l desvio y el d e e v i o g Y i e n o dado por: e. \ 1 P- - 4 e - P e figura2 TABLA 1 ' El v a l o r d r e p r e s e n t a l a x a n t i d a d , en t a n t o s por uno, d e pro7 porciones observadas que e s t d n f u e r a d e l i n t e r v a l o alrededor d e p, d e f i n i d o por d i c h o d e s v í o 2. Condicionss d e a p l i c a c i ó n La f6rmula ( 4 ) y l o s v a l o r e s qq dados en l a t a b l a 1, son v d l i d o s exclusivamente para d i s t r i b u c i o n e s que siguen e l r n x d e l o normal. Se Comprueba experimentalmente que l a d i a t r i h u c i d n de las proporciones observadao s i g u e un modelo normal cuando se cumple que l o s productos y 3 son i g u a l e s o s u p e r i o r e s a 5 . E s t a s muestras r e c i b e n e l nombre de muestras grandes. E s t e Teorema Fundamental s e demuestra a p a r t i r d e l a Teorfa de l a Probabilidad ( * ) y e s un c a s o p a r t i c u l a r d e un i m p o r t a n t e teorema llamado Teorema Llmite C e n t r a l . Definici6n d e I n t e r v a l o d e Probabilidad Se d e f i n e i n t e r v a l o d e probabilidad todo i n t e r v a l o , e i m 6 t r i c o alrededor d e E, que contenga gran p a r t e de l a s proporciones observadas en muestras d e tamaiio e x t r a i d a s a l azar d e una población c a r a c t e r i z a d a por l a proporción p. El i n t e r v a l o alrededor d e E, d e f i n i d o por e l desvfo -e, que c o n t i e n e e l 9 5 % de l a s proporciones observadas, r e c i b e e l nombre d e i n t e r v a l o d e probabilidad d e l 9 5 % . En g e n e r a l , r e c i b e e l nombre d e i n t e r v a l o d e probabilidad 1-b( , aquel i n t e r v a l o que contiene e l l-o( (en t a n t o s por uno) iie l a s proporc i o n e s observadas p,,, e s d e c i r , a q u e l i n t e r v a l o que s ó l o d e j a d e l a s proporciones observadas f u e r a una pequeña proporcit3n En e l i n t e r v a l o probabilidad 1-4 , e l v a l o r O( i n d i c a l a probabilidad d e observar, en una muestra precedente d e l a poblaci6n e, una proporcign observada po f u e r a d e d i c h o i n t e r - - ("1 Un e s t u d i o d e t a l l a d o puede v e r s e en l a obra (1) d e l a Bdblbograffa Seleccionada va l o . Una idea importante e s que un i n t e r v a i o d e probabil i d a d nunca podrd contener todas l a s proporciones que pueden observarse.en l a s muestras. Para d e f i n i r e l i n t e r v a l o de prob a b i l i d a d siempre debe e x c l u i r s e una p r o p o r c i ó n 4 , t a n peque ña como queramos, de c a s o s extremos. La e s t a d í s t i c a a n a l i z a fenómenos cuya r e g l a fundamental e s l a v a r i a b i l i d a d . S i queremos d a r un i n t e r v a l o en e l que se encuentran l o s v a l o r e s da un c i e r t o c a r d c t o r , medido en una población de individuos, l a v a r i a b i l i d a d puede hacer que en algGn individuo e s t e c a r á c t e r tome un v a l o r excepcionalmente grande o excepcionalmente pequeño. La e s t a d í s t i c a busca un i n t e r v a l o que sea l o mds pg queño p o s i b l e pero que a l a vez contenga l a máxima informac i ó n p o s i b l e ( e l máximo número de casos p o s i b l e ) . Para l o g r a r l o s e debe p r e s c i n d i r de unos pocos casos extremos que agrandan mucho e l i n t e r v a l o s i n c a s i a p o r t a r información. Por convenio s e ha aceptado universalmente d a r int e r v a l o s que contengan e l 95% d e l o s individuos. De e s t a d e f i n i c i ó n y de l a observaci6n de l a f i g u r a 2 s e deduce fdcilmente l a fórmula d e l i n t e r v a l o de p r o b a b i l i dad : de A . . Las muestras deben s e r ~l i n t e r v a l o de probabilidad 1 - 4 permite p r e d e c i r , aceptando e l r i e s g o & d e equivocarnos, e l i n t e r v a l o en e l c u a l e s t a r 5 contenida l a proporci6n po observada en una c i e r t a . una poblacibn c a r e o t e r i z a d a n u a s t r a d e tamaño p procedente ~ o rl a proporción p. Generalizacidn El concepto de i n t e r v a l o d e probabilidad se general i z a f l s i l r n e n t e a otras c a r a c t e r P e t f c a e estadgeticas. Por eje^ / p l o s i se e s t u d i a un c a r a c t e r c u a n t i t a t i v o , e l i n t e r v a l o d e p r o b a b i l i d a d que p e r m i t e p r e d e c i r con r i e s g o o( , e l i n t e r v a l o e n e l c u a l e s t a r d c o n t e n i d a l a media observada e n una m u e s t r a d e tamafio E, p r o c e d e n t e d e una p o b l a c i d n c a r a c t e r i z a d a por una media 5 y una d e s v i a c i ó n t i p o 0- , vie.ne dado por ( 6 ) . I C. d e A . : 1 Las m u e s t r a s deben ser grondee i n ) 3 0 ) . IJ Ejemplo 1 Dada una p o b l a c i ó n q u e c o n t i e n e un 50% d e b o l a s b l a n c a s y un 50% d e b o l a s n e g r a s , p r e d e c i r e l i n t e r v a l o e n e l q u e se e n c o n t r a r 5 e l 952 de l a s p r o p o r c i o n e s o b s e r v a d a s e n m u e s t r a s d e 40 b o l a s e x ' t r a l d a s , no e x h a u s t i v a m e n t e y a l a z a r , d e dicha población. Aplicando l a fórmula (5) se o b t i e n e e l i n t e r v a l o pedido : IV. - TEORIA DE LA ESTIMACION ESTADISTICA a Un problema d e e s t i m a c i ó n c o n s i s t e en h a l l a r , con determinada p r e c i s i ó n , e l v e r d a d e r o v a l o r de un pariiniarro (prop o r c i ó n , media, v a r i a n c i a , e t c . c a l c u l a d a con t o d o s l o s i n d i v i d u o s d e una p o b l a c i ó n ) , a p a r t i r solamente d e l a información c o n t a n i d a en una mueetra r e p r e s e n t a t i v a ( * ) d e la p o b l n c i b n . * La o b t e n c i ó n d e una m u e s t r a r e p r e s e n t a t i v a e s un p r o b l e - ma de nattirjileza e s t a d l s t l c a cuya ~ u l u u i G i i~ u l - x c c t ae s que l a a l a c c i d n d e los i n d i v i d u o s d e la muestra e x c l u y a c u a l q u i e r sistembtica. E s t o se l o g r a mediante una e l e c c i ó n a l a z a r . En e l c a s o p a r t i c u l a r d e e s t i m a r una p r o p o r c i ó n E, si s ó l o se d i s p o n e de l a informaciGn c o n t e n i d a e n una m u e s t r a d e tamaño 5, es d e c i r d e l a p r o p o r c i ó n po o b s e r v a a a e n e l l a , s e d e m u e s t r a q u e l a mejor e s t i m a c i d n p u n t u a l d e p es l a p r o p o r c i 6 n p u n t u a l d e p es l a p r o p o r c i ó n p; " observada e n l a muestra. Ademds d e e s t a e s t i m a c i 6 n p u n t u a l , e s i m p o r t a n t e conocer s u p r e c i s i 6 n . e s d e c i r l o prdximo o l o a l e j a d o q u e po puede e s t a r d e e. E s t e c o n c e p t o d e p r e c i s i ó n se e x p l i c i G con l a e s t i m a c i b n p o r i n t e r v a l o d e p o i n t e r v a l o d e c o n f i a n z a , que es un i n t e r v a l o s i m é t r i c o a l r e d e d o r d e p_ q u e t i e n e g r a n probabilidad d e contener e l valor E .. E l i n t e r v a l o d e c o n f i a n z a se d e d u c e a p a r t i r d e l i n t e r v a l o de probabilidad. S i por un momento imaginamos c o n o c i d a l a p r o p o r c i 6 n d e l a poblacióri a l i r e x t r a y e n d o d e e l l a s m u e s t r a s d e tamaño l a s p r o p o r c i o n e s p o b s e r v a d a s e n e l l a s , e x c e p t o una p e q u e O ña c a n t i d a d q d e e l E s , i r á n cayendo d e n t r o d e l i n t e r v a l o d e probabilidad. S a l v o l a pequeña c a n t i d a d 4 d e e l l a s , l a s p r o p o r c i o n e s o b s e r v a d a s po n o e s t a r l n mas a l e j a d a s d e c i a definida p o r e l desvío % (figura 3): E que l a d i s t a n - Volvamos a l problema r e a l , en e l que s ó l o s c conoce po. S i e s t a proporci6n po ha caPdo d e n t r o d e l i n t e r v a l o d e que l a d i s t a n c i a dep r o b a b i l i d a d no e s t a r d mds a l e j a d a d e - f i n i d a por e l desvfo e. Es d e c i r e l v a l o r desconocido p e s (figura 3 ) : t a r d en algGn punto d e l i n t e r v a l o L a p r o b a b i l i d a d d e que e l i n t e r v a l o ( 8 ) no contenga e l v a l o r E c o i n c i d e con l a probabilidad d e que po no esté - d e n t r o d e l i n t e r v a l o de p r o b a b i l i d a d . Esta probabilidad v a l e o( E l i n t e r v a l o ( 8 ) que t i e n e gran p r o b a b i l i d a d de con tener e, aun no puede c a l c u l a r s e ya que para h a l l a r l a d e s v i 5 c i 6 n t i p o W debe conocerse p. P' Se demuestra cuando l a muestra e s grande que e l rámetro desviaci6n t i p o t e b r i c a , puede s e r estimado meP' que e s l a desviaci6n t i p o c a l c u l a d a diante el estadlstico S 1 ' a p a r t i r de l o s d a t o s observados en l a muestra: Sustituyendo este v a l o r e n ( 8 ) se o b t i e n e e l i n t e r v a l o d e confianza: - -- C. de A. 1 La muestra debe s e r ....-- iv I n t e r v a l o da Pxababilidad y á n t o r v a l a BQ confianza L a f i g u r a 4 muestra como e s t o s d o s conceptos son t o talmente diferente. PROBLEMA DE PREDICCION (PROBA~IUOAO) (ESTADIBTICA) figura 4 E l i n t e r v a l o d e p r o b a b i l i d a d es l a b a s e t e 6 r i c a q u e p e r m i t e d e d u c i r e l i n t e r v a l o d e c o n f i a n z a . Ambos i n t e r v a l o s son d e n a t u r a l e z a r a d i c a l m e n t e d i f e r e n t e . En e f ' e c t o e l i n t e r v a l o d e p r o b a b i l i d a d p a r t e d e l conocimiento d e l a p r o p o r c i d n que c a r a c t e r i z a a l a p o b l a c i b n y r e s u e l v e un problema d e p r e d i c c i d n a l i n d i c a r dónde e s t a r d n s i t u a d a s l a s p r o p o r c i o n e s p, o b s e r v a d a s e n m u e s t r a s d e tamaño p r o c e d e n t e s d e d i c h a pom c i b n . E l i n t e r v a l o d e c o n f i a n z a p a r t e únicamente d e l conoc i m i e n t o d e l a p r o p o r c i d n po o b s e r v a d a e n una m u e s t r a d e tamaño n_ y r e s u e l v e un p r o b l e m a d e estimaciBn a l d a r e l i n t e r v a l o que t i e n e g r a n p r o b a b i l i d a d d e c o n t e n e r l a v e r d a d e r a p r o p o r c i d n E (desconocida) que c a t a c t e r i z a a l a p o b l a c i d n o r i g e n d e d i c h a muestra. Dado un c i e r t o tamaño d e m u e s t r a q y un v a l o r 4 , e x i s t e un ú n i c o i n t e r v a l o d e p r o b a b i l i d a d m i e n t r a s q u e pueden h a b e r i n f i n i t o s i n t e r v a l o s de confíanha, tenga. uno para ceda muestra que se Tamaño de l a m u e s t r a La f6rmula de cdlculo del intervalo de c o n f i a n z a fn- de l a muestra, esd i c a cdmo a medida que aumenta . e l tamaño t e i n t e r v a l o e s más e s t r e c h o , e s d e c i r l a estimación d e l a proporción 2 a p a r t i r de l a proporción observada po e s mds - precisa. 2 Cudntos individuos deberemos e l e g i r para estimar l a proporci6n 2 ?. Se t r a t a de f i j a r a p r i o r i l a p r e c i s i ó n para que l a deseada y a p a r t i r de e l l a c a l c u l a r e l v a l o r de proporción observada en l a muestra como máximo e s t é a una d i s tancia e de l a verdadera proporción p. Despejando e l v a l o r en l a fdrmul-a ( 4 ) s e ,obtiene E l v a l o r E ea desconocido ya que precisamente s e r e a l i z a e l sondeo para estimarlo. En l a fórmula (11) debe sus'tit u i r s e E por un v a l o r aproximado, obtenido según uno de l o s ' s i guientes c r i t e r i o s : a.- Estudios a n t e r i o r e s proporcionan una idea aproximada d e l v a l o r de p. b.- Realizar un sondeo previo, extrapendo una pequeña muestra, y s u s t i t u i r E por l a proporción po ~bbel~~ü dii d ie l l d . C.- S u s t i t u i r e l producto ~q de l a fórmula (11) por e l caso más desfavorable. E l valor pq=o,25 mayor de todos l o s p o s i b l e s . es el Estrategia global La determinaciGn d e l ta11:nAo da l a niuestra da una nueva perspectiva a l o s problemas de estimación. En e f e c t o , e s más 16gico f i j a r l a p r e c i s i d n deseada que p a r t i r de un tamaño de muestra a r b i t r a r i o . E l proceso metodológico 6ptircio para estimar una proporci6n ea e l s i g u i e n t e : e . 1.- F i j a r l a p r e c i s i d n 5 deseada y e l riesgo* . 2.- Determinar e l tamaño p de l a muestra: 3.- R e a l i z a r un sondeo para e x t r a e r una muestra a l a z a r d e tamaño E. 4.- Calcular l a proporci6n observada en dicha muest r a (Estimación puntual de p) : .S.- Calcular e l i n t e r v a l o de confianza (Estimacien por i n t e r v a l o d e .E): Aunque d s t e e s e l proceso dptimo, no siempre e s posib l e s e g u i r l o . En e f e c t o , si s61o s e dispone de una informacidn l i m i t a d a , por ejemplo d e n=87 individuos, y no hay p o s i b i l i d a d de obtener más informacibn, l a estimacibn s e r e a l i z a r d con l a maxima informacidn d i s p o n i b l e , e s d e c i r con l o s n=87 individuos, pasando directamente por 4. Cuando l a c a r a c t e r L s t i c a e s t a d f s t i c a a estimar no es una proporci6n, cambian l a s t r e s fdrmulas recuadradas, pero e l proceso a n t e r i o r permanece i n v a r i a b l e . Ejemplo 2 E l . r e s u l t a d , o d e un primer sondeo d e opinidn s i t u a e n t r e S I en un . r e f e r e n d a . un 70% y un 839 e l p o r c e n t a j e d e v o t o s a.- ¿Cuántos individuos debera contener e l proximo son- deo, para que l a proporci6n de votos a f i r m a t i v o s , dados por l o s individuos de l a muestra, no e s t é más a l e j a d a de un 2 2 % de l a verdadera proporci6n?. Se acepta un r i e s g o O( =o.oS. Se a p l i c a l a fdrmula (11). Por e s t a r e l v a l o r de comprendido e n t r e 0 . 7 0 y 0.83, e l caso más desfavorable c o r r e s ponde a ~ ~ 0 . 7 0 . n = 3 . 9 6 2x 0 . 7 0 x 0 . 3 0 / 0 . 0 2 ~ = 2017 individuos b.- Una vez r e a l i z a d o e l sondeo a i a z a r con 2017 i n dividuos, s e ha observado que 1613 votarán afirmativamente. E s - timar l a proporci6n d e votos S I que d a r á toda l a poblacibn. La estimacidn puntual e s : La estimacidn por i n t e r v a l o e s : V.- TEORIA DE LA DECISION ESTADISTICA Un problema de d e c i s i 6 n h i p ó t e s i s complementarias H y H~ o a p a r t i r de r e s u l t a d o s observados h i p b t e s i s H1 e x i s t e e l r i e s g o < d e c o n s i s t e en e l e g i r e n t r e dos l a más verocimil de e l l a s , en muestras. A l e l e g i r l a tomar una d e c i s i 6 n equivoca- da. A l e l e g i K l a h i p b t e s i s Ho e x i s t e e l r i e s g o d e c i s i 6 n equivocada. @ d e tomar una Sea una muestra que contiene 1 bolas, de l a s c u a l e s una proporciBn po de e l l a s son blancas. - ci6n Sea una poblacidn de bolas bláncas. A conocida que contiene una propor- Se desea saber s i l a muestra procede o no procede de dicha poblaci6n. Hipbtesis nula e H i p ó t e s i s a l t e r n a t i v a La f i g u r a 5 esquematiza e l p l a n t e o g e n e r a l de e s t e problema d e d e c i í idn Flip~fcsLrn111n ( l l e l : La iiiucstra prtrcde de In población A. . llipolesis a1trrnalA.a (H,): L a tnuestra proqdc de una población ,Y dc diícrcntc coiiiposici6n quo la poblac a n A. figura 5 Hay dos h i p ó t e s i s p o s i b l e s . La h i p d t e s i s p r i n c i p a l e s l a h i p o t e s i s pula H , según l a c u a l l a muestra procede d e l a poblacidn 5. En e s t e caso l a d i f e r e n c i a e x i s t e n t e e n t r e l a s proporciones pO y p ha s i d o producida por l a i n f l u e n c i a d e l h i E 6 t e s i s nula e s f a l s a s i g n i f i c a que l a muesa z a r . Cuando t r a procede de una poblacidn 5 c a r a c t e r i z a d a por una proporcidn px desconocida, d i f e r e n t e de l a proprocibn p. Esta h i p b t e s i s , complementaria a l a a n t e r i o r , r e c i b e e l nombre de . h i p B t e s i s a l ternativa. Prueba d e d ~ c i s i d n La prueba e s muy s e n c i l l a y e s t 5 i l u s t r a d a en la f i gura 6 . Las priiebas de d e c i s i 6 n e s t a d f s t i c a e s t á n basadas e n l a h i p d t e s i s nula. Si l a muestra procede de l a poblacidn E, l a pr$ porcidn go observada e n e l l a e s t a r a d e n t r o d e l i n t e r v a l o d e pro - habilidad, es d e c i r den-o d e l i n t e r v a l o en e l que s e encuentran l a mayor p a r t e d e l a s proporciones observadas e n muestras d e t'aprocedentes de l a poblacidn p. maiio Cuando l a proporcidn observada po e s t á f u e r a d e l i n t c r v a l o d e probabilidad, l o mgs v e r o s í m i l e s q u e l a muestra proceda d e una poblaci6n px d i f e r e n t e de l a población E. En e s t e c a s o l a d e c i s i d n a tomar l a d e quedarse con l a h i p ó t e s i s a l t e r n a t i v a . V e r si po e s t d d e n t r o o f u e r a d e l i n t e r v a l o de probab' l i d a d equivale a si l a d i f e r e n c i a , en v a l o r a b s o l u t o , e n t r e es ver es menor o mayor que e l desvfo g y po - e: Dividiendo ambos miembros por l a r a i z cuadrada: S i llamamos 5 a l primer miembro, s e obtiene una prueba de d e c i s i d n e s t a d í s t i c a llamada prueba de comparacidn d e una ~ r o p o r c i ó nobservada a una proproción t e 6 r i c a . ] E s t a prueba, por e s t a r basada en e l i n t e r v a l o de probabilidad, serd v a l i d a para muestras grandes. PRUEBA DE COMPARaCTON DE UNA PROPORCfON OBSERVADA po EN UNA MUESTRA D E TAMAWO n, A UNA PROPORCION TEORICA p z <z4 : Nada s e opone en a c e p t a r l a h i p d t e s i s nula. z) zd : I Rechazo de l a h i p d t e s i s nula con un riesgo d . Condicioncs de a p l i c a c i ó n : La prueba e s s61o v d l i da para muestras grandes (np y nq mayores o igua: les a 5). Cuando l a conclusi6n e s t a d í s t i c a e s rechazar Ho con r i e s g o O ( , y s ó l o en e s t e caso, l e corresponde l a s i g u i e n t e con- cluaiAn experimental: S i po) p podemos afirmar con r i e s g o d que l a muestra procede de nna población px mepor que E. - S ~ . E > , ( ? poGemos afirmar con r i e s g o 4 que Pa muestra pr,roc.de de una población px menor que - E. Esta afirmación e s evidente, ya que por ejemplo, s i po e s menor que e, t i n t o que s e ha demostrado que no puede proceder de 2, e s l ó g i c o q i e roce da de una población c a r a c t e r i z a da por una proporci6n px me?or que l a proporción E. - Nótese que una prueba cuando concluye a c e p t a r Ulr afirma s d l o que px e s d i f e r e n t e de p. - Para saber en que cantidad p e s mayor o menor que p, X e s n e c e s a r i o conocer e l v a l o r px. ~ s t o e sun problema de natural e z a d i f e r e n t e pero que ya ha =do estudiado: b a s t a estimar p, a p a r t i r d e p. Se t r a t a de un problema de estimacidn que s e r e s u e l v e mediante e l i n t e r v a l o de confianza. - Los r i e s g o s asociados a una d e c i s i b n e s t a d f s t i c a Hay s610 dos p o s i b i l i d a d e s d e equivocarse a l tomar l a decisión: Cuando s e toma l a d e c i s i 6 n de a c e p t a r Hl, puede s e r que tio sea verdadera. Este e r r o r r e c i b e e l nombre de Error t i p o 1. La probabilidad de cometer un e r r o r t i p o 1 s e llama r i e s g o * o r i e s g o de primera especie. - Cuando s e toma l a d e c i s i ó n d e a c e p t a r H , puede s e r que H1 sea verdadera. E s t e e r r o r r e c i b e e l nombre de Error t i p o 11. La probabilidad de cometer un e r r o r t i p o 11 s e llama r i e s g o p o r i e g o de segunda e s p e c i e . - E l riesgo* e s conocido y s e f i j a a p r i o r i . En l a p r u e ba a n t e r i o r l a probabilidad de que una proporci6n observada s e e' c u e n t r e f u e r a d e l i n t e r v a l o d e probabilidad (zona d e aceptacibn de H1l procediendo de l a población e (Ho verdadera) viene dada por e l valorMasociado a l i n t e r v a l o de probabilidad. Esta probab i l i d a d es l a que s e d e f i n e como r i e s g o o( o r i e s g o de primera especie. De ahP l a f r a ~ ese rechaza l a h í a b t e s i s nula con r j ~ s q o d. Las f r a s e s s e rechaza Ho a l n i v e l de s i g n i f i c a c i b n d o s e rechaza Ho a l n i v e l de confianza 1 - 4 , son e q u i v a l e n t e s y expresan e l mismo concepto de r i e s g o o( . E l r i e s g o f?e s siempre desconocido. E l hecho de observ a r una proporci6n p d e n t r o d e l i n t e r v a l o de probabilidad, i n d i o c a un r e s u l t a d o q u e ñ o e s t a en contradiccidn con l a h i p b t e s i s nu l a , pero en ningun caso prueba que Ho sea verdadera. - En e f e c t o , e s p o s i b l e que, debido a l a i n f l u e n c i a d e l a z a r , una p?!oporcibn po observada en una muestra procedente d e l a población px, c a i g r d e n t r o d e l i n t e r v a l o de probabilidad E Czona d e no rocha20 de H o ) . Esto o c u r r e mds a menudo cuando px t i e n e un v a l o r prdximo a p. l a probabilidad de que e s t o pase,lla mada r i e s g o o r i e s g o d e segunda especie' siempre se desconoce Ya que l a proporciBn px e s tambien desconocida. p - Una f r a s e e q u i v a l e n t e a l a de nada s e opone en a c e p t a r la hipdtesis nula e s l a d i f e r e n c i a encontrada no es s i g n i f i c a t i v a . Un e s t u d i o d e t a l l a d o d e l r i e s g o s i g u i e n t e s apartados. P se hace en uno de los Se d e f i n e como Potencia de una prueba d e d e c i s i ó n - e s t a d í s t i c a e l v a l o r 1-/3 S i e l r i e s g o @ i n d i c a l a probabilidad de equivocarse al. a c e p t a r Ho, l a potencia e s l a probabilidad compled e c i r l a potencia c a r a c t e r i z a l a capamentaria a l r e i g g o p . cidad que t i e n e una prueba de d e c i s i d n e s t a d l s t i c a . , d e no equivoc a r s e a l a c e p t a r Ho. . Pruebas b i l a t e r a l e s y pruebas u n i l a t e r a l e s Se a p l i c a una prueba b i l a t e r a l o prueba de dos c o l a s cuando se t i e n e l a h i p 6 t e s i s a l t e r n a t i v a : l a población 5 e s d i f e r e n t e de l a población 5. La prueba d e d e c i s i ó n d e s c r i t a es una prueba b i l a t e r a l ya que l a h i p b t e s i s a l t e r n a t i v a (doble) e r a que l a proporcidn px podía s e r s u p e r i o r o i n f e r i o r a l a proporcibn (p, d i f e r e n t e a e E). La f i g u r a 7a i l u s t r a e s t a prueba para un r z s g o o( ~ 0 . 0 5 . e Cuando l a h i p d t e s i s a l t e r n a t c v a (simpie) e s que l a caes g u j e r i o r a l a de l a r a c t e r f s t i c a e s t u d i a d a en l a poblacion poblacibn , s e t ~ a t ad e una prueba u n i l s t e r a l o prueba de una c o l a por l a derecha, t a l como i l u s t r a l a figura 7b. PRUEBA BILATERAL CON RIESGO ct = 0 . 0 5 Ho: PO = P Hi: P O # P Se acepta H I cuando cl valor de PO está fuera del intervalo pi f-ps. PRUEBA UNILATERAL CON RIESGO U .= 0 . 0 5 H n : PO = P Hi:PO > P Se acepta Hi cuando el valor de po es mayor que p,. PRUEBA UNILATERAL CON RIFSGO ct = 0.05 Ho: PO = P HI: PO < p Se acepta H I cuando el valor de po es menor que pi. Pi P l figc1t-a 7 Cuando l a h i p d t e s i s a l t e r n a t i v a (simple) e s que l a car a c t e r f s t i c a estudiada en l a poblacion t e r f s t i c a d e l a poblacidn E, 5 e s i n f e r i o r a l a carac- s e t r a t a de una eruet.ir u n i l a t e r a l por l a izquierda, t a l como i l u s t r a l a f i g u r a 7c para e l mismo r i e s g o 4=0.05. Las pruebas u n i l a t e r a l e s s e d i f e r e n c i a n de l a s b i l a t e r a l e s , e n t r e o t r a s razones por e l hecho de que e l r i e s g o a( e s t á s i t u a d o en uno de l o s dos l a d o s , en e l correspondiente a l a zona de aceptacfon d e H1, ya que e l r i e s g o d i n d i c a l a probabilidad de que una observada procedente de E caiga en dicha zona. De ahf se dedduce ( * ) que para r e a l i z a r una prueba unil a t e r a l b a s t a comparar e l v a l o r & calculado en l a prueba con e l v a l o r z2@ correspondiente a dos veces e l r i e s g o f i j a d o . La t a b l a 2 da l o s v a l o r e s con que s e deben comparar 2 según l a prueba sea b i l a t e r a l o u n i l a t e r a l . t DE RIESGO PRIMERA ESPECIE 108 5% 1% l%o 1.65 1.96 2.58 3.29 1.28 1.65 2.33 3.09 PRUEaA BILATERAL =M PRUEBA UNILATERAL z2d TABLA 2 Actitud e x p l i c a t i v a y a c t i t u d pragmdtica ¿En que caSos se a p l i c a una prueba b i l a t e r a l y en cudl e s se a p l i c a una prueba u n i l a t e r a l ? ( 1 Un e s t u d i o más d e t a l l a d o puede v e r s e e n l a obra ( 3 ) pp. 75 y s i g . , cuya r e f e r e n c i a se encuentra en l a bibliografLa s e l e c * cionada. E s t e a s p e c t o , poco d i s c u t i d o en l a s o b r a s d e e s t a d í s t i c a , es muy i m p o r t a n t e . P a r a c o m p r e n d e r l o se n e c e s i t a n d e f i n i r d o s a c t i t u d e s f u n d a m e n t a l e s q u e pueden a d o p t a r s e a n t e un p r o b l e ma e x p e r i m e n t a l . Se e s t a e n a c t i t u d e x p l i c a t i v a cuando s e t r a t a n e s t a d i ? t i c a m e n t e d a t o s d e problemas d e i n v e s t i g a c i ó n f u n d a m e n t a l . Por e j e n i p 1 0 , s i s e e l a b o r a un nuevo método a u d i o v i s u a l d e e n s e ñ a n z a en i n v e s t i g a c i ó n f u n d a m e n t a l t a n i n t e r e s a n t e e; d e m o s t r a r q u e es m i s e f i c a z q u e un metodo d e r e f e r e n c i a 5 X A. Para a n a l i z a r l o s d a t o s d e e s t e experimento con a c t i t u d e x p l i c a t i y a , s e a p l i c a r á una prueba b i l a t e r a l , ya q u e l a h i p d t e s i s a l t e r n a t i v a planteada e s doble. Aunque e l e q u i p o d e i n v e s t i g a c i ó n a p r i o r i p i e n s e q u e c s mds e f i c a z q u e 5, l a 5 p r u e b a a a p l i c a r d e b e ser b i l a t e r a l ya q u e s i f i n a l i z a d o e l e x p e r i m e n t o s e o b s e r v a r a una d i f e r e n c i a s i g n i f i c a t i v a en s e n t i d o c o n t r a r i o , e l i n v e s t i g a d o r no d u d a r d e n conc l u i r q u e & es m a s e f i c a z q u e %. S e e s t á e n a c t i t u d p r a g m á t i c a cuando s e t r a t a n e s t a d l s t ' camente problemas d e i n v e s t i a a c i ó n a p l i c a d a . Continuando c o n e l e j e m p l o a n t e r i o r , l a D i r e c c i ó n d e un C e n t r o d e Enseñanza que emplea el curso A, p a r a d e c i d i r l a compra d e l c u r s o i n t e r e s a d a en saber si el c u r s o 5 estard sólo e s más e f i c a z que e l A. Probar X es menos e f i c a z que no l e i n t e r e s a e n a b s o l u t o . S e t r a t a de un problema d e i n v e s t i g a c i ó n a p l i c a d a . que Para a n a l i z a r l o s d a t o s d e e s t e e x p e r i m e n t o , e n a c t i t u d prLtgmática, s e a p l i c a r á una p r u e b a u n i l a t e r a l , ya q u e l a h i p ó t e - s i s a l t e r n a t i v a p l a n t e a d a es s i m p l e . En P s i c o l o g í a E x p e r i m e n t a l , l a s p r u e b a s b i l a t e r a l e s son l a s m á s u t i l i z a d a s ya que e l i n v e s t i g a d o r a d o p t a una a c t i t u d e x p l i c a t i v a a n t e l a mayor p a r t e d e l o s problemas. D e t e r m i n a c i ó n d e l número d e i n d i v i d u o s n e c e s a r i o s p a r a limitar el riesgo Y 1 c o n c e p t o d e i r i e s g o 4 y s u i n t e r p r e t a c i ó n g r d f i c a han quedado c l a r o s con l a s a n t e r i o r e s e x p l i c a c i o a e s . Ahora se a b o r d a P el estudio y la interpretacion grafica d e l riesgo en el caso paz t i c u l a r d e l a p r u e b a u n i h a t e r a l d e comparacion d e una p r o p o r c i b n observada a una proporción t e b r i c a . En caso de u t i l i z a r o t r a s . pruebas l a s fbrmulas son d i f e r e n t e s - ( * ) pero l o s conceptos aquí d e f i n i d o s permanecen i n v a r i a b l e s . La prueba u n i l a t e r a l de comparación d e una proporción observada a una proporci6n t e o r i c a , resuelve e l problema esquematizado e n - l a f i g u r a 8 . Los v a l o r e s E, po, y n_ son d a t o s conocidos. E l v a l o r px, correspondiente a i a h i p ó t e s i s a l t e r n a t i v a , es siempre d e s c o z c i d o . La prueba c o n s i s t e en ver s i e l v a l o r po e s t á d e n t r o o f u e r a d e l i n t e r v a l o de probabilidad d e p. En l a S u e b a u n i l a t e r a l se t r a t a d e v e r s i po e s t d a l a derecha o a l a izquierda d e S Cfigura 9a). Se l l e g a n a l a s s i g u i e n t e s conclusiones: - p,gt po >e : Nada s e opone en a c e p t a r Ho : Se rechaza tio con r i e s g o Cuando l a conclusidn de l a prueba es nada s e opone en ( * ) E l problema de l a determinación d e l número de individuos ne- c e s a r i o , para l a s pruebas d e d e c i s i ó n e s t a d f s t i c a m & s usudles, puede e s t u d i a r s e en DOMENECH MASSONS, J. M . : 1.létodos Estad í s t i c o s para l a InvestigaciÓn en Ciencias Humanas.-Herder Barcelona, 1975. a c e p t a r H ,no q u i e r e d e c i r que l a muestra proceda de l a poblaciún e, ya que podría muy bien proceder d e una población p,>p pero debido a l a s f l u c t u a c i o n e s d e l a z a r po cayese a l a izquierda de e s d e c i r d e n t r o d e l a zona de no r z h a z o de 5 . Por e s t e m o t i v o es, l a conclusi4n d e l a prueba e s i n d i c a r que e l r e s u l t a d o observado no e s t á en contradicción con l a h i p ó t e s i s nula , y no l a de a f i r mar que l a h i p ó t e s i s nula e s verdadera. S i l a población origen de l a muestra fuese l a población E ' , l a s proporciones observadas en muestras procedentes de E ' f l u c t u a r i a n alrededor de p'segGn una l e y normal. S i s e d i b u j a d i - cha d i s t r i b u c i b n junto a l g r d f i c o d e l a f i g u r a ga, s e o b t i e n e l a s e r á l a zona sornbreada ya que indica l a f i g u r a 9b. E l r i e s g o cantidad de veces que muestras procedentes de p'dan,proporciones observadas a l a izquierda de e s d e c i r d e n t r o de l a zona de no rechazo de Ho- es. - - p , dibujada en l a f i g u r a 9b, corresponde a l r i e s g o de l a prueba s i l a muestra procediese de l a población e'. Pero e l r i e s g o (3 r& d e l a prueba e s desconocido ya que l a proporci6n px, correspondiente a l a h i p ó t e s i s a l t e r n a t i v a , e s un val o r que e x i s t e pero que no s e conoce. ~l r i e s g o La f i g u r a 9d i l u s t r a e l caso en que l a proporci6n px coincide con un v a l o r '2 muy cercano a l valor p. En e l caso r e presentado en l a f i g u r a 9d e l r i e s g o ? e s muy grande, supera e l 5 0 % . E,e La f i g u r a 9 muestra cómo a medida que l r i e s g o (3 d e l a prueba va aumentando. 'E se aproxima a sobre (3 ( y tam Par o t r a p a r t e e x i s t e una i n f l u e n c i a d e bien sobre o( ) La f i g u r a 1 0 i l u s t r a cdmo para una misma h i p ó t e s i s . a l t e r n a t i v a a l aumentar e l tamaño 1 d e l a muestra disminuye e l riesgo (3 (y tambien e l r i e s g o o( ) . EL o b j e t o d e e s t e apartado e s c a l c u l a r que l o s r i e s g o 6 4 y (j sean pequeños, por ejemplo de t a l manera ~c6- 4 =8=0.05. - mo I o g r a r l o e l p, es desconocido?. El conocieminto de px no e s n e c e s a r i o s i s e a n a l i z a e l problema deede un dngulo práctbco. 'En efecto, auflnr~ehie que rpr. t r a t a 88 probar si una muestra prooede de una poblacibn p-0.80. Si en r e a l i d a d procede de una poblacf6n px= 0.81 y l a prueba conOLuym que paooeci~ de 2 , eote error tipo 10 aomatido no Ciena nin- guna importancia ya que p= 0.80 e s t á muy prdximo de p,= ... 0.81. LO mismo o c u r r i r l a s i px v a l i e s e 0.82, 0.83, e t c . Pero l l e g a r á un momento, a p a r t i r de un c i e r t o v a l o r p$ p + b p , en que e l afirmar que l a muestra procede de E empieza a ser un e r r o r t i p o 11 grave y no s e e s t á d i s p u e s t o a cometerlo, e s d e c i r a que l a prueba concluya que l a muestra procede de E cuando procede de una población c a r a c t e r i z a d a por l a proporcidn p, i g u a l o mayor que 2'. - El v a l o r A p c s e f i j a subjetivamente y e s e l v a l o r a part i r d e l c u a l si px es i g u a l o superior a p g p + h p no s e e s t á d i s puesto a c o m e t e r u n e r r o r t i p o 11. ( d e c i r que po procede de cuando en r e a l i d a d procede de px). - e - Por l o t a n t o , para determinar e l nGmero d e individuos ng 6 c e s a r i o para asegurar un r i e s g o pequeño, se debe evaluar subjetivamente A p y f i j a r a p r i o r i unos r i e s g o s o( y (3 pequeños. La ecuación (15), que r e l a c i o n a l o s d a t o s E, E', L] p, 4 y (3 con E , s e deduce de l a f i g u r a 10. - ~ e s p e j a n d og'de e s t a . e c u a c i 8 n s e o b t i e n e : NUMERO DE INDIVIDUOS NECESARIOS EN UNA PRUERA UNILATERAL DE COMPARACION DE UNA PROPORCION OBSERVADA A UNA PROPORCION TEORICA (16) Condiciones d e a p l i c a c i ó n : E l v a l o r n encontrado debe s e r t a l que l o s productos np, nq, np' y nq' sean igual e s o mayores que 5 A I Con un razonamiento análogo e s f a c i l deducir ( * ) l a £65 mula- (17) que da e,l nbnero de individuos n e c e s a r i o s para una prue ba b i l a t e r a l d e comparación d e una proporción observada a una proporci6n t e 6 r i c a . C*) Vease l a obra nada. 43) pp. 86 y s i g : de l a ~ i b l i o g r a f l aS e l e c c i o / TERAL DE COMPARACION DE UNA PROPORCION OBSERVADA 1 A -UNA PROPORCION TEORICA I1 Condiciones d e a p l i c a c i b n : El. v a l p r encontrado n debe s e r t a l q u e . 1 0 ~productos np, nq, np' c s e a n i g u a l e s o mayores que 5 y nq' Curva d e Potencia La f i g u r a 11, llamada c u r v a d e p o t e n c i a , da l o s v a l o r e s d e l a potencia p=l-P dientes en funcidn de p o s i b l e s v a l o r e s px correspon- a l a h i p ó t e s i s a l t e r n a t i v a , e n una prueba u n i l a t e r a l de c o m p a r a c i 6 n . d e una p r o p o r c i d n observada a una p r o p o r c i b n t e d r i c ' a , e n e l c a s o p a r t i c u l a r d e p=0.50., n=10.0 y un r i e s g o 0( =O. 05. E s t a c u r v a es o t r a manera d e v e r e l c o n c e p t o i l u s t r a d o e n l a f i g u r a 9, segdn e l c u a l d a que p se hace pequeño. a (j aumenta (p=l-fl disminuye) a medi No se i n d i c a l a manera d e d i b u j a r e s t a c u r v a ya q u e s e . t r a t a d e u n s e n c i l l o problema de c a l c u l a r r e p e t i d a s v e c e s s u p e r f i c i e s b a j o l a l e y normal, segdn e l esquema d e l a f i g u r a 9. Estrategia global L a d e t e r m i n a c i ó n p r e v i a d e l número d e i n d i v i d u o s comp l e t a l a a o n c l u s i 6 n d e l e prueba cuando l a d e c i s i d n a tomar Q S l a de no r e c h a z o de l a h i p b t e s i s n u l a . E l p r o c e s o metodológico a s e g u i r en un p r o c e s o d e dec i s i ó n , mediante la prueba d e comparación de una p r o p o r c i 6 n obs e r v a d a a una p r o p o r c i d n t e o r i c a , es e l s i g u i e n t e : . . 1.- F i j a r subje.tivamente e l vlilor Y 2.- p- . p y l o s r i e g o s .@-t . Determinar e l ndmero 2 d e i n d i v i d u o s : l.= c ( z q *+ z 2 p ~ ~ ) / * e j 2 J 3.- R e a l i z a r e l experimento c o n l a muestra d e viduos-. , . 4.- calcula= el valor 5.- Tomar l a d e c i s i 6 n dando una d e l a s siguiente conclusiones: z b z O ( : Nada se opone e n a c e p t a r Ho. La p r o b a b i l i d a d d e equivocarse, cuand o px e s t á más a l e j a d o d e E q u e E, es i g u a l o i n f e l a distancia z indi.- d e l a - prueba d e d e c i s i d n : r i o r a l valor p fijado. : Se a c e p t a z > z4 H1. La p r o b a b i l i d a d d e equivocarte e s i g u a l a l r i e s g o a( f i j a d o . Generalización Cuando l a prueba d e d e c i s i d n e s o t r a que l a prueba b i l a t e r a l d e coniparaci6n d e una p r o p o r c i d n o b s e r v a d a a una p r o p o r c i ó n t e ó r i c a , cambian l a s f ó r m u l a s r e c u a d r a d a s , p e r o e l a n t e r i o r p r o c e s o peri:?ar!ecc i n v a r i a b l e . . Llri ~L.\II.KI d e ~ 1 1 v c s t i q a c i b nha c o n s t r u f d o un nuevo c u e s - tiocario x - para n i e d i r r e l f a c t o r neurotici.smo y d e s e a ' e s t u d i a r s u e f i c . a c i a con r e l a c i i j r i a l a d e l c u e s t i o n a r i o A_ d e r e f e r e n c 4 a cuyo r r i i d i r a i c n t o e s d'e 0.80 (80 d e cada 100 i n d i v i d u o s n e u r b t i c o c con dia~jiiosticados correcta!~icnte). a.- ¿Cuántos i n d i v i d u o s n e u r b t i c o s debe h a b e r en l a miles Lra? S e t r a t a d e a s e q u r a r una d e t e r m i n a d a p o t e n c i a a l a p r u e ba b i l a t e r a l ( d c t ~ t u c ie x p l i c a t i v a ) d e comparación d e una p r o p o r - c i ó n o b s e r v a d a a una p r o y o r c i ó n t e 6 r i c a . E l e q u i p o d e i n v e s t i g a ción evalúa A p= -+ 0 . 1 0 , ya que c o n s i d e r a i m p o r t a n t e a v e r i g u a r s i e l nuevo c u e s t i o n d r i o d e t e c t a un + 10%d e i n d i v i d u o s n e u r d t i c o s respect-o a l o s d e l c u e s t i o n a r i o A, y 0.G5. d o s v a l o r e s p' q' a c e p t a unos r i e s g o s 4 posibles: s e e l i g e e l c o r r e s p o n d i e n t e a l mayor p r o d u c t o : - =p= e n ( 1 7 ) y teniendo cn cuenta que de 10s Sustituyenda valorcs i i p # q O = max ( p q , S S p q ) = 0.70~0.30 . . Se o b t i e n e : En una m u e s t r a d e n=233 n e u r d t i c o s e l c u e s t i o n a r i o b.- X ha diagnosticado correctamente diferente de a01 d e e l l o s . 2- t i e n e e f i c a c i a A? S i se a c e p t a 4 =O. 05, a p l i c a n d o ( 1 4 ) p a r a c o m p a r a r se o b t i e n e : p o = a O k / 2 3 3 = ~ . 86 c o n p=O. D O , z= (0.86-0.801/ 40.8x0.2/233 = 2.32) 1.96 Conclunib_n_~c7<&9&1~a~r S e a c e p t a H 1 con riasclo 0.05 . C o n c l u s i 6 n e x p e r i m e n s : P u e s t o que p = 0.86 e s supeO rior a p=0.80, y l a d i f e r e n c i a e n c o n t r a d a es s i g n i f i c a t i v a , e l rendimiento d e E e s superior a l rendimiento d e 5. 5 c.- ¿En qu6 c a n t i d a d e l r e n d i m i e n t o d e l c u e s t i o n a r l o es s u p e r i o r a l d e l c u e s t i o n a r i o A? B a s t a e s t i m a r l a p r o p o r c i á n px d e d i a c j n o s t i c o s c o r r e c t o s d e l cuestionario E, a p a r t i r d e l a p r o p o r c i 6 n p O=0.86 o b s e r n e u r ó t i c o s . A c e p t a n d o un r i e s g o O( v a d a e n l a m u e s t r a d e n.233 =p= ~ 0 . 0 5 y a p l i c a n d o ( 5 ) se o b t i e n e : E l rendimiento d e 5 e s t a s i t u a d o e n t r e 0.82 y 0 . 9 0 , es decir e l r e n d i m i e n t o d e l c u e s t i o n a r i o 5 sera s u p e r i o r entre un 2 % y un 1 0 % r e s p e c t o a l r e n d i m i e n t o d e l c u e s t i o n a r i o A . d.- Una v e z d e m o s t r a d a e s t a d f s t i c a m ~ n t el a s u p e r i o r i - dad d e l c u e s t i o n a r i o 5, e l Grupo d e I n v c s t i g a c L ó n d c s e a v e r d c r l o a un G a b i n e t - Psicológico que emplea e l ' c u c s t i o n d r i o 5. Antes de c o m p r a r l o e l D i r e c t o r de d i c h o G a b i n e t e desea r e a l i z a r un e x p e r i m e n t o para p r o b a r qlie l a e f i c a c i a d e l c u e s t i o n a r i o 5 es supe- r i o r a l a d e l cuestionario A. ¿Cuántos i n d i v i d u o s debe haber e n l a muestra? Se t r a t a d e a s e g u r a r una c i e r t a p o t e n c i a a l a p r u e b a unilateral ( a c t i t u d p r a g m á t i c a ) d e c o m p a r a c i ó n d e una p r o p o r c i ó n c b s e r v a d a a una p r o p o r c i ó n t e 6 r i c a . E l D i r e c t o r d e l G a b i n e t e p s i c o l b q i c o evalúa&= + 0 . 0 7 , ya q u e c o n s i d e r a i m p o r t a n t e a d o p t a r s i como mfnimo d e t e c t a un 7 % m a s d e n e u r b t i c o s q u e u n o s r i e s g o s o( 5 A, y acepta = O . 05. S u s t i t u y e n d o v a l o r e s e n ( 1 6 ) se o b t i e n e : =o e . - En 1.3 m u e s t r a d e n=302 n e u r 6 t i c o s e l c u e s t i o n a r i o ha d i a g n o s t i c a d o c o r r e c t a m e n t e 254. S i se a c e p L a o( =0.05, ~5 e s 5 más e f i c a z q u e aplicando (14) p e r o teniendo e n c u e n t a q u e s e t r a t a d e una p r u e b a u n i l a t e r a l d e c o m p a r a c i ó n d e po=254/302=0.84 c o n p = 0 . 8 0 , s e obtiene: ~l v a l o r z= 1 . 7 4 es s u p e r i o r a z2* =0.84 es s u p e r i o r a p=0.80. e f i c a z que e l c u e s t i o n a r i o VI.- = 1 . 6 5 y además po= Conclusión: El c u e s t i o n a r i o g es más A. BIBLIOGRAFIA SELECCIONADA (1) BONET, E: F o n a m e n t s d ' E s t a d f s t i c a . Teide. Barcelona, 1974 Introducci6ii a l a n d l i s i s o s t a d f s t i c o . C a s t i l l o . Madrid, 1966 ( 2 ) DIXON-MASY: ( 3 ) DOMENECH M A S S O ~ S , J . M . : Métodos E s t a d í s t i c o s p a r a l a . I n v e s t i g a c i b n e n C i e n c i a s Humanas. ~ e r d e r B a r c e l o n a , 1975.