1 Estudios anteriores han demostrado que puede admitirse una distribucion de Poisson para el numero de hembras, en una determinada region, de la mosca tropical americana (Dermatobia hominis) la cual se caracteriza por poner sus huevos en un mosquito, pasando las larvas de la mosca a la piel de la persona cuya sangre ha chupado el mosquito. Examinada la region en cuestion en 10 das elegidos al azar, se obtuvo el siguiente numero de moscas hembra de la citada especie: 2; 1; 3; 3; 4; 2; 1; 2; 3; 2 Se pide: a) Estimar la ley de probabilidad que rige el mencionado numero de moscas hembra de la region en estudio. b) Determinar la estimacion de maxima verosimilitud del numero medio de moscas hembra de la region en cuestion. c) Calcular el numero mnimo de das que debe de muestrearse en la region en estudio, para que la diferencia entre el numero medio de moscas hembra de la region y su estimacion, se diferencien en menos de una, con probabilidad 0 99. 0 a) Del enunciado se desprende que para la variable aleatoria X , numero de moscas hembra de la region en estudio, puede admitirse una distribucion de Poisson P ( ), lo cual signica que modelizamos, en cuanto a la forma, la ley de probabilidad que rige dicha variable aleatoria |la correspondiente a una distribucion de Poisson{, dependiendo la determinacion completa de dicha ley de probabilidad del valor que asignemos a . Estimando convenientemente, habremos estimado la ley de probabilidad de la variable en estudio. Un metodo que nos proporciona buenos estimadores del parametro o parametros de la distribucion es el de la m axima verosimilitud, independientemente de lo que representen aquellos |media, varianza u otra cosa|. Para determinar el estimador de maxima verosimilitud de debemos formar, en primer lugar, la ecuacion de verosimilitud. Como la funcion de masa de la distribucion de Poisson P ( ) es ( )= p x a e 0 x ! x x = 0; 1; 2; ::: dicha funcion sera Y ( )= n L =1 i a e 0 x i xi ! = la cual tiene por logaritmo neperiano log L() = 0n + Xx a la cual tiene como similitud de 0 i=1 i n P n 1 xi x1 ! 1 ::: 1 xn ! n Derivando esta funci on respecto a verosimilitud: a e 2 log 0 log a Yx : n i=1 i! obtenemos la siguiente ecuaci on de P n x @ i=1 i = 0 log L( ) = 0n + @ a ^ = x; por tanto, el estimador de m soluci on axima vero- sera la media muestral y, en consecuencia, estimaremos la ley a x) = P (2 3). de probabilidad que rige la variable en estudio por una P ( 0 (Obs ervese que, en la obtenci on del estimador de m axima verosimilitud, no se ha tenido en cuenta el que cir, la media de la poblaci on. fuera la media de la distribuci on, es de- En la obtenci on del estimador s olo hay que seguir los tres pasos antes indicados: obtenci on de la ecuaci on de verosimilitud, derivada (igualada a cero) de dicha funci on respecto al par ametro o par ametros que determinan totalmente la distribuci on modelo y, por u ltimo, resoluci on de la ecuaci on o sistema de ecuaciones determinado en el segundo paso.) b) Como la media de la distribuci on de Poisson es el par ametro que la caracteriza (CB-secci on 4.4.2), el cual hemos estimado en el apartado anterior, la estimaci on de m axima verosimilitud del n umero medio de moscas 0 hembra de la regi on es 2 3. c) El problema aqu es el de determinar el menor tama~ no muestral n tal que se cumpla la condici on P fj 0 a xj < 1g = 0 99 0 o bien, P fja x 0 j < 1g = 0 99 0 para lo que ser a necesario conocer la distribuci on de la media muestral. Si el tama~ no muestral resultante fuera grande, digamos mayor que 100, 3 a ax ; N ; pa x=n ( an ) podr amos utilizar la aproximaci on normal a la distribuci on de CB-secci on 5.5, la cual es u ltima expresi on ser a ( a ). a x dada en En ese caso, tipicando en la p P con Z ;N ; (0 1). j Zj < p a a x 0 = 0 99 La tabla 3 de la distribuci on normal nos dice que a la 0 0 area de probabilidad 0 005, por lo que dentro del derecha de 2 575 hay un 0 ; 0 0 0 intervalo (02 575 2 575) habr a un area de probabilidad 1 0 2 2 0 005 = 0 99. 8 Es decir, que es 9 P jZ j < 2 575 0 Por tanto, debe ser aa p n a a x p 0 = 0 99 : 0 = 2 575 a o bien, p pa n = 2 575 1 a x = 2 575 1 2 3 a p 0 0 0 es decir, n = 2 5752 1 2 3 = 15 25: 0 A medida que mal de a x n aumenta, 0 0 disminuye la varianza de la distribuci on nor- antes utilizada, por lo que esta estar a cada vez m as concentrada entorno a su media, , y ser a cada vez mayor la probabilidad del suceso puesto como condici on al inicio del apartado. muestral requerido es n = 16. En suma, el menor tama~ no Observemos, sin embargo, que hemos utilizado una aproximaci on normal, la cual es buena cuando el tama~ no muestral es grande; como no ha resultado tan grande como lo inicialmente supuesto, vamos a calcular directamente la probabilidad en cuesti on: utilizando el que x = 16 1 a x n1a antes mencionada. Ser a P fja x 0 j < 1g ; P (16 ) como se indica en la seccion de CB 4 P fja x 0 j < 1g = P f 0 1 < a x < + 1g = P ( 16( 0 1) < Si es = 2 3, esta probabilidad sera 16 X i=1 Xi ) < 16( + 1) : 0 P con P16=1 X i i P f20 8 < 0 16 X i=1 ( 20 8 < 0 Xi < 52 8g 0 Xi < 52 8 ) 0 aa a ; P (36 8). Por tanto, 0 16 X i=1 16 16 16 X X X = P f X = 21g + P f X = 22g + ::: + P f X = 52g i i i=1 i=1 36 821 + e 21! = F (52) 0 F (20) = e 360 8 0 0 36 822 + ::: + e 22! 360 8 0 i i=1 0 36 852 52! 360 8 0 0 = 0 992986 0 0 001840 0 0 = 0 991146 > 0 99 0 0 como queramos y en donde F representa la funcion de distribucion de la P (36 8). Como ultimos calculos a realizar que conrman el que n = 16 aes el menor tama~ requerido, se tiene que, si fuera n = 15, sera n1 x = 15 1 ax = P15 nXo muestral ; P (15 ) = P (15 1 2 3) = P (34 5) y =1 0 i 0 i 0 ( P fjax 0 j < 1g = = P 15(2 3 0 1) < 0 ( = P 19 5 < 0 X 15 i=1 15 X i=1 Xi < 15(2 3 + 1) Xi < 49 5 ) 0 ) 0 = F (49) 0 F (19) = 0 992295 0 0 002957 = 0 989338 < 0 99 con F ; P (34P5) no llegando, por tanto, a la probabilidad exigida, y si fuera n = 17, sera 17=1 X ; P (17 1 2 3) = P (39 1) y 0 0 0 0 i i 0 0 0 5 P fjax 0 j < 1g ( = P 22 1 < 0 17 X i=1 ) Xi < 56 1 0 = F (56) 0 F (22) = 0 995758 0 0 002135 = 0 993623 > 0 99 con F ; P (39 1), mayor que la probabilidad solicitada aunque no siendo n = 17 el menor tama~no muestral que lo cumple. Por tanto, se concluye que es razonable utilizar la aproximacion normal para la media de una muestra procedente de la distribucion de Poisson, al menos en una primera etapa. Si el tama~no muestral resultante no es muy grande conviene realizar unos calculos, similares a los anteriores, que conrmen el resultado obtenido. 0 0 0 0 0