Ajuste de datos reales a una variable de Poisson

Anuncio
AJUSTE DE UN CONJUNTO DE DATOS REALES A UNA DISTRIBUCION
TEORICA
En la práctica, uno recoge datos experimentales pero desconoce a priori cuál es la
distribución (binomial, Poisson, etc.) que siguen esos datos. Por ello, a la hora de
determinar cuál es esa distribución teórica, resulta habitual el método de ensayo/error:
ensayamos con una cierta distribución que nos parece verosímil, y comparamos los
resultados que produciría esa distribución (teórica) con los datos reales que hemos
recogido. Si los primeros aproximan suficientemente bien los segundos, admitiremos que la
distribución que siguen los datos es la que hemos conjeturado; en otro caso, probaremos
otras posibilidades.
Como ejemplo de esta situación (que aparece constantemente en la investigación científica),
durante la Segunda Guerra Mundial se tuvo la sospecha de que los impactos de las bombas
nazis en el Sur de Londres obedecían a una Ley de Poisson. Para decidir si esta conjetura
era cierta, se dividió el área total en 576 áreas parciales de 0’25 km2, y se recogieron los
siguientes datos:
Nº impactos (k)
Nº áreas con k impactos
0
229
1
211
2
93
3
35
4
7
5
1
A fin de ajustar los datos anteriores a una distribución de Poisson, se hicieron las siguientes
consideraciones:
1) Para definir una distribución de Poisson, es necesario conocer el valor del parámetro 
correspondiente. Como  coincide con la media de la distribución, se estimó el valor del
parámetro como la media del conjunto de datos anterior. Puede comprobarse que esta
media es de 0’93. En consecuencia, se estimó   0,93.
2) En consecuencia, el modelo propuesto fue P( X  k )  e
 0,93
0,93k
. Esta fórmula
k!
proporcionaba la probabilidad de que uno de esos pequeños áreas (de 0’25 km2) recibiera
exactamente k bombas.
3) Para comprobar la bondad del modelo, se compararon las predicciones del modelo con
los datos reales. Con ese fin se determinaron las siguientes probabilidades, utilizando la
expresión obtenida en el apartado anterior:
Nº impactos (k)
Probabilidad
0
0,3946
1
0,3669
2
0,1706
3
0,0529
4
0,0123
5
0,0023
Finalmente, traduciendo cada probabilidad a porcentaje (multiplicando por 100), y
considerando un total de impactos de 229 + 211 + 93 + 35 + 7 + 1 = 576, se determinó el
número de áreas con k impactos predicho por el modelo. Por ejemplo, el número predicho
de áreas con 0 impactos se calcula como el 39’46% de 576, es decir, 227 (que está muy
próximo a 229). Estas predicciones se muestran en la siguiente tabla:
Nº impactos (k)
Nº (predicho) de áreas
con k impactos
0
227
1
211
2
98
3
30
4
7
5
1
Se puede comprobar que las predicciones concuerdan muy bien con los datos observados,
con lo cuál el modelo obtenido es razonable. Obsérvese que el modelo predice una media
de impactos en cada área casi igual a 1 (concretamente, 0’93); en otras palabras, que es raro
que un mismo área reciba más de 1 impacto.
En el momento en que el estudio se hizo, la utilidad del estudio fue la de avalar
matemáticamente la idea de que los lugares más seguros eran los que ya habían sido
bombardeados previamente, tanto más seguros cuantas más bombas hubieran recibido en
el pasado.
Descargar