AJUSTE DE UN CONJUNTO DE DATOS REALES A UNA DISTRIBUCION TEORICA En la práctica, uno recoge datos experimentales pero desconoce a priori cuál es la distribución (binomial, Poisson, etc.) que siguen esos datos. Por ello, a la hora de determinar cuál es esa distribución teórica, resulta habitual el método de ensayo/error: ensayamos con una cierta distribución que nos parece verosímil, y comparamos los resultados que produciría esa distribución (teórica) con los datos reales que hemos recogido. Si los primeros aproximan suficientemente bien los segundos, admitiremos que la distribución que siguen los datos es la que hemos conjeturado; en otro caso, probaremos otras posibilidades. Como ejemplo de esta situación (que aparece constantemente en la investigación científica), durante la Segunda Guerra Mundial se tuvo la sospecha de que los impactos de las bombas nazis en el Sur de Londres obedecían a una Ley de Poisson. Para decidir si esta conjetura era cierta, se dividió el área total en 576 áreas parciales de 0’25 km2, y se recogieron los siguientes datos: Nº impactos (k) Nº áreas con k impactos 0 229 1 211 2 93 3 35 4 7 5 1 A fin de ajustar los datos anteriores a una distribución de Poisson, se hicieron las siguientes consideraciones: 1) Para definir una distribución de Poisson, es necesario conocer el valor del parámetro correspondiente. Como coincide con la media de la distribución, se estimó el valor del parámetro como la media del conjunto de datos anterior. Puede comprobarse que esta media es de 0’93. En consecuencia, se estimó 0,93. 2) En consecuencia, el modelo propuesto fue P( X k ) e 0,93 0,93k . Esta fórmula k! proporcionaba la probabilidad de que uno de esos pequeños áreas (de 0’25 km2) recibiera exactamente k bombas. 3) Para comprobar la bondad del modelo, se compararon las predicciones del modelo con los datos reales. Con ese fin se determinaron las siguientes probabilidades, utilizando la expresión obtenida en el apartado anterior: Nº impactos (k) Probabilidad 0 0,3946 1 0,3669 2 0,1706 3 0,0529 4 0,0123 5 0,0023 Finalmente, traduciendo cada probabilidad a porcentaje (multiplicando por 100), y considerando un total de impactos de 229 + 211 + 93 + 35 + 7 + 1 = 576, se determinó el número de áreas con k impactos predicho por el modelo. Por ejemplo, el número predicho de áreas con 0 impactos se calcula como el 39’46% de 576, es decir, 227 (que está muy próximo a 229). Estas predicciones se muestran en la siguiente tabla: Nº impactos (k) Nº (predicho) de áreas con k impactos 0 227 1 211 2 98 3 30 4 7 5 1 Se puede comprobar que las predicciones concuerdan muy bien con los datos observados, con lo cuál el modelo obtenido es razonable. Obsérvese que el modelo predice una media de impactos en cada área casi igual a 1 (concretamente, 0’93); en otras palabras, que es raro que un mismo área reciba más de 1 impacto. En el momento en que el estudio se hizo, la utilidad del estudio fue la de avalar matemáticamente la idea de que los lugares más seguros eran los que ya habían sido bombardeados previamente, tanto más seguros cuantas más bombas hubieran recibido en el pasado.