Cajón de Ciencias Distribución binomial Hay dos distribuciones básicas en la estadística de Bachillerato: la normal y la binomial. La normal, recordemos, es aquella en la que las probabilidades de los casos posibles se distribuyen según una curva en la cual los más probables son los más cercanos a la media. La binomial es (atentos a la definición) aquella en la que en cada ocasión sólo hay dos resultados posibles, que se excluyen el uno al otro (es decir, o se da uno, o se da otro, no hay más posibilidades). Ejemplos de distribución binomial: - Número de caras que se obtienen en un número de lanzamientos de una moneda. - Número de hijos varones (o de hijas) dentro de la cantidad de bebés que haya tenido una pareja. - Número de veces que acierta en la diana un arquero que efectúa un cierto número de disparos. Fíjate que la variable no es cuántos lanzamientos (o hijos, o disparos) ocurren, ni tampoco si sale cara o cruz (o niño/niña, o acierta/falla), sino el número de “éxitos”, entendiendo “éxito” como que ocurra aquello por lo que estamos preguntando, no porque esa opción sea mejor o peor que la otra. Tenemos que tener en cuenta que habrá: → Un cierto número de experimentos, pruebas o repeticiones, al que llamaremos n. → Un número de éxitos, al que llamaremos m. → Una probabilidad de acierto, que llamaremos p, para ser originales. → Una probabilidad de fallo, q, que en realidad es 1-p, porque si no ocurre una cosa, a la fuerza ocurre la otra. → Habrá un cierto número de formas en las que se podrán distribuir esos éxitos en el total de repeticiones. Como siempre, veremos mejor las cosas con un ejemplo. Supongamos que tenemos una moneda trucada, cuya probabilidad de cara es de 1/3, y la de cruz, 2/3 (fíjate que la suma de ambas da 1). Si la lanzamos cuatro veces, tenemos los siguientes resultados posibles: cero caras, una cara, dos caras, tres caras o cuatro caras. Sólo nos pueden preguntar la probabilidad de esas cinco cosas. Hasta aquí fácil. De la probabilidad básica (repásala si lo siguiente te suena a chino) recordarás que cuando se tienen sucesos independientes y queremos calcular la probabilidad de su intersección (es decir, de que ocurra uno y otro), lo que se operaba era el producto de sus probabilidades: cero caras una cara dos caras tres caras cuatro caras → → → → → 2/3·2/3·2/3·2/3 = (2/3)4 1/3·2/3·2/3·2/3 = 1/3·(2/3)3 (1/3)2·(2/3)2 (1/3)3·2/3 (1/3)4 www.cajondeciencias.com Cajón de Ciencias No parece muy difícil. Pero aún hay que añadir algo más. Dos caras de un total de cuatro lanzamientos pueden suceder de varias formas posibles: CCXX CXXC CXCX XCCX XXCC XCXC Cuando son pocos casos, se puede hacer por la cuenta de la vieja. Pero esto no sirve cuando son muchos (y además queda poco elegante). En la práctica, calcularemos el número de ordenaciones posibles a través de un número combinatorio (otra cosa más para repasar si no la recuerdas), cuya parte superior será igual al número de repeticiones y la inferior igual al número de éxitos. Así, en el caso de la probabilidad de conseguir dos caras de un total de cuatro tiradas, tendríamos: P x=2= 4 ·1 /3 ·2/ 3 2 2 2 En resumen, para calcular cualquier probabilidad en una distribución binomial, en la que se realizan m repeticiones y se esperan n éxitos, y donde p es la probabilidad de éxito y q la de fracaso, la fórmula general sería la siguiente: P x=n= m · p n · q m−n n Una aclaración, por si hace falta: m-n es el número de fracasos, ya que si se hacen m repeticiones, y de ellas n son aciertos, el resto son, obviamente, fallos. Si, como ocurría en la normal, nos pidiesen la probabilidad de como máximo (o como mínimo) un número de aciertos, tendríamos que calcular las probabilidades necesarias por separado y luego sumarlas. Siguiendo con el ejemplo anterior, ¿cuál es la probabilidad de obtener al menos una cara? Calculamos por separado la probabilidad de una cara, de dos, de tres y de cuatro, y luego sumamos los resultados. O, si somos avispados, utilizamos la definición de suceso contrario: calculamos la probabilidad de lo contrario a “al menos una cara” (es decir, ninguna) y luego hacemos P (al menos una cara) = 1 – P(ninguna cara) www.cajondeciencias.com Cajón de Ciencias Aproximando la binomial a una normal (o qué hacer cuando se lanza una moneda mil veces) Imaginemos que una mente perversa nos propone el siguiente problema: se lanza una moneda mil veces ¿Cuál es la probabilidad de obtener 335 caras? Nadie puede negar que se trata de una binomial, pues hay una serie de repeticiones en cada una de las cuales sólo existen dos resultados posibles. Pero esto es lo que encontramos cuando aplicamos la fórmula de la binomial: P x=335= 1000 ·1 /2335 · 1/2665 335 A ver quién es el guapo que calcula esas potencias, por no hablar de los factoriales que nos saldrían en el número combinatorio. Esto no puede hacerse así. Y de hecho, hay otra forma. Resulta que, cuando el número de repeticiones es lo bastante grande, puede tratarse una distribución binomial como si fuera una normal, haciendo unos pequeños ajustes. En estadística existe algo llamado (quizás un poco pomposamente) “Ley de los grandes números”, que predice que, a la larga, los sucesos aleatorios terminarán apareciendo en una proporción equivalente a sus probabilidades. O lo que es lo mismo, si lanzamos una moneda seis veces, nada nos garantiza que salgan tres caras y tres cruces, pero si lo hacemos mil veces, es esperable que aproximadamente la mitad sean caras. Resumiendo, cuando el número de repeticiones sea lo bastante grande1, convertiremos nuestra binomial en una normal, realizando los siguientes cambios. Recuerda que una normal necesita dos parámetros: media y desviación típica. - La media la obtendremos multiplicando m por la probabilidad de éxito p. μ = m·p - La desviación típica la sacamos calculando la raíz cuadrada de m·p·q. σ= mpq A partir de ahí, ya tendremos los datos necesarios para operar como si estuviésemos de nuevo en la distribución normal, aunque seguramente tendremos que tipificar la variable primero. Si lo necesitas, echa un vistazo a cómo se hacía todo eso en el documento de nuestra página llamado “Distribución normal”. 1 ¿Y cuánto es “lo bastante grande”? Sentimos decir que no hay ninguna norma establecida. Algunos autores consideran que 30 es suficiente; otros apuestan por el 100. Pregunta a tu profesor. En cualquier caso, la aproximación siempre se puede hacer, pero será muy pobre cuando el número de repeticiones sea bajo, y mejor cuanto más alto sea éste. www.cajondeciencias.com