PRIMERO DE BACHILLERATO QUIMESTRE I BLOQUE 1 Coeficiente de Lineal Correlación Regresión Lineal (Curva del mejor ajuste) BLOQUE 2 Probabilidad BLOQUE 3 Teorema de Bayes Definiciones importantes (Probabilidad, Experimento, Resultado, Evento) Principios de Conteo Combinación Permutación Tipos de Probabilidad: Clásica, Empírica, Subjetiva. QUIMESTRE II BLOQUE 4 Distribución Probabilidades Media, Varianza y Desviación Estándar de una distribución de probabilidad. Distribución Binomial Tipos de Eventos (Mutuamente excluyentes; no mutuamente excluyentes; independientes) Reglas de Probabilidad Reglas de Adición (General-Especial) Reglas de Multiplicación (General-Especial) Logros que se desea alcanzar en el estudiante Materiales BLOQUE 5 BLOQUE 6 Distribución Hipergeométrica Distribución de Poisson de Entender claramente el uso y sentido del coeficiente de correlación lineal Leer un coeficiente de correlación lineal Calcular de forma adecuada el coeficiente de correlación lineal Manejar oportunamente el criterio de regresión lineal Estructurar curvas del mejor ajuste Diagramar curvas de mejor ajuste sobre gráficas de dispersión Proyector- Ordenador Distribución Exponencial Distribución Uniforme BLOQUE 1 Coeficiente de Correlación Lineal El coeficiente de correlación lineal “r”, es un estadígrafo adimensional que intenta demostrar si existe influencia de una variable llamada independiente sobre otra llamada dependiente, además intenta medir la proporcionalidad directa o inversa de una variable sobre otra. Sus valores pueden estar entre -1 y 1. RELACIÓN INVERSA NEGATIVA RELACIÓN DIRECTA POSITIVA -1 a -0.5 -0.5 a 0 0 a 0.5 0.5 a 1 FUERTE DÉBIL DÉBIL FUERTE 𝑟= 𝑆𝑆𝑥𝑦 √𝑆𝑆𝑥 ∗ 𝑆𝑆𝑦 2 (∑ ) 𝑋 𝑆𝑆𝑥 = ∑ 𝑋 2 − 𝑛 2 (∑ ) 𝑌 𝑆𝑆𝑦 = ∑ 𝑌 2 − 𝑛 ∑𝑋 ∗ ∑𝑌 𝑆𝑆𝑥𝑦 = ∑ 𝑋𝑌 − 𝑛 Pasos para calcular el coeficiente de correlación lineal 1. Encontrar valores de x al cuadrado 2. Encontrar valores de y al cuadrado 3. Encontrar la multiplicación de X por Y 4. Hallas sumatorias de X, Y, X2, Y2; XY. 5. Aplicar fórmulas de sumas de cuadrados. 6. Reemplazar en fórmula del coeficiente de correlación lineal 7. Obtener conclusiones de coeficiente Ejemplo 1: En una clase de Literatura el profesor Thompson, encuesta a sus alumnos sobre el tiempo de estudio previo al examen, esto lo hace antes de darles las calificaciones, su interés es conocer si existe alguna correlación entre las horas de estudio y la calificación. 𝑆𝑆𝑥 = 13.8 − 𝑟= 7.5 √2.55∗24.32 (7.5)2 5 = = 2.55 7.5 7.875 Alumno Horas de Calificación (Y) estudio (X) X^2 Y^2 XY A B C D E 2,5 1,5 1 0,5 2 9,6 7,6 6,2 3 8 6,25 2,25 1 0,25 4 92,16 57,76 38,44 9 64 24 11,4 6,2 1,5 16 7,5 34,4 13,8 261 59,1 𝑆𝑆𝑦 = 261 − (34.4)2 5 = 24.32 𝑆𝑆𝑥𝑦 = 59.1 − 10 Calificación = 7.5 El coeficiente de correlación lineal es positivo y fuerte, lo que quiere decir que existe una relación directa entre las horas de estudio y las calificaciones. A más horas de estudio más alta será la calificación, y viceversa, y que su valor sea próximo a 1, indica que existe una fuerte influencia de las horas de estudio respecto a las calificaciones. 12 8 6 4 2 0 0.5 5 = 0.95238 Gráfico de Dispersión 0 7.5∗34.4 1 Horas de Estudio 1.5 2 2.5 3 Ejemplo 2: La empresa “LADY GUADA” que se dedica a organizar eventos sociales, desea conocer si existe influencia entre la inversión mensual que se realiza en publicidad y el nivel de ingresos en eventos. 𝑆𝑆𝑥 = 330000 − 𝑟= 197500 √88000∗495000 (1100)2 5 = Mes Gasto Ventas (Y) Publicidad (X) X^2 Y^2 XY Mayo Junio Julio Agosto Septiembre $ 200,00 $ 250,00 $ 450,00 $ 150,00 $ 50,00 $ 1.200,00 $ 1.350,00 $ 1.600,00 $ 850,00 $ 750,00 40000 62500 202500 22500 2500 1440000 1822500 2560000 722500 562500 240000 337500 720000 127500 37500 1100 5750 330000 7107500 1462500 = 88000 197500 208710.32 𝑆𝑆𝑦 = 7107500 − (5750)2 5 = 495000 𝑆𝑆𝑥𝑦 = 1462500 − Ventas = 197500 El coeficiente de correlación lineal es positivo y fuerte, lo que quiere decir que existe una relación directa entre el gasto en publicidad y el nivel de ventas de un mes en específico. A más gasto en publicidad mayores ventas y viceversa, y que su valor sea próximo a 1, indica que existe una fuerte influencia del gasto en publicidad sobre las ventas mensuales. $ 1,800.00 $ 1,600.00 $ 1,400.00 $ 1,200.00 $ 1,000.00 $ 800.00 $ 600.00 $ 400.00 $ 200.00 $ 0.00 $ 50.00 5 = 0.9462 Gráfico de Dispersión $ 0.00 1100∗5750 $ 100.00 $ 150.00 $ 200.00 $ 250.00 $ 300.00 Gasto Publicidad $ 350.00 $ 400.00 $ 450.00 $ 500.00 Ejemplo 3: La empresa “Medias Don Gato”, que se dedica a la confección de medias desea conocer si existe una relación entre el nivel de ausentismo de sus empleados en un mes y su producción mensual. 𝑆𝑆𝑥 = 525 − 𝑟= (47)2 5 −3402 √83.2∗167720 = Mes Ausentismo (X) Producción en X^2 miles de pares (Y) Y^2 XY Agosto Septiembre Octubre Noviembre Diciembre 12 5 6 8 16 900 1250 1000 950 680 144 25 36 64 256 810000 1562500 1000000 902500 462400 10800 6250 6000 7600 10880 47 4780 525 4737400 41530 = 83.2 −3402 3735.54 𝑆𝑆𝑦 = 4737400 − (4780)2 5 = 167720 𝑆𝑆𝑥𝑦 = 41530 − 47∗4780 5 = −3402 = −0.9107 Gráfico de Dispersión 1400 El coeficiente de correlación lineal es negativo y fuerte, lo que quiere decir que existe una relación inversa entre el nivel de ausentismo mensual y el nivel de producción. A más ausentismo menor producción y viceversa, y que su valor sea próximo a -1, indica que existe una fuerte influencia del nivel de ausentismo sobre la producción mensual. Producción Mensual 1200 1000 800 600 400 200 0 0 2 4 6 8 10 Nivel de Ausentismo 12 14 16 18 Ejercicios de Tarea: En los siguientes ejercicios, calcule el coeficiente de correlación lineal, exprese sus conclusiones y trace el gráfico de dispersión. 1. Se desea conocer si existe correlación entre la edad de una persona y el tiempo que demora en recorrer 100 metros. Edad (años) 4 5 6 11 15 18 2. Tiempo (Seg) 27 25 26 23 20 19 ¿Qué relación existirá entre la cantidad de personas que entran diariamente a un local comercial y su nivel de ventas? Personas 20 40 30 15 29 50 Ventas $ 120,00 $ 250,00 $ 180,00 $ 130,00 $ 356,00 $ 500,00 3. Tome una muestra de 20 alumnos y mida su estatura y peso, calcule la correlación lineal, explique sus conclusiones y obtenga el gráfico de dispersión 4. Forme 4 muestras (ABCD) de n=10; con 100RAN# (Números aleatorios de una calculadora científica). Calcule el coeficiente de correlación lineal, explique su conclusión y grafique el diagrama de dispersión, para los pares de muestras AB; AC; AD; BC; BD; CD. 5. Cree 3 casos de estudio reales donde se pueda aplicar criterios de correlación lineal y resuélvalo. 6. Resuelva de forma analítica el siguiente ejercicio X 2𝑎 + 𝑏 3𝑎 𝑎2 + 𝑏 −1 −4𝑎 Y 3𝑎 − 2𝑏 4𝑏 5𝑏 −2𝑏 Regresión Lineal La regresión lineal es un proceso matemático que sirve para encontrar la curva del mejor ajuste, que representa una función lineal que intentan modelar el comportamiento más aproximado de los datos en una gráfica de dispersión. Además servirá para realizar pronósticos dentro del dominio de la gráfica. 𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝑆𝑆𝑥𝑦 𝑏0 = 𝑆𝑆𝑥 𝑏1 = 𝑌̅ − 𝑏1 𝑋̅ Pasos para aplicar regresión lineal 1. Encontrar valores de x al cuadrado 2. Encontrar la multiplicación de X por Y 3. Hallas sumatorias de X, Y, X2, XY. 4. Aplicar fórmulas de sumas de cuadrados, de XY y de X. 5. Reemplazar en la fórmula de bo y en la fórmula de b1 ((pendiente)) 6. Formar curva del mejor ajusta 7. Graficar curva del mejor ajuste con los valores mínimo y máximo de los valores de X. 8. Pronosticar lo solicitado Ejemplo 1: En una clase de Literatura el profesor Thompson, encuesta a sus alumnos sobre el tiempo de estudio previo al examen, esto lo hace antes de darles las calificaciones, su interés es conocer si existe alguna correlación entre las horas de estudio y la calificación, y PRONOSTICAR cuánto sacará en nota un alumno que estudio 2.3 horas. 𝑆𝑆𝑥 = 13.8 − (7.5)2 Alumno Horas de Calificación (Y) estudio (X) X^2 Y^2 XY A B C D E 2,5 1,5 1 0,5 2 9,6 7,6 6,2 3 8 6,25 2,25 1 0,25 4 92,16 57,76 38,44 9 64 24 11,4 6,2 1,5 16 7,5 34,4 13,8 261 59,1 𝑆𝑆𝑥𝑦 = 59.1 − 7.5∗34.4 = 2.55 5 5 = 7.5 𝑏𝑜 = 𝑌̅ − 𝑏1 𝑋̅ = 6.88 − 2.94 ∗ 1.5=2.47 𝑦̂ = 2.47 + 2.94𝑥 CURVA DEL MEJOR AJUSTE: Gráfico de Dispersión 12 Pronóstico para 2.3 horas. 10 Calificación 𝑦̂ = 2.47 + 2.94(2.3) 𝑦̂ = 2.47 + 6.762 𝑦̂ = 9.23 y = 2,94x + 2,47 8 6 4 2 0 0 0.5 1 1.5 2 Horas de Estudio 2.5 3 𝑏1 = 𝑆𝑆𝑥𝑦 𝑆𝑆𝑥 = 7.5 2.55 = 2.94 Ejemplo 2: La empresa “LADY GUADA” que se dedica a organizar eventos sociales, desea conocer si existe influencia entre la inversión mensual que se realiza en publicidad y el nivel de ingresos en eventos. Y PRONOSTICAR cuál será su venta estimada con un gasto en publicidad de USD 380.00. 𝑆𝑆𝑥 = 330000 − (1100)2 5 Mes Gasto Ventas (Y) Publicidad (X) X^2 Y^2 XY Mayo Junio Julio Agosto Septiembre $ 200,00 $ 250,00 $ 450,00 $ 150,00 $ 50,00 $ 1.200,00 $ 1.350,00 $ 1.600,00 $ 850,00 $ 750,00 40000 62500 202500 22500 2500 1440000 1822500 2560000 722500 562500 240000 337500 720000 127500 37500 1100 5750 330000 7107500 1462500 = 88000 𝑆𝑆𝑥𝑦 = 1462500 − 1100∗5750 5 = 197500 𝑏1 = 𝑆𝑆𝑥𝑦 𝑆𝑆𝑥 = 197500 88000 𝑏𝑜 = 𝑌̅ − 𝑏1 𝑋̅ = 1150 − 2.24 ∗220 = 657.2 CURVA DEL MEJOR AJUSTE: 𝑦̂ = 657.2 + 2.24𝑥 Ventas Gráfico de Dispersión $ 1,800.00 $ 1,600.00 $ 1,400.00 $ 1,200.00 $ 1,000.00 $ 800.00 $ 600.00 $ 400.00 $ 200.00 $ 0.00 $ 0.00 Pronóstico para un gasto de USD 380.00 y = 2,2443x + 657,2 $ 100.00 $ 200.00 $ 300.00 Gasto Publicidad 𝑦̂ = 657.20 + 2.24(380) 𝑦̂ = 657.20 + 851.12 𝑦̂ = 1508.40 $ 400.00 $ 500.00 = 2.24 Ejemplo 3: La empresa “Medias Don Gato”, que se dedica a la confección de medias desea conocer si existe una relación entre el nivel de ausentismo de sus empleados en un mes y su producción mensual. Se desea PRONOSTICAR el nivel de producción si se logra establecer el ausentismo en 7 personas por mes. 𝑆𝑆𝑥 = 525 − (47)2 5 Mes Ausentismo (X) Producción en X^2 miles de pares (Y) Y^2 XY Agosto Septiembre Octubre Noviembre Diciembre 12 5 6 8 16 900 1250 1000 950 680 144 25 36 64 256 810000 1562500 1000000 902500 462400 10800 6250 6000 7600 10880 47 4780 525 4737400 41530 = 83.2 𝑆𝑆𝑥𝑦 = 41530 − 47∗4780 5 = −3402 𝑏1 = 𝑆𝑆𝑥𝑦 𝑆𝑆𝑥 = −3402 83.2 = −40.88 𝑏𝑜 = 𝑌̅ − 𝑏1 𝑋̅ = 956 + 40.88 ∗9.4 = 1340.27 𝑦̂ = 1340.27 − 40.88𝑥 CURVA DEL MEJOR AJUSTE: Gráfico de Dispersión Pronóstico para ausentismo de 7 personas por mes. Producción Mensual 1400 𝑦̂ = 1340.27 − 40.88(7) 𝑦̂ = 1340.27 − 286.16 𝑦̂ =1054.11 1200 1000 800 600 y = -40.889x + 1340.4 400 200 0 0 2 4 6 8 10 Nivel de Ausentismo 12 14 16 18 Ejercicios de Tarea: En los siguientes ejercicios, calcule el coeficiente de correlación lineal, exprese sus conclusiones y trace el gráfico de dispersión. 1. Se desea conocer si existe correlación entre la edad de una persona y el tiempo que demora en recorrer 100 metros. PRONOSTIQUE EL TIEMPO PARA EDAD 13 AÑOS. Edad (años) 3 5 6 11 16 18 2. Tiempo (Seg) 27 25 26 23 20 19 ¿Qué relación existirá entre la cantidad de personas que entran diariamente a un local comercial y su nivel de ventas? PRONOSTIQUE LAS VENTAS PARA UN INGRESO DE 36 PERSONAS. Personas 22 40 32 15 29 55 Ventas $ 120,00 $ 250,00 $ 180,00 $ 130,00 $ 356,00 $ 500,00 1. Tome una muestra de 20 alumnos y mida su estatura y peso, calcule la correlación lineal, explique sus conclusiones y obtenga el gráfico de dispersión. PRONOSTIQUE EL PESO PARA UNA ESTATURA DE 1.65M. 2. Forme 4 muestras (ABCD) de n=10; con 50RAN# (Números aleatorios de una calculadora científica). Calcule el coeficiente de correlación lineal, explique su conclusión y grafique el diagrama de dispersión, para los pares de muestras AB; AC; AD; BC; BD; CD. ENCUENTRE EN TODOS LOS CASOS LA CURVA DEL MEJOR AJUSTE. 3. Cree 3 casos de estudio reales donde se pueda aplicar criterios de REGRESIÓN LINEAL 4. Resuelva de forma analítica el siguiente ejercicio X Y 2𝑎 3𝑎 3𝑎 4𝑏 𝑏 −1 5𝑏 −4𝑎 −2𝑏 BLOQUE 2 Probabilidad Se define como la posibilidad de que un evento suceda o no. Está representada por un valor entre 0 y 1, que se pueden aproximar a porcentajes multiplicando por 100 y agregando el símbolo %. No existen probabilidades negativas. Si una probabilidad llega a ser 1 quiere decir que es cierta, siempre sucederá, por ejemplo, la probabilidad de que sienta hambre luego de transcurridas 15 horas sin ingerir ningún alimento. Si una probabilidad es muy cercana a cero la llamamos débil y quiere decir que es muy poco probable que ese evento ocurra. Si una probabilidad es próxima a 0.5, es una probabilidad medio o incierta, que no estamos seguros si puede o no ocurrir. Definiciones importantes Experimento: Es el conjunto de condiciones controlados que se crean para medir o comprobar un supuesto. Evento: Son los acciones que se presentan como resultado de un experimento. Resultado: Afirmaciones o negaciones dadas por los eventos provenientes de un experimento. Ejemplo Experimento: Preparar las hojas de tabulación de datos, y recolectar edades de alumnos. Evento: La mayoría de hombres no quisieron responder. Resultado: La mayor cantidad de personas encuestadas fueron mujeres con un promedio de 17.5 años por estudiante. Tipos de Probabilidad: Clásica, Empírica, Subjetiva. Subjetiva: Es aquella que nunca ha sucedido antes, está basada en la intuición de las personas, conociendo otro tipo de datos, por ejemplo: La probabilidad de que una mujer sea presidenta de los Estados Unidos. Empírica: Se presenta cuando se realiza un análisis de datos históricos, que han sucedido en tiempo s anteriores, y nos permiten realizar una aproximación de pronósticos. Por ejemplo: En cierta población, el año anterior nacieron 50 bebes, de los cuales 40 eran mujeres y 10 hombres; por lo que se dice que existe una probabilidad de 80% de que en el año siguiente nazcan mujeres y un 20% para hombres. Clásica: Es la más común, y basa su cálculo en las observaciones tangibles o constantes durante una observación, es equivalente al número de éxitos dividido para el número de total de observaciones, por ejemplo: Pensemos que tenemos una mano de 5 barajas donde 2 de las mismas son cartas altas y 3 son cartas bajas, la probabilidad de sacar una carta alta es 2 de 5 (40%) y la probabilidad de obtener una carta alta es 3 de 5 (60%) Tipos de Eventos (Mutuamente excluyentes; no mutuamente excluyentes; independientes) Los eventos pueden ser mutuamente excluyentes cuando no podrían suceder al mismo tiempo, y lógicamente en un diagrama de VEN se encuentran separados, por ejemplo: La probabilidad de encontrar un auto que sea moto, los eventos ser auto y ser moto, son mutuamente excluyentes, porque no existe una máquina que al mismo tiempo pueda ser auto y pueda ser moto. AUTO MOTO Nótese que no hay intersección porque no existirían elementos que compartan las dos características. Los eventos no mutuamente excluyentes son aquellos que pueden suceder al mismo tiempo, regularmente cruzan variables de diferente caracterización, por ejemplo: Que un automóvil pase frente a nosotros y sea Verde o Deportivo, en este caso existen autos verdes que no son deportivos, autos deportivos que no son verdes, y también existen autos deportivos que si son verdes, por lo tanto el diagrama se dibuja con alguna interesección. AUTO DEPORTIVO AUTO VERDE Reglas de Probabilidad Las reglas de probabilidad son parámetros que deben ser aplicados siempre que se note casos específicos de eventos mutuamente excluyentes o no mutuamente excluyentes, al igual forma que eventos dependientes e independientes. Reglas de Adición Las reglas de adición se deben usar cuando se desea comprobar la probabilidad de que dos eventos sucendan en tiempos diferentes, es decir el uno o el otro pero no los dos al mismo tiempo. La Regla General dice que si se desea calcular que puedan suceder dos eventos que son mutuamente excluyentes, se deben sumar las probabilidades. La Regla Especial dice que si se desea calcular que puedan suceder dos eventos que son NO mutuamente excluyentes, se deben sumar las probabilidades y restar la multiplicación de las mismas, es decir restar la intersección. Reglas de Multiplicación Las reglas de multiplicación se deben usar cuando se desea comprobar la probabilidad de que dos eventos sucedan al mismo tiempo. La Regla General se debe utilizar para eventos independientes, es decir que la ocurrencia del uno afecta en nada a la ocurrencia del otro. P(A y B) = P(A) * P(B) La Regla Especial, se utiliza para eventos dependientes donde la ocurrencia de un evento afecta a que el otro pueda o no suceder. P(A/B)= P(A)*P(B/A) se lee como al probabilidad de A dado que B sucedió. Ejercicio de Probabilidad: 1. Una urna tiene ocho bolas rojas, 5 amarilla y siete verdes. Si se extrae una bola al azar calcular la probabilidad de: a. Sea roja. b. Sea verde. c. Sea amarilla. d. No sea roja. e. No sea amarilla. 2. Se extrae una bola de una urna que contiene 4 bolas rojas, 5 blancas y 6 negras, ¿cuál es la probabilidad de que la bola sea roja o blanca? ¿Cuál es la probabilidad de que no sea blanca? 3. En una clase hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un día asisten 45 alumnos, encontrar la probabilidad de que un alumno: a. Sea hombre. b. Sea mujer morena. c. Sea hombre o mujer. 4. Un dado está trucado, de forma que las probabilidades de obtener las distintas caras son proporcionales a los números de estas. Hallar: a. La probabilidad de obtener el 6 en un lanzamiento. b. La probabilidad de conseguir un número impar en un lanzamiento. c. Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: d. La probabilidad de que salga el 7. e. La probabilidad de que el número obtenido sea par. f. La probabilidad de que el número obtenido sea múltiplo de tres. 5. Se lanzan tres dados. Encontrar la probabilidad de que: a. alga 6 en todos. b. Los puntos obtenidos sumen 7. 6. Hallar la probabilidad de que al levantar unas fichas de dominó se obtenga un número de puntos mayor que 9 o que sea múltiplo de 4. 7. Busca la probabilidad de que al echar un dado al aire, salga: a. Un número par. b. Un múltiplo de tres. c. Mayor que cuatro. 8. Hallar la probabilidad de que al lanzar al aire dos monedas, salgan: a. Dos caras. b. Dos cruces. c. Una cara y una cruz. 9. En un sobre hay 20 papeletas, ocho llevan dibujado un coche las restantes son blancas. Hallar la probabilidad de extraer al menos una papeleta con el dibujo de un coche: a. Si se saca una papeleta. b. Si se extraen dos papeletas. c. Si se extraen tres papeletas. SEGUNDO DE BACHILLERATO QUIMESTRE I BLOQUE 1 BLOQUE 2 BLOQUE 3 Distribución Normal Función Campana de Gauss Aproximación Normal a Binomial Teorema central Áreas bajo la curva Métodos de Muestreo El Emprendedor Cree una idea de negocio ¿Qué es un emprendedor? Descubra su vocación ¿Quién es emprender? Desarrollo de un banco de ideas Análisis subjetivo de las oportunidades de las ideas del límite QUIMESTRE II BLOQUE 4 BLOQUE 5 BLOQUE 6 Intervalos de Confianza Para medias poblacionales Intervalos de Confianza Para proporciones poblacionales Aplicación del Factor de Corrección poblacional Tamaño adecuado de la muestra Estudio de las oportunidades para las ideas de negocio Costos Inversión Plan financiero Directos Gastos pre-operativos Plan de costos y ventas Mercado Indirectos Gastos operativos Utilidades Clientes Precios Fuentes financiamiento Estudio de los requerimientos para la empresa seleccionada Personal humano Recursos materiales Recursos técnicos Materiales Flujo de caja Demanda Competencia Logros que se desea alcanzar en el estudiante de Conocer todas las propiedades del distribución normal Encontrar áreas bajo la curva de distribución normal para resolver problemas EMPRENDIMIENTO Conocer si tienen un perfil emprendedor Ubicar sus mayores fortalezas como potenciales emprendedores Reconocer las oportunidades del entorno en el que desean emprender Proyector- Ordenador Forma legal empresa de la Bloque 1 Distribución Normal La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar. Propiedades de la distribución normal: La distribución normal posee ciertas propiedades importantes que conviene destacar: Tiene una única moda, que coincide con su media y su mediana. La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre a 1. Es simétrica con respecto a su media . Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica ( ). Cuanto mayor sea , más aplanada será la curva de la densidad. La forma de la campana de Gauss depende de los parámetros y (Figura 3). La media indica la posición de la campana, de modo que para diferentes valores y es teóricamente posible. El área total bajo la curva es, por tanto, igual de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución. Es importante conocer que, a partir de cualquier variable X que siga una distribución estándar, sin más que efectuar la transformación: , se puede obtener otra característica Z con una distribución normal Áreas Bajo la Curva Normal A través de métodos de integración se pude encontrar el área bajo la curva normal, sin embargo estos ya están plasmados en la tabla Z, donde una vez estandarizados los valores se debe encontrar el entero y el primero decimal en la columna y el segundo decimal en las filas, y el valor que coincida entre los dos es el área bajo la curva, desde la media hasta el valor estandarizado. TABLA DE ÁREAS Z Z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 0 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,05 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,06 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,07 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,08 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,09 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 Ejemplo: Se sabe que los pesos de un grupo de estudiantes se distribuyen normalmente, con una media de 70Kg, y desviación estándar de 4.8Kg. Si se selecciona uno al azar cual es la probabilidad de que este: a) Se de peso mayor que 75Kg b) Pese entre 62 y 73Kg c) Pese menos de 60Kg Z 1,04 Área Z=1,04 0,3508 Cola superior 0,1492 x=62 x=73 Z -1,67 Z 0,63 Área Z=1,04 0,4525 Área Z=1,04 0,2357 Área Total 0,6882 x=60 Z -2,08 Área Z=1,04 0,4812 Cola inferior 0,0188 Ejercicios: 1. En una distribución normal de media 4 y desviación típica 2, calcular el valor de a para que: P(X ≤ 0.5934) 2. En una ciudad se estima que la temperatura máxima en el mes de junio sigue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°. 3. La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación típica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan: a. b. c. d. Entre 60 kg y 75 kg. Más de 90 kg. Menos de 64 kg. 55.64 kg o menos. 4. Se supone que los resultados de un examen siguen una distribución normal con media 78 y desviación típica 36. Se pide: a. ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una calificación superior a 72? b. Si se sabe que la calificación de un estudiante es mayor que 72 ¿cuál es la probabilidad de que su calificación sea, de hecho, superior a 84? 5. Tras un test de cultura general se observa que las puntuaciones obtenidas siguen una distribución una distribución N(65, 18). Se desea clasificar a los examinados en tres grupos (de baja cultura general, de cultura general aceptable, de excelente cultura general) de modo que hay en el primero un 20% la población, un 65% el segundo y un 15% en el tercero. ¿Cuáles han de ser las puntuaciones que marcan el paso de un grupo al otro? 6. Varios test de inteligencia dieron una puntuación que sigue una ley normal con media 100 y desviación típica 15. a. b. c. Determinar el porcentaje de población que obtendría un coeficiente entre 95 y 110. ¿Qué intervalo centrado en 100 contiene al 50% de la población? En una población de 2500 individuos ¿cuántos individuos se esperan que tengan un coeficiente superior a 125? DESARROLLO DE EMPRENDEDORES ¿Qué es un emprendedor? Es un individuo que es capaz de acometer un proyecto rechazado por la mayoría. Sabe interpretar las características reales del entorno a pesar de que no son aparentes. Es capaz de luchar ante cualquier inconveniente que se les atraviesa a su estrategia y no le teme al fracaso. Además, es capaz de crear un grupo con motivación suficiente que le da el apoyo que necesita. "Un emprendedor es alguien que "acomete" un proyecto que implica trabajo o presenta dificultades; toda persona que tenga iniciativa y decisión de llevar adelante un proyecto empresarial " El emprendedor empresarial además de haber llevado adelante el proyecto, este debe reportarles un beneficio comercial. Los proyectos militares, científicos o educativos reportan beneficios pero no económicos sino sociales. La naturaleza del proyecto empresarial está enraizada en el mercado. Debe satisfacer una necesidad expresada por el mercado. "El emprendedor modelo tiene una gran necesidad de realización personal. Es una persona con ilusiones, llena de energía y de creatividad, tiene confianza en sí mismo, se compromete entera y totalmente. Ama los riesgos moderados y quiere ser independiente y autónomo. Estas características se encuentran en diferentes grados en cualquier emprendedor. No es que todos los individuos los posean, sin embargo en nuestra sociedad, existe un buen número de personas que pueden convertirse en emprendedores, en una proporción semejante a la que tienen otras ciudades, esto es, alrededor del 10% de la población. Si el número de empresas correspondiera al de las personas que tienen las características básicas de los emprendedores, habría al menos un 50% más de empresas de las que hay ahora" La función específica de los emprendedores es la capacidad para tomar los factores de la producción -tierra, trabajo y capital- y usarlos para producir bienes o servicios nuevos. El emprendedor percibe oportunidades que otros ejecutivos de empresas no ven o no les interesan. Algunos emprendedores usan información, al alcance de todos, para producir algo nuevo. "Básicamente, el emprendedor detecta una necesidad y, después, reúne la mano de obra, los materiales y el capital que se necesita para satisfacer esa necesidad." En esencia, un emprendedor crea una organización como medio para ofrecer algo nuevo a los clientes, empleados u otros grupos de interés. Características de un Emprendedor Búsqueda de oportunidades e iniciativa o ¿Qué oportunidades se desarrollarían en su barrio o con grupos de amigos? Persistencia o ¿Por qué creen que es importante persistir? Cumplimiento o ¿Es necesario cuantificar las metas? Exigir eficiencia y calidad o ¿Al hacer algo es importante la calidad de esto? Correr riesgos calculados o ¿Por qué debemos calcular los riesgos? ¿Cómo podemos hacerlo? Fijar metas o ¿Cómo se pueden plantear metas? ¿Siempre deben ser las mismas? Búsqueda de información o ¿Por qué es importante información de primera mano? Planificación sistemática y seguimiento o ¿Qué rol cumple la planificación en el emprendimiento? Persuasión y redes de apoyo o ¿Para qué asociarse? ¿Es bueno? Autoconfianza e independencia o ¿Si emprendo algo es posible que me vaya bien o mal inicialmente? ¿Por qué? Ejercicios de aplicación: Realizar el TEST propuesto en el link http://www.unet.edu.ve/~ilabarca/test1.htm e imprimir el resultado. Investigue en su comunidad o región personas que han emprendido y sus resultados. Encueste a un emprendedor y pregúntele: ¿Qué fue lo más complejo al inicio del emprendimiento? ¿Cómo venció el temor al emprender? ¿Volvería a emprender en otro campo? ¿Cuál fue su mejor y su peor decisión al momento de emprender? Investigue en la revista Líderes un emprendimiento y realice un comentario de esto (cada lunes se publica la revista, esta es una tarea continua) Visite el Link http://www.100ideasparaemprender.com/home/ y escoja un tipo de emprendimiento y coméntelo (exposición en clase.) BLOQUE 2 Aproximación Normal a Binomial. Una distribución binomial B(n,p) se puede aproximar por una distribución normal, siempre que n sea grande y p no esté muy próxima a 0 o a 1. La aproximación consiste en utilizar una distribución normal con la misma media y desviación típica que la distribución binomial. Condiciones de uso de la aproximación Modelo Supóngase una distribución de probabilidad binomial, con n = 40 y u = 0.55. Calcule lo siguiente: a. La media y la desviación estándar de la variable aleatoria. b. La probabilidad de que x sea igual o superior a 25. c. La probabilidad de que x sea igual o inferior a 15. d. La probabilidad de que x este entre 15 y 25 , inclusive Un estudio realizado por el club de acondicionamiento físico Taurus Health club, revelo que 30% de sus socios nuevos tienen sobrepeso considerable. Una promoción para membrecías en la zona metropolitana dio como resultado la descripción de 500 socios nuevo. a) Se ha planteado utilizar la aproximación normal a la binomial para determinar la probabilidad de que 175 o más de los miembros nuevos tengan sobrepeso considerable. ¿Se puede calificar este problema como binomial? Explique su respuesta. Sí, porque existen dos resultados posibles el uno que tienen sobrepeso y el otro que no tienen sobrepeso. - El número de éxitos es el resultado de socios con sobrepeso. - Los ensayos son independientes. - Su probabilidad va a ser igual en los ensayos que es 0,3 b) ¿Cuál es la probabilidad de que 175 o más de los sociosnuevos tengan sobrepeso? c) ¿Cuál es la probabilidad de que 140 o más de los socios recientes tengan sobrepeso? La empresa de asuntos fiscales Theresa Tax Service se especializa en la elaboración de declaraciones de impuestos de clientes profesionales (médicos, dentistas, contadores, abogados). Una auditoria reciente de las declaraciones indicó que 5% de las declaraciones del año anterior preparadas por la empresa tenían algún error. Suponiendo que la tasa continúe en este año, y la empresa elaboró 60 declaraciones, cuál es la probabilidad de que cometa algún error en: a. Más de 6 declaraciones? b. Al menos 6 declaraciones? c. Exactamente 6 declaraciones? Métodos de Muestreo. Llamamos muestreo al efecto de tomar una muestra, debido a que es imposible estudiar poblaciones completas, y para realizarlo se debe tomar en cuenta la naturaleza de las pruebas y el tamaño de la población, se puede realizar en los siguientes modelos: Aleatorio Simple, Sistemático, Estratificado y por Conglomerados. Muestreo aleatorio simple Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para obtener una muestra aleatoria simple, cada elemento en la población tiene la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemáticos, estratificados y de conglomerados. Muestreo sistemático. Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población es, primero, dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población van a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la población, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar. Muestreo Estratificado Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamaño del estrato en relación con la población. Muestreo de conglomerados. Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria. Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir en otra área. No todas las áreas son muestreadas en un muestreo de áreas. La variación entre los elementos obtenidos de las áreas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la población entera es muestreada mediante muestreo aleatorio simple. Esta debilidad puede reducida cuando se incrementa el tamaño de la muestra de área. El incremento del tamaño de la muestra puede fácilmente ser hecho en muestra de área. Los entrevistadores no tienen que caminar demasiado lejos en una pequeña área para entrevistar más familias. Por lo tanto, una muestra grande de área puede ser obtenida dentro de un corto período de tiempo y a bajo costo. Por otra parte, una muestra de conglomerados puede producir la misma precisión en la estimación que una muestra aleatoria simple, si la variación de los elementos individuales dentro de cada conglomerado es tan grande como la de la población. Ejercicios Estructure 5 ejemplos de cada tipo de muestreo Aplique cada uno de los muestreos a la prueba: “Conocer la talla de calzado promedio de los alumnos del colegio Lev Vygotsky” TERCERO DE BACHILLERATO QUIMESTRE I BLOQUE 1 Pruebas de Hipótesis (Unilateral y bilateral) BLOQUE 2 Análisis de la Varianza BLOQUE 3 Regresión simple correlación y QUIMESTRE II BLOQUE 4 Regresión múltiple y correlación Datos de Series de Tiempo ANOVA a una vía Para medias poblacionales Pruebas de hipótesis Modelo de Regresión Múltiple ANOVA a dos vías Para poblacionales proporciones BLOQUE 5 Análisis de Series de tiempo Técnicas de suavizamiento Intervalos de confianza Comparaciones por pares Multicolinealidad Coeficiente determinación de Variables dummy Modelos Curvilíneos Logros que se desea alcanzar en el estudiante Materiales Entender el uso y beneficios de las pruebas de hipótesis Desarrollar ordenada y estructuradamente los pasos para realizar una prueba de hipótesis. Comprender el procedimiento para una prueba de hipótesis para medias y proporciones poblacionales Reconocer los errores tipo de las pruebas de hipótesis Proyector- Ordenador BLOQUE 6 PROYECTO APLICACIÓN DE CONOCIMIENTOS DE OCTAVO A TERCERO DE BACHILLERATO BLOQUE 1 Pruebas de Hipótesis Las pruebas de hipótesis en Estadística son la base fundamental de la inferencia, es decir el criterio más claro para comprobar si un comportamiento muestral se aproxima a uno poblacional. Dentro de la prueba de hipótesis existe la capacidad de comprobar si una teoría es cierta o si no lo es, es decir si se acepta o rechaza, todo esto asumiendo distribuciones normales o aproximaciones a normalidad, para ellos se deberá utilizar los estadísticos Z y T de Student. PASOS PARA APLICAR UNA PRUEBA DE HIPÓTESIS Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1. Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian. La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro. Paso 2: Seleccionar el nivel de significancia. Nivel de significancia es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba. Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población. La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo. Tipos de errores Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho o de la Ha, puede incurrirse en error: Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada. En cualquiera de los dos casos se comete un error al tomar una decisión equivocada. Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los errores de decisión. En la práctica un tipo de error puede tener más importancia que el otro, y así se tiene a conseguir poner una limitación al error de mayor importancia. La única forma de reducir ambos tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible. La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de la diferencia entre los valores supuesto y real del parámetro de la población. Como es más fácil encontrar diferencias grandes, si la diferencia entre la estadística de muestra y el correspondiente parámetro de población es grande, la probabilidad de cometer un error de tipo II, probablemente sea pequeña. El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán apoyado exclusivamente en el análisis de una parte de ésta. De la probabilidad con la que estemos dispuestos a asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida siguen una distribución normal Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo ideal sería establecer α y β.En la práctica se establece el nivel α y para disminuir el Error β se incrementa el número de observaciones en la muestra, pues así se acortan los limites de confianza respecto a la hipótesis planteada .La meta de las pruebas estadísticas es rechazar la hipótesis planteada. En otras palabras, es deseable aumentar cuando ésta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- β). La aceptación de la hipótesis planteada debe interpretarse como que la información aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis. Paso 3: Cálculo del valor estadístico de prueba Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza el estadístico t. Tipos de prueba a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad Ejemplo H0 : µ = 200 H1 : µ ≠ 200 b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤ H0 : µ ≥ 200 H0 : µ ≤ 200 H1 : µ < 200 H1 : µ > 200 En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de: El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación: En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional desconocida se utiliza el valor estadístico t. Paso 4: Formular la regla de decisión Se establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. Paso 5: Tomar una decisión. En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II). Pruebas de Hipótesis para Proporciones Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de prueba depende de si el número de observaciones de la muestra es grande o pequeño. Como se habrá observado anteriormente, las pruebas de grandes muestras de medias y proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba miden la desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se basan en la distribución normal estándar para valores críticos. Quizá la única diferencia real entre las ambas radica en la forma corno se obtiene la desviación estándar de la distribución de muestreo. Esta prueba comprende el cálculo del valor estadístico de prueba Z Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla normal a un nivel de significación seleccionado. Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de una o dos colas. BLOQUE 2 Análisis de la Varianza El análisis de la varianza parte de los conceptos de regresión lineal. El primer concepto fundamental es que todo valor observado puede expresarse mediante la siguiente función: Donde Y sería el valor observado (variable dependiente), y X el valor que toma la variable independiente. Sería una constante que en la recta de regresión equivale a la ordenada en el origen, es otra constante que equivale a la pendiente de la recta, y aleatoria que añade a la función cierto error que desvía la puntuación observada de la puntuación pronosticada. Por tanto, a la función de pronóstico la podemos llamar "Y prima": Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, más el error aleatorio: (1.1) Sabiendo este concepto, podemos operar con esta ecuación de la siguiente forma: 1) Restamos a ambos lados de la ecuación (para mantener la igualdad) la media de la variable dependiente: 2) Substituimos el error por la ecuación resultante de despejar la ecuación 1.1: Por tanto... Y reorganizando la ecuación: Ahora hay que tener en cuenta que la media de las puntuaciones observadas es exactamente igual que la media de las puntuaciones pronosticadas: Por tanto: es una variable Podemos ver que nos han quedado 3 puntuaciones diferenciales. Ahora las elevamos al cuadrado para que posteriormente, al hacer el sumatorio, no se anulen: Y desarrollamos el cuadrado: Podemos ver que tenemos los numeradores de las varianzas, pero al no estar divididas por el número de casos (n), las llamamos Sumas de Cuadrados., excepto en el último término, que es una Suma Cruzada de Cuadrados (el numerador de la covarianza), y la covarianza en este caso es cero (por las propiedades de la regresión lineal, la covarianza entre el error y la variable independiente es cero). Por tanto: O lo mismo que: De un factor, que es el caso más sencillo, la idea básica del análisis de la varianza es comparar la variación total de un conjunto de muestras y descomponerla como: Dónde: es un número real relacionado con la varianza, que mide la variación debida al "factor", "tratamiento" o tipo de situación estudiado. es un número real relacionado con la varianza, que mide la variación dentro de cada "factor", "tratamiento" o tipo de situación. En el caso de que la diferencia debida al factor o tratamiento no sean estadísticamente significativa puede probarse que las varianzas muestrales son iguales: Donde: es el número de situaciones diferentes o valores del factor se están comparando. es el número de mediciones en cada situación se hacen o número de valores disponibles para cada valor del factor. Así lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadísticamente significativo. Existen tres clases de modelos. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podrían diferir únicamente en sus medias. El Modelo de efectos aleatorios asume que los datos describen una jerarquía de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarquía. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento sólo tres de muchos más métodos posibles, el método de enseñanza es un factor aleatorio en el experimento. El Modelo de efectos mixtos describe situaciones que éste puede tomar. Ejemplo: Si el método de enseñanza es analizado como un factor que puede influir donde están presentes ambos tipos de factores: fijos y aleatorios. Supuestos previos El ANOVA parte de algunos supuestos que han de cumplirse: La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribución de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas. La técnica fundamental consiste en la separación de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un análisis de regresión lineal) El número de grados de libertad (gl) puede separarse de forma similar y corresponde con la forma en que la distribución chi-cuadrado (χ² o Ji-cuadrada) describe la suma de cuadrados asociada. Tipos de modelo Modelo I: Efectos fijos El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable respuesta" con una distribución normal. Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor presentes en el experimento, por lo que cualquier variación observada en las puntuaciones se deberá al error experimental. Modelo II: Efectos aleatorios (componentes de varianza) Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo más simple es el de estimar la media desconocida de una población compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medición. Este modelo se supone cuando el investigador está interesado en una población de niveles, teóricamente infinitos, del factor de estudio, de los que únicamente una muestra al azar (t niveles) están presentes en el experimento. Grados de libertad Los grados de libertad pueden descomponerse al igual que la suma de cuadrados. Así, GLtotal = GLentre + GLdentro. Los GLentre se calculan como: a - 1, donde a es el número de tratamientos o niveles del factor. Los GLdentro se calculan como N - a, donde N es el número total de observaciones o valores de la variable medida (la variable respuesta). Pruebas de significación El análisis de varianza lleva a la realización de pruebas de significación estadística, usando la denominada distribución F de Snedecor. Tablas ANOVA Una vez que se han calculado las sumas de cuadrados, las medias cuadráticas, los grados de libertad y la F, se procede a elaborar una tabla que reúna la información, denominada "Tabla de Análisis de varianza o ANOVA", que adopta la siguiente forma: Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio Intergrupo t-1 Intragrupo o Error N-t Total N-1 F