DISTRIBUCION F. DE FISHER Grupo NO 5 ESTADISTICA Y PROBABILIDAD Docente: Yanet Romeros Vargas Integrantes: ❖ Avalos Casilla Juan Manuel ❖ Hurtado Monteagudo Favio Mathias ❖ Jack Joel Navarrete Huaman ❖ Ramírez Guillen Daniel ❖ Zanalia Quispe Frank Pool Universidad: UNSAAC Escuela profesional: Ingeniería Civil Semestre académico: 24-1 CUSCO-PERÚ 2024 221969 230158 230749 231650 230752 DISTRIBUCION F DE FISHER 1.1 Introduccion: En teoría de probabilidad y estadística, la distribución F, también conocida como distribución de FisherSnedecor (nombrada por Ronald Fisher y George Snedecor), esta distribución se utiliza principalmente para evaluar la relación entre dos estimaciones de varianza, proporcionando una base para la prueba de hipótesis en contextos donde se comparan dos o más grupos de datos. La distribución de Fisher surge al comparar dos estimaciones independientes de la varianza poblacional, obtenidas a partir de muestras de datos. En particular, se aplica en la prueba F de análisis de varianza (ANOVA), que es una técnica clave para determinar si existen diferencias estadísticamente significativas entre las medias de tres o más grupos. La forma de la distribución de Fisher depende de los grados de libertad asociados con cada muestra, lo cual influye en la forma de la curva y en las probabilidades asociadas a los diferentes resultados. En este informe, se explorará en detalle la distribución F, incluyendo su formulación matemática, sus propiedades estadísticas y su aplicación práctica en el análisis de datos. Figura 1 Nota. Distribución F 1.2 Definición: Sea una variable aleatoria continua y sean. Se dice que la variable aleatoria tiene una distribución con y grados de libertad y escribimos si su función de densidad está dada por: para x>0. La expresión anterior también suele escribirse como: donde B es la función beta. 1.3 Propiedades: Si X~ 𝐹𝑚,𝑛 entonces la variable aleatoria X satisface algunas propiedades: Media: Varianza: 1.4 Teorema: Sean y variables aleatorias independientes tales que y, esto es y siguen una distribución chicuadrado con y grados de libertad respectivamente entonces la variable aleatoria donde 𝐹𝑚,𝑛 denota la distribución F con m y n grados de libertad. 1.5 Propiedades: ❖ Forma de la Distribución: La distribución F es asimétrica y sesgada a la derecha, especialmente cuando los grados de libertad son bajos. A medida que los grados de libertad aumentan, la distribución se aproxima a una distribución normal. ❖ Dependencia de los Grados de Libertad: La forma de la distribución F depende de los grados de libertad del numerador (m) y del denominador (n). A medida que estos grados de libertad aumentan, la distribución se vuelve menos sesgada y más cercana a una distribución normal estándar. ❖ Propiedad de No Negatividad: La distribución F solo toma valores no negativos, ya que es una razón de varianzas. ❖ Valor Esperado y Varianza: 𝑛 • El valor esperado de una distribución F es para • La varianza de una distribución F es 𝑚(𝑛−2)2(𝑚−4) para n>4. 2(𝑛2 )(𝑚+𝑚−2) 𝑛−2 para n>2. 1.6 Aplicaciones de la distribución F: • • • Análisis de Varianza (ANOVA): La distribución F se utiliza para determinar si hay diferencias significativas entre las medias de tres o más grupos. La prueba ANOVA compara la variabilidad entre los grupos con la variabilidad dentro de los grupos, y utiliza la distribución F para evaluar la significancia estadística. Regresión Lineal: En el contexto de la regresión lineal, la distribución F se usa para probar la hipótesis de que al menos una de las variables predictoras tiene un efecto significativo sobre la variable dependiente. Comparación de Modelos: La distribución F también es útil para comparar modelos estadísticos. Se usa para evaluar si un modelo con más parámetros (o variables) ajusta significativamente mejor los datos que un modelo más simple. 1.7 Cálculo de Valores Críticos y P-Values: Para realizar pruebas de hipótesis con la distribución F, se utilizan tablas de valores críticos o software estadístico para determinar el valor crítico correspondiente a un nivel de significancia dado (por ejemplo, 0.05). El valor calculado de F se compara con este valor crítico para decidir si rechazar o no la hipótesis nula. 1.8 Aplicaciones a la carrera de Ingeniería Civil: Evaluación de la Resistencia a la Compresión de Diferentes Tipos de Concreto Contexto Un ingeniero civil quiere comparar la resistencia a la compresión de tres tipos diferentes de concreto utilizados en la construcción de estructuras. Los tipos de concreto son: 1. Concreto Tipo I: Concreto estándar. 2. Concreto Tipo II: Concreto con aditivo de sílice. 3. Concreto Tipo III: Concreto con aditivo de fibra. El objetivo es determinar si existe una diferencia significativa en la resistencia a la compresión entre estos tres tipos de concreto. Para ello, el ingeniero realiza un experimento en el que se preparan 12 muestras de concreto para cada tipo, y se mide la resistencia a la compresión de cada muestra después de 28 días de curado. Datos Las resistencias a la compresión (en megapascales, MPa) para los tres tipos de concreto son las siguientes: • • • Concreto Tipo I: [32.5, 31.8, 33.2, 32.0, 31.5, 32.3, 32.1, 31.9, 32.7, 33.0, 32.2, 31.6] Concreto Tipo II: [34.1, 33.9, 34.3, 34.0, 34.5, 34.2, 34.6, 34.3, 34.1, 34.4, 33.8, 34.2] Concreto Tipo III: [36.5, 36.8, 36.7, 37.0, 36.9, 36.6, 37.2, 36.8, 37.1, 37.3, 36.9, 36.7] Paso 1: Planteamiento de la Hipótesis Queremos probar si hay diferencias significativas en la resistencia a la compresión entre los tres tipos de concreto. Nuestra hipótesis nula (H0) es que no hay diferencias en las medias de resistencia entre los tres tipos de concreto, es decir, μI = μII = μIII . La hipótesis alternativa (HA) es que al menos una de las medias de resistencia es diferente. Paso 2: Cálculo de Estadísticas Descriptivas Calculamos las medias y varianzas de cada grupo: • • • Concreto Tipo I: o Media (𝑋𝐼 ) = 32.2 MPa o Varianza (𝑠𝐼2 ) = 0.089 MPa² Concreto Tipo II: o Media (𝑋𝐼𝐼 ) = 34.2 MPa 2 o Varianza (𝑠𝐼𝐼 ) = 0.091 MPa² Concreto Tipo III: o Media (𝑋𝐼𝐼𝐼 ) = 36.9 MPa 2 o Varianza (𝑠𝐼𝐼𝐼 ) = 0.056 MPa² La media global (𝑋𝐺 ) es: Paso 3: Cálculo de la Suma de Cuadrados Calculamos la suma de cuadrados entre grupos (SSB) y dentro de los grupos (SSW). • Suma de Cuadrados Entre Grupos (SSB): donde n es el número de observaciones por grupo. • Suma de Cuadrados Dentro de los Grupos (SSW) Calculamos la variación dentro de cada grupo y sumamos: Paso 4: Cálculo de los Grados de Libertad • • Grados de Libertad Entre Grupos (DFB): k−1=3−1= Grados de Libertad Dentro de los Grupos (DFW): N−k=36−3=33 Paso 5: Cálculo del Estadístico F • Media de Suma de Cuadrados Entre Grupos (MSB): • Media de Suma de Cuadrados Dentro de los Grupos (MSW): • Estadístico F: Paso 6: Determinación de la Significancia Consultamos una tabla de distribución F con 2 grados de libertad para el numerador y 33 grados de libertad para el denominador, con un nivel de significancia típico de 0.05. El valor crítico F para estos grados de libertad es aproximadamente 3.29. Dado que el valor calculado de F (849.4) es mucho mayor que el valor crítico (3.29), rechazamos la hipótesis nula. Esto indica que hay diferencias significativas en la resistencia a la compresión entre al menos dos de los tipos de concreto. Conclusión El análisis de varianza muestra que al menos uno de los tipos de concreto tiene una resistencia a la compresión significativamente diferente en comparación con los otros tipos. Para identificar qué tipos de concreto difieren entre sí, se podrían realizar pruebas post hoc como el test de Tukey. Este ejemplo demuestra cómo la distribución F se aplica en la ingeniería civil para comparar la eficacia de diferentes materiales o métodos en términos de sus propiedades clave. Si necesitas más detalles o tienes alguna pregunta adicional, no dudes en preguntar.