CONTENIDO 1. Descripción del problema 3 2. Estadística descriptiva 3 3. Estadística no paramétrica 5 4. Distribuciones continuas 7 5. Regresión lineal y correlación 7 6. Conclusiones 8 7. Anexo 1 10 Nota: • En los archivos .xls, se encuentra: la base de datos (anexo 1.xls), así como todas las gráficas y tablas mostradas en este trabajo (trabajo final.xls). Descripción del problema. A partir de los datos de la precipitación máxima en 24 horas (anexo 1.xls), registrada en la estación de La Joya, ubicada en el municipio de Sta. Rosa, se pretende determinar lo siguiente: • Obtener la media, mediana y la distribución de frecuencias • Demostrar que la serie de datos elegida es homogénea, de manera que las estimaciones estadísticas muestrales sean válidas. • La probabilidad de en el mes de julio de este año, la lámina de lluvia sea superior a los 100 mm. • Estimar la precipitación media anual (PMA) para el año 2004 y 2005. Estadística descriptiva. Es sabido que para poder determinar parámetros hidrológicos a partir de datos climatológicos es necesario tener una base de datos de por lo menos 20 años, para este estudio en especial se tomaron los datos de la estación climatológica de La Joya, y una periodo de registro de 25 años de 1976−2000. De la base de datos se obtuvo la PMA con los resultados siguientes. La estadista descriptiva de la seria de datos se muestra en la tabla 1. Tabla 1. PMA estación La Joya y estadística descriptiva Año 1976 1977 1978 1979 1980 PMA 707.9 547.1 548.7 433.0 720.9 Media 582.86 Error típico 29.92 Mediana 571.20 Desviación estándar 149.60 1 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 681.5 571.2 601.5 729.3 797.8 801.0 438.9 456.8 419.0 661.3 887.8 680.6 540.0 722.2 448.7 375.0 387.7 404.7 416.9 591.9 Varianza de la muestra 22379.42 Curtosis −1.06 Coeficiente de asimetría 0.26 Rango 512.80 Mínimo 375.00 Máximo 887.80 Suma 14571.40 Cuenta 25.00 Mayor (1) 887.80 Menor(1) 375.00 Nivel de confianza(95.0%) 61.75 En la figura 1, es posible ver la distribución de los datos, así como los datos de la media, el máximo y el mínimo. Se observa que la distribución es cíclica, parecida a una W. 2 Figura 1. Precipitaciones medias anuales, estación La Joya. El histograma (figura 2) muestra que la clase que mayor numero de datos tiene es la 503.2 mm, y se ve un valor lógico y representativo porque es sabido que la PMA del estado de Querétaro es de 550 mm y el dato de la estación La Joya se asemeja al del Edo. Los datos que se muestra en el rango de y mayor corresponden a los años de: 1985, 1986 y 1991 que se caracterizaron por ser años demasiado lluviosos en el estado, y finalmente el único dato que se encuentra en el rango de 375 mm corresponde al año 1996 y representa un año extremadamente seco. 3 Figura 2. Histograma correspondiente a la estación La Joya. Estadística no paramétrica. Para demostrar que la serie de datos es confiable y poder hacer uso de ellos para estimaciones estadísticas y todo tipo de cálculos hidrológicos, se demostró que los datos son homogéneos mediante dos pruebas : Helmert y secuencias (pruebas.xls), ambas pruebas usan como parámetro de comparación la media de la población y los resultados al ser aplicadas dichas pruebas demuestran que la serie es homogénea y por lo tanto los datos 4 son confiables y pueden ser usados para cálculos y predicciones. La prueba de secuencias se basa en un rango de número de secuencias que se muestran a continuación. 5 6 Distribuciones continuas. Para poder predecir la probabilidad de que en el mes de julio la lámina de lluvia sea mayor a los 100 mm. Se aplicará la distribución normal. A partir de la base de datos de 25 años (anexo 1.xls) se obtuvieron los datos siguientes para el mes de julio: Media = 124.85 mm 7 Des. Estándar 78.60 x = 100 mm de la tabla de distribución normal = 0.1255 P = 0.5 −1 + 0.1255 = 0.3745 =37.45 % de probabilidad de que el siguiente mes de julio llueva más de 100 mm. Regresión lineal y correlación. De acuerdo a los datos de la tabla 1, se obtuvo la ecuación de regresión para poder predecir valores, se realizó la regresión lineal (figura 3)y la 8 Figura 3. Gráfica de datos y ecuación de regresión lineal. De acuerdo con la ecuación de regresión lineal la predicción para la PMA del año de 2004 es: Y = − 6.6879 (2004) + 13878 Y = 475.44 mm 9 Igualmente con los datos de la tabla 1, se obtuvo la ecuación de regresión tipo potencial (figura 4). Figura 4. Gráfica de datos y ecuación de regresión potencial. De acuerdo con la ecuación de regresión lineal la predicción para la PMA del año de 2004 es: Y = 4E+87x−25.734 10 Y = 427.59 mm Como se puede ver a pesar de que R es lejano de 1, el resultado no es tan extraño, se podría decir que es conservador respecto a los datos que se tienen registrados. Conclusiones. De acuerdo a las técnicas estadísticas aplicadas se pueden inferir varias características del sitio donde se ubica la estación, respecto con los datos analizados. Se puede ver que el a pesar de que las pruebas de homogeneidad dieron como resultado que los datos utilizados son confiables, en muchos casos las pruebas no son favorables y se supone que no se pueden usar o los datos, pero dado que no se tienen otros parámetros para los estudios hidrológicos se tiene que trabajar con estos datos y tomar ciertas reservas en los resultados. En las ecuaciones de regresión, a pesar de que la R es pequeña los valores que se predicen para el año 2004, no son del todo erróneos, pues podrá corroborarse una vez que el registro este completo para dicho año. Como se dijo al principio los datos mínimos que se requieren son los de un periodo de 20 años, en este caso se utilizó un periodo de 25 años y se recomienda que este se vaya ampliando de acuerdo a como se vayan realizando los registros necesarios. Normalmente este tipo de pruebas en las estaciones se aplican no sólo a una estación si no a varias, normalmente las que tienen influencias dentro de la zona de estudios y algunas veces el registro no esta completo y tiene que ser completado con los datos de la misma estación o con las más cercanas, y muchas veces esto puede ocasionar que las muestras no sean homogéneas. 11