Errores e incertidumbres en las medidas y los resultados 1. Introducción La mayor parte de los experimentos que se realizan en los laboratorios de Química tienen como objetivo obtener información de alguna característica de los sistemas químicos en forma de datos numéricos (datos experimentales). Dicha información generalmente se emplea con alguno de los siguientes propósitos: • Conocer la composición de un sistema. • Estudiar el comportamiento del sistema en determinadas condiciones con el fin de obtener un modelo matemático que lo describa. • Evaluar un modelo teórico que pretende describir el sistema. La información se obtiene empleando distintos tipos de aparatos y material de laboratorio para realizar alguno de los siguientes tipos de medidas: • • • • Medidas de masa: balanza analítica, granetario. Medidas de volumen: buretas, pipetas, matraces aforados, probetas. Medidas de temperatura: termómetros. Medida de propiedades relacionadas con la naturaleza y composición de los sistemas químicos: medidores de pH, conductímetros, espectrofotómetros de absorción UV-Vis, etc. Todas las medidas que se realizan en el laboratorio están afectadas de errores experimentales, de manera que si se repiten dos experiencias en las mismas condiciones, es probable que los resultados no coincidan. Por eso, los datos experimentales carecen de significado o valor científico si no van acompañados de una estimación del grado de incertidumbre que llevan asociado. Esa estimación requiere una adecuada calibración de los aparatos o materiales de laboratorio empleados en las medidas. 2. Objetivos • • • • • • Aprender el manejo del material volumétrico corriente de laboratorio Identificar los errores que se cometen en el trabajo experimental Calcular parámetros estadísticos de un conjunto de datos Expresar de forma correcta los resultados de un experimento Determinar la incertidumbre asociada a las medidas experimentales Clasificar el material volumétrico según su precisión. 3. Fundamento teórico 3.1.Estimación de errores En el trabajo experimental pueden presentarse tres tipos de errores: a) Errores crasos: errores graves que invalidan el experimento; se producen por avería del instrumento, pérdida de muestra, dilución accidental, etc. Este tipo de errores generalmente se detecta con facilidad. b) Errores sistemáticos o determinados: son los que producen una desviación de las medidas, siempre en el mismo sentido, respecto al valor real o aceptado. Son debidos a fallos en el método de medida o a falta de calibración del instrumento. Este tipo de errores se puede corregir, pero a veces es difícil detectarlos. c) Errores aleatorios o indeterminados: son los que hacen que los resultados de un conjunto de medidas repetidas se dispersen al azar alrededor del valor medio. Son debidos a la influencia de las variables incontroladas que siempre intervienen en el proceso de medida. No se pueden identificar fácilmente y por tanto es difícil corregirlos, pero en muchos casos es posible disminuir su magnitud. Existen distintos procedimientos para evaluar los errores y es habitual emplear parámetros estadísticos para su caracterización. Los errores sistemáticos en las medidas experimentales de sistemas químicos se corrigen mediante calibración del material e instrumentos que intervienen en el proceso de medida, y realizando las medidas sobre sustancias patrón o materiales de referencia. Generalmente se realizan varias medidas repetidas en las mismas condiciones sobre el mismo sistema y se calcula el valor medio del conjunto: donde, Xi es cada uno de los valores individuales y N es el número de medidas realizadas. Se considera el valor medio como el resultado representativo del conjunto de medidas. El error absoluto (E) es la diferencia entre el valor medio (Xm) y el valor verdadero (Xv): E = Xm-Xv Cuando el error absoluto es pequeño se dice que el método de medida es exacto. La exactitud expresa, por tanto, la concordancia entre un resultado y su valor verdadero. También puede expresarse el error sistemático como error relativo (Er) según la siguiente expresión: Er = (Xm -Xv / Xv).100 La estimación de los errores aleatorios se basa en el hecho de que, en un conjunto de medidas repetidas, los errores indeterminados hacen que éstas se distribuyan en torno al valor medio siguiendo la forma de una distribución normal o gaussiana, curva con forma de campana que puede verse en la Figura 1, en la que se representan los resultados de la calibración de una pipeta de 10 mL. Volumen (mL) Figura 1. Histograma de los 50 resultados de la calibración de una pipeta de 10 mL y la curva de Gauss con la misma media y desviación estándar que los datos del histograma. Un parámetro estadístico que expresa la dispersión en torno al valor medio de un conjunto de resultados es la desviación estándar (s), que se calcula según la expresión siguiente: Cuando los datos experimentales están todos próximos al valor medio, la desviación estándar es pequeña y se dice que el método de medida es muy preciso. La precisión es la proximidad entre dos medidas que se han hecho en las mismas condiciones. La Figura 2 sirve para ilustrar las diferencias entre exactitud y precisión empleando como ejemplo una diana de tiro al blanco. Baja exactitud y baja precisión Alta exactitud y baja precisión Baja exactitud y alta precisión Alta exactitud y alta precisión 3.2. Desviación estándar de resultados calculados En el trabajo de laboratorio es muy frecuente que los resultados finales se obtengan mediante cálculo a partir de dos o más datos experimentales. La desviación estándar del resultado depende del tipo de cálculo realizado y no es simplemente una combinación lineal de las desviaciones estándar de los datos. Así, si se conocen las desviaciones estándar de los datos experimentales, es posible estimar la desviación estándar de un resultado, según la operación empleada para su cálculo, aplicando las expresiones que figuran en la tabla 2.2.1 En caso de que se empleen varios tipos de operaciones en un cálculo, se estima primero la desviación estándar de las sumas y restas, después de los productos, cocientes y potencias, y por último de los logaritmos y antilogaritmos. 3.3. Rechazo de datos discrepantes Con frecuencia, en un conjunto de medidas experimentales repetidas podemos encontrar algún dato que parece ser muy diferente del resto. Estos datos se denominan datos anómalos o discrepantes y debemos decidir entre retenerlos o rechazarlos, ya que los valores de la media y la desviación estándar pueden variar de forma importante si en su cálculo se incluyen dichos datos. Para ayudar a tomar la decisión se han desarrollado métodos estadísticos que son fiables en distribuciones normales con más de 50 datos experimentales pero que se deben usar con precaución cuando se aplican a un pequeño número de datos. Un test estadístico muy sencillo y de uso generalizado es el test Q de Dixon. En él se calcula un valor experimental Qexp de la manera siguiente: donde Xd es el dato dudoso, Xp el dato con el valor más próximo al dato dudoso y w es la diferencia entre el valor máximo y el mínimo del conjunto de datos. El valor de Qexp se compara con los valores críticos Qcrit que se recogen en la Tabla 2.2.2, de manera que si Qexp > Qcrit el dato dudoso puede ser rechazado con un cierto nivel de confianza. Conviene insistir en que el rechazo de resultados discrepantes siempre se debe hacer con cautela. Los cálculos de la media y de la desviación estándar de un conjunto de datos experimentales se deben hacer una vez realizado el test de rechazo. 3.4. Expresión de resultados Los resultados experimentales deben ir acompañados de una estimación de los errores de medida. Existen varios procedimientos para expresar los resultados de un conjunto de medidas; una práctica común es tomar la media del conjunto como estimación de la cantidad medida y la desviación estándar como estimación de la precisión. Una buena alternativa al procedimiento anterior es emplear los límites de confianza de la media. Estos límites definen un intervalo de valores en torno al valor medio en el que es posible encontrar el valor verdadero con un cierto grado de probabilidad. Los límites de confianza LC se determinan según la siguiente expresión: donde s es la desviación estándar y t es un factor estadístico (t de Student) que depende del grado de probabilidad (nivel de confianza) con el que se quieren expresar los límites de confianza, y también del número de medidas sobre las que se ha calculado s. Los valores de t para distintos niveles de confianza y grados de libertad (N-1) se recogen en la Tabla 2.2.3. 3.5. Cifras significativas Una forma sencilla de expresar la incertidumbre de una medida experimental es indicar en el resultado únicamente las cifras significativas. Son cifras significativas todos los dígitos seguros más el primer dígito incierto. Así, por ejemplo, las lecturas de una bureta graduada en 0,1 mL, cuando el nivel del líquido se encuentra entre dos graduaciones, deben estimarse con aproximación de al menos 0,05 mL. Así pues, las lecturas de una bureta deben tener dos cifras decimales, siendo la segunda cifra decimal el primer dígito incierto. Los datos que aparecen en la pantalla digital de algunos instrumentos también están afectados de incertidumbre, siendo el último dígito el primer dígito incierto, aunque éste sea cero. En resumen, conviene recordar que nunca se puede obtener más precisión que la que nos dan los equipos de medida. Los ceros pueden ser significativos o no dependiendo de su posición. Un cero rodeado de otros números es siempre significativo (el resultado 10,32 mL tiene cuatro cifras significativas). Sin embargo, los ceros a la izquierda de un número nunca son significativos y su única función es situar la cifra decimal (el resultado 0,027 g tiene dos cifras significativas). Los ceros a la derecha pueden, o no, ser significativos. Así, si el volumen de un vaso se dice que es 2,0 L el cero indica que se conoce el volumen hasta la décima de litro y es por tanto significativo; pero si se expresa el volumen del vaso como 2000 mL la expresión es confusa, pues no es posible apreciar el volumen con precisión de 1 mL. En este caso, los dos últimos ceros no son significativos, y si queremos expresar el volumen del vaso en mililitros, teniendo en cuenta las cifras significativas, hay que emplear la notación científica y expresar el volumen del vaso como 2,0.103 mL. Tabla 2.2.3. Valores del factor t de Student Nivel de confianza Grados de libertad (N-1) 90% 95% 99% 1 2 3 4 5 6 7 8 9 6,314 12,706 2,920 4,303 2,353 3,182 2,132 2,776 2,015 2,571 1,943 2,447 1,895 2,365 1,860 2,306 1,833 2,262 63,657 9,925 5,841 4,604 4,032 3,707 3,500 3,355 3,250 En muchos casos los resultados finales se calculan a partir de dos o más datos experimentales. Dependiendo de dónde provenga el resultado aplicaremos lo siguiente: • Si el resultado proviene de la suma o resta de datos, debe tener tantas cifras decimales como el dato que tiene menos cifras decimales. • En el caso del producto y la división el resultado debe tener tantas cifras significativas como el dato que posea menor número de cifras significativas. • En el caso del logaritmo de un número se mantienen tantos dígitos a la derecha de la coma como cifras significativas tiene el número. • En el antilogaritmo de un número se mantienen tantos dígitos como dígitos hay a la derecha de la coma decimal del número. 3.6. Redondeo de resultados Una vez que se ha determinado el número de cifras significativas que debe tener un resultado, se debe proceder al redondeo, de manera que la última cifra significativa se aumenta en una unidad si el siguiente dígito es mayor de 5, o se deja como está si es menor. Cuando se redondea un número que termina en 5 se hace siempre al número par más cercano. El redondeo se debe hacer después de haber terminado todos los cálculos. Las calculadoras dan un gran número de cifras, que en muchos casos son en su mayoría no representativas, pero es conveniente arrastrar todas ellas hasta el final y, por último, redondear el resultado de forma que contenga sólo las cifras significativas.