TP N1-Distribuciones de Frecuencia

Anuncio
1 - TEORIA DE ERRORES : distribución de frecuencias
CONTENIDOS
Distribución de Frecuencias. Histograma. Errores de Apreciación. Propagación de errores.
OBJETIVOS
Representar una serie de datos mediante un histograma
Determinar los errores de apreciación de diversos instrumentos disponibles y establecer el
alcance de los mismos.
Determinar la propagación de errores de magnitudes físicas calculadas a partir de
mediciones experimentales directas.
I.1
FUNDAMENTOS TEÓRICOS
Los fundamentos teóricos de este práctico se detallan en el apunte “Teoría de Errores”
del Departamento de Física, aquí sólo se verán algunos conceptos sobre datos agrupados y distribución
de frecuencias.
I.1.1
Distribuciones de Frecuencia
Hay varios modelos característicos de distribución de frecuencias, la más común de las
cuales es la distribución simétrica acampanada, o distribución normal. Hay también distribuciones
sesgadas (más alargadas en un extremo que en otro), distribuciones en forma de L, distribuciones en
forma de U y otras. Podemos hacer distribuciones de frecuencia cualitativas y cuantitativas.
Si la forma de una distribución de frecuencia es de particular interés, muchas veces
puede ser deseable presentar la distribución en forma gráfica cuando se discuten los resultados.
Generalmente esto se hace por medio de diagramas de frecuencia de los que hay dos tipos comunes.
Para una distribución de datos merísticos o discretos utilizamos un diagrama de barras. La abscisa
representa la variable, y la ordenada las frecuencias. La característica importante de este diagrama es
que las barras no se tocan, lo que indica que la variable no es continua. En cambio, las variables
continuas se representan gráficamente por medio de un histograma, en el cual la amplitud de cada
barra a lo largo de la abscisa representa un intervalo de clase de la distribución de frecuencias y las
barras se tocan para mostrar que los límites reales de las clases son contiguos. El punto medio de la
barra corresponde a la marca de clase y la altura de la barra representa la frecuencia de clase.
Para demostrar que los histogramas son aproximaciones apropiadas para las
distribuciones continuas que se encuentran en la naturaleza, podemos tomar un histograma y hacer
más estrechos los intervalos de clase, produciendo más clases. Entonces el histograma claramente se
ceñirá más a una distribución continua. Podemos continuar este proceso hasta que los intervalos de
clase se aproximen al límite de amplitud infinitesimal. En este momento el histograma se convierte en
la distribución continua de la variable.
1
I.1.2
Distribución de frecuencias de variables continuas
La función de densidad de probabilidad normal puede representarse por:
Z=
1
σ *
2π
*
e−
(x i − x ) 2
2σ
2
Z es la altura de la ordenada de la curva que representa la densidad de los ítems. Es la variable
dependiente de la expresión, siendo función de la variable x .
En una función de densidad de probabilidad normal hay dos parámetros, la media
paramétrica x y la desviación típica paramétrica σ que determinan la situación y forma de la
distribución. Hay una infinidad de curvas ya que estos parámetros pueden tomar una infinidad de
valores.
Una variable distribuida según la ley normal puede tomar cualquier valor sea grande o
pequeño, aunque los valores más distantes de la media en más o menos 3 veces la desviación típica son
bastantes improbables siendo muy escasas sus frecuencias relativas esperadas.
Esto se ve en la ecuación, cuando x es muy grande o muy pequeño, el término
e
(
− xi − x
)2
2σ
2
será muy pequeño y por esta razón Z será muy bajo.
La curva es simétrica en torno a la media. En una distribución de frecuencias normal
los siguientes porcentajes de ítems están dentro de los límites indicados:
µ ± σ contiene el 68,26 % de los ítems
µ ± 2σ contiene el 95,46 % de los ítems
µ ± 3σ contiene el 99,73 % de los ítems
Recíprocamente:
I.1.3
El 50% de los ítems están entre µ ± 0,674 σ
El 95% de los ítems están entre µ ± 1,960 σ S
El 99% de los ítems están entre µ ± 2,576 σ
Datos Agrupados y Distribución de Frecuencias
Aunque un conjunto de observaciones puede hacerse más comprensible y más
significativo por medio de un arreglo ordenado, es más útil el resumen que se obtiene mediante la
agrupación de datos. Al agrupar un conjunto de observaciones se debe seleccionar un conjunto de
intervalos contiguos que no se traslapen, para que cada valor en el conjunto de observaciones pueda
ser puesto en uno y sólo uno de los intervalos. Estos intervalos normalmente se identifican como
intervalos de clase.
Una de las primeras consideraciones cuando se agrupan datos es la de cuántos intervalos
se deben incluir. Resulta inadecuado incluir pocos intervalos, porque se pierde información. Por otra
parte, si se utilizan muchos intervalos, el objetivo de resumir no se obtiene. Para ello, lo más
importante es conocer los datos. Una regla empírica habitualmente seguida establece que deben ser
entre 6 y 15 intervalos. Si hay menos de 6 intervalos, los datos se han resumido en exceso y la
2
información que contienen se pierde. Si hay más de 15 intervalos, no se han resumido lo suficiente los
mismos.
Hay guías más específicas para decidir cuántos intervalos de clase son necesarios. Para
ello se puede utilizar la fórmula propuesta por Sturges:
k = 1 + 3,322(log10 n) (I)
donde:
k = es el número de intervalos de clase
n = es el número de valores en el conjunto de datos en observación.
La respuesta que se obtiene aplicando esta fórmula no es definitiva y se debe tomar
como guía.
El número de intervalos de clase especificado por la regla deberá incrementarse o
disminuirse por conveniencia y para lograr una presentación más clara.
También se debe tener en cuenta la dimensión del intervalo de clase. Generalmente tienen la misma
dimensión. Esta se determina mediante la división de la amplitud R (diferencia entre la observación
más pequeña y la más grande dentro del conjunto de datos) y k.
w=
R
(II)
k
Generalmente, este procedimiento deja una dimensión que no es conveniente para su uso y
nuevamente se debe utilizar el sentido común para elegir la dimensión (normalmente cercana con la
que se obtiene con la ecuación anterior) que resulte ser la más conveniente (tamaño de clase).
PROCEDIMIENTOS
I.2
A)
Confección de un Histograma – Metodología de la Experiencia
1. Efectuar un número grande de mediciones (Ver apéndice I Ejercicios de aplicaciones específicos
para cada área) sobre una determinada muestra con el instrumento que se elija para realizar la
experiencia.
2. Tomando el menor y el mayor valor ordenar en forma creciente o decreciente todos los posibles
valores entre el máximo y el mínimo.
3. Obtener la frecuencia correspondiente a cada valor.
4. Graficar el diagrama de bastones llamado también “Histograma de frecuencia de la variable”
5. Agrupar los valores posibles en “clases” seleccionando el tamaño de clase más conveniente.
6. Hallar la frecuencia de clase.
7. En los gráficos anteriores observar cuales son los valores que aparecen con más frecuencia, donde
está el porcentaje más importante, y si el crecimiento y la forma en que decrecen son bastantes
simétricos.
8. ¿En cuál de los dos gráficos se visualiza mejor lo solicitado en el punto anterior?
9. ¿Si tomara un número de clases muy pequeño (gran tamaño de clase) que pasa con la información?
B) Determinación del error de apreciación de algunos instrumentos
1.
2.
3.
Observe la unidad de medida de cada uno de los instrumentos disponibles.
Determine el valor de la menor división de la escala y el alcance de los mismos.
Consigne los datos en una tabla de la siguiente forma:
3
TABLA N°°1
ERRORES DE APRECIACION Y DE DIVERSOS INSTRUMENTOS
N°°
INSTRUMENTO
UNIDAD
MENOR DIVISION
1
2
3
4
5
C) Medicion directa de magnitudes físicas
1. Mida con una regla el largo de la hoja de esta guía y el espesor de un cuerpo cualquiera
2. Exprese los valores leídos con tantas cifras decimales como el instrumento lo permita.
l = .................................
a = ................................
3. De acuerdo a “Teoría de Errores” del Departamento de Física, consigne:
a) El error de apreciación:
∆ l = ..........................
∆ a = .........................
b) El resultado de la medición.
4. Dibuje en ambos casos el intervalo del error en el cual está comprendido el valor de la
magnitud medida.
5. Para cada instrumento de los que disponga (regla, calibre, tornillo micrométrico,
termómetro, probeta, voltímetro, amperímetro, etc.) mida la magnitud correspondiente y
determine los valores de las mediciones con su correspondiente error.
6.
Consigne los valores en una tabla como la que se muestra:
TABLA N° 2
MEDICION DIRECTA DE MAGNITUDES FISICAS
MAGNITUD
MEDIDA
TIPO
UNIDAD
INSTRUMENTO
UTILIZADO
TIPO
ALCANCE
APRECIACION
INSTRUMENTO
VALOR
MEDIDO
∆x
x
4
ERROR RELATIVO
ER= ∆x/x
ER %
RESULTADO
DE LA
MEDICION
x = x ± ∆x
7. Compare los errores relativos de la tabla anterior.
8. Mida el perímetro y calcule el área de la hoja. Aplique propagación de errores para expresar
los resultados de ambas mediciones.
9. Calcule el volumen de un cuerpo y exprese el resultado con su correspondiente error.
Apéndice I
Ejercicios de aplicaciones específicos para cada área
Histograma - Polígono de Frecuencia
Ejercicio de Aplicación N° 1 (Bioquímica, Farmacia, Laboratorista y Genética)
La tabla siguiente muestra los pesos en onzas de los tumores malignos extirpados del abdomen de 57
pacientes.
68
27
32
12
25
44
25
36
31
45
51
49
27
38
24
23
49
27
30
63
30
28
27
24
65
74
42
28
12
12
38
31
21
69
22
28
23
43
42
36
79
22
23
43
51
28
25
57
32
42
50
16
47
43
19
46
49
Es posible presentar una distribución de frecuencias gráficamente en forma de un
Histograma. Para su construcción, los valores de la variable respectiva se colocan sobre el eje
horizontal, y las frecuencias de ocurrencia en el eje vertical. Si se pretende cronstruir un Diagrama de
Bastones, sobre cada dato del eje horizontal, se levanta un bastón hasta que intercepte la frecuencia
respectiva. Si se pretende cronstruir un Diagrama de Barras, sobre cada intervalo de clase, arriba del
eje horizontal, se levanta una barra rectangular, hasta que intercepte con la frecuencia respectiva. Las
barras del histograma deben ser adyacentes y es necesario tomar en cuenta los límites correctos de los
intervalos de clase para prevenir una separación de barras en la gráfica. El nivel de precisión que se
observa en los datos obtenidos y que tienen mediciones sobre una escala continua indica algún orden
de redondeo. Sin embargo, se sabe que algunos de los valores que caen, por ejemplo, dentro del
segundo intervalo de clase, probablemente serán menores que 20 mientras que otros serán mayores que
29 cuando la medición es precisa. Al considerar la continuidad implícita de la variable, y suponiendo
que los datos fueron redondeados al entero positivo menor más próximo, entonces es lógico suponer,
por ejemplo, que 19,5 y 29,5 son límites correctos para este segundo intervalo. Utilizando estos
límites de clase no habrá separaciones.
Una distribución de frecuencia también puede ser mostrada gráficamente por medio de
un polígono de frecuencia. Para dibujar este polígono, primero se hace una marca arriba del punto
medio de cada intervalo de clase (marca de clase), representado sobre el eje horizontal de la gráfica.
La altura con respecto del eje horizontal de una marca dada corresponde a la frecuencia del intervalo
de clase. Al unir las marcas mediante líneas rectas se obtiene el polígono de frecuencia. El polígono
cae sobre el eje horizontal en los puntos que corresponderían a la marca en caso de haber celdas
adicionales en cada extremo del histograma correspondiente. Esto permite que el área total sea
delimitada. El área total bajo el polígono de frecuencia es igual al área bajo el histograma.
5
Desarrollo
1. Ubicar el valor mínimo y máximo de la serie de datos.
2. Ordenar en forma creciente o decreciente todos los posibles valores
frecuencia de aparicición. Graficar el Diagrama de Bastones.
3. ¿Cuántos intervalos de clase se deben usar para la distribución de
Aplicar la fórmula de Sturges (I)
4. ¿Cuál sería una dimensión de los intervalos conveniente? Aplicar
consideraciones.
5. Realizar la distribución de frecuencia según los intervalos de clase.
Barras y el Polígono de Frecuencia de los tumores malignos:
de aparcición. Hallar la
frecuencia de los datos?
la ecuación (II). Hacer
Elaborar el Diagrama de
DIAGRAMA DE BARRAS Y POLÍGONO DE FRECUENCIAS
Hallar la frecuencia de aparición de cada posible valor de aparación:
INTERVALO
DE CLASE
FRECUENCIA
TOTAL
20
18
6
5
4
3
2
1
0
14
12
10
8
6
4
2
frecuencia
Diagrama de Bastones
16
dias
0
Esta figura permite observar la relación entre las dos formas gráficas para un mismo
conjunto de datos.
6
Histogramas - Polígono de Frecuencia
Ejercicio de Aplicación
N° 2 (Ingeniería Química)
La tabla siguiente muestra la resistencia a la compresión de 80 muestras de aleación aluminio-litio
(libras/pulgada cuadrada)
105 221 183 186 121 181 180 143
97
154 153 174 120 168 167 141 245 228 174 199
181 158 176 110 163 131 154 115 160 208 158 133 207 180 190 193 194 133 156 123
134 178
76
167 184 135 229 146 218 157 101 171 165 172 158 169 199 151 142 163
145 171 148 158 160 175 149
87
160 237 150 135 196 201 200 176 150 170 118 149
Desarrollo
1. Ubicar el valor mínimo y máximo de la serie de datos.
2. Ordenar en forma creciente o decreciente todos los posibles valores de aparición. Hallar la
frecuencia de aparición. Graficar el Diagrama de Bastones.
3. ¿Cuántos intervalos de clase se deben usar para la distribución de frecuencia de los datos?
Aplicar la fórmula de Sturges (I)
4. ¿Cuál sería una dimensión de los intervalos conveniente? Aplicar la ecuación (II). Hacer
consideraciones.
5. Realizar la distribución de frecuencia según los intervalos de clase. Elaborar el Diagrama de
Barras y el Polígono de Frecuencia de la resistencia a la compresión:
Hallar la frecuencia de aparición de cada posible valor de aparición:
INTERVALO
DE CLASE
FRECUENCIA
TOTAL
20
18
16
14
12
10
8
6
4
2
0
6
5
4
3
2
1
0
frecuencia
Diagrama de Bastones
datos
Esta figura permite observar la relación entre las dos formas gráficas para un mismo
conjunto de datos.
7
Descargar