Subido por Jorge Aguilera

1er-Examen-de-Inferencia-1

Anuncio
1er Parcial de Inferencia (Completo)
Inferencia Estadística: Consiste en asignar probabilidades de tal manera que se puedan
alcanzar conclusiones para una determinada población partiendo de un experimento o de
un muestreo. Las inferencias pueden ser decisiones acerca de la población. Es muy
importante puesto que permite hacer estimaciones de los parámetros poblacionales de
una población o permite tomar decisiones acerca de hipótesis relacionadas con los
parámetros de una población para luego hacer extensivas esas decisiones o estimaciones.
Prueba de significancia: tiene como objetivo examinar una hipótesis relacionada con
los valores de uno o más parámetros poblacionales. Permite determinar si los resultados
obtenidos en un experimento son debidos o no al azar.
Experimento: Prueba o series de pruebas en las cuales se hacen cambios deliberados
en ciertas variables (variables independientes) y se mide el efecto de esos cambios sobre
variables denominadas variables de respuesta o variables dependientes.
Un experimento es un cambio en las condiciones de operación de un sistema o proceso
que se hace con el objetivo de medir el efecto de ese cambio en una o varias propiedades
de un producto.
Diseño de experimentos: Mecanismo de recolección de información. Consiste en
planear un conjunto de pruebas experimentales, de tal manera que los datos generados
puedan analizarse estadísticamente para obtener conclusiones validas, precisas y
objetivas acerca de un sistema o proceso.
Diseñar un experimento consiste en planificarlo de tal manera que se pueda obtener
información valida y precisa sobre un determinado fenómeno que esté investigando.
Objetivos del diseño de experimentos:
1. Promover disciplina en la conducción de experimentos.
2. Presentar un considerable número de diseños experimentales útiles en la
investigación, así como un conjunto de métodos de análisis estadístico.
3. Enseñar a realizar el análisis estadístico de los datos experimentales, así como
interpretar los resultados de esos análisis.
Nivel de significancia (α): Riesgo de equivocarse, margen de error fijado por el
investigador.
Explique porque en todo experimento es necesario que se cumplan los principios
básicos del diseño de experimentos.
En todo experimento es necesario que se cumplan los tres principios fundamentales del
diseño de experimento para garantizar la obtención de conclusiones valederas y precisas
con el fin de disminuir el error experimental.
Discuta la importancia de la aplicación de los métodos del diseño de experimentos al
campo de ingeniería.
La experimentación juega un papel fundamental en virtualmente todos los campos de
la investigación y el desarrollo. El objetivo de la experimentación es obtener información
de calidad. Información que permita desarrollar nuevos productos y procesos,
comprender mejor un sistema (un proceso industrial, un procedimiento analítico,...) y
tomar decisiones sobre como optimizarlo y mejorar su calidad, comprobar hipótesis
científicas, etc. El análisis de los resultados experimentales permitirá obtener conclusiones
sobre el sistema en estudio y decidir actuaciones futuras.
Explique porque es importante reconocer la diferencia entre la significancia
estadística y la significancia práctica cuando se analizan los resultados de un
experimento.
Porque en muchos casos al realizar un experimento donde la población posee un
tamaño muy grande; la muestra puede arrojar resultados estadísticamente significativos
pero sin embargo esta puede tener escasa significancia práctica o poco valedera a la hora
de tomar decisiones.
Discuta las ventajas del diseño de comparaciones pareadas.
Las muestras son dependientes: porque cada muestra es sometida a los mismos
procedimientos de avaluó a utilizar.
Tiene mecanismos de control de la heterogeneidad del material experimental para
reducir errores en los resultados generados en un experimento.
Balances o control de la heterogeneidad del material experimental mediante la
formación de bloques o pares; ya que por medio de estos pueden resultar más
heterogéneos que el conjunto total de datos para eliminar la variabilidad y lograr mayor
precisión del experimento.
Permite comparar 2 tratamientos para estudiar la variabilidad de los datos generados
de las muestras en la respuesta observada.
Los dos tratamientos deben ser probados en cada par o bloque de manera aleatoria, es
decir, que cada uno de ellos tenga la misma posibilidad de ser escogido para aplicarles
dichos tratamientos.
Mencione los mecanismos de control de la heterogeneidad del material experimental
y sus efectos sobre los resultados experimentales.
1. Selección del material experimental homogéneo. Si esto no es posible debe
seleccionar material experimental de tal manera que él pueda balancear o controlar
los efectos de esa causa de variación.
2. Repetición y aleatorización: Las repeticiones le dan mayor oportunidad a los
tratamientos a ser probados en los niveles de productividad o heterogéneos del
material experimental. La aleatorización le da igual oportunidad a los tratamientos
a ser probados en los distintos niveles de heterogeneidad del material
experimental.
3. Uso de un diseño experimental adecuado:
a. Diseño que no controla la heterogeneidad del material experimental porque no
tiene ningún mecanismo de control: Diseño completamente aleatorizado.
b. Diseños que tienen mecanismos de control de la heterogeneidad del material
experimental: Diseño de bloques al azar, diseño de cuadrado latino, diseño de
rectángulo latino y las variantes del diseño cuadrado latino.
Efectos de la heterogeneidad del material experimental sobre los resultados
experimentales:
-
Puede provocar diferencias entre tratamientos que no son productos de que exista
una diferencia real entre los tratamientos (un tratamiento es superior a otro
cuando lo contrario e cierto).
-
Puede abultar al error experimental con la inclusión de la variabilidad producto de
una causa de variación que no es el azar.
-
El medio ambiente puede modificar el comportamiento de los tratamientos,
entonces se deberá repetir el experimento en el tiempo y en el espacio.
Una fábrica de un producto químico ha producido en promedio 825 toneladas por día
de ese producto. Las cantidades diarias producidas la semana anterior fueron: 822, 885,
861, 873 y 852 toneladas. Usando α = 0,05, pruebe si estos datos indican que la cantidad
promedio por día fabricada del producto es inferior a 825 toneladas.
Días
1
2
3
4
5
Cantidades producidas (𝑌𝑖)
822
885
861
873
852
α=0,05
Ho = µ = 825,
Ha = µ < 825,
_
Tc =
𝑌−µo
𝑆
𝑌
, Tc: valor calculado de t.
_
Y: media de las observaciones
µo : Valor especificado por el fabricante.
𝑆
𝑌
: Error típico de la media,
𝑆
𝑌
=
𝑆
√𝑛
S: desviación típica, S = √𝑆 2
𝑆 2 : Variancia, 𝑆 2 =
∑𝑌𝑖 2 − (∑𝑌𝑖 2 )/𝑛
𝑛−1
_
Y=
∑𝑌𝑖
𝑛
, n: numero de observaciones.
_
Y=
∑𝑌𝑖
𝑛
𝑆2 =
=
822+885+861+873+852
5
∑𝑌𝑖 2 − (∑𝑌𝑖)2 /𝑛
𝑛−1
=
= 858,6
3688263−3685969.8
4
= 573.3
S = √𝑆 2 = √573.3 = 23.94
𝑆
𝑌
𝑆
=
√𝑛
=
23.94
√5
= 10.70
_
Tc =
𝑌−𝑈𝑜
𝑆
𝑌
=
858.6 − 825
10.70
= 3.13
Con n – 1 grados de libertad (5 -1): 4 grados de libertad = 2.132
Reglas de decisión:
Tc < -Tt → Rechazar Ho
Tc > -Tt → Aceptar Ho
3,14 > - 2.132 Se decide aceptar Ho.
Conclusión: Se decide aceptar que las toneladas diarias que se producen del producto
químico son 825 toneladas, es decir, no es menos a 825 toneladas.
Pr ≥ l t l = 0,0349
Reglas de decisión para Pr ≥ l t l:
(Pr > l t l) > α Aceptar Ho
(Pr > l t l) < α Rechazar Ho
En este caso 0,0349 < α entonces se rechaza Ho.
Un nuevo dispositivo de filtrado se instala en una planta química. Antes de su
instalación, se tomó una muestra aleatoria de 9 observaciones y se obtuvo que la media
del porcentaje de impurezas fuera igual a 27,9 por ciento y que la variancia de esas
observaciones fuera 80,7. Después de la instalación del dispositivo, una muestra
aleatoria de 8 observaciones permitió determinar que la media del porcentaje de
impurezas fue 16,8 por ciento y la variancia 59,33.
a) ¿Puede concluirse que las variancias son estadísticamente iguales? Use α = 0,05.
b) ¿Puede concluirse que el dispositivo de filtrado ha reducido el porcentaje de
impurezas en forma significativa? Use α = 0,01.
1. Variable de interés: porcentaje de impurezas.
2. Ho = µa = µb
3. Ha = µa > µb
4. Estadístico de prueba.
_
Tc =
_
Ya – Yb – (µa − µb)
𝑆𝑌𝑎 − 𝑌𝑏
_
Ya = 27,9%
𝑆 2 𝑎 = 80,7
_
Yb = 16,8%
𝑆 2 𝑏 = 59,33
Prueba de homogeneidad (Prueba de F)
Ho = 𝑆 2 𝑎 = 𝑆 2 𝑏
Ha = 𝑆 2 𝑎 ≠ 𝑆 2 𝑏
Fc =
Fc =
max(𝑆 2 𝑎, 𝑆 2 𝑏) 𝑐𝑜𝑛 (𝑛𝑎−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
min((𝑆 2 𝑎, 𝑆 2 𝑏) 𝑐𝑜𝑛 (𝑛𝑏−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
max(80.7) 𝑐𝑜𝑛 (9−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
min( 59.33) 𝑐𝑜𝑛 (8−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
Fc =
80.7
59.33
8 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
= 1.36
7 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
Ft α/2 = 4.90
Reglas de decisión:
Fc > Ft α/2 Rechaza Ho (Estadísticamente diferentes)
Fc < Ft α/2 Acepta Ho (Estadísticamente iguales)
1.36 < 4.90 Acepta Ho → son estadísticamente iguales.
_ _
Tc =
0
Ya – Yb – (µa − µb)
(µa = µb) → (µa − µb = 0)
𝑆𝑌𝑎 − 𝑌𝑏
𝑆𝑌𝑎 − 𝑌𝑏 = 𝑆𝑝 √
1
𝑛𝑎
+
1
𝑆𝑝 = √𝑆𝑝 2
𝑛𝑏
𝑆𝑝 2 =
(𝑛𝑎 −1) 𝑆𝑎 2 + (𝑛𝑏 −1) 𝑆𝑏 2
𝑆𝑝 2 =
(8∗80.7) + (7∗59.33)
𝑛𝑎+𝑛𝑏−2
9+8−2
=
(645.6 + 415.31)
15
𝑆𝑝 = √70.73 = 8.41
1
1
9
8
𝑆𝑌𝑎 − 𝑌𝑏 = 8.41 √ +
Tc =
na = 9
27.9 – 16.8
4.08
= 4.08
= 2.72
Grados de libertad: na + nb – 2 = 9 + 8 -2 = 15
Tt = 2.947
Reglas de decisión:
Tc < Tt Acepta Ho
Tc > Tt Rechaza Ho
= 70.73
nb = 8
2.72 < 2.947 Aceptar Ho. No se ha reducido impurezas significativamente. Se rechaza
la alternativa.
Los datos siguientes se relacionan con los accidentes en una fábrica que causan
pérdidas de tiempo por mes en un periodo de un año (los datos son los números
promedios de horas-hombre perdidas por mes en un periodo de un año) antes y
después de ponerse en marcha un programa de seguridad industrial en seis plantas
industriales.
Antes del programa
Después del programa
1
42
38
2
44
31
Planta
3
4
55
42
35
24
5
69
38
6
49
33
a) ¿Proporcionan los datos suficiente evidencia para concluir que el programa de
seguridad industrial fue efectivo en reducir los accidentes que causan pérdidas de
tiempo en la fábrica? Use α = 0.05 y el valor Pr> l t l reportado por el SAS.
b) Haga el programa que permita analizar los datos usando el SAS.
1. Variable de interés: Horas-Hombres trabajadas.
2. Ho : µd = 0
3. Ha: µd > 0 (ha reducido)
4. Estadístico de prueba.
_
Tc =
𝑑− µ𝑑
𝑆𝑑
con (nd – 1) grados de libertad.
_
d=
∑𝑑𝑖
𝑛𝑑
𝑆𝑑 =
2
𝑆 =
𝑆2 =
=
−4 −13−20−18 −31−16
6
𝑆𝑑
= −17
→ Sd = √𝑆2
√𝑛𝑑
∑𝑑𝑖 2 − (∑𝑑𝑖)2 /𝑛𝑑
𝑛𝑑−1
2126+1734
5
=
= 78.4
42 + 132 + 202 + 182 + 312 + 162 +
5
[(4+13+20+18+31+16)2 ]
6
𝑆𝑑 = √78.4 = 8.85
𝑆𝑑 =
8.85
√6
_
Tc =
= 3.61
0
𝑑− µ𝑑
𝑆𝑑
=
17
3.61
= 4.71 con (nd – 1) grados de libertad = 5
α=0.05
Tt = 2.571
Reglas de decisión:
Tc > Tt Rechazar Ho
Tc < Tt Aceptar Ho
4.71 > 2.571 Rechaza Ho
Reglas de decisión: (Para 1 cola)
(Pr > l t l)/2 > α Acepto Ho
(Pr > l t l)/2 < α Rechazo Ho
0.00265 < 0.05 Rechaza Ho
Conclusión: Si Proporciona los datos suficientes para establecer que el programa de
seguridad industrial es efectivo.
OPTIONS LS=79;
TITLE1 DISEÑO DE COMPARACIONES PAREADAS;
TITLE2 PRUEBA DE QUE UN PROGRAMA DE SEGURIDAD INDUSTRIAL REDUCE ACCIDENTES;
DATA PAR;
INPUT PLANTA DESPUES ANTES;
DATALINES;
1 38 42
2 31 44
3 35 55
4 24 42
5 38 69
6 33 49
;
PROC PRINT DATA=PAR;
PROC TTEST H0=0 ALPHA=0.05;
PAIRED DESPUES*ANTES;
RUN;
DISEÑO DE COMPARACIONES PAREADAS
PRUEBA DE QUE UN PROGRAMA DE SEGURIDAD INDUSTRIAL REDUCE ACCIDENTES
The TTEST Procedure
Statistics
Difference
N
Lower CL
Mean
Mean
Upper CL
Mean
Lower CL
Std Dev
Std Dev
DESPUES - ANTES
6
-26.29
-17
-7.708
5.527
8.8544
Statistics
Difference
Upper CL
Std Dev
Std Err
Minimum
Maximum
21.716
3.6148
-31
-4
DESPUES - ANTES
T-Tests
Difference
DESPUES - ANTES
DF
t Value
Pr > |t|
5
-4.70
0.0053
2
OPTIONS LS=79;
TITLE PRUEBA DE QUE LA MEDIA DE PRODUCCION DE UN PRODUCTO QUIMICO ES INFERIOR A 825 TONS POR DIA;
DATA PRODUCTO;
INPUT PRODUCCION;
DATALINES;
822
885
861
873
852
;
PROC PRINT DATA=PRODUCTO;
PROC TTEST H0=825 ALPHA=0.05;
VAR PRODUCCION;
RUN;
PRUEBA DE QUE LA MEDIA DE PRODUCCION DE UN PRODUCTO QUIMICO ES INFERIOR A 825
The TTEST Procedure
Statistics
Variable
N
Lower CL
Mean
Mean
Upper CL
Mean
Lower CL
Std Dev
Std Dev
Upper CL
Std Dev
PRODUCCION
5
828.87
858.6
888.33
14.345
23.944
68.804
Statistics
Variable
PRODUCCION
Std Err
Minimum
Maximum
10.708
822
885
T-Tests
Variable
PRODUCCION
DF
t Value
Pr > |t|
4
3.14
0.0349
Descargar