COLECCION_DE_DATOS

Anuncio
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
COLECCIÓN DE DATOS
Primitivo Reyes Aguilar
Septiembre 2007
Página 1 de 8
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
Colección y resumen de datos
•
Tipos de datos
•
Escalas de medición
•
Métodos de colección de datos
•
Técnicas para asegurar la exactitud e integridad de los datos
Los Datos por atributos son datos discretos enteros, por ejemplo 3, 45,
2032. Cuenta, unidades, ocurrencias, bueno – malo.
Los Datos por variables son datos continuos medibles con
instrumentos que proporcionan números reales, por ejemplo 1.037,
4.69, etc. Longitud, tiempo, volumen, tensión.
Es preferible tener información por variables, proporcionan mayor
información.
Los Datos de localización contestan a la pregunta “¿Dónde?”. Las
cartas que utilizan datos de localización de defectos se denominan
“Measless charts” o “Cartas de concentración”. Por ejemplo mapas
con oficinas de distribución; defectos de pintura en un automóvil.
Conversión de datos por atributos a variables: 10 desportilladuras se
pueden reportar como una longitud total de 8.37”; 25 rayas de
pintura como 3.2” cuadradas de rayones de pintura.
Página 2 de 8
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
Escalas de medición
En función de la deseabilidad estadística se tiene:
Escala
Descripción
Ejemplo
Nominal
Datos como nombres o
categorías. No hay orden
Bolsa con dulces de colores:
15 amarillos, 10 rojos, 7
verdes
Ordinal
(rango)
Los datos están ordenados pero
sus diferencias no pueden
determinarse ni tienen sentido
Defectos A más críticos que los
defectos D se tabulan como:
A 16, B 32, C 42, D 30
Intervalo
Los datos se arreglan por orden
y diferencia. No hay punto de
inicio de ref. y la razón no tiene
significado
La temperatura de 3 lingotes
es de 200ºC, 400ºC y 600ºC.
Notar que 3 veces 200ºC no
es lo mismo que 600ºC en T.
Razón
Similar al anterior con un punto
cero inicial. Tanto las diferencias
como las razones son
significativas
El producto A cuesta $300 y el
B $600. Notar que $600 es
tanto como dos veces $300
Medidas estadísticas para las escalas de medición
Escala
Localización
central
Dispersión
Prueba de
significancia
Nominal
Moda
Solo informativa
Chi – cuadrada
Ordinal
(rango)
Mediana
Pocentajes
Prueba de signos o
rachas
Intervalo
Media aritmética
Desviación
Prueba t, Prueba F,
media o estándar Análisis de correlación
Razón
Media geométrica Variación
o media armónica pocentual
Página 3 de 8
Similar al anterior
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
Métodos de colección de datos
Incluye métodos manuales y automáticos. Guías:
•
Formular una clara descripción del problema
•
Definir de manera precisa lo que se va a medir
•
Listar todas las características importantes a medir
•
Cuidadosamente seleccionar la técnica de medición
•
Construir un formato sencillo de registro
•
Decidir quién colectara los datos
•
Establecer un método de muestreo apropiado
•
Decidir quien analizará e interpretará los resultados
•
Decidir quien reportará los resultados
Tipos de información para proyectos
Atributos
Variables
Caliper
PASA
NO PASA
ORDEN DE ENVIO
CIUDAD
UNIDAD DESCRIPCION
TOTAL
1
3
10
$10.00
$1.50
$10.00
$10.00
$4.50
$10.00
2
$5.00
$10.00
FALLA
Error
Tiempo
PASA
TEMPERATURE
Termómetro
Circuito Eléctrico
Plan de recolección de datos
Un plan de Recolección de Datos relacionada con las CTQs de interés
es la documentación de:
•
Qué información se va a recolectar
•
Por qué se necesita
•
Quién es responsable
Página 4 de 8
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
•
Cómo se va a recolectar
•
Cuándo se va a recolectar
•
Dónde se va a recolectar
Definiciones operacionales
El Plan de Recolección de Datos debería de basarse en las Definiciones
Operativas medibles:
•
Definiciones Operativas ya desarrolladas para los clientes CTQs – las
“Ys”
•
Se necesita desarrollar Definiciones Operativas para el proceso “Xs”
Y = ƒ(X1, X2, X3, X4…Xn)
Y es el CTQ del cliente y las X son los CTQs del proceso (proveedor,
entrada, proceso).
Codificación de datos
Codificar al agregar o restar una constante o multiplicar o dividir por un
factor:
Codificación por substitución: para una observación de 32-3/8”, los
datos pueden codificarse como enteros expresando el número de
incrementos de 1/8” de desviación vs el valor nominal.
Página 5 de 8
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
Codificación por truncamiento o valores decimales repetitivos: las
mediciones como 0.55303, 0.55310, 0.55308 pueden ser registradas
como los dos últimos dígitos, 3, 10, 8.
Aseguramiento de la exactitud e integridad de los datos
Los datos malos corrompen el proceso de toma de decisiones
•
Evitar sesgo emocional respecto a tolerancias
•
Evitar redondeo innecesario
•
Si una característica cambia con el tiempo, registrar la medición
inicial y la posterior a la estabilización
•
Filtrar los datos para identificar y eliminar errores de captura
•
Si los datos siguen una distribución normal, determinar si la
dispersión de los datos puede ser representada por al menos 8 o
10 incrementos de resolución. Si no puede ser mejor contar las
observaciones.
•
Usar pruebas estadísticas objetivas para identificar outliers o
puntos aberrantes
•
Cada identificación de clasificación importante debe ser
registrada junto con los datos
Muestreo estadístico
Muestreo: Proceso mediante el cual hacemos inferencia a toda una
población observando solo una parte de esta (muestra).
Ventajas del Muestreo
•
Se economizan recursos
•
Se reduce el tiempo
•
Confiabilidad
•
Se pueden proyectar resultados
Página 6 de 8
COLECCIÓN DE DATOS
P. Reyes / Sept. 2007
Métodos de muestreo: Es un procedimiento científico mediante el cual
obtenemos los componentes de una muestra, tratando que la muestra
nos de información acerca de un parámetro poblacional, y también nos
permite medir el grado de incertidumbre de equivocarnos en la
inferencia.
•
Muestreo aleatorio: En este caso cada parte tiene la misma
oportunidad de ser seleccionada
•
Muestreo secuencial: se toman piezas de una línea continua y se
muestrea hasta que se hayan inspeccionado más de 3 veces el
tamaño de muestra de un plan de muestreo simple
•
Muestreo estratificado: Se seleccionan muestras aleatorias de
cada uno de los grupos o procesos diferentes, deben reflejar la
frecuencia de los grupos
Muestreo Simple Aleatorio
•
Cada uno de los elementos de una población tiene la misma
probabilidad de salir en una muestra.
•
La selección se hace generalmente usando números
aleatorios.(de la uniforme 0,1).
•
Ejemplo: Se tiene una población de 100 artículos. Se desean
seleccionar 5. Para obtener la muestra se deben enumerar los 100
artículos y se saca una lista de 5 números al azar entre 1 y 100. (
Usando la computadora generamos una lista de 5 números de la
uniforme 0,1 y los multiplicamos por 100 y solo tomamos las
primeras dos decimales.).
Muestreo Sistemático
•
En este método enumeramos los elementos de la población de 1
a N. La muestra es tomada en intervalos de N/n. (con n= tamaño
de la muestra).
Página 7 de 8
COLECCIÓN DE DATOS
•
P. Reyes / Sept. 2007
Ejemplo: de los 100 artículos anteriores si muestreamos
sistemáticamente para n=5. Tomaremos la muestra cada
100/5=20 objetos. (i.e. Tomamos el 1er. Articulo , luego el 20esimo.,
etc.).
Muestreo con probabilidades desiguales.
Útil en poblaciones con mucha variabilidad. Hacemos que aparezcan
con mayor los datos grandes o pequeños.
Página 8 de 8
Descargar