COLECCIÓN DE DATOS P. Reyes / Sept. 2007 COLECCIÓN DE DATOS Primitivo Reyes Aguilar Septiembre 2007 Página 1 de 8 COLECCIÓN DE DATOS P. Reyes / Sept. 2007 Colección y resumen de datos • Tipos de datos • Escalas de medición • Métodos de colección de datos • Técnicas para asegurar la exactitud e integridad de los datos Los Datos por atributos son datos discretos enteros, por ejemplo 3, 45, 2032. Cuenta, unidades, ocurrencias, bueno – malo. Los Datos por variables son datos continuos medibles con instrumentos que proporcionan números reales, por ejemplo 1.037, 4.69, etc. Longitud, tiempo, volumen, tensión. Es preferible tener información por variables, proporcionan mayor información. Los Datos de localización contestan a la pregunta “¿Dónde?”. Las cartas que utilizan datos de localización de defectos se denominan “Measless charts” o “Cartas de concentración”. Por ejemplo mapas con oficinas de distribución; defectos de pintura en un automóvil. Conversión de datos por atributos a variables: 10 desportilladuras se pueden reportar como una longitud total de 8.37”; 25 rayas de pintura como 3.2” cuadradas de rayones de pintura. Página 2 de 8 COLECCIÓN DE DATOS P. Reyes / Sept. 2007 Escalas de medición En función de la deseabilidad estadística se tiene: Escala Descripción Ejemplo Nominal Datos como nombres o categorías. No hay orden Bolsa con dulces de colores: 15 amarillos, 10 rojos, 7 verdes Ordinal (rango) Los datos están ordenados pero sus diferencias no pueden determinarse ni tienen sentido Defectos A más críticos que los defectos D se tabulan como: A 16, B 32, C 42, D 30 Intervalo Los datos se arreglan por orden y diferencia. No hay punto de inicio de ref. y la razón no tiene significado La temperatura de 3 lingotes es de 200ºC, 400ºC y 600ºC. Notar que 3 veces 200ºC no es lo mismo que 600ºC en T. Razón Similar al anterior con un punto cero inicial. Tanto las diferencias como las razones son significativas El producto A cuesta $300 y el B $600. Notar que $600 es tanto como dos veces $300 Medidas estadísticas para las escalas de medición Escala Localización central Dispersión Prueba de significancia Nominal Moda Solo informativa Chi – cuadrada Ordinal (rango) Mediana Pocentajes Prueba de signos o rachas Intervalo Media aritmética Desviación Prueba t, Prueba F, media o estándar Análisis de correlación Razón Media geométrica Variación o media armónica pocentual Página 3 de 8 Similar al anterior COLECCIÓN DE DATOS P. Reyes / Sept. 2007 Métodos de colección de datos Incluye métodos manuales y automáticos. Guías: • Formular una clara descripción del problema • Definir de manera precisa lo que se va a medir • Listar todas las características importantes a medir • Cuidadosamente seleccionar la técnica de medición • Construir un formato sencillo de registro • Decidir quién colectara los datos • Establecer un método de muestreo apropiado • Decidir quien analizará e interpretará los resultados • Decidir quien reportará los resultados Tipos de información para proyectos Atributos Variables Caliper PASA NO PASA ORDEN DE ENVIO CIUDAD UNIDAD DESCRIPCION TOTAL 1 3 10 $10.00 $1.50 $10.00 $10.00 $4.50 $10.00 2 $5.00 $10.00 FALLA Error Tiempo PASA TEMPERATURE Termómetro Circuito Eléctrico Plan de recolección de datos Un plan de Recolección de Datos relacionada con las CTQs de interés es la documentación de: • Qué información se va a recolectar • Por qué se necesita • Quién es responsable Página 4 de 8 COLECCIÓN DE DATOS P. Reyes / Sept. 2007 • Cómo se va a recolectar • Cuándo se va a recolectar • Dónde se va a recolectar Definiciones operacionales El Plan de Recolección de Datos debería de basarse en las Definiciones Operativas medibles: • Definiciones Operativas ya desarrolladas para los clientes CTQs – las “Ys” • Se necesita desarrollar Definiciones Operativas para el proceso “Xs” Y = ƒ(X1, X2, X3, X4…Xn) Y es el CTQ del cliente y las X son los CTQs del proceso (proveedor, entrada, proceso). Codificación de datos Codificar al agregar o restar una constante o multiplicar o dividir por un factor: Codificación por substitución: para una observación de 32-3/8”, los datos pueden codificarse como enteros expresando el número de incrementos de 1/8” de desviación vs el valor nominal. Página 5 de 8 COLECCIÓN DE DATOS P. Reyes / Sept. 2007 Codificación por truncamiento o valores decimales repetitivos: las mediciones como 0.55303, 0.55310, 0.55308 pueden ser registradas como los dos últimos dígitos, 3, 10, 8. Aseguramiento de la exactitud e integridad de los datos Los datos malos corrompen el proceso de toma de decisiones • Evitar sesgo emocional respecto a tolerancias • Evitar redondeo innecesario • Si una característica cambia con el tiempo, registrar la medición inicial y la posterior a la estabilización • Filtrar los datos para identificar y eliminar errores de captura • Si los datos siguen una distribución normal, determinar si la dispersión de los datos puede ser representada por al menos 8 o 10 incrementos de resolución. Si no puede ser mejor contar las observaciones. • Usar pruebas estadísticas objetivas para identificar outliers o puntos aberrantes • Cada identificación de clasificación importante debe ser registrada junto con los datos Muestreo estadístico Muestreo: Proceso mediante el cual hacemos inferencia a toda una población observando solo una parte de esta (muestra). Ventajas del Muestreo • Se economizan recursos • Se reduce el tiempo • Confiabilidad • Se pueden proyectar resultados Página 6 de 8 COLECCIÓN DE DATOS P. Reyes / Sept. 2007 Métodos de muestreo: Es un procedimiento científico mediante el cual obtenemos los componentes de una muestra, tratando que la muestra nos de información acerca de un parámetro poblacional, y también nos permite medir el grado de incertidumbre de equivocarnos en la inferencia. • Muestreo aleatorio: En este caso cada parte tiene la misma oportunidad de ser seleccionada • Muestreo secuencial: se toman piezas de una línea continua y se muestrea hasta que se hayan inspeccionado más de 3 veces el tamaño de muestra de un plan de muestreo simple • Muestreo estratificado: Se seleccionan muestras aleatorias de cada uno de los grupos o procesos diferentes, deben reflejar la frecuencia de los grupos Muestreo Simple Aleatorio • Cada uno de los elementos de una población tiene la misma probabilidad de salir en una muestra. • La selección se hace generalmente usando números aleatorios.(de la uniforme 0,1). • Ejemplo: Se tiene una población de 100 artículos. Se desean seleccionar 5. Para obtener la muestra se deben enumerar los 100 artículos y se saca una lista de 5 números al azar entre 1 y 100. ( Usando la computadora generamos una lista de 5 números de la uniforme 0,1 y los multiplicamos por 100 y solo tomamos las primeras dos decimales.). Muestreo Sistemático • En este método enumeramos los elementos de la población de 1 a N. La muestra es tomada en intervalos de N/n. (con n= tamaño de la muestra). Página 7 de 8 COLECCIÓN DE DATOS • P. Reyes / Sept. 2007 Ejemplo: de los 100 artículos anteriores si muestreamos sistemáticamente para n=5. Tomaremos la muestra cada 100/5=20 objetos. (i.e. Tomamos el 1er. Articulo , luego el 20esimo., etc.). Muestreo con probabilidades desiguales. Útil en poblaciones con mucha variabilidad. Hacemos que aparezcan con mayor los datos grandes o pequeños. Página 8 de 8