Prácticas de Estadística Conceptos Básicos Diciembre’05 INTRODUCCIÓN n ¿Qué es MINITAB? n Paquete estadístico de “Estadística Básica”: • Univariante y bivariante • Estadística Descriptiva • Correlación • Regresión simple y múltiple • Tablas de contingencia • Test de hipótesis • ... 1 Conceptos Básicos (i) n Ventanas del MINITAB n Session • Muestra los resultados de los análisis y permite introducir órdenes de forma directa n Woksheet • Se introducen los datos a analizar • De apariencia parecida a las hojas de Excel n Graph • Ventanas de imagen, se crea una por gráfico realizado n Project Manager • Muestra las carpetas y archivos creados con MINITAB Conceptos Básicos (ii) n Barra de Herramientas n Standard • Botón “Edit last command” n Project Manager • Pequeñas vistas predefinidas n Worksheet • Edición de celdas: insertar fila, celda, columna… n Guardar datos • Guardar proyecto (.MPJ): File/Save Project • Hojas de datos (. MTW): File/Save Current Worksheet • Gráficos (.MGF): File/ Save Graph As 2 Conceptos Básicos (iii) n Introducir datos n Escribir directamente en la hoja de datos • Normalmente cada columna una variable n Importar datos de otras aplicaciones: SPSS, Excel o Notepad • Opción Open\Worksheet n Edición de datos n Similar a la de hojas de cálculo Excel • Edit/InsertColumns o Edit/InsertRows • Botón derecho Manipular datos (i) n Menú Data n n n n n Subset: Copia ciertas líneas de una hoja de datos activa en otra nueva Split: separa la hoja de datos activa en dos o más hojas de datos Merge: Abre una nueva ventana dónde sitúa los datos de otras dos seleccionadas previamente Unstack Columns: Sirve para separar bloques de columnas en otras más cortas Transpose Columns: permite trasponer un grupo de filas y columnas para reordenar datos 3 Manipular datos (ii) n Menú Calc n n Operaciones aritméticas, comparaciones, operaciones lógicas y funciones por columnas Make Patterned Data • Simple set of numbers: igualmente espaciados • Arbitrary set of numbers: no igualmente espaciados • Text Values: patrones de texto • Simple Set of Date/Time Values: fechas o datos temporales igualmente espaciados • Arbitrary Set of Date/Time Values: fechas o datos temporales no igualmente espaciados n Make Indicator variables • Crea una matriz de 0 y 1 identificando filas con columnas Menu Calculadora n Data/Change data type n n Data/Code n n Recodifica una variable Random Data n n Cambia el tipo de una variable Genera filas o columnas de números aleatorios con hasta 24 distribuciones de datos diferentes Probability distributions n Permite calcular las funciones de masa, valores de función de densidad y funciones de distribución de las distribuciones de probabilidad más usuales 4 Estadística Descriptiva n Estadísticos descriptivos n Stat/Basis Statistics/Display Descriptive Statistics • Índices de posición: • First quartil: Q1 à 25% de los valores a la izda • Median: Q2 à mediana • Third quartil: Q3… • Índices de tendencia central: • Mean: Media aritmética • Sum: Suma de todos los valores • Medidas dispersión • SE of mean • Estándar deviation • Variance • Minimum, maximum… • Índices de distribución • Curtosis y asimetría Gráficos Guardar/Abrir n n n Los gráficos abiertos se guardan cuando se guarda el proyecto entero (.mpj) pero no cuando se guarda la hoja de datos (.mtw) Abrir gráfico: File/Open Graph Ejemplo n Tiempo de vida de móviles Hi st o gr a m o f T i e m p o d e V i d a N o rm a l 20 M ean S tD ev N 1528 1 65.6 100 15 Fre quency n 10 5 0 1 120 1280 1440 1600 Tie m p o de V i da 1760 1920 5 Gráficos n Diagramas de Caja: Graph/Boxplot n • Ejemplo Sensores: Son iguales o distintos los que provienen del proovedor A y los del B?? Multiple Ys Simple n Multiple Ys with Groups Boxplot of tipo A; tipo B vs tamaño Boxplot of tipo A; tipo B 75 75 Extremo superior: Q3+1.5(Q3-Q1) 74 74 73 Mediana 72 71 Dat a Dat a 73 Tercer Cuartil: Q372 71 70 70 69 Primer Cuartil: 69 Q1 68 68 67 67 66 tamaño Extremo inferior: Q3-1.5(Q3-Q1) 66 tipo A grande peque grande tipo A tipo B peque tipo B Gráficos n Diagramas circulares: Graph/Pie Chart n Ejemplo: la venta de relojes de una empresa por meses es Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 171.556 205.266 233.63 190.786 225.059 200.175 141.989 168.691 201.9 211.541 191.351 178.869 P ie C hart of Sal es vs Month 7. 7% 7. 4% 8 .2% 8 .8% 9 .1% 10. 1% 8 .7% Ca teg o r y en er o fe br e ro mar zo ab r il may o ju n io ju lio ag o sto sep tiemb r e o ctu b r e n o viemb r e d iciemb re 8.2 % 7. 3% 9. 7% 6. 1% 8 .6% 6 Gráficos n Diagramas temporales: Graph/Time Series Plot Ejemplo: la venta de relojes por trimestres n Año 2000 2000 2000 2000 2001 2001 2001 2001 2002 2002 2002 Trimestre Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 2002 Q4 Sales 192.47 203.24 174.79 218.83 183.74 111.44 194.06 175.53 247.80 195.11 161.73 153.424 Q2 Q4 Time Series Plot of S ales Q 260 240 220 Sa le s Q 200 180 160 140 120 100 Quarter Q1 Year 2000 Q2 Q3 Q4 Q1 2001 Q2 Q3 Q4 Q1 2002 Q3 Gráficos n Diagramas de dispersión: Graphs/Scatterplots Ejemplo: ¿Hay relación entre el tiempo de desarrollo de un tumor y su tamaño? n Time 18 20 22 24 26 28 30 32 34 36 38 40 42 44 Size 5.94 11.25 13.21 13.89 12.13 16.33 24.31 25.36 32.65 32.89 33.54 39.98 39.68 47.41 Sc att er plo t o f Si ze v s T ime 50 40 Siz e 30 20 10 0 20 25 30 Time 35 40 45 7 Gráficos Paretos: Stat/QualityTool/ParetoChart Par eto Char t of Damage Ejemplo: ¿Cuál es la frecuencia con la que aparece un determinado fallo? 9 8 10 0 7 Count 5 Defects Counts 60 4 40 Scratch Missing Screws 274 Scratch Missing Clips 59 Bend Defective Housi 19 Chip Leaky Gasket 43 Dent Scrap 4 Scratch Unconnected Wir 8 Chip Missing Studs 6 Scratch Incomplete Part 2 20 1 0 Da ma ge Cou nt Pe rce nt Cum % S cr atch 4 5 0.0 5 0.0 Ch ip 2 25. 0 75. 0 Ben d 1 1 2.5 8 7.5 Den t 1 12 .5 100 .0 0 Par eto Char t of Damage 10 0 4 00 80 3 00 Count Damage Percent 80 6 3 60 2 00 40 10 1 00 0 Da ma ge Cou nt Pe rce nt Cum % 20 S cr atch 351 8 3.0 8 3.0 Ch ip 49 11. 6 94. 6 Ben d 19 4.5 9 9.1 Ot her 4 0 .9 100 .0 0 Gráficos Multi-variable: Stat/QualityTools/Multi-Vari Chart n n Ejemplo: ¿Cómo depende la calidad de los tubos de escape de los factores de producción? Caudal Gas Intens Velo Calidad 8 230 0.6 10.5 12 230 0.6 26 8 240 0.6 13.5 12 240 0.6 19 8 230 1 12 12 230 1 25.5 8 240 1 16 12 240 1 21.5 Multi-Vari C hart for C alidad by Caudal Gas - V elo 230 0.6 28 240 1.0 26 C au dal Gas 8 12 24 22 Calidad n Percent n 20 18 16 14 12 10 230 240 Inte ns Panel variable: V elo n Lo mejor: Caudal de gas alto; intensidad baja y velocidad baja 8