Universidad Tecnológica Nacional Facultad Regional Buenos Aires Tesis de Magister en Ingeniería en Sistemas de Información Detección de Patrones de Daños y Averías en la Industria Automotriz Ing. Hugo Daniel Flores Directora: Dra. Paola V. Britos Codirector: Dr. Ramón García Martínez - 2009 - DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Resumen En la industria automotriz uno de los temas relevantes en la producción y distribución de unidades es la detección e identificación de daños y/o averías producidas a lo largo del circuito que recorren los autos desde que salen de planta de producción hasta que llegan a su destino final. Con el incremento de la globalización, los fabricantes de vehículos han ido rediseñando sus redes de producción en todo el mundo. Para optimizar los costes, determinados países son escogidos para especializarse en la producción de ciertos modelos. Esta situación ha dado lugar a un inevitable aumento del transporte de los vehículos desde los países productores a los mercados finales. Durante estos trayectos los vehículos se ven sometidos a daños, en grado variable, en toda la cadena de suministro. El objetivo del proyecto es utilizar la metodología CRISP-DM para detectar patrones en la producción de daños y/o averías en la cadena de distribución para permitir a la industria: • • • • • • • • • • Identificar daños y/o averías. Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de transporte. Imputar incidentes según el tipo de transporte. Determinar tipos de averías y/o daños. Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento. Especificar gravedad de daños y/o averías. Definir e identificar modelos con daños especificando partes, tipo de daño y gravedad. Especificar lugares donde se producen daños y/o averías tratando de definir patrones de comportamiento. Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así también, partes, tipos de averías, gravedades, lugares donde se producen. Descubrir información “oculta” en función de los modelos generados a partir de los datos disponibles. Página 1 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 2 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Dedicatoria A mi esposa y familia Sandra, María Elena, Paula y Marcos Página 3 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 4 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Agradecimiento A la Universidad Tecnológica Nacional, Facultad Regional Tucumán y por su intermedio al Estado Nacional por darme la posibilidad de estudiar y acceder a un nivel académico superior. A la Escuela de Posgrado de la Universidad Tecnológica Nacional, Facultad Regional Buenos Aires por haberme permitido acceder a este nivel de estudio. A mis tutores Dra. Paola Britos y Dr. Ramón García Martínez por haberme conducido a lo largo del desarrollo de este trabajo de tesis. A la Dra. Zulma Cataldi por su colaboración y asesoramiento en la especificación de los lineamientos generales para el desarrollo de esta tesis. A mis colegas y asociados por haber contribuido abierta y desinteresadamente en las pruebas y consultas realizadas no solo para este proyecto en particular sino también por todos los emprendimientos que vamos logrando. A mi esposa por darme la confianza y el apoyo, y soportar diariamente la ardua labor que implica mi desarrollo profesional permanente. A mi madre por haberme inculcado desde niño a seguir el camino de la educación para mejorar mi futuro como persona, como hijo, como hermano y como hombre de familia. Espero que este trabajo y su propuesta de futuras líneas de investigación sirvan como agradecimiento y devolución hacia la sociedad por las oportunidades que me brindó a través de la Universidad Estatal. Página 5 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 6 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Índice 1. Introducción .....................................................................................................................................9 1.1. Minería de Datos (Data Mining)...............................................................................................9 1.2. Lineamientos del documento de tesis .....................................................................................10 2. Técnicas de Minería de Datos........................................................................................................11 1. Análisis estadístico.....................................................................................................................11 2. Análisis a través de sistemas inteligentes ..................................................................................12 3. Conclusiones ..............................................................................................................................13 3. Metodologías de Minería de Datos ................................................................................................15 3.1. SEMMA ..................................................................................................................................15 3.2. CRISP-DM..............................................................................................................................16 3.3. Microsoft.................................................................................................................................18 3.4. Comparación de Metodologías ...............................................................................................21 4. La metodología CRISP-DM...........................................................................................................23 4.1. Introducción ............................................................................................................................23 4.1.1. La Metodología CRISP-DM ............................................................................................23 4.1.2. Pasaje de modelos genéricos a modelos especializados ..................................................24 4.2. El modelo de referencia CRISP-DM ......................................................................................25 4.2.1. Comprensión del Negocio................................................................................................27 4.2.2. Comprensión de Datos .....................................................................................................31 4.2.3. Preparación de Datos .......................................................................................................33 4.2.4. Modelado .........................................................................................................................37 4.2.5. Evaluación........................................................................................................................39 4.3. La guía de usuario de CRISP-DM ..........................................................................................43 4.3.1. Comprendiendo el negocio ..............................................................................................43 4.3.2. Comprensión de Datos .....................................................................................................51 4.3.3. Preparación de los datos...................................................................................................56 4.3.4. Modelado .........................................................................................................................60 4.3.5. Evaluación........................................................................................................................64 4.3.6. Desarrollo.........................................................................................................................67 4.4. Las salidas del CRISP-DM .....................................................................................................69 4.4.1. Comprensión del Negocio................................................................................................70 4.4.2. Comprensión de Datos .....................................................................................................71 4.4.3. Preparación de Datos .......................................................................................................72 4.4.4. Modelado .........................................................................................................................73 4.4.5. Evaluación........................................................................................................................74 4.4.6. Desarrollo.........................................................................................................................75 4.4.7. Resumen de dependencias ...............................................................................................75 4.5. Apéndice .................................................................................................................................77 4.5.1. Glosario/Terminología .....................................................................................................77 4.5.2. Tipos de problemas de minería de datos..........................................................................77 5. Descripción y desarrollo de la industria.........................................................................................85 5.1. La industria automotriz y el control de daños y/o averías ......................................................85 5.2. Circuitos logísticos..................................................................................................................86 5.3. Transportes y lugares de almacenamiento ..............................................................................87 6. Procesos a analizar, límites y alcance ............................................................................................89 6.1. Puntos de Control....................................................................................................................89 6.2. Estándares de inspección ........................................................................................................89 7. Información y datos .......................................................................................................................91 Página 7 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 7.1. Proceso de inspección y captura de datos ...............................................................................91 7.2. Sistema normalizado de codificación de daños y/o averías....................................................91 7.3. Proceso de educción de requerimientos del proyecto .............................................................91 8. Aplicación de la metodología propuesta........................................................................................95 8.1. Comprensión del Negocio.......................................................................................................95 8.2. Comprensión de Datos ..........................................................................................................104 8.3. Preparación de Datos ............................................................................................................112 8.4. Modelado ..............................................................................................................................115 8.4.1. Selección de las técnicas de modelado ..........................................................................115 8.4.2. Generación de la prueba de diseño ................................................................................115 8.4.3. Construcción de los modelos .........................................................................................116 8.4.4. Descripción de los modelos ...........................................................................................119 8.4.4.1. Modelo de Clasificación .........................................................................................119 8.4.4.2. Modelo de Clustering..............................................................................................144 8.4.4.3. Modelo de Predicción .............................................................................................167 8.4.5. Dificultades encontradas ................................................................................................190 8.5. Evaluación.............................................................................................................................190 8.5.1. Evaluación de los resultados en términos de minería de datos ......................................190 8.5.2. Evaluación de los resultados en términos de objetivos de negocio. ..............................218 8.5.2.1. Tipos de averías. .....................................................................................................219 8.5.2.2. Lugares....................................................................................................................220 8.5.2.3. Modelos...................................................................................................................220 8.5.2.4. Partes, Averías y Gravedad.....................................................................................221 8.5.2.5. Lugares, Partes y Tipos de Averías.........................................................................224 8.5.2.6. Modelos, Partes y Tipos de Averías........................................................................232 8.5.2.7. Imputación Tipo de Transporte...............................................................................238 8.6. Desarrollo..............................................................................................................................241 8.6.1. Plan de desarrollo...........................................................................................................241 8.6.2. Supervisión y mantenimiento del plan...........................................................................250 8.6.3. Producción de Informe definitivo ..................................................................................251 8.6.4. Revisión del proyecto.....................................................................................................252 9. Conclusiones ................................................................................................................................253 10. Líneas futuras de investigación..................................................................................................257 11. Bibliografías y Documentación .................................................................................................259 12. Anexos .......................................................................................................................................261 Anexo 1: Terminología de negocio..............................................................................................261 Anexo 2: Terminología de minería de datos................................................................................262 Anexo 3: Consultas estructuradas para base de datos..................................................................264 Anexo 4: Codificación .................................................................................................................273 Anexo 5: Presentación final. ........................................................................................................277 Página 8 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 1. Introducción 1.1. Minería de Datos (Data Mining) El gran desarrollo tecnológico de los últimos años ha potenciado el almacenamiento de grandes volúmenes de información. No solo desde el punto de vista del “computador personal” sino también desde el punto de vista de la computación como un conjunto de dispositivos electrónicamente interconectados capaces de soportar el trasporte de grandes cantidades de información en una dirección determinada con el propósito de ser almacenada centraliza o descentralizadamente, o bien desde el punto de vista de redes electrónicas donde desde cada nodo se permite la posibilidad de cargar información en una o más bases de datos. Al mayor poder de procesamiento y transporte de información se suman los avances tecnológicos en materia de base de datos que soportan “grandes” volúmenes de información de diferentes orígenes y fuentes pudiendo incluir texto, números, imágenes, video, etc. Estos avances en materia de gran capacidad de almacenamiento de información han dado lugar a la creación de nuevas tecnologías como la Minería de Datos. Conceptualmente la Minería de Datos o Explotación de Datos, como también será llamada en el presente trabajo, se puede definir como un conjunto de técnicas y herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento implícito, previamente desconocido, potencialmente útil y humanamente comprensible, a partir de grandes conjuntos de datos con motivo de predecir de forma automatizada tendencias y comportamientos y/o descubrir de forma automatizada modelos previamente desconocidos [Piatetski-Shapiro, 1991]. Desde un punto de vista empresarial la minería de datos puede ser definida como un conjunto de áreas que tiene como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisiones [Molina, 2001]. Lo que realmente hace el data mining es reunir las ventajas de varias áreas como la Estadística, la Inteligencia Artificial, la Computación Gráfica, el Datawarehouse y el Procesamiento Masivo, principalmente usando como materia prima bases de datos. Para tener una aproximación cercana a las diversas definiciones encontradas en diferentes artículos de diferentes autores se puede concluir que la minería de datos es un proceso con el cual se pueden descubrir y cuantificar relaciones predictivas en los datos, y del resultado de este proceso es posible obtener conocimiento útil para el negocio. Hoy en día realizando las consultas (simplemente navegando los datos) convencionales a grandes bases de datos no es suficiente para resolver problemas de negocios, sino que se hace necesario seguir una metodología ordenada para aplicar herramientas tecnológicas y técnicas disponibles en informáticas para así obtener conocimiento y resultados que permitan a las compañías obtener un beneficio. El entorno natural del Data Mining es el Datawarehouse. La minería de datos trata de sacar información de detalle de un almacén de datos. No se conforma solo con la visualización de datos, sino que es necesario obtener resultados en cuanto a la relación que existe entre los mismos y como estos podrían repercutir en el negocio. Página 9 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Para la explotación de datos aplicando minería de datos existen diferentes técnicas las cuales pueden ser desarrolladas según diferentes metodologías. A continuación se describirán algunas técnicas y metodologías de Data Mining. 1.2. Lineamientos del documento de tesis El primer capítulo desarrolla una breve introducción a la minería de datos que es la base operacional del presente proyecto de tesis. El capítulo dos muestra una descripción de las diferentes técnicas de minería de datos que pueden ser aplicadas en función de las necesidades del estudio en cuestión. El tercer capítulo realiza una comparación entre las diferentes metodología de minería de datos desarrolladas hasta el presente. Además muestra el avance tecnológico de cada técnica y muestra como resultado una breve conclusión que motiva la aplicación de la metodología seleccionada para este proyecto. En el cuarto capítulo se desarrolla la metodología completa a utilizar en este proyecto y esta además representa para esta tesis el estado de la tecnología. Se toma como marco de referencia la metodología propuesta por la organización creadora de la misma y a la cual se hace referencia en las respectivas citas. Le quinto capítulo describe la situación actual de la industria automotriz en lo referente a daños y/o averías. Además se muestran los posibles circuitos logísticos estándares en la industria y demás detalles como los tipos de transporte o lugares de estacionamiento de las unidades automotrices. El sexto capítulo hace referencia a los procesos a analizar, los límites del proyecto y los alcances del mismo. En el séptimo capítulo se realiza la descripción global del sistema de información del que se obtiene toda la información para la explotación de datos. En el capítulo ocho se realiza la aplicación de la metodología propuesta a la industria automotriz. Paso a paso se hace el desarrollo completo de la metodología propuesta. El capítulo nueve muestra las conclusiones a las que se arriba luego del desarrollo del proyecto de tesis. En el capítulo diez se presentan las posibles líneas de investigación que surgen de la realización de este proyecto. El capítulo once muestra la bibliografía a la cual se ha recurrido para el desarrollo del presente proyecto. Finalmente en el capítulo doce se muestran todos los anexos utilizados para la preparación, análisis y evaluación de los resultados. Página 10 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 2. Técnicas de Minería de Datos Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico y mediante los modelos extraídos. Utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación. 1. Análisis estadístico Debido al gran volumen de datos con el que se puede contar en la actualidad y al poder de proceso en la tecnología desarrollada hasta aquí, se hace viable la exploración de la información utilizando diferentes técnicas estadísticas. El Análisis Estadístico se preocupa más por el poder de generalización de los resultados obtenidos para inferir los resultados a situaciones más generales que la estudiada. A continuación se presentan algunas técnicas: • • • • • • • • 1 ANOVA o análisis de la Varianza: Contrasta si existen diferencias significativas entre las medidas de una o más variables continuas en grupos de población distintos. Regresión: Define la relación entre una o más variables y un conjunto de variables predictoras de las primeras. Chi cuadrado: Contrasta la hipótesis de independencia entre variables. Componentes principales: Permite reducir el número de variables observadas a un menor número de variables artificiales, conservando la mayor parte de la información sobre la varianza de las variables. Análisis discriminante: Método de clasificación de individuos en grupos que previamente se han establecido, y que permite encontrar la regla de clasificación de los elementos de estos grupos, y por tanto identificar cuáles son las variables que mejor definan la pertenencia al grupo. Series temporales: Es el conocimiento de una variable a través del tiempo para que a partir de ese conocimiento y bajo el supuesto de que no van a producirse cambios estructurales, poder realizar predicciones. Suelen basarse en un estudio de la serie en ciclos, tendencias y estacionalidades, que se diferencian por el ámbito de tiempo abarcado, para por composición obtener la serie original. Se pueden aplicar enfoques híbridos con los métodos anteriores, en los que la serie se puede explicar no sólo en función del tiempo sino como combinación de otras variables de entornos más estables y, por lo tanto, más fácilmente predecibles. Análisis cluster1: Permite clasificar una población en un número determinado de grupos, en base a semejanzas y desemejanzas de perfiles existentes entre los diferentes componentes de dicha población. El método Chaid (Chi Squared Automatic Interaction Detector): Es un análisis que genera un árbol de decisión para predecir el comportamiento de una variable, a partir de una o más variables predictoras, de forma que los conjuntos de una misma rama y un mismo nivel son disjuntos. Es útil en aquellas situaciones en las que el objetivo es dividir una población en distintos segmentos basándose en algún criterio de decisión. El árbol de decisión se construye partiendo el conjunto de datos en dos o más subconjuntos de observaciones a partir de los valores que toman las variables predictoras. Cada uno de estos subconjuntos vuelve después a ser particionado utilizando el mismo algoritmo. Este proceso continúa hasta que no se encuentran diferencias significativas en la influencia de las Análisis cluster usando mapas autoorganizados (técnica de sistemas inteligentes) será aplicado en esta tesis. Página 11 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS variables de predicción de uno de estos grupos hacia el valor de la variable de respuesta. La raíz del árbol es el conjunto de datos íntegro, los subconjuntos y los subsubconjuntos conforman las ramas del árbol. Un conjunto en el que se hace una partición se llama nodo. El número de subconjuntos en una partición puede ir de dos hasta el número de valores distintos que puede tomar la variable usada para hacer la separación. La variable de predicción usada para crear una partición es aquella más significativamente relacionada con la variable de respuesta de acuerdo con test de independencia de la Chi cuadrado sobre una tabla de contingencia. 2. Análisis a través de sistemas inteligentes El objetivo de la aplicación de Sistemas Inteligentes en la minería de datos es extraer información de manera no supervisada. Se preocupa por ofrecer soluciones algorítmicas con un costo computacional aceptable. A continuación se presentan algunas de estas técnicas: • • • • • Algoritmos genéticos: Son métodos numéricos de optimización, en los que aquella variable o variables que se pretenden optimizar junto con las variables de estudio constituyen un segmento de información. Aquellas configuraciones de las variables de análisis que obtengan mejores valores para la variable de respuesta, corresponderán a segmentos con mayor capacidad reproductiva. A través de la reproducción, los mejores segmentos perduran y su proporción crece de generación en generación. Se puede además introducir elementos aleatorios para la modificación de las variables (mutaciones). Al cabo de cierto número de iteraciones, la población estará constituida por buenas soluciones al problema de optimización. Redes neuronales: Genéricamente son métodos de proceso numérico en paralelo, en el que las variables interactúan mediante transformaciones lineales o no lineales, hasta obtener salidas. Estas salidas se contrastan con los que tenían que haber salido, basándose en unos datos de prueba, dando lugar a un proceso de retroalimentación mediante el cual la red se reconfigura, hasta obtener un modelo adecuado. Lógica difusa: Es una generalización del concepto de estadística. La estadística clásica se basa en la teoría de probabilidades, a su vez ésta en la técnica conjuntista, en la que la relación de pertenencia a un conjunto es dicotómica (el 2 es par o no lo es). Si se establece la noción de conjunto borroso como aquel en el que la pertenencia tiene una cierta graduación (¿un día a 20º C es caluroso?), dispondremos de una estadística más amplia y con resultados más cercanos al modo de razonamiento humano. Mapas autoorganizados: Los mapas autoorganizados o SOM (Self-Organizing Map), también llamados redes de Kohonen son un tipo de red neuronal no supervisada, competitiva, distribuida de forma regular en una rejilla de, normalmente, dos dimensiones, cuyo fin es descubrir la estructura subyacente de los datos introducidos en ella. A lo largo del entrenamiento de la red, los vectores de datos son introducidos en cada neurona y se comparan con el vector de peso característico de cada neurona. La neurona que presenta menor diferencia entre su vector de peso y el vector de datos es la neurona ganadora (o BMU, Best-Matching Unit, Unidad con mejor ajuste) y ella y sus vecinas verán modificados sus vectores de pesos. Algoritmos de inducción: Encuadrado dentro de las técnicas de Aprendizaje Automático (Machine Learning), estos algoritmos permiten construir automáticamente a partir de un conjunto de datos de entrenamiento un árbol de clasificación. Para inferir el árbol, el algoritmo realiza particiones binarias sucesivas en el espacio de las variables explicativas, Página 12 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS de forma que en cada partición se escoge la variable que aporta más información en función de una medida de entropía o cantidad de información. El árbol así construido consta del mínimo número de atributos (variables) que se requieren para la clasificación eficiente de los ejemplos dados, con lo que es claro el gran poder explicativo de esta técnica. También se pueden elaborar, a partir del árbol, reglas de clasificación fácilmente interpretables, que definen las características que más diferencian a las distintas clases establecidas inicialmente. Este tipo de sistemas clasificadores presentan la ventaja, frente a las técnicas estadísticas, de que tienen un carácter estrictamente no paramétrico. Además, aunque no alcanzan el poder predictivo de las redes neuronales, sus resultados son mucho más fácilmente interpretables que los modelos de “caja negra” suministrados por aquéllas. 3. Conclusiones En general, cualquiera que sea el problema a resolver, no existe una única técnica para solucionarlo, sino que puede ser abordado siguiendo aproximaciones distintas. El número de técnicas es muy grande y es muy probable que siga creciendo. La experiencia práctica muestra la aptitud de las técnicas de minería de datos para resolver problemas empresariales. También es clara su aportación para resolver problemas científicos que impliquen el tratamiento de grandes cantidades de datos. La minería de datos es, en realidad, una prolongación de una práctica estadística de larga tradición, la de Análisis de Datos. Existe, además, una aportación propia de técnicas específicas de Inteligencia Artificial, en particular sobre la integración de los algoritmos, la automatización del proceso y la optimización del coste. A diferencia de la IA, que es una ciencia joven, en Estadística se viene aprendiendo de los datos desde hace más de un siglo, la diferencia consiste en que ahora existe la potencia de cálculo suficiente para tratar ficheros de datos de forma masiva y automática. Esta es una realidad que cada vez será más habitual. Por otro lado y en relación a la amplia diversidad de técnicas disponibles, conviene tener claro que no existe la técnica más inteligente, sino formas inteligentes de utilizar una técnica y que cada uno utiliza de forma inteligente aquello que conoce. También que para la mayoría de los problemas no existen diferencias significativas en los resultados obtenidos. Página 13 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 14 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 3. Metodologías de Minería de Datos 2 3.1. SEMMA 3 SAS Institute es el desarrollador de esta metodología, la define como el proceso de selección, exploración y modelado de grandes cantidades de datos para descubrir patrones de negocio desconocidos. El nombre de esta terminología es el acrónimo correspondiente a las cinco fases básicas del proceso (Figura 1). Muestreo (Sample) Exploración (Explore) Manipulación (Modify) Modelado (Model) Valoración (Assess) Figura 1: Fases de la metodología SEMMA El proceso se inicia con la extracción de la población muestral sobre la que se va a aplicar el análisis. El objetivo de esta fase consiste en seleccionar una muestra representativa del problema en estudio. La representatividad de la muestra es indispensable ya que de no cumplirse invalida todo el modelo y los resultados dejan de ser admisibles. La forma más común de obtener una muestra es la selección al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Este método de muestreo se denomina muestreo aleatorio simple. La metodología SEMMA establece que para cada muestra considerada para el análisis del proceso se debe asociar el nivel de confianza de la muestra. Una vez determinada una muestra o conjunto de muestras representativas de la población en estudio, la metodología SEMMA indica que se debe proceder a una exploración de la información disponible con el fin de simplificar en lo posible el problema para optimizar la eficiencia del modelo. Para lograr este objetivo se propone la utilización de herramientas de visualización o de técnicas estadísticas que ayuden a poner de manifiesto relaciones entre variables. De esta forma se pretende determinar cuáles son las variables explicativas que van a servir como entradas al modelo. La tercera fase de la metodología consiste en la manipulación de los datos, en base a la exploración realizada, de forma que se definan y tengan el formato adecuado los datos que serán introducidos en el modelo. Una vez que se han definido las entradas del modelo con el formato adecuado para la aplicación de la técnica de modelado, se procede al análisis y modelado de los datos. El objetivo de esta fase consiste en establecer una relación entre las variables explicativas y las variables objeto del estudio, que posibiliten inferir el valor de las mismas con un nivel de confianza determinado. Las técnicas utilizadas para el modelado de los datos incluyen métodos estadísticos tradicionales (tales como análisis discriminante, métodos de agrupamiento, y análisis de regresión), así como técnicas basadas en datos tales como redes neuronales, técnicas adaptativas, lógica fuzzy (difusa), árboles de decisión, reglas de asociación y computación evolutiva. 2 SEMMA: Simple, Explore, Modify, Model, Assess. SAS Institute: Es una empresa con sede en Cary (Carolina del Norte, Estados Unidos). Es uno de los principales fabricantes de software business intelligence.[ 3 Página 15 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Finalmente, la última fase del proceso consiste en la valoración de los resultados mediante el análisis de bondad del modelo o modelos contrastados con otros métodos estadísticos o con nuevas poblaciones muestrales. 4 3.2. CRISP-DM La metodología CRISP-DM (Chapman, 1999) consta de cuatro niveles de abstracción, organizados de forma jerárquica en tareas que van desde el nivel más general hasta los casos más específicos. A nivel más general, el proceso está organizado en seis fases (Figura 2), estando cada fase a su vez estructurada en varias tareas generales de segundo nivel. Las tareas generales se proyectan a tareas específicas, donde se describen las acciones que deben ser desarrolladas para situaciones específicas. Así, si en el segundo nivel se tiene la tarea general “limpieza de datos”, en el tercer nivel se dicen las tareas que tienen que desarrollarse para un caso específico, como por ejemplo, “limpieza de datos numéricos”, o “limpieza de datos categóricos”. El cuarto nivel, recoge el conjunto de acciones, decisiones y resultados sobre el proyecto de Data Mining específico. La metodología CRISP-DM proporciona dos documentos distintos como herramienta de ayuda en el desarrollo del proyecto de Data Mining: el del modelo de referencia y la guía del usuario. El documento del modelo de referencia describe de forma general las fases, tareas generales y salidas del proyecto de Data Mining. La guía del usuario proporciona información más detallada sobre la aplicación práctica del modelo de referencia al proyecto de Data Mining específico, proporcionando consejos y listas de comprobación sobre las tareas correspondientes a cada fase. La metodología CRISP-DM estructura el ciclo de vida de un proyecto de Data Mining en seis fases, que interactúan entre ellas de forma iterativa durante el desarrollo del proyecto (Figura 2). Las flechas indican relaciones más habituales entre las fases, aunque se pueden establecer relaciones entre cualquier fase. El círculo exterior simboliza la naturaleza cíclica del proceso de modelado. 4 CRISP-DM: Cross Industry Standard Process for Data Mining. Página 16 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Análisis del Problema Análisis de los datos Preparación de los datos Evaluación Datos Modelado Explotación Figura 2: Fases del proceso de modelado metodología CRISP-DM. La primera fase análisis del problema, incluye la comprensión de los objetivos y requerimientos del proyecto desde una perspectiva empresarial, con el fin de convertirlos en objetivos técnicos y en una planificación. La segunda fase de análisis de datos comprende la recolección inicial de datos, en orden a que sea posible establecer un primer contacto con el problema, identificando la calidad de los datos y estableciendo las relaciones más evidentes que permitan establecer las primeras hipótesis. Una vez realizado el análisis de datos, la metodología establece que se proceda a la preparación de los datos, de tal forma que puedan ser tratados por las técnicas de modelado. La preparación de datos incluye las tareas generales de selección de datos a los que se van a aplicar la técnica de modelado (variables y muestras), limpieza de los datos, generación de variables adicionales, integración de diferentes orígenes de datos y cambios de formato. La fase de preparación de los datos, se encuentra muy relacionada con la fase de modelado, puesto que en función de la técnica de modelado que vaya a ser utilizada los datos necesitan ser procesados en diferentes formas. Por lo tanto las fases de preparación y modelado interactúan de forma sistemática. Página 17 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS En la fase de modelado se seleccionan las técnicas de modelado más apropiadas para el proyecto de Data Mining específico. Las técnicas a utilizar en esta fase se seleccionan en función de los siguientes criterios: • • • • • Ser apropiada al problema Disponer de datos adecuados Cumplir los requerimientos del problema Tiempo necesario para obtener un modelo Conocimiento de la técnica Antes de proceder al modelado de los datos se debe de establecer un diseño del método de evaluación de los modelos, que permita establecer el grado de bondad de los modelos. Una vez realizadas estas tareas genéricas se procede a la generación y evaluación del modelo. Los parámetros utilizados en la generación del modelo dependen de las características de los datos. En la fase de evaluación, se evalúa el modelo, no desde el punto de vista de los datos, sino del cumplimiento de los criterios de éxito del problema. Se debe revisar el proceso teniendo en cuenta los resultados obtenidos para poder repetir algún paso en el que a la vista del desarrollo posterior del proceso se hayan podido cometer errores. Si el modelo generado es válido en función de los criterios de éxito establecidos en la primera fase, se procede a la explotación del modelo. Normalmente los proyectos de Data Mining no terminan en la implantación del modelo, sino que se deben documentar y presentar los resultados de manera comprensible en orden a lograr un incremento del conocimiento. Además en la fase de explotación se debe de asegurar el mantenimiento de la aplicación y la posible difusión de los resultados [Fayyad, 1996]. 3.3. Microsoft En la Figura 3 se describe las relaciones entre cada paso en la metodología desarrollada por Microsoft para la implementación de Data Mining (Figura 3). Página 18 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Definir el problema Integración de servicio Preparar datos Integración de servicio Implementar y actualizar modelos Explorar datos Vista de origen de datos Diseñador de minería de datos Validar modelos Generar modelos Figura 3: Fases del proceso de modelado metodología Microsoft. El primer paso del proceso de minería de datos consiste en definir claramente el problema empresarial. Este paso incluye analizar los requisitos empresariales, definir el ámbito del problema, definir las métricas por las que se evaluará el modelo y definir el objetivo final del proyecto de minería de datos. Estas tareas se traducen en preguntas como las siguientes: • • • • • • ¿Qué se está buscando? ¿Qué atributo del conjunto de datos se desea intentar predecir? ¿Qué tipos de relaciones se intenta buscar? ¿Se desea realizar predicciones a partir del modelo de minería de datos o sólo buscar asociaciones y patrones interesantes? ¿Cómo se distribuyen los datos? ¿Cómo se relacionan las columnas? o en caso de haber varias tablas, ¿cómo se relacionan las tablas? Para responder a estas preguntas, es probable que se deba dirigir un estudio de disponibilidad de datos para investigar las necesidades de los usuarios de la empresa con respecto a los datos disponibles. Si los datos no son compatibles con las necesidades de los usuarios, puede que se deba volver a definir el proyecto. El segundo paso del proceso de minería de datos consiste en consolidar y limpiar los datos identificados en el paso “Definir el problema”. Los datos pueden estar dispersos en la empresa y almacenados en distintos formatos; también pueden contener incoherencias como entradas que faltan o contienen errores. Página 19 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El tercer paso del proceso de minería de datos consiste en explorar los datos preparados. Se debe comprender los datos para tomar las decisiones adecuadas al crear los modelos. Entre las técnicas de exploración se incluyen calcular los valores mínimos y máximos, calcular la media y las desviaciones estándar y examinar la distribución de los datos. Una vez explorados los datos, se puede decidir si el conjunto de datos contiene datos con errores y, a continuación, crear una estrategia para solucionar los problemas. El cuarto paso del proceso de minería de datos consiste en generar los modelos de minería de datos. Antes de generar un modelo, se deben separar aleatoriamente los datos preparados en conjuntos de datos de entrenamiento y comprobación independientes. El conjunto de datos de entrenamiento se utiliza para generar el modelo y el conjunto de datos de comprobación para comprobar la precisión del modelo mediante la creación de consultas de predicción. Una vez definida la estructura del modelo de minería de datos, se procesa rellenando la estructura vacía con los patrones que describen el modelo. Esto se conoce como entrenar el modelo. Los patrones se encuentran al pasar los datos originales por un algoritmo matemático. El modelo de minería de datos se define mediante un objeto de estructura de minería de datos, un objeto de modelo de minería de datos y un algoritmo de minería de datos. El quinto paso del proceso de minería de datos consiste en explorar los modelos que se han generado y comprobar su eficacia. No se debe implementar un modelo en un entorno de producción sin comprobar primero si el modelo funciona correctamente. Además, puede ser que se hayan creado varios modelos y se deba decidir cuál funciona mejor. Si ninguno de los modelos que se han creado en el paso Generar Modelos funciona correctamente, puede ser que se deba volver a un paso anterior del proceso y volver a definir el problema o volver a investigar los datos del conjunto de datos original. El último paso del proceso de minería de datos consiste en implementar los modelos que funcionan mejor en un entorno de producción. Una vez que los modelos de minería de datos se encuentran en el entorno de producción, se pueden llevar acabo diferentes tareas, dependiendo de las necesidades. Éstas son algunas de las tareas que se pueden realizar: • Utilizar los modelos para crear predicciones que se puedan utilizar para tomar decisiones empresariales. • Incrustar la funcionalidad de minería de datos directamente en una aplicación. • Crear un paquete en el que se utilice un modelo de minería de datos para separar de forma inteligente los datos entrantes en varias tablas. • Crear un informe que permita a los usuarios realizar consultas directamente en un modelo de minería de datos existente. La actualización del modelo forma parte de la estrategia de implementación. A medida que la organización recibe más datos, se deben volver a procesar los modelos para mejorar así su eficacia. Página 20 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 3.4. Comparación de Metodologías Las metodologías SEMMA, CRISP-DM y Microsoft esencialmente son muy parecidas. Las tres están compuestas por etapas o fases que interactúan entre sí. En referencia a la tecnología SEMMA está más ligada a los aspectos técnicos de la explotación de datos. En cuanto a las otras dos, están más enfocadas en el negocio en sí; es decir en la aplicación de la Minería de Datos a los negocios. Esta diferencia se ve específicamente en la primera etapa donde SEMMA arranca directamente en el trabajo de datos mientras que CRISP-DM y Microsoft empiezan por el estudio del negocio y sus objetivos, y luego recién se transforma en un problema técnico. Analizando la propuesta metodológica de Microsoft se puede ver que está íntimamente vinculada a la aplicación de las herramientas de su propia compañía (Microsoft) especialmente en lo que respecta a la integración de servicios, vista de origen de datos y diseñador de minería de datos. Lo mismo ocurre con la metodología SEMMA la cual está ligada a herramientas SAS. Para concluir se puede decir que uno de los motivos por los cuales fue escogida para el presente proyecto la metodología CRISP-DM es que este sistema está diseñado como una metodología independiente de la herramienta tecnológica a utilizar en la Explotación de Datos. Esto último la hace más flexible. Otro punto importante es que es de libre acceso y cumple con la característica de ser orientada al negocio. Para esta implementación su desarrollo será aplicado a los datos de la Industria Automotriz. Finalmente también es posible resaltar que la metodología CRISP-DM es más completa debido a que tiene toda una fase dedicada al entendimiento del negocio. La Tabla 1 muestra un cuadro comparativo entre las diferentes metodologías descriptas hasta aquí. Metodologías Estructura Niveles Fases Herramientas Procesos Documentación Objetivos CRISP-DM Fases y niveles Parte de lo general a lo específico Análisis del problema Análisis de datos Preparación de Datos Modelado Evaluación Explotación Genéricas Iterativo e interactivo entre fases SEMMA Microsoft Fases No tiene Fases No tiene Muestreo Exploración Manipulación Modelado Valoración Definir el problema Preparar los datos Explorar los datos Generar modelos Explorar y validar los modelos Implementar y actualizar los modelos Microsoft Iterativo e interactivo entre fases SAS Iterativo e interactivo entre fases Modelo de referencia No se especifica No se especifica Guía de usuario Se centra en los Se centra en las Se centra en los objetivos características técnicas del empresariales del proyecto empresariales del desarrollo del proceso proyecto Tabla 1: Cuadro comparativo de metodologías Página 21 de287 objetivos Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 22 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4. La metodología CRISP-DM 4.1. Introducción 4.1.1. La Metodología CRISP-DM 4.1.1.1. Interrupción jerárquica La metodología de CRISP-DM está descrita en términos de un modelo de proceso jerárquico consistente en un conjunto de tareas descritas en cuatro niveles de abstracción (de lo general a lo específico): fase, tarea genérica, tarea especializada, e instancia de procesos. (Ver figura 4.) Figura 4: Cuatro niveles de interrupción de la metodología CRISP-DM En el nivel superior, el proceso de minería de datos es organizado en un número de fases; cada fase consiste de varias tareas genéricas de segundo nivel. Este segundo nivel es llamado genérico porque esta destinado a ser bastante general para cubrir todas las situaciones posibles de minería de datos. Las tareas genéricas están destinadas a ser tan completas y estables como sea posible. Completo significa que cubre tanto al proceso entero de minería de datos como todas las aplicaciones de minería de datos posibles. Estable significa que el modelo debería ser válido para acontecimientos normales y aún para desarrollos imprevistos como técnicas de modelado nuevo. El tercer nivel, el nivel de tarea especializado, es el lugar para describir como las acciones en las tareas genéricas deberían ser realizadas en ciertas situaciones específicas. Por ejemplo, en el segundo nivel podría haber una tarea genérica llamada limpieza de datos. El tercer nivel describe como esta tarea se distingue en situaciones diferentes, como la limpieza de valores numéricos contra la limpieza de valores categóricos, o si el tipo de problema es de agrupamiento o de modelado predictivo. La descripción de fases y tareas como pasos discretos realizados en un orden específico representa una secuencia idealizada de eventos. En la práctica, muchas de las tareas pueden ser realizadas en un orden diferente, y esto a menudo es necesario para volver a hacer tareas anteriores repetidamente y repetir ciertas acciones. Este modelo Página 23 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS de proceso no intenta capturar todas estas posibles rutas del proceso de la minería de datos porque esto requeriría un modelo de proceso demasiado complejo. El cuarto nivel, la instancia de proceso, es un registro de las acciones, decisiones, y de los resultados de una minería de datos real. Una instancia de proceso esta organizado según las tareas definidas en los niveles más altos, pero representa más bien lo que en realidad sucede en un caso particular que lo que sucede en general. 4.1.1.2. Modelo de referencia y guía de usuario Horizontalmente, la metodología de CRISP-DM distingue entre el modelo de referencia y la guía de usuario. El modelo de referencia presenta una descripción rápida de fases, las tareas, y sus salidas, y describe que hacer en el proyecto de minería de datos. La guía de usuario da consejos más detallados e insinuaciones para cada fase y cada tarea dentro de una fase, y representa como realizar un proyecto de minería de datos. 4.1.2. Pasaje de modelos genéricos a modelos especializados 4.1.2.1. Contexto de la minería de datos El contexto de minería de datos traza un mapa entre lo genérico y el nivel especializado en CRISPDM. Actualmente se distinguen cuatro dimensiones diferentes de contextos de minería de datos: • • • • El dominio de aplicación es el área específica en la que el proyecto de minería de datos toma lugar. Los tipos de problemas de minería de datos describen la(s) clase(s) específica(s) de objetivo(s) con el que el proyecto de minería de datos trata. El aspecto técnico cubre cuestiones específicas en minería de datos que describe diferentes (técnicas) dificultades que por lo general ocurren durante la minería de datos. La herramienta y las especificaciones de dimensión técnica en la que las herramienta(s) de minería de datos y/o técnicas son aplicadas durante el proyecto de minería de datos. La Tabla 2 resume estas dimensiones de contextos de minería de datos y muestra ejemplos específicos para cada dimensión. Dimensión Dominio Aplicación Modelar Respuesta Realizar Predicción Realizar Predicción Ejemplos Contexto Data Mining Tipo Aspecto Problema Técnico Data Mining Descripción y Valores por sumarización omisión Segmentación Outliers Descripción Outliers Concepto Clasificación Predicción Análisis Dependencia Herramienta y Técnica Clementine Mineset Decision Tree Decision Tree Tabla 2: Dimensión de contextos y ejemplos de minería de datos Página 24 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Un contexto específico de minería de datos es un valor concreto para una o más de estas dimensiones. Por ejemplo, un proyecto de minería de datos tratando con un problema de clasificación que se revuelve con la predicción constituye un contexto específico. Lo más específico (los valores) para las dimensiones de contextos diferentes son fijadas (especificadas), lo mas concreto es el contexto de minería de datos. 4.1.2.2. Pasaje con contextos Se distinguen dos tipos diferentes de pasajes (plan) entre el nivel genérico y un especializado en el CRISP-DM: • Pasaje para el presente: Si sólo se aplica el modelo de proceso genérico para realizar un proyecto de minería simple e intentar pasar de tareas genéricas y sus descripciones al proyecto específico como requerido, se habla sobre un pasaje solo para (probablemente) un solo uso. • Pasaje para el futuro: Si sistemáticamente se especializa el modelo de proceso genérico según un contexto predefinido (o se analiza sistemáticamente de modo similar y consolidando las experiencias de un único proyecto hacia un modelo de proceso especializado para el uso futuro en contextos comparables), se habla explícitamente de la sobre escritura de un modelo de proceso especializado en términos de CRISP-DM. Cualquiera de los tipos de trazados es apropiado según sus propios objetivos, depende de su contexto de minería de datos específicos y las necesidades de su organización. 4.1.2.3. Pasaje La estrategia básica para pasar un mapa del modelo de proceso genérico al nivel especializado es la misma para ambos tipos de pasaje: • • • • • Analizar su contexto específico. Quitar cualquier detalle no aplicable a su contexto. Agregar cualquier detalle específico a su contexto. Especializar (o instanciar) el contenido genérico según las características concretas de su contexto. Renombrar el contenido genérico posible para proporcionar significados más explícitos en su contexto para la aclaración. 4.2. El modelo de referencia CRISP-DM El modelo de proceso corriente para la minería de datos proporciona una descripción del ciclo de vida del proyecto de minería de datos. Este contiene las fases de un proyecto, sus tareas respectivas, y las relaciones entre estas tareas. En este nivel de descripción, no es posible identificar todas las relaciones. Las relaciones podrían existir entre cualquier tarea de minería de datos según los objetivos, el contexto, y -lo más importante- el interés del usuario sobre los datos. El ciclo de vida del proyecto de minería de datos consiste en seis fases, se muestran en la Figura 2 (Fases del proceso de modelado metodología CRISP-DM). La secuencia de las fases no es rígida. Página 25 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El movimiento hacia adelante y hacia atrás entre fases diferentes es siempre requerido. El resultado de cada fase determina que la fase o la tarea particular de una fase tienen que ser realizados después. Las flechas indican las más importantes y frecuentes dependencias entre fases. El círculo externo en la Figura 2 simboliza la naturaleza cíclica de la minería de datos. La minería de datos no se termina una vez que la solución es desplegada. Las informaciones ocultas (lecciones ocultas) durante el proceso y la solución desplegada pueden provocar nuevas y a menudo más preguntas enfocadas en el negocio. Los procesos de minería subsecuentes se beneficiarán de las experiencias previas. A continuación se describe brevemente cada fase: • • • • • • Comprensión del Negocio: Esta fase inicial se enfoca en la comprensión de los objetivos de proyecto y exigencias desde una perspectiva de negocio, luego se convierte este conocimiento de los datos en la definición de un problema de minería de datos y en un plan preliminar diseñado para alcanzar los objetivos. Comprensión de los datos: La fase de entendimiento de datos comienza con la colección de datos inicial y continúa con las actividades que permiten familiarizarse con los datos, identificar los problemas de calidad de datos, descubrir los primeros conocimientos en los datos, y/o descubrir subconjuntos interesantes para formar hipótesis en cuanto a la información oculta. Preparación de Datos: La fase de Preparación de Datos cubre todas las actividades necesarias para construir el conjunto de datos final (los datos que serán provistos por las herramientas de modelado) de los datos en bruto iniciales. Las tareas de Preparación de Datos probablemente van a ser realizadas muchas veces y no en cualquier orden prescripto. Las tareas incluyen la selección de tablas, registros y atributos, así como la transformación y la limpieza de datos para las herramientas que modelan. Modelado: En esta fase, varias técnicas de modelado son seleccionadas y aplicadas, y sus parámetros son calibrados a valores óptimos. Típicamente hay varias técnicas para el mismo tipo de problema de minería de datos. Algunas técnicas tienen requerimientos específicos sobre la forma de datos. Por lo tanto, volver a la fase de Preparación de Datos es a menudo necesario. Evaluación: En esta etapa en el proyecto, se ha construido un modelo (o modelos) que parece tener una alta calidad de la perspectiva de análisis de datos. Antes de proceder al despliegue final del modelo es importante evaluar a fondo el modelo y la revisión de los pasos ejecutados para crearlo para comparar el modelo correctamente obtenido con los objetivos de negocio. Un objetivo clave es determinar si hay alguna cuestión importante de negocio que no ha sido suficientemente considerada. En el final de esta fase, una decisión en el uso de los resultados de minería de datos debería ser tomada. Desarrollo: La creación del modelo no es generalmente el final del proyecto. Incluso si el objetivo del modelo es de aumentar el conocimiento de los datos, el conocimiento ganado debería ser organizado y presentado en el modo en el que el cliente pueda usarlo. Ello a menudo implica la aplicación de modelos "vivos" dentro de un proceso de toma de decisiones de una organización, por ejemplo, en tiempo real la personalización de página Web o la repetida obtención de bases de datos de mercadeo. Dependiendo de los requerimientos, la fase de desarrollo puede ser tan simple como la generación de un informe o tan compleja como la realización repetida de un proceso cruzado de minería de datos a través de la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva el paso de desarrollo. Sin embargo, incluso si el analista realizara el esfuerzo de despliegue, esto es importante para el cliente para entender que acciones necesitan ser ejecutadas en orden para hacer uso de los modelos creados en ese momento. Página 26 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS La figura 5 presenta un contexto de fases acompañadas por tareas genéricas y las salidas. En las secciones siguientes, se describen cada tarea genérica y sus salidas más detalladamente. La atención es enfocada en descripciones de tarea y resúmenes de salidas. Figura 5: Tareas genéricas y salidas del modelo de referencia CRISP-DM 4.2.1. Comprensión del Negocio La primera etapa de la metodología apunta a la comprensión de los objetivos del proyecto desde el punto de vista de los objetivos de negocio. En función del conocimiento obtenido del negocio se plantea un problema de minería de datos. En esta etapa se desarrollan los pasos preliminares para lograr los objetivos del negocio con herramientas de minería de datos. Página 27 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Figura 6: Comprensión del Negocio 4.2.1.1. Determinación de objetivos de negocio Tarea: Determinar los objetivos de negocio El primer objetivo para un contexto es entender desde una perspectiva de negocio lo que el cliente realmente quiere lograr. A menudo el cliente tiene muchos objetivos que compiten y restricciones que deben ser correctamente equilibrados. El objetivo debe ser mostrar (destapar) factores importantes, al principio esto puede influir en el resultado del proyecto. Una consecuencia posible de la negligencia de este paso es gastar un gran esfuerzo produciendo respuestas correctas a preguntas incorrectas o erradas. Salida: Contexto Se registra la información que se conoce sobre la situación de negocio de la organización en el principio del proyecto. Objetivos de negocio Se describe el objetivo primario del cliente, desde una perspectiva de negocio. Además de los objetivos del negocio primario allí hay típicamente otras preguntas de negocio relacionadas con lo que al cliente le gustaría administrar. Por ejemplo, el objetivo primario del negocio podría ser mantener a clientes corrientes por predicción cuando ellos son propensos a moverse a un competidor. Los ejemplos de preguntas relacionadas de negocio son ¿Cómo el uso del canal Página 28 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS primario (por ejemplo, ATM, visita al negocio, Internet) afecta si los clientes se quedan o se van? o ¿Bajar los honorarios de ATM considerablemente reducirá el número de los clientes más importante que se irán? Criterios de éxito de negocio Se describen los criterios para un resultado acertado o útil al proyecto desde el punto de vista del negocio. Esto podría ser bastante específico y capaz de ser medido objetivamente, por ejemplo, la reducción de clientes se revuelve a un cierto nivel o valor, o esto podría ser general y subjetivo, como “dar ideas útiles en las relaciones”. En este último caso, debería indicarse quien hace el juicio subjetivo. 4.2.1.2. Evaluación de la situación Tarea: Evaluar la situación Esta tarea implica la investigación más detallada sobre todos los recursos, restricciones, presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de análisis de datos y el plan de proyecto. En la tarea anterior, su objetivo es ponerse rápidamente al día con la situación. Aquí se quiere ampliar sobre los detalles. Salida: Inventario de recursos Se listan los recursos disponibles para el proyecto, incluyendo el personal (expertos de negocio, expertos de datos, soportes técnicos, expertos en minería de datos), datos (extractos fijos, aproximaciones a la vida real, almacenes de datos, o datos operacionales), recursos computacionales (plataformas de hardware), y software (herramientas de minería de datos, otros software relevantes). Requerimientos, presunciones, y restricciones Se listan todos los requerimientos del proyecto, incluyendo el programa de terminación, la comprensibilidad y calidad de los resultados, y la seguridad, así como las cuestiones legales. Como parte de esta salida se debe asegurar que se permita usar los datos. Se listan las presunciones hechas por el proyecto. Estas pueden ser presunciones sobre los datos que pueden ser verificados durante la minería de datos, pero también puede incluir presunciones no comprobables sobre el negocio relacionado con el proyecto. Es en particular importante listar si esto afectará la validez de los resultados. Se listan las restricciones sobre el proyecto. Estas pueden ser restricciones sobre la disponibilidad de recursos, pero puede también incluir coacciones tecnológicas como el tamaño de conjunto de datos lo que es práctico para usar el modelado. Riesgos y contingencias Se listan los riesgos o los acontecimientos que podrían retrasar el proyecto o hacer que falle. Se listan los planes de contingencia correspondientes, que acción será tomada si estos riesgos o acontecimientos ocurren. Página 29 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Terminología Se compila un glosario de terminología relevante al proyecto. Esto puede incluir dos componentes: (1) Un glosario de terminología relevante del negocio, que forma parte de la comprensión del negocio disponible al proyecto. La construcción de este glosario es una útil “evocación al conocimiento” y un ejercicio de educación. (2) Un glosario de terminología de minería de datos, ilustrada con ejemplos relevantes al problema del negocio en cuestión. Costos y beneficios Se construye un análisis de costo-beneficio para el proyecto, que compare los gastos del proyecto con los beneficios potenciales al negocio si esto es exitoso. La comparación debería ser tan específica como sea posible. Por ejemplo, usar medidas monetarias en una situación comercial. 4.2.1.3. Determinación de los objetivos de la minería de datos Tarea: Determinar los objetivos de la minería de datos Un objetivo de negocio declara objetivos en la terminología de negocio. Un objetivo de minería de datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría ser “Aumentar catálogos de ventas a clientes existentes.” Un objetivo de minería de datos podría ser “Predecir cuantas baratijas un cliente comprará, obteniendo datos de sus compras de tres años pasados, información demográfica (edad, sueldo, ciudad, etc.), y el precio del artículo.” Salida: Objetivos de la minería de datos Se describen las salidas intencionadas del proyecto que permiten el logro de los objetivos de negocio. Criterios de éxito de la minería de datos Se definen los criterios de un resultado exitoso para el proyecto en términos técnicos por ejemplo, un cierto nivel de predicción precisa o un perfil de inclinación a comprar con un determinado grado de "elevación". Como con un criterio de éxito de negocio, puede ser necesario describir estos en términos subjetivos, en este caso la persona o las personas que hacen el juicio subjetivo deberían ser identificadas. 4.2.1.4. Producir el plan del proyecto Tarea: Producir el plan del proyecto Se describe el plan intencionado para alcanzar los objetivos de minería de datos y así alcanzar los objetivos de negocio. El plan debería especificar los pasos para ser realizados durante el resto del proyecto, incluyendo la selección inicial de herramientas y técnicas. Página 30 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Plan del Proyecto Se listan las etapas a ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos, entradas, salidas, y dependencias. Donde sea posible, se debe hacer explícita la iteración en gran escala en el proceso de minería de datos. Por ejemplo, las repeticiones del modelado y las fases de evaluación. Como parte del plan de proyecto es también importante analizar dependencias entre la planificación de tiempo y los riesgos. Se marcan los resultados de estos análisis explícitamente en el plan de proyecto, idealmente con acciones y recomendaciones si los riesgos se manifiestan. El plan de proyecto contiene proyectos detallados para cada fase. Se decide en este punto que estrategia de evaluación será usada en la fase de evaluación. El plan de proyecto es un documento dinámico debido a que en el final de cada fase son necesarios una revisión del progreso y logros y es recomendada una actualización correspondiente del plan de proyecto. Los puntos de revisión específicas para estas actualizaciones son parte del plan del proyecto. Evaluación inicial de herramientas y técnicas En el final de la primera fase, una evaluación inicial de herramientas y técnicas debería ser realizada. Aquí, por ejemplo, se puede seleccionar una herramienta de minería de datos que soporte varios métodos para las distintas etapas del proceso. Es importante evaluar herramientas y técnicas tempranamente en el proceso desde la selección de herramientas y técnicas y esto puede influir en el proyecto entero. 4.2.2. Comprensión de Datos En esta fase se desarrolla el entendimiento de datos y todas aquellas actividades relacionadas con la limpieza de datos, identificación de problemas vinculados con la toma de datos, procedimientos para determinar la calidad de datos y todo lo tendiente a facilitar la familiarización con los datos. A partir de esta etapa se determinan los primeros subconjuntos de datos que pueden contener la información que se está buscando. Página 31 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Figura 7: Comprensión de Datos 4.2.2.1. Recolección de datos iniciales Tarea: Recolectar datos iniciales Se adquieren en el proyecto los datos (o el acceso a los datos) listados en los recursos del proyecto. Esta colección inicial incluye carga de datos, si es necesario para la comprensión de los datos. Por ejemplo, si se usa un instrumento específico para la comprensión de los datos, esto perfectamente se entiende para abrir sus datos en esta herramienta. Este esfuerzo posiblemente conduce a los pasos iniciales de Preparación de Datos. Si se adquieren datos de múltiples fuentes, la integración es una cuestión adicional, aquí o más tarde en las fases de Preparación de Datos. Salida: Informe de colección de datos inicial Se lista el conjunto de dato(s) adquirido(s), juntos con sus posiciones, los métodos usados para adquirirlos, y algunos de los problemas encontrados. Se registran los problemas encontrados y algunas de las resoluciones alcanzadas. Esto ayuda a la réplica (observación) futura del proyecto o a la ejecución de proyectos similares futuros. Página 32 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.2.2.2. Describir los datos Tarea: Describir los datos Se examinan las propiedades "gruesas" o "superficiales" de los datos e informes adquiridos en los resultados. Salida: Informe de descripción de datos Se describen los datos que han sido adquiridos, incluyendo su formato, la cantidad de datos (por ejemplo, el número de registros y campos en cada tabla), los identificadores de los campos, y cualquier otro rasgo superficial que ha sido descubierto. Se evalúa si los datos adquiridos satisfacen las exigencias relevantes. 4.2.2.3. Explorar los datos Tarea: Explorar los datos Esta tarea dirige interrogantes de minería de datos usando preguntas, visualización, y técnicas de reporte. Estos incluyen la distribución de atributos claves (por ejemplo, el atributo objetivo de una tarea de predicción) relacionados entre pares o pequeños números de atributos, los resultados de simples agregaciones, las propiedades de las subpoblaciones significativas, y análisis estadísticos simples. Estos análisis directamente pueden dirigir los objetivos de minería de datos; ellos también pueden contribuir o refinar la descripción de datos e informes de calidad, y alimentar en la transformación y otros pasos de Preparación de Datos necesarios para análisis futuros. Salida: Informe de exploración de datos Se describen los resultados de esta tarea, incluyendo primeras conclusiones o hipótesis iniciales y su impacto sobre el resto del proyecto. Si es apropiado, se pueden incluir gráficos y plots para indicar las características de datos que sugieren más examen de subconjuntos de datos interesantes. 4.2.2.4. Verificar la calidad de los datos Tarea: Verificar la calidad de los datos Se examina la calidad de los datos, dirigiendo preguntas como: ¿Los datos están completos? ¿Esto cubre todo los casos requeridos? ¿Son correctos, o estos contienen errores y, si hay errores, que tan comunes son estos? ¿Hay valores omitidos en los datos? Si es así, ¿como se representan estos, donde ocurre esto, y que tan comunes son estos? Salida: Informe de calidad de datos Se listan los resultados de la verificación de calidad de datos; si existen problemas de calidad, se listan las posibles soluciones. Las soluciones a los problemas de calidad de datos generalmente dependen tanto del conocimiento de los datos como del negocio. 4.2.3. Preparación de Datos Página 33 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS En esta etapa se desarrollan las actividades para construir el conjunto de datos final. Aquí se relaciona directamente el formato de los datos obtenidos con las herramientas de minería de datos a utilizar. La tarea de Preparación de Datos probablemente será desarrollada en más de una fase en paralelo a lo largo de todo el proyecto. Esta fase y sus tareas están vinculados con los aspectos técnicos de sistemas como lo son las base de datos, tablas, registros, documentos electrónicos y todos los programas / procesos para la transformación de los datos en información utilizable por los modelos de minería de datos. Figura 8: Preparación de Datos Salida: Conjunto de datos Este es el conjunto (o conjuntos) producido por la fase de Preparación de Datos, que es usada para modelar o para el trabajo principal de análisis del proyecto. Página 34 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Descripción del conjunto de datos Se describe el conjunto de datos (o conjuntos) que es usado para el modelado y el trabajo principal de análisis del proyecto. 4.2.3.1. Selección de datos Tarea: Seleccionar datos Se decide si los datos son usados para el análisis. Los criterios incluyen tanto la importancia a los objetivos de la minería de datos, la calidad, y las restricciones técnicas como los límites sobre el volumen de datos o los tipos de datos. La selección de datos puede cubrir tanto la selección de atributos (columnas) como la selección de registros (filas) en una tabla. Salida: Razonamiento para la inclusión/exclusión Se listan los datos para ser incluidos o excluidos y los motivos para estas decisiones. 4.2.3.2. Limpieza de datos Tarea: Limpiar datos Se eleva la calidad de los datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de los subconjuntos de datos limpios, la inserción de datos por defecto adecuados, o técnicas más ambiciosas tales como la estimación de datos faltantes mediante modelado. Salida: Informe de la limpieza de los datos Se describe que decisiones y acciones fueron tomadas para dirigir los problemas de calidad de datos informados durante la tarea de Verificación de Calidad de Datos de la fase de Comprensión de Datos. Las transformaciones de los datos para una apropiada limpieza y el posible impacto en el análisis de resultados deberían ser considerados. 4.2.3.3. Construir datos Tarea: Construir datos Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción de atributos derivados o el ingreso de nuevos registros, o la transformación de valores para atributos existentes. Salidas: Atributos derivados Los atributos derivados son los atributos nuevos que son construidos de uno o más atributos existentes en el mismo registro. Ejemplo: área = longitud x anchura. Página 35 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Registros generados Se describe la creación de registros completamente nuevos. Ejemplo: Crear registros para los clientes quienes no hicieron compras durante el año pasado. No habría ninguna razón de tener tales registros en los datos brutos, pero para el objetivo del modelado esto podría tener sentido para representar explícitamente el hecho que ciertos clientes no hayan hecho ninguna compra. 4.2.3.4. Integrar datos Tarea: Integrar datos Estos son los métodos por el cual la información es combinada desde múltiples tablas o registros para crear nuevos registros o valores. Salida: Combinación de datos La combinación de tablas se refiere a la unión simultánea de dos o más tablas que tienen información diferente sobre el mismo objeto. Ejemplo: una cadena de venta al público tiene una tabla con la información sobre las características generales de cada tienda (por ejemplo, el espacio, el tipo de comercio), otra tabla con datos resumidos de las ventas (por ejemplo, el beneficio, el cambio porcentual en ventas desde el año anterior), y la otra con información sobre los datos demográficos del área circundante. Cada una de estas tablas contiene un registro para cada tienda. Estas tablas pueden ser combinadas simultáneamente en una nueva tabla con un registro para cada tienda, combinando campos de las tablas fuentes. Los datos combinados también cubren agregaciones. La agregación se refiere a operaciones en la que nuevos valores de información resumida son calculados desde múltiples registros y/o tablas. Por ejemplo, convirtiendo una tabla de compra de clientes donde hay un registro para cada compra en una tabla nueva donde hay un registro para cada cliente, con campos tales como el número de compras, el promedio de la cantidad de compra, el porcentaje de ordenes cobrados a tarjeta de crédito, el porcentaje de artículos bajo promoción, etc. 4.2.3.5. Formatear datos Tarea: Formatear datos Se refiere a modificaciones principalmente sintácticas hechas a los datos que no cambian su significado, pero podría ser requerido por la herramienta de modelado. Salida: Datos reformateados Algunas herramientas tienen requerimientos sobre el orden de los atributos, tales como el primer campo que es un único identificador para cada registro o el último campo que es el campo resultado que el modelo debe predecir. Podría ser importante cambiar el orden de los registros en el conjunto de datos. Quizás la herramienta de modelado requiere que los registros sean clasificados según el valor del atributo de resultado. Página 36 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Comúnmente, los registros del conjunto de datos son ordenados al principio de algún modo, pero el algoritmo que modela necesita que ellos estén en un orden moderadamente arbitrario. Por ejemplo, cuando se usan redes neuronales, esto es generalmente mejor para los registros para ser presentados en un orden aleatorio, aunque algunas herramientas manejen esto automáticamente sin la intervención explicita del usuario. Además, hay cambios puramente sintácticos hechos para satisfacer las exigencias de la herramienta de modelado específica. Ejemplos: el quitar las comas de adentro de campos de texto en ficheros de datos delimitados por coma, cortar todos los valores a un máximo de 32 caracteres. 4.2.4. Modelado En esta fase se eligen diferentes técnicas de modelado de datos y se estudian y ajustan parámetros con los valores correctos para el proyecto. Existen en el universo tecnológico muchas técnicas para la resolución del mismo problema de minería de datos. Es altamente probable que desde el modelado sea necesario volver a la fase de preparación de datos puesto que todas las técnicas en evaluación pueden tener requisitos de formato de datos diferentes. Durante esta etapa los datos son procesados más de una vez posiblemente por cada herramienta. Figura 9: Modelado Página 37 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.2.4.1. Selección de la técnica de modelado Tarea: Escoger la técnica de modelado Como primer paso en modelado, se debe seleccionar la técnica de modelado real que va a ser usado. Aunque se haya podido seleccionar una herramienta durante la fase de Comprensión del Negocio, esta tarea se refiere a la técnica de modelado específico, por ejemplo, un árbol de decisión construido con C4.5, o la generación de redes neuronales Back-Propagación. Si múltiples técnicas son aplicadas, se realiza esta tarea separadamente para cada técnica. Salida: Técnicas de modelado Se documenta la técnica de modelado real que se está por usar. Presunciones del modelado Muchas técnicas de modelado hacen presunciones específicas sobre los datos como por ejemplo que todos los atributos tengan distribuciones uniformes, no encontrar valores no permitidos, el atributo de clase debe ser simbólico, etc. Se debe registrar cualquiera de tales presunciones hechas. 4.2.4.2. Generación de la prueba de diseño Tarea: Generar la prueba de diseño Antes de construir un modelo, se debe generar un procedimiento o el mecanismo para probar la calidad y validez del modelo. Por ejemplo, en tareas de minería de datos supervisados como la clasificación, es común usar tasas de errores como medida de calidad para modelos de minería de datos. Por lo tanto, típicamente se separa el conjunto de datos en una serie y en un conjunto de prueba construimos el modelo sobre el conjunto de series, y se estima su calidad sobre el conjunto de prueba separado. Salida: Prueba de diseño Se describe el plan intencionado para el entrenamiento, la prueba, y la evaluación de los modelos. Un componente primario del plan determina como dividir un conjunto de datos disponible en datos de entrenamiento, datos de prueba, y conjunto de datos de validación. 4.2.4.3. Construcción del modelo Tarea: Construir el modelo Se ejecuta la herramienta de modelado sobre el conjunto de datos preparados para crear uno o más modelos. Salidas: Parámetros de ajustes Página 38 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Con cualquier herramienta de modelado, hay a menudo un gran número de parámetros que pueden ser ajustados. Se listan los parámetros y sus valores escogidos, también con el razonamiento para elegir los parámetros de ajustes. Modelos Estos son los modelos reales producidos por la herramienta de modelado, no un informe. Descripciones del modelo Se describen los modelos obtenidos. Se informa sobre la interpretación de los modelos y se documenta cualquier dificultad encontrada con sus significados. 4.2.4.4. Evaluación del modelo Tarea: Evaluar el modelo Se interpretan los modelos según su conocimiento de dominio, los criterios de éxitos de minería de datos, y el diseño de prueba deseado. Se juzga el éxito de la aplicación del modelado y se descubren técnicas mas técnicamente; se necesita tomar contacto con analistas de negocio y expertos en el dominio luego para hablar de los resultados de la minería de datos en el contexto de negocio. Se nota que esta tarea sólo se considera para modelos, mientras que la fase de evaluación también toma en cuenta todos los otros resultados que fueron producidos en el curso del proyecto. Se intenta clasificar los modelos. Se evalúan los modelos según los criterios de evaluación. Tanto como es posible, también se tiene en cuenta objetivos del negocio y criterios de éxito de negocio. En los grandes proyectos de minería de datos, se aplica una sola técnica más de una vez, o se generan resultados de minería de datos con varias técnicas diferentes. En esta tarea, se comparan todos los resultados según los criterios de evaluación. Salida: Evaluación de modelos Se resumen los resultados de esta tarea, se listan las calidades de los modelos generados (por ejemplo, en términos de exactitud), y se clasifican su calidad en relación con cada uno. Parámetros de ajustes revisados Según la evaluación del modelo, se revisan los parámetros de ajuste para la siguiente corrida en la tarea de Construcción del Modelo. Se repite la construcción y evaluación del modelo hasta que se encuentre el/los mejor/es modelo/s. Se documenta todo, tanto las revisiones como las evaluaciones. 4.2.5. Evaluación Hasta esta fase se han obtenido algunos modelos de minería de datos con sus datos y parámetros establecidos en forma óptima pero antes de pasar a la etapa final es necesario evaluar los resultados obtenidos por la ejecución de los programas en función de los objetivos de negocio. Aquí se puede presentar la necesidad de eliminar, modificar o considerar nuevas cuestiones relacionadas con el negocio. Al final de la fase probablemente se tomarán algunas decisiones. Página 39 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Figura 10: Evaluación 4.2.5.1. Evaluación de los resultados Tarea: Evaluar los resultados Los pasos de la evaluación anterior tratan con factores como la exactitud y la generalidad del modelo. Este paso evalúa el grado al que el modelo responde (encuentra) los objetivos de negocio y procura determinar si hay alguna decisión de negocio por el que este modelo es deficiente. Otra opción de evaluación es probar el/los modelo/s sobre aplicaciones de prueba en la aplicación real, si el tiempo y las restricciones de presupuesto lo permiten. Además, la evaluación también verifica otros resultados generados por la minería de datos. Los resultados de la minería de datos implican modelos que necesariamente son relacionados con los objetivos originales de negocio y todas los otros descubrimientos que no son relacionados necesariamente con los objetivos originales de negocio, pero también podría revelar desafíos adicionales, información, o insinuaciones para futuras direcciones. Salida: Evaluación de los resultados de la minería de datos en lo que concierne a criterios de éxito de negocio Se resumen los resultados de evaluación en términos de criterios de éxito de negocio, incluyendo una declaración final en cuanto a si el proyecto ya encuentra los objetivos iniciales de negocio. Modelos aprobados Después de la evaluación de modelos en lo que concierne a criterios de éxito de negocio, los modelos generados que encuentran los criterios seleccionados son los modelos aprobados. Página 40 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.2.5.2. Proceso de revisión Tarea: Revisar el proceso En este punto, los modelos resultantes pasan a ser satisfactorios y a satisfacer las necesidades de negocio. Ahora es apropiado hacer una revisión más cuidadosa de los compromisos de la minería de datos para determinar si hay algún factor importante o tarea que de algún modo ha sido pasada por alto. Esta revisión también cubre cuestiones de calidad como por ejemplo: ¿Se construyó correctamente el modelo? ¿Se usan sólo los atributos que se permitieron usar y que están disponibles para análisis futuros? Salida: Revisión de proceso Se resume la revisión de proceso y se destacan las actividades que han sido omitidas y/o aquellas que deberían ser repetidas. 4.2.5.3. Determinación de los próximos pasos Tarea: Determinar los próximos pasos Según los resultados de la evaluación y la revisión de proceso, se decide como proceder. Se decide si hay que terminar este proyecto y tomar medidas sobre el desarrollo si es apropiado, tanto iniciar más iteraciones, o comenzar nuevos proyectos de minería de datos. Esta tarea incluye los análisis de recursos restantes y del presupuesto, que puede influir en las decisiones. Salida: Lista de posibles acciones Se listan las acciones futuras potenciales, con los motivos a favor y en contra de cada opción. Decisión Se describe la decisión en cuanto a como proceder, junto con el razonamiento. 4.2.6. Desarrollo El final del proyecto no termina con el modelado de datos y su ejecución y posterior evaluación de los resultados puesto que el conocimiento obtenido hasta aquí debe ser presentado de forma clara y precisa a todos los actores dentro de la organización. Se puede presentar un simple informe de resultados, desarrollar una aplicación para la presentación de los resultados o bien instruir al usuario de los modelos para que ellos mismos generen y ejecuten los modelos con nuevos datos. Es importante al final de esta fase tener desarrollada toda la documentación del proyecto para dar independencia al usuario final en la utilización y generación de nuevos procesos de explotación de datos. Página 41 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Figura 11: Desarrollo 4.2.6.1. Desarrollo del plan Tarea: Desarrollar el plan De acuerdo al desarrollo de los resultados de minería de datos en el negocio, esta tarea toma los resultados de la evaluación y determina una estrategia para el desarrollo. Si un procedimiento general ha sido identificado para crear el/los modelo/s relevante/s, este procedimiento es documentado aquí para el desarrollo posterior. Salida: Desarrollo del plan Resumir la estrategia de desarrollo, incluyendo los pasos necesarios y como realizarlos. 4.2.6.2. Plan de supervisión y mantenimiento Tarea: Planear la supervisión y el mantenimiento La supervisión y el mantenimiento son cuestiones importantes si los resultados de minería de datos son parte del negocio cotidiano y de su ambiente. La preparación cuidadosa de una estrategia de mantenimiento ayuda a evitar largos periodos innecesarios de uso incorrecto de resultados de minería de datos. Para supervisar el desarrollo de los resultados de la minería de datos, el proyecto necesita un plan detallado de proceso de supervisión. Este plan tiene en cuenta el tipo específico de desarrollo. Página 42 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Supervisión y plan de mantenimiento Se resume la estrategia de supervisión y mantenimiento incluyendo los pasos necesarios y como realizarlos. 4.2.6.3. Informe definitivo de producto Tarea: Producir el informe final En el final del proyecto, se sobrescribe un informe final. Según el plan de desarrollo, este informe puede ser sólo un resumen del proyecto y sus experiencias (si éstas aún no han sido documentadas como una actividad en curso) o ésta puede ser una presentación final y comprensiva de los resultados de minería de datos. Salidas: Informe definitivo Esto es el informe escrito final del compromiso de la minería de datos. Esto incluye todo el desarrollo anterior, el resumen y la organización de los resultados. Presentación final También a menudo habrá una reunión en la conclusión del proyecto en el que los resultados son presentados verbalmente al cliente. 4.2.6.4. Revisión del proyecto Tarea: Revisar el proyecto Se evalúa lo que fue correcto y lo que se equivocó, lo que fue bien hecho y lo que necesita ser mejorado. Salida: Documentación de la experiencia Se resumen las experiencias importantes ganadas durante el proyecto. Por ejemplo, trampas, accesos engañosos, o las insinuaciones para seleccionar las mejores técnicas de minería de datos en situaciones similares podrían ser la parte de esta documentación. En proyectos ideales, la documentación de la experiencia también cubre cualquier informe que ha sido escrito por miembros individuales del proyecto durante las fases del proyecto y sus tareas. 4.3. La guía de usuario de CRISP-DM 4.3.1. Comprendiendo el negocio 4.3.1.1. Determinación de objetivos de negocio Tarea: Determinar objetivos de negocio El primer objetivo es comprender a fondo, desde una perspectiva de negocio, lo que el cliente realmente quiere lograr. A menudo el cliente tiene muchos objetivos y restricciones que compiten que deben ser correctamente equilibrados. El objetivo debe ser destapar factores importantes en el Página 43 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS principio del proyecto esto puede influir en el resultado final. Una consecuencia probable de descuidar este paso puede ser a expensas de un gran esfuerzo de producir las respuestas correctas a las preguntas incorrectas. Salida: Contexto Se debe cotejar la información sobre la situación de negocio de la organización al principio del proyecto. Estos detalles no sólo sirven para identificar más estrechamente los objetivos de negocio a ser alcanzados, sino también sirven para identificar los recursos, tanto humanos como materiales, que pueden ser usados durante el curso del proyecto. Actividades: Organizar • • • • • Desarrollar organigramas que identifiquen divisiones, departamentos, y grupos de proyectos. El organigrama debería también identificar los nombres de los gerentes y sus responsabilidades. Identificar a personas claves en el negocio y sus roles. Identificar a un patrocinador interno (el patrocinador financiero y el experto primario del dominio de usuario). Indicar si hay un comité de dirección y lista de miembros. Identificar las unidades de negocio que son afectadas por el proyecto de minería de datos (por ejemplo, el Control de comercialización, Ventas, Finanzas). Área del problema • • • • • • • Identificar el área del problema (por ejemplo, el control de comercialización, el cuidado de cliente, el desarrollo comercial, etc.). Describir el problema en términos generales. Comprobar el estado actual del proyecto (por ejemplo, comprobar si ya esta claro que dentro de la unidad de negocio un proyecto de minería de datos debe ser realizado, o si la minería de datos necesita ser promovida como una tecnología clave en el negocio). Clarificar los requisitos previos del proyecto (por ejemplo, ¿Cuál es la motivación del proyecto? ¿La minería de datos ya está siendo usada en el negocio?). Si es necesario, preparar presentaciones y demostraciones de minería de datos para el negocio. Identificar grupos de objetivos para el resultado de proyecto (por ejemplo, ¿Se espera entregar un informe para la dirección superior o un sistema operacional para ser usado por usuarios finales inexpertos?). Identificar las necesidades de los usuarios y sus expectativas. Solución actual • • Describir cualquier solución usada actualmente para dirigir el problema. Describir las ventajas y las desventajas de la solución corriente y el nivel al que esto es aceptado por los usuarios. Página 44 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Objetivos de negocio Describir el objetivo primario del cliente, desde una perspectiva de negocio. Además del objetivo de negocio primario, hay típicamente un gran número de preguntas relacionadas al negocio a las que al cliente le gustaría dirigir. Por ejemplo, el objetivo primario de negocio podría ser mantener a clientes actuales por predicción cuando ellos son propensos a moverse a un competidor, mientras un objetivo secundario de negocio podría ser el de determinar si precios (comisiones) inferiores afectan sólo un a segmento particular de clientes. Actividades • • • • De manera informal describir el problema a ser solucionado. Especificar todas las preguntas de negocio tan precisas como sea posible. Especificar cualquier otras exigencias de negocio (por ejemplo, el negocio no quiere perder a ningún cliente). Especificar las ventajas esperadas en términos de negocio. Se debe tener cuidado Se debe tener cuidado de establecer objetivos inalcanzables. Deben ser tan realistas como posibles y hechos por ellos. Salida: Criterios de éxito de negocio Describir los criterios para un resultado exitoso o útil al proyecto desde el punto de vista del negocio. Esto podría ser bastante específico y fácilmente medible, como una reducción de cliente a un cierto grado, o general y subjetivo, como “dar ideas útiles en las relaciones”. En el caso último, se debe estar seguro de indicar quien haría el juicio subjetivo. Actividades • • Especificar criterios de éxito de negocio (por ejemplo, Mejorar la tasa de respuesta en una campaña de correo en el 10 por ciento y marcar la tasa en el 20 por ciento). Identificar quien evalúa los criterios de éxito. Se debe recordar Cada uno de los criterios de éxito debería relacionarse con al menos uno de los objetivos especificados de negocio. Se recomienda Antes del comienzo de la evaluación de situación, se podría analizar las experiencias anteriores del problema. Internamente, usando CRISP-DM, o externamente, usando soluciones pre-empaquetadas. Página 45 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.3.1.2. Evaluación de la situación Tarea: Evaluar la situación Esta tarea implica una investigación más detallada sobre todos los recursos, restricciones, presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de análisis de datos y en el desarrollo del plan de proyecto. Salida: Inventario de recursos Listar los recursos disponibles para el proyecto, incluyendo el personal (expertos de datos y de negocios, soportes técnicos, expertos en minería de datos), datos (extracciones fijas, acceso a datos existentes en almacenes de datos u operacionales), recursos computacionales (plataformas de hardware), y software (instrumentos de minería de datos, otros software relevantes). Actividades: Recursos de Hardware • • • • Identificar el hardware básico. Establecer la disponibilidad del hardware básico para el proyecto de minería de datos. Comprobar si la planificación del mantenimiento de hardware se opone a la disponibilidad del hardware para el proyecto de minería de datos. Identificar el hardware disponible para ser usado por la herramienta de minería de datos (si el instrumento es conocido en esta etapa). Fuentes de datos y conocimientos • • • • • • Identificar las fuentes de datos. Identificar el tipo de fuentes de datos (fuentes en línea, expertos, documentación escrita, etc.). Identificar fuentes de conocimiento. Identificar el tipo de fuentes de conocimientos (fuentes en línea, expertos, documentación escrita, etc.). Comprobar herramientas disponibles y técnicas. Describir el conocimiento de generalidades relevantes (de manera informal o formal). Fuentes de personal • • • • Identificar al patrocinador del proyecto. Identificar al administrador de sistema, el administrador de base de datos, y el personal de soporte técnico para futuras preguntas. Identificar al analista de mercado, los expertos en minería de datos, y estadísticos, y comprobar su disponibilidad. Comprobar la disponibilidad de expertos de dominio para fases posteriores Se debe recordar Se debe recordar que el proyecto puede necesitar personal técnico en cualquier momento en todas partes del proyecto, por ejemplo durante la transformación de datos. Página 46 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salidas: Requerimientos, presunciones, y restricciones Listar todos los requerimientos del proyecto, incluyendo la planeación de la terminación, la comprensibilidad, y la calidad y seguridad de los resultados, así como cuestiones legales. Como parte de esta salida, se debe asegurar que se permiten usar los datos. Listar las presunciones hechas por el proyecto. Estos pueden ser presunciones sobre los datos, que pueden ser verificados durante la minería de datos, pero también puede incluir presunciones no comprobables relacionadas con el proyecto. Esto es en particular importante de ponerlos en una lista si ellos afectarán la validez de los resultados. Listar las restricciones hechas en el proyecto. Estas restricciones podrían implicar la carencia de recursos para terminar algunas tareas en el proyecto en el tiempo requerido, o pueden ser restricciones legales o éticas sobre el uso de los datos o la solución necesaria para terminar la tarea de minería de datos. Actividades: Requerimientos • • • • Especificar el perfil del grupo objetivo. Capturar todos los requerimientos en la planificación. Capturar los requerimientos de comprensibilidad, exactitud, desarrollar habilidades, mantenimiento, y repetibilidad del proyecto de minería de datos y los modelos resultantes. Capturar los requerimientos de seguridad, restricciones legales, de privacidad, información, y planificación de proyecto. Presunciones • • • • • Aclarar todas las presunciones (incluyendo las implícitas) y las hechas por ellos explícitamente (por ejemplo, dirigir las cuestiones de negocio, a un número mínimo de clientes con la edad por encima de 50 es necesaria). Listar las presunciones sobre calidad de datos (por ejemplo, exactitud, disponibilidad) Listar las presunciones sobre factores externos (por ejemplo, cuestiones económicas, productos competitivos, avances técnicos). Aclarar presunciones que conducen a cualquiera de las estimaciones (por ejemplo, el precio de un instrumento específico es asumido para ser menor que $ 1.000). Listar todas las presunciones en cuanto a si es necesario entender y describir o explicar el modelo (por ejemplo, cómo el modelo y los resultados son presentados a la dirección / patrocinador). Restricciones • • • • • Comprobar restricciones generales (por ejemplo, cuestiones legales, presupuesto, escalas de tiempo, y recursos). Comprobar el correcto acceso a fuentes de datos (por ejemplo, restricciones de acceso, la contraseña requerida). Comprobar la accesibilidad de técnica de datos (los sistemas operativos, el sistema de administración de datos, el formato de archivo y de base de datos). Comprobar si el conocimiento relevante es accesible. Comprobar restricciones de presupuesto (gastos fijos, gastos de implementación, etc.). Página 47 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Se debe recordar La lista de presunciones también incluye presunciones al principio del proyecto, esto es, lo que el punto de inicio del proyecto ha sido. Salidas: Riesgos y contingencias Listar los riesgos, es decir los acontecimientos que podrían ocurrir, impactando en la planificación, el costo, o el resultado. Listar los planes de contingencias respectivos: que acción será tomada para evitar o reducir al mínimo el impacto o recuperarse de la ocurrencia de los riesgos previstos. Actividades: Identificar riesgos • • • • • Identificar riesgos de negocio (por ejemplo, el competidor aparece primero con mejores resultados). Identificar riesgos de organización (por ejemplo, el departamento que solicita el proyecto no tiene financiación para el proyecto). Identificar riesgos financieros (por ejemplo, aumentar la financiación depende de los resultados iniciales de minería de datos). Identificar riesgos técnicos. Identificar los riesgos que dependen de datos y de las fuentes de datos (por ejemplo, la mala calidad y cobertura). Desarrollo de planes de contingencia • • Determinar condiciones en las que cada riesgo puede ocurrir. Desarrollar planes de contingencia. Salida: Terminología Compilar un glosario de terminología relevante al proyecto. Esto debería incluir al menos dos componentes: (1) Un glosario de terminología relevante de negocio, que forma parte de la comprensión de negocio disponible al proyecto. (2) Un glosario de terminología de minería de datos, ilustrada con ejemplos relevantes al problema de negocio en cuestión. Actividades • • • Comprobar la disponibilidad previa de glosarios; sino se debe comenzar a bosquejar glosarios. Hablar a expertos de dominio para entender la terminología. Familiarizarse con la terminología de negocio. Salida: Costos y beneficios Preparar un análisis de costo-beneficio para el proyecto, comparando los gastos del proyecto con el beneficio potencial para el negocio si esto es exitoso. Página 48 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Actividades • • • • Estimar el costo para la colección de datos. Estimar el costo de desarrollo y realización de una solución. Identificar beneficios (por ejemplo, mejorar la satisfacción del cliente, ROI, y el aumento de las ganancias). Estimar gastos de operación. Se recomienda La comparación debería ser tan específica como sea posible, cómo esto permite un mejor caso de negocio para ser realizado. Se debe tener cuidado Se deben identificar costos ocultos, como la extracción y preparación repetida de datos, cambios en los procesos laborales, y tiempo requerido para el entrenamiento. 4.3.1.3. Determinar objetivos de minería de datos Tarea: Determinar objetivos de minería de datos Un objetivo de negocio declara objetivos en la terminología de negocio; un objetivo de minería de datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría ser, “Aumentar la venta por catalogo a clientes existentes”, mientras un objetivo de minería de datos podría ser, “Predecir cuantas baratijas comprará un cliente, considerando sus compras durante los tres años pasados, información demográfica relevante, y el precio del artículo.” Salida: Objetivos de minería de datos Describir las salidas planeadas del proyecto que permiten el logro de los objetivos de negocio. Se debe tener en cuenta que estas son salidas normalmente técnicas. Actividades • • Traducir las preguntas de negocio a objetivos de minería de datos (por ejemplo, una campaña de control de comercialización requiere la segmentación de clientes para decidir a quien acercarse en esta campaña; el nivel/tamaño de los segmentos deberían ser especificados). Especificar datos, tipo de problema de minería de datos (por ejemplo, la clasificación, la descripción, la predicción, y clustering). Se recomienda Puede ser sabio redefinir el problema. Por ejemplo, modelar la retención de producto más que la retención del cliente cuando la retención del cliente entrega resultados muy tarde para afectar la salida. Página 49 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Criterios de éxitos de minería de datos Definir los criterios para un resultado acertado para el proyecto en términos técnicos, por ejemplo un cierto grado de exactitud predictiva o un perfil de propensión a comprar con un nivel dado "elevación". Cómo con los criterios de éxitos del negocio, puede ser necesario describir estos en términos subjetivos, en el caso de que la persona o las personas que hacen el juicio subjetivo debieran ser identificadas. Actividades • • • Especificar los criterios para evaluar el modelo (por ejemplo, la exactitud del modelo, el funcionamiento y la complejidad). Definir el patrón de pruebas para los criterios de evaluación. Especificar las reglas que dirigen criterios de evaluación subjetivos (por ejemplo, la habilidad de explicar del modelo y de los datos y la comprensión de mercadeo proporcionada por el modelo). Se debe tener cuidado Los datos que extraen criterios de éxito son diferentes a los criterios de éxito de negocio definidos antes. Se debe recordar Se debe recordar que es sabio planear para el desarrollo desde el principio del proyecto. 4.3.1.4. Producción del plan del proyecto Tarea: Producir el plan del proyecto Describir el plan propuesto para alcanzar los objetivos de minería de datos y así alcanzar los objetivos de negocio. Salida: Plan del Proyecto Listar las etapas para ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos, entradas, salidas, y dependencias. En cualquier parte donde sea posible, se deben hacer explícitas las iteraciones en gran escala en el proceso de minería de datos. Por ejemplo, las repeticiones del modelado y fases de evaluación. Como parte del plan de proyecto, es también importante analizar dependencias entre el planeamiento de los tiempos y los riesgos. Marcar los resultados de estos análisis explícitamente en el plan de proyecto, idealmente con acciones y recomendaciones para actuar si los riesgos son manifestados. Aunque esta sea la única tarea en la que el plan de proyecto directamente es llamado, sin embargo debería ser consultado continuamente y repasado en todas partes del proyecto. Debería ser consultado el plan de proyecto como mínimo siempre que una tarea nueva sea comenzada o una iteración futura de una tarea o una actividad este comenzando. Página 50 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Actividades • • • • • • • Definir el plan de proceso inicial y hablar de la viabilidad con todo el personal incluido. Combinar todos los objetivos identificados y técnicas seleccionadas en un procedimiento coherente que solucione las cuestiones del negocio y encuentre los criterios de éxito de negocio. Estimar el esfuerzo y los recursos necesarios para alcanzar y desarrollar la solución. Es útil considerar la experiencia de otras personas estimando escalas de tiempo para proyectos de minería de datos. Por ejemplo, es a menudo presumido que el 50-70 por ciento del tiempo y el esfuerzo en un proyecto de minería de datos es usado en la fase de Preparación de Datos, mientras que solo un 20-30 por ciento es usado en la fase de Comprensión de Datos, mientras que solo un 10-20 por ciento es gastado en cada uno de las fase de Modelado, Evaluación, y Comprensión del Negocio y el 5-10 por ciento en la fase de Desarrollo. Identificar pasos críticos. Marcar los puntos de decisión. Marcar los puntos de revisión. Identificar las principales iteraciones. Salida: Evaluación Inicial de herramientas y técnicas Al final de la primera fase, el equipo de proyecto realiza una evaluación inicial de herramientas y técnicas. Aquí, es importante seleccionar una herramienta de minería de datos que soporte varios métodos para las diferentes etapas del proceso, ya que la selección de herramientas y técnicas puede influir en el proyecto entero. Actividades • • • • Crear una lista de criterios de selección para herramientas y técnicas (o usar uno existente si está disponible). Escoger herramientas y técnicas posibles. Evaluar la adecuación de técnicas. Revisar y priorizar técnicas aplicables según la evaluación de soluciones alternativas 4.3.2. Comprensión de Datos 4.3.2.1. Recolección de datos iniciales Tarea: Recoger datos iniciales Obtener los datos (o el acceso a los datos) listados en los recursos de proyecto. Esta colección inicial incluye carga de datos, si es necesario para la Comprensión de Datos. Por ejemplo, si se tiene la intención de usar una herramienta específica para comprender los datos es lógico cargar los datos en esta herramienta. Salida: Informe de la recolección de datos inicial Se debe describir toda la variedad de datos usados para el proyecto, e incluir cualquier requerimiento de selección para datos más detallados. El informe de colección de datos también debería definir si algunos atributos son relativamente más importantes que otros. Página 51 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Se debe recordar que cualquier evaluación de calidad de datos debería ser hecha no solamente de las fuentes de datos individuales, sino también de algunos datos que son resultado de fuentes de datos que se combinan. Por inconsistencias entre las fuentes, los datos combinados pueden presentar los problemas que no existen en las fuentes de datos individuales. Actividades: Planificación de requerimientos de datos Se debe planear que información es necesaria (por ejemplo, sólo para atributos determinados, o la información adicional específica). Comprobar si toda la información necesaria (para resolver los objetivos de la minería de datos) esta en realidad disponible. Criterios de selección • • • • Se debe especificar los criterios de selección (por ejemplo, ¿Qué atributos son necesarios para los objetivos específicos de minería de datos? ¿Que atributos han sido identificados como no pertinentes? ¿Cuantos atributos se pueden manejar con las técnicas escogidas?). Elegir tablas/archivos de interés. Elegir datos dentro de una tabla/archivo. Pensar cuanto tiempo de un historial habría que usar (por ejemplo, si 18 meses de datos están disponibles, sólo 12 meses pueden ser necesarios para el ejercicio). Se debe tener cuidado Se debe estar consciente de que los datos recolectados de diferentes fuentes pueden dar lugar a problemas de calidad cuando sean combinados (por ejemplo, los archivos de dirección combinados con una base de datos de cliente pueden mostrar inconsistencias de formato, invalidez de datos, etc.). Inserción de datos • • • Si los datos contienen libre entradas de texto, ¿se tendrá que codificarlos para modelar o necesitamos agruparlos en entradas específicas? ¿Se pueden encontrar atributos omitidos? ¿Se puede mejorar la extracción los datos? Se recomienda Se debe recordar que algún conocimiento sobre los datos puede estar disponible de fuentes no electrónicas (por ejemplo, de gente, de texto impreso, etc.). Puede ser necesario un preproceso de los datos (datos de serie tiempo, promedios ponderados, etc.). 4.3.2.2. Descripción de datos Tarea: Describir datos Examinar las propiedades "gruesas" de los datos obtenidos y el informe sobre los resultados. Página 52 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Informe de descripción de datos Se deben describir los datos que han sido obtenidos, incluyendo el formato de los datos, la cantidad de los datos (por ejemplo, el número de registros y campos internos de cada tabla), las identidades de los campos, y cualquier otro rasgo superficial que haya sido descubierto. Actividades: Análisis volumétrico de datos • • • • • • Identificar datos y métodos de captura. Acceder a las fuentes de datos. Usar análisis estadísticos si es apropiado. Reportar las tablas y sus relaciones. Comprobar el volumen de datos, el número de múltiplos, la complejidad. Notar si los datos contienen entradas de texto libres. Atributo, tipos y valores • • • • • • • • • • • Comprobar la accesibilidad y disponibilidad de atributos. Comprobar los tipos de atributos (numérico, simbólico, la taxonomía, etc.). Comprobar el rango de valores de los atributos. Analizar los atributos correlativos (correlaciones de atributo). Comprender el significado de cada atributo y clasificar (describir) el valor en términos de negocio. Para cada atributo se debe calcular la estadística básica (por ejemplo, calcular la distribución, el promedio, el máximo, el mínimo, la desviación estándar, la varianza, la moda, la inclinación, etc.). Analizar la estadística básica y relacionar los resultados con su significado en términos de negocio. Decidir si el atributo es relevante para los objetivos específicos de la minería de datos. Determinar si el significado del atributo es usado coherentemente (conscientemente). Entrevistar a expertos de dominio para obtener su opinión sobre la importancia de los atributos. Decidir si es necesario equilibrar los datos (basado en las técnicas a ser usadas). Claves • • Se deben analizar relaciones claves. Se debe comprobar la cantidad de coincidencias entre valores de atributos claves a través de tablas. Revisión de Objetivos/Presunciones Se debe actualizar la lista de presunciones, si es necesario. Página 53 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.3.2.3. Exploración de datos Tarea: Explorar datos Esta tarea aborda las preguntas de minería de datos que pueden ser dirigidas usando la interrogación, la visualización, y técnicas de informe. Estos análisis pueden directamente dirigir los objetivos de minería de datos. Sin embargo, ellos pueden también contribuir a refinar la descripción de datos e informes de calidad, y alimentar internamente la transformación y otros pasos de preparación de datos necesario antes de que pueda ocurrir un futuro análisis. Salida: Informe de exploración de datos Describir los resultados de esta tarea, incluyendo las primeras conclusiones o las hipótesis iniciales y su impacto sobre el resto del proyecto. El informe también puede incluir gráficos y diseños (plots) que indican las características de los datos o los puntos de interés de subconjuntos de datos dignos de una futura investigación. Actividades: Explorar Datos • • Se debe analizar en detalles las propiedades de atributos interesantes (por ejemplo, la estadística básica, las sub-poblaciones interesantes). Identificar las características de las sub-poblaciones. Formar suposiciones para análisis futuro • • • • • Considerar y evaluar la información y conclusiones en el informe de descripciones de datos. Formar una hipótesis e identificar acciones. Transformar la hipótesis en un objetivo de minería de datos, si es posible. Aclarar objetivos de minería de datos o hacerlos más exactos. Una búsqueda "ciega" no es necesariamente inútil, pero una búsqueda más dirigida hacia objetivos de negocio es preferible. Realizar un análisis básico para verificar la hipótesis. 4.3.2.4. Verificación de la calidad de datos Tarea: Verificar la calidad de datos Se debe examinar la calidad de los datos, dirigiendo preguntas como: ¿Son los datos completos? ¿Estos cubren todos los casos requeridos? ¿Hay en ellos errores o ellos contienen errores? Si hay errores, ¿como son ellos? ¿Hay valores omitidos en los datos? Si es así, ¿cómo son representados, donde ocurren, y como son ellos? Salida: Informe de calidad de datos Listar los resultados de la verificación de calidad de datos; si hay problemas de calidad listar las posibles soluciones. Actividades Identificar valores especiales y catalogar su significado. Página 54 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Revisión de atributos claves • • • • • • • • • Se debe comprobar la cobertura (por ejemplo, si todos los valores posibles son representados). Comprobar las claves. Verificar que los significados de los atributos y valores contenidos se satisfacen simultáneamente. Identificar atributos omitidos y campos en blanco. Establecer el significado de datos que faltan o fallan. Se deben comprobar los atributos con los valores diferentes que tienen significados similares (por ejemplo, la grasa baja la dieta). Comprobar la ortografía y el formato de valores (por ejemplo, mismo valor pero a veces comienza con una letra minúscula y a veces con una letra mayúscula). Comprobar las desviaciones, y decidir si una desviación es "ruido" o puede indicar un fenómeno interesante. Comprobar la plausibilidad de valores, (por ejemplo, todos los campos que tienen el mismo o casi los mismos valores). Se recomienda Se debe repasar cualquiera de los atributos que dan respuestas que están en desacuerdo con el sentido común (por ejemplo, adolescentes con altos niveles de ingreso). Se pueden usar plots de visualización, histogramas, etc. para revelar inconsistencias en los datos. Calidad de datos en archivos planos • • Si los datos son almacenados en archivos planos, se debe comprobar que delimitador es usado y si esto es usado coherentemente en todos los atributos. Si los datos son almacenados en archivos planos, comprobar el número de campos en cada registro para ver si ellos coinciden. Ruido e inconsistencias entre fuentes • • • Comprobar consistencia y superabundancia entre fuentes diferentes. Se debe planear para tratar el ruido. Descubrir el tipo de ruido y que atributos son afectados. Se recomienda Se debe recordar que puede ser necesario excluir algunos datos ya que ellos no exponen comportamiento positivo o negativo (por ejemplo, al comprobar en el comportamiento del préstamo de clientes, excluye a todo los que nunca han tomado prestado, aquellos que no financian una hipoteca de casa, aquellos cuya hipoteca se acerca a la madurez, etc.). Revisar si las presunciones son válidas o no, considerando la información real o actual en los datos y el conocimiento de negocio. Página 55 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.3.3. Preparación de los datos Salida: Conjunto de datos Estos son los conjuntos de dato(s) producidos por la fase de Preparación de Datos, usada para modelar o para el trabajo de análisis principal del proyecto. Salida: Descripción del conjunto de datos Esto es, la descripción del conjunto de datos(s) usado para el modelado o para el trabajo de análisis principal del proyecto. 4.3.3.1. Datos seleccionados Tarea: Seleccionar datos Se debe decidir los datos a ser usados para el análisis. Los criterios incluyen la importancia a los objetivos de minería de datos, la calidad, y las restricciones técnicas como los límites en el volumen de datos o en los tipos de datos. Salida: Razonamiento para inclusión/exclusión Listar los datos a ser usados / excluidos y los motivos para estas decisiones. Actividades • • • • • • • • Recoger datos adicionales apropiados (de diferentes fuentes - internos así como externos). Realizar las pruebas de importancia y correlación para decidir si los campos son incluidos. Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de calidad de los datos y en la exploración de datos (esto es, se puede desear incluir/excluir otros juegos de datos). Reconsiderar Criterios de Selección de Datos (ver la Tarea 2.1) en la luz de experiencia de modelado (esto es, la evaluación del modelo puede mostrar que otros conjuntos de datos son necesarios). Seleccionar diferentes subconjuntos de datos (por ejemplo, atributos diferentes, sólo los datos que encuentran ciertas condiciones). Considerar el uso de técnicas de muestreo (por ejemplo, una solución rápida puede implicar la prueba dura y el entrenamiento del conjunto de datos o la reducción del tamaño del conjunto de datos de prueba, si la herramienta no puede manejar conjunto de datos llenos. Esto puede también ser útil para tener muestras ponderadas para dar distinta importancia a atributos diferentes o valores diferentes del mismo atributo). Documentar el razonamiento para la inclusión/exclusión. Comprobar técnicas disponibles para el muestreo de datos. Se recomienda Basado en Criterios de Selección de Datos se debe decidir si uno o más atributos son más importantes que otros y el correspondiente peso de los atributos. Decidir basado en el contexto (esto es, el uso, la herramienta, etc.), cómo manejarse con el peso. Página 56 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.3.3.2. Limpieza de datos Tarea: Limpiar datos Se debe elevar la calidad de datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de subconjuntos limpios de los datos, la inserción de faltas apropiadas, o técnicas más ambiciosas como la estimación de datos omitidos por modelado. Salida: Informe de la limpieza de datos Describir las decisiones y las acciones que fueron tomados para dirigir los problemas de calidad de datos informados durante la Tarea de Verificación de Calidad de Datos. Si los datos están para ser usados en el ejercicio de minería de datos, el informe debería dirigir cuestiones de calidad de datos excepcionales y el efecto posible que esto podría tener sobre los resultados. Actividades • • • • Reconsiderar como tratar con cualquier tipo de ruido observado. Corregir, remover, o ignorar el ruido. Decidir como tratar con valores especiales y su significado. El área de valores especiales puede dar lugar a muchos resultados extraños y con cuidado deberían ser examinados. Los ejemplos de valores especiales podrían surgir por los resultados tomados de una revisión donde algunas cuestiones no fueron preguntadas o no fueron contestadas. Esto podría terminar en un valor de 99 para datos desconocidos. Por ejemplo, 99 para estado civil o afiliación política. Los valores especiales también podrían surgir cuando los datos son truncados por ejemplo 00 para gente de 100 años o para todos los coches con 100.000 kilómetros en el odómetro. Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de los datos limpios (esto es, se puede desear incluir/excluir otros conjuntos de datos). Se recomienda Recordar que algunos campos pueden ser irrelevantes a los objetivos de la minería de datos y, por lo tanto, el ruido en aquellos campos no tiene ninguna importancia. Sin embargo, si el ruido es ignorado por estos motivos, esto debería ser totalmente documentado como circunstancias que pueden cambiarse más tarde. 4.3.3.3. Construcción de datos Tarea: Construir datos Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción de atributos derivados, completar registros nuevos, o transformar valores para atributos existentes. Actividades • • Comprobar los mecanismos de construcción disponibles con la lista de herramientas sugeridas para el proyecto. Decidir si esto es lo mejor para realizar la construcción dentro de la herramienta o fuera de ella (esto es, que es más eficiente, exacto, repetible). Página 57 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de construcción de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos). Salida: Atributos derivados Los atributos derivados son los atributos nuevos que son construidos de uno o más atributos existentes en el mismo registro. Un ejemplo podría ser: área = longitud x anchura. ¿Por qué se debería tener que construir atributos derivados durante el curso de una investigación de minería de datos? No debería pensarse que sólo los datos de bases de datos u otras fuentes deberían ser usados en la construcción de un modelo. Los atributos derivados podrían ser construidos porque: • • • El conocimiento del contexto convence que algún hecho es importante y debería ser representado aunque no se tenga ningún atributo actualmente para representarlo. El algoritmo de modelado en uso maneja sólo ciertos tipos de datos - por ejemplo se está usando regresión lineal y se sospecha que hay ciertas no-linealidades que serán incluidas en el modelo. El resultado de la fase de modelado sugiere que ciertos hechos no sean cubiertos. Actividades: Derivar atributos • • • • Decidir si cualquier atributo puede ser normalizado (por ejemplo, usando un algoritmo de agrupamiento (clustering) con el periodo y el ingreso, en ciertas divisas, el ingreso se controlará). Considerar agregar nueva información sobre la importancia relevante de los atributos para agregar nuevos atributos (por ejemplo, atributos con peso, normalización ponderada). ¿Cómo se puede construir o imputar atributos faltantes? Decidir el tipo de construcción (por ejemplo, la combinación, el promedio, la inducción). Agregar atributos nuevos a los datos de acceso. Se recomienda Antes de agregar Atributos Derivados, se debe intentar determinar si y como ellos facilitan el proceso de modelado o facilitan el algoritmo de modelado. Quizás “el ingreso por persona” es un mejor o más fácil atributo para usar que “el ingreso por casa.” No se debe sacar atributos simplemente para reducir el número de atributos de entrada. Otro tipo de atributo derivado es la transformación de un atributo individual, por lo general realizado para cubrir las necesidades de las herramientas de modelado. Actividades Transformaciones de atributo individual • • Especificar los pasos de transformaciones necesarias en los términos de facilitar la transformación disponible (por ejemplo, cambiar un binning de un atributo numérico). Realizar pasos de transformación. Se recomienda Las transformaciones pueden ser necesarias para cambiar rangos a campos simbólicos (por ejemplo, años a rangos de edad) o campos simbólicos (“definitivamente sí”, “sí”, “no se sabe,” "no") a valores numéricos. Las herramientas de modelado o los algoritmos a menudo los requieren. Página 58 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Registros generados Los registros generados son registros completamente nuevos, que agregan nuevo conocimiento o representan nuevos datos que de otro modo no son representados (por ejemplo, habiendo segmentado los datos, puede ser útil generar un registro para representar al miembro prototípico de cada segmento para un tratamiento futuro). Actividades Comprobar por técnicas disponibles si es necesario (por ejemplo, mecanismos para construir prototipos para cada segmento de datos segmentados). 4.3.3.4. Integración de datos Tarea: Integrar datos Estos son métodos para combinar la información de múltiples tablas u otras fuentes de información para crear nuevos registros o valores. Salida: Datos combinados La combinación de tablas se refiere a la unión de dos o más tablas que tienen diferente información sobre los mismos objetos. En esta etapa, también puede ser aconsejable generar registros nuevos. También puede ser recomendado para generar valores agregados. La agregación se refiere a operaciones donde los nuevos valores son calculados por información resumida de múltiples registros y/o tablas. Actividades • • • Comprobar si las aplicaciones de integración son capaces de integrar las fuentes de entrada como se requiere. Integrar fuentes y resultados almacenados. Reconsiderar Criterios de Selección de Datos (ver la Tarea 2.1) en la luz de las experiencias de integración de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos). Se recomienda Recordar que algún conocimiento puede estar contenido en un formato no-electrónico. 4.3.3.5. Formateo de datos Tarea: Formatear datos Transformar formateando se refiere principalmente a modificaciones sintácticas hechas a los datos que no cambian su significado, pero podría ser requerido por la herramienta de modelado. Página 59 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Datos reformateados Algunas herramientas tienen requerimientos sobre el orden de los atributos, tal que el primer campo sea un único identificador para cada registro o el campo último ser el juego de resultados que el modelo debe predecir. Actividades: Atributos reorganizados Algunas herramientas tienen requerimientos sobre el orden de los atributos, tal que el primer campo es un único identificador para cada registro o el campo último es el juego de resultados que el modelo debe predecir. Reordenando registros Podría ser importante cambiar el orden de los registros en el conjunto de datos. Quizás el instrumento de modelado requiere que los registros sean clasificados según el valor del atributo de resultado. Reformateado de valores internos • • Estos son cambios puramente sintácticos hechos para satisfacer las exigencias de la herramienta específica de modelado. Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de limpieza de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos). 4.3.4. Modelado 4.1. Seleccionar técnicas de modelado Tarea: Seleccionar técnicas de modelado Como primer paso en modelado, seleccionar la técnica de modelado inicial actual. Si hay múltiples a ser aplicados, realizar separadamente esta tarea para cada técnica. Se debe recordar que no todos los instrumentos y técnicas son aplicables a todas y cada tarea. Para ciertos problemas, sólo algunas técnicas son apropiadas. “Requerimientos políticos” y otras restricciones adicionales limitan las opciones disponibles para el ingeniero de minería de datos. Puede ser que solo una herramienta o técnica estén disponibles para solucionar el problema a mano y que el instrumento no pueda ser absolutamente lo mejor, desde un punto de vista técnico. Página 60 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Figura 11: Diversidad de Técnicas Salida: Técnicas de modelado Registrar las técnicas de modelado real que se usan. Actividades Decidir las técnicas apropiada para el ejercicio teniendo en cuenta la herramienta seleccionada. Salida: Presunciones de modelado Muchas técnicas de modelado realizan presunciones específicas sobre los datos. Actividades • • • Definir cualquier presunción construida por la técnica sobre los datos (por ejemplo, la calidad, el formato, la distribución). Comparar estas presunciones con aquellas del Informe de Descripción de Datos. Se debe asegurar que estas presunciones sostienen y permiten volver a la fase de Preparación de Datos, si es necesario. Página 61 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.3.4.2. Generar el diseño de prueba Tarea: Generar el diseño de prueba Antes de construir un modelo, es necesario definir un procedimiento para probar la calidad del modelo y la validez. Por ejemplo, en tareas de minería de datos supervisadas como la clasificación, es común usar tasas de error como medidas de calidad para modelos de minería de datos. Por lo tanto, el diseño de prueba especifica que el conjunto de datos debería ser separado en el entrenamiento y en el conjunto de prueba. El modelo esta construido sobre el conjunto de entrenamiento y su calidad estimada sobre el conjunto de prueba. Salida: Diseño de Prueba Describir el plan deliberado para el entrenamiento, las pruebas, y la evaluación de los modelos. Un componente primario del plan es para decidir como dividir el conjunto de datos disponible sobre datos que se entrenan, datos de prueba, y conjunto de pruebas de validación. Actividades • • • Comprobar que existen diseños de prueba separadamente para cada objetivo de minería de datos. Decidir los pasos necesarios (el número de iteraciones, el número de desviaciones o curvas, etc.). Preparar los datos requeridos para la prueba 4.3.4.3. Construcción del modelo Tarea: Construir el modelo Se corre la herramienta de modelado sobre el conjunto de datos listo para crear uno o más modelos. Salida: Parámetros de ajuste Con cualquier herramienta de modelado hay a menudo un gran número de parámetros que pueden ser ajustados. Se debe listar los parámetros y sus valores seleccionados, con la explicación (el razonamiento) para la elección. Actividades • • Determinar los parámetros iniciales. Documentar las razones para elegir aquellos valores. Salida: Modelos Controlar la herramienta de modelado en el conjunto de datos listos para crear uno o más modelos. Actividades • Ejecutar la técnica seleccionada sobre el conjunto de datos de entrada para producir el modelo. Página 62 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Post-procesar los resultados de minería de datos (por ejemplo, editar reglas, mostrar árboles). Salida: Descripción del modelo Describir el resultado del modelado y evaluar su exactitud esperada, la robustez, y defectos posibles. Informar sobre la interpretación de los modelos y encontrar cualquier dificultad. Actividades • • • • • • • Describir cualquier característica del modelo actual que puede ser útil para el futuro. Ajustar parámetro de entorno (de registro) usado para producir el modelo. Dar una descripción detallada del modelo y cualquier rasgo especial. Para modelos basados por regla, listar las reglas producidas, más cualquier evaluación de cada regla o la exactitud y alcance total del modelo. Para modelos no transparentes, listar cualquier información técnica sobre el modelo (como la topología de las redes neuronales) y cualquier descripción de comportamiento producido por el proceso de modelado (como la exactitud o la sensibilidad). Describir el comportamiento del modelo y la interpretación. Expresar conclusiones respecto a los patrones en los datos (si hay alguno); a veces el modelo revela hechos importantes sobre los datos sin un proceso de evaluación separado (por ejemplo, que la salida o la conclusión son duplicadas en una de las entradas). 4.3.4.4. Evaluación del modelo Tarea: Evaluar el modelo El modelo ahora debería ser evaluado para asegurar que se encontró criterio de éxito de la minería de datos y aprobar los criterios de prueba deseados. Esto es una evaluación puramente técnica basada en el resultado de las tareas de modelado. Salida: Evaluación del modelo Resumir los resultados de esta tarea, listar las calidades de los modelos generados (por ejemplo, en términos de exactitud), y el nivel de su calidad en relación a otro. Actividades • • • • • • • • Evaluar los resultados en lo que concierne a criterios de evaluación. Probar los resultados según una estrategia de prueba (por ejemplo: Corrida y Prueba, Validación cruzada, bootstrapping, etc.). Comparar los resultados de la evaluación y la interpretación. Crear la clasificación de resultados en lo que concierne a criterios de éxito y evaluación. Seleccionar los mejores modelos. Interpretar los resultados en términos de negocio (tanto como sea posible en esta etapa). Conseguir comentarios de los modelos por expertos en datos o en el dominio. Chequear la credibilidad del modelo. Página 63 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • • • • Comprobar los efectos sobre los objetivos de minería de datos. Comprobar los modelos contra una base de conocimiento determinada para ver si la información descubierta es nueva y útil. Comprobar la fiabilidad de los resultados. Analizar el potencial para el desarrollo de cada resultado Si hay una descripción verbal del modelo generado (por ejemplo, en forma de reglas), evaluar las reglas: ¿Ellas son lógicas, o ellas son factibles, hay demasiadas reglas o hay demasiado poco, ellos violan el sentido común? Evaluar resultados. Conseguir ideas específicas de cada técnica de modelado y ciertos parámetros de ajustes que conduzcan a resultados buenos/malos. Se recomienda “Tablas de Elevación” y “Tablas de Beneficio” pueden ser construidas para determinar bien lo que el modelo predice. Salida: Revisión de parámetros de ajuste Según la evaluación del modelo, se debe revisar parámetros de ajuste para la siguiente corrida en la tarea de Construcción del Modelo. Iterar (repetir) la construcción del modelo y evaluar hasta que se encuentre el mejor modelo. Actividades Ajustar parámetros para producir mejores modelos. 4.3.5. Evaluación Los pasos de evaluación previa tratan con factores como la exactitud y la generalidad del modelo. Este paso evalúa el grado en el que el modelo encuentra los objetivos de negocio, y procura determinar si hay alguna razón de negocio por la qué este modelo sea deficiente. Se comparan resultados con los criterios de evaluación definidos en el principio del proyecto. Un modo bueno para definir las salidas totales de un proyecto de minería de datos es usar la ecuación: RESULTADOS = MODELOS + CONCLUSIONES En esta ecuación, definimos que la salida total del proyecto de minería de datos no son solamente los modelos (aunque ellos sean, desde luego, importantes) sino también las conclusiones, las que definimos como algo (aparte del modelo) que es importante en: • • • la búsqueda de los objetivos de negocio o importancia para arribar a nuevas preguntas, las líneas de aproximación, o los efectos negativos (por ejemplo, los problemas de calidad de datos descubierto por el uso de la minería de datos). Página 64 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Se debe tener en cuenta que aunque el modelo esté directamente conectado a las preguntas de negocio, las conclusiones no necesariamente están relacionadas con cualquiera de las preguntas u objetivos, mientras ellos son importantes para el promotor del proyecto. 4.3.5.1. Evaluación de los resultados Tarea: Evaluar los resultados Esta etapa evalúa el grado al que el modelo encuentra los objetivos de negocio, y procura determinar si hay alguna razón de negocio por el cual este modelo es deficiente. Otra opción es probar el (los) modelo(s) sobre la aplicación de prueba en el sistema verdadero, si las restricciones de tiempo y de presupuesto así lo permiten. Además, la evaluación también evalúa otros resultados generados por la minería de datos. Los resultados de minería de datos cubren los modelos que están relacionados con los objetivos originales de negocio y todas las demás conclusiones. Unos son relacionados con los objetivos de negocios originales mientras que otros podrían revelar desafíos adicionales, información, o ideas para futuras administraciones (direcciones). Salida: Evaluación de los resultados de minería de datos en lo que respecta a criterios de éxito de negocio Resumir resultados de evaluación en términos de criterios de éxito de negocio, incluyendo una declaración final relacionada a si el proyecto encuentra los objetivos iniciales de negocio. Actividades • • • • • • • • • • Comprender los resultados de la minería de datos. Interpretar los resultados en términos de la aplicación (del uso). Comprobar efectos sobre los objetivos de minería de datos. Comprobar los resultados de minería de datos contra la base de un conocimiento determinado para ver si la información descubierta es nueva y útil. Evaluar y estimar los resultados en lo que respecta a criterios de éxito de negocio (esto es, si el proyecto ha alcanzado los Objetivos de Negocio originales). Comparar los resultados de la evaluación y la interpretación. Clasificar los resultados en lo que respecta a criterios de éxito de negocio. Comprobar el efecto de los resultados sobre el objetivo (fin) de la aplicación inicial. Determinar si hay nuevos objetivos de negocio para ser dirigidos más tarde en el proyecto, o en nuevos proyectos. Expresar recomendaciones para proyectos futuros de minería de datos Salida: Modelos aprobados Después de evaluar los modelos con respecto a los criterios de éxito de negocio, se debe seleccionar y probar los modelos generados que encontraron los criterios seleccionados. Página 65 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.3.5.2. Proceso de revisión Tarea: Revisar el proceso En este punto, el modelo resultante parece ser satisfactorio y parece satisfacer necesidades de negocio. Es ahora apropiado hacer una revisión más cuidadosa de las promesas de minería de datos para determinar si hay algún factor importante o tarea que de algún modo ha sido pasada por alto. En esta etapa del ejercicio de minería de datos, el Proceso de Revisión toma la forma de una Revisión de Garantía de Calidad. Salida: Revisión de procesos Resumir el proceso de revisión y poner en una lista las actividades que han sido omitidas y/o deberían ser repetidas. Actividades • • • • • • Proporcionar una descripción del proceso de minería de datos usado. Analizar el proceso de minería de datos. Para cada etapa del proceso: ¿Esto fue necesario? ¿Esto fue ejecutado de forma óptima? ¿En que modo podría ser mejorado? Identificar fracasos. Identificar pasos desviados (de engaños). Identificar acciones alternativas posibles y/o caminos inesperados en el proceso. Revisar resultados de minería de datos en lo que concierne a criterios de éxito de negocio. 4.3.5.3. Determinación de los próximos pasos Tarea: Determinar los próximos pasos Basado en los resultados de evaluación y la revisión de proceso, se debe decidir como proceder. Las decisiones a ser tomadas incluyen si hay que terminar este proyecto y seguir adelante al desarrollo para iniciar futuras iteraciones, o establecer nuevos proyectos de minería de datos. Salida: Lista de acciones posibles Listar acciones futuras posibles con los motivos para y contra de cada opción. Actividades • • • • • Analizar el potencial para el desarrollo de cada resultado. Estimar el potencial para la mejora de proceso actual. Comprobar los recursos restantes para determinar si ellos permiten iteraciones de proceso adicionales (o si recursos adicionales pueden estar siendo disponibles). Recomendar continuar con las alternativas. Refinar el plan de proceso. Salida: Decisión Describir las decisiones hechas, con el razonamiento para ello. Página 66 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Actividades • • • Clasificar las acciones posibles. Seleccionar una de las acciones posibles. Documentar las razones para la elección. 4.3.6. Desarrollo 4.3.6.1. Plan de desarrollo Tarea: Desarrollo del Plan Esta tarea comienza con la evaluación de los resultados y concluye con una estrategia para el desarrollo de los resultados de la minería de datos en el negocio. Salida: Plan de Desarrollo Resumir la estrategia de desarrollo, incluyendo los pasos necesarios y como realizarlos. Actividades • • • • • • • • • Resumir resultados desarrollados. Construir y evaluar los planes alternativos para el desarrollo. Decidir para cada resultado conocimiento o información distintos. Determinar como el conocimiento o la información serán propagados (generados) a usuarios. Decidir como será supervisado el uso del resultado y medir sus beneficios (donde aplicable). Decidir por cada resultado de modelo desarrollado o de software. Establecer como el modelo o el resultado de software serán desplegados dentro de sistemas de la organización. Determinar como su empleo será supervisado y como se miden sus beneficios (donde aplicable). Identificar posibles problemas durante el desarrollo (peligros a ser evitados). los sea los sea 4.3.6.2. Supervisión y mantenimiento del plan Tarea: Supervisar y mantener el plan La supervisión y el mantenimiento son cuestiones importantes si los resultados de la minería de datos se hacen parte del negocio cotidiano y de su ambiente. Una preparación cuidadosa de una estrategia de mantenimiento ayuda a evitar innecesariamente largos períodos de uso incorrecto de los resultados de minería de datos. Para supervisar el desarrollo de los resultados de minería de datos, el proyecto necesita un plan detallado para supervisar y mantener. Este plan tiene en cuenta el tipo específico de desarrollo. Página 67 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Salida: Plan de supervisión y mantenimiento Resumir la estrategia de supervisión y mantenimiento, la inclusión de pasos necesarios y como realizarlos. Actividades • • • • • Comprobar aspectos dinámicos (esto es, ¿qué cosas podrían cambiar en el entorno?). Decidir como será supervisada la precisión. Determinar cuando el resultado de minería de datos o el modelo no deberían ser usados más. Identificar criterios (la validez, el límite de la exactitud, nuevos datos, cambios en el dominio de aplicación, etc.), y que debería pasar si el modelo o el resultado no pueden ser usados más. Actualización del modelo, establecimiento de nuevos proyectos de minería de datos, etc. ¿Cambiarán con el tiempo los objetivos de negocio del empleo del modelo? Documentar totalmente el problema inicial que el modelo intentaba solucionar. Desarrollar el plan de mantenimiento y la supervisión. 4.3.6.3. Producción de Informe definitivo Tarea: Producir Informe definitivo En el final del proyecto, el equipo de proyecto sobrescribe un informe definitivo. Según el plan de desarrollo, este informe puede ser sólo un resumen del proyecto y su experiencia, o una presentación final de los resultados de minería de datos. Salida: Informe definitivo En el final del proyecto, habrá al menos un informe definitivo en el que todos los hilos son encontrados. Así como la identificación de los resultados obtenidos, el informe también debería describir el proceso, mostrar los costos que se han encontrados, definir cualquier desviación del plan original, describir proyectos de implementación, y hacer cualquier recomendación para el futuro trabajo. El contenido real detallado del informe depende en gran medida de la audiencia planeada. Actividades • • • • • • Identificar cuales informes son necesarios (presentación de diapositiva, conclusiones de administración, detalles encontrados, explicación de los modelos, etc.). Analizar que tan bien se han encontrado los objetivos de minería de datos iniciales. Identificar grupos de objetivos para el informe. Describir en forma general las estructuras y el contenido de informe(s). Seleccionar conclusiones para ser incluidas en los informes. Escribir un informe. Salida: Presentación final Así como un informe definitivo, puede ser necesario hacer una presentación final para concluir el proyecto (por ejemplo, al patrocinador de dirección). La presentación normalmente contiene un Página 68 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS subconjunto del contenido de la información en el informe definitivo, estructurado de un modo diferente. Actividades • • Decidir el grupo objetivo para la presentación final y determinar si ellos ya habrán recibido el informe definitivo. Seleccionar cuales de los artículos del informe definitivo deberían ser incluidos en la presentación final. 4.3.6.4. Revisión del proyecto Tarea: Revisar el proyecto Evaluar que fue lo correcto y que fue lo errado, cual fue el éxito obtenido, y que necesidades serán mejoradas. Salida: Documentación de experiencia Resumir la gran experiencia ganada durante el proyecto. Por ejemplo, trampas, accesos a información incorrecta (misleading approaches), o los puntos para seleccionar las mejores técnicas de minería de datos en situaciones similares podrían ser la parte de esta documentación. En proyectos ideales, la documentación de experiencia también cubre cualquier informe que ha sido escrito por miembros individuales del proyecto durante el proyecto. Actividades • • • • • • Entrevistar a toda la gente significativa involucrada en el proyecto y preguntarles sobre su experiencia durante el proyecto. Si los usuarios finales trabajan en el negocio con los resultados de minería de datos, entrevistarlos: ¿Están satisfechos? ¿Cómo podría haber sido mejor realizado? ¿Necesitan de apoyo adicional? Resumir la realimentación y escribir la documentación de experiencia. Analizar el proceso (las cosas que se trabajaron bien, los errores producidos, las lecciones aprendidas, etc.). Documentar el proceso de minería de datos específico (¿Cómo pueden los resultados y la experiencia de aplicación del modelo ser realimentado en el proceso?) Generalizar desde los detalles para producir la experiencia útil para proyectos futuros. 4.4. Las salidas del CRISP-DM Esta sección contiene las breves descripciones de los objetivos y el contenido de los informes más importantes. Aquí, se enfoca en los informes que son significativos para comunicar los resultados de una fase a la gente no involucrada en esta fase (y posiblemente no involucrada en este proyecto). Estos no son necesariamente idénticos a las salidas como lo descrito en el modelo de referencia y la guía de usuario. El objetivo de estas salidas es mas para documentar resultados mientras se está realizando el proyecto. Página 69 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.4.1. Comprensión del Negocio Los resultados de la fase de Comprensión de Negocio pueden ser resumidos en un informe. Se sugiere las secciones siguientes: Contexto La sección Contexto proporciona una descripción básica del contexto de proyecto. Se deben listar cuales áreas están trabajando en el proyecto, que problemas han sido identificados, y por qué la minería de datos parece proporcionar una solución. Objetivos de negocio y criterios de éxito La sección de Objetivos de negocio describe los objetivos del proyecto en términos de negocio. Para cada objetivo, Los Criterios de Éxito de Negocio, esto es, describir las medidas para determinar si realmente el proyecto ha logrado sus objetivos. Esta sección también debería listar los objetivos que fueron considerados, pero rechazados. El razonamiento de la selección de objetivos debería ser dado. Inventario de recursos La sección de Inventario de Recursos apunta a identificar el personal, fuentes de datos, instalaciones técnicas, y otros recursos que pueden ser útiles en la realización del proyecto. Requerimientos, presunciones, y restricciones Esta sección lista los requerimientos generales para la ejecución del proyecto: tipo de resultados de proyecto, presunciones hechas sobre la naturaleza del problema y de los datos que están siendo usados, y restricciones impuestas al proyecto. Riesgos y contingencias Esta sección identifica los problemas que pueden ocurrir en el proyecto, describe las consecuencias, y declara que acciones pueden ser tomadas para reducir al mínimo tales riesgos. Terminología La sección de Terminología permite a la gente desconocida con los problemas que están siendo dirigidos por el proyecto hacerse más familiar con ellos. Costos y beneficios Esta sección describe los costos del proyecto y predice los beneficios del negocio si el proyecto es exitoso (por ejemplo, la vuelta en la Inversión). Otros beneficios menos tangibles (por ejemplo, la satisfacción del cliente) también deberían ser destacadas. Objetivos de minería de datos y criterios de éxito Página 70 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS La sección de Objetivos de Minería de datos declara los resultados del proyecto que permiten el logro de los objetivos de negocio. También como el listado de los accesos probables de minería de datos, los criterios de éxito para los resultados en términos de minería de datos también deberían ser puestos en una lista. Plan de proyecto Esta sección pone en una lista las etapas para ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos, entradas, salidas, y dependencias. Donde sea posible, esto debería hacer explícitamente las iteraciones en gran escala en el proceso por ejemplo de minería de datos (por ejemplo, las repeticiones del modelado y fases de evaluación). Evaluación inicial de herramientas y técnicas Esta sección da una vista inicial de que herramientas y técnicas probablemente van a ser usadas y como. Esto describe los requerimientos para las herramientas y técnicas, ponen en una lista herramientas disponibles y técnicas, y los compara con los requerimientos. 4.4.2. Comprensión de Datos Los resultados de la fase Comprensión de Datos por lo general son documentados en varios informes. Idealmente, estos informes serían los escritos mientras se estaban realizando las respectivas tareas. Los informes describen el conjunto de datos que es explorado durante la Comprensión de Datos. Para el informe definitivo, un sumario de las partes más relevantes es suficiente. Informe de colección de datos iniciales Este informe describe como las diferentes fuentes de datos identificadas en el inventario fueron capturadas y extraídos. Temas a ser cubiertos: • • • • Contexto de datos. Lista de fuentes de datos con amplia área de cobertura de datos requeridos por cada uno. Para cada fuente de datos, método de adquisición o extracción. Problemas encontrados en adquisición de datos o extracción. Informe de descripción de datos Cada conjunto de datos adquirido es descrito en este informe. Temas a ser cubiertos: • • • Cada fuente de datos descrita detalladamente. Lista de tablas (puede ser sólo uno) u otros objetos de base de datos. Descripción de cada campo, incluyendo unidades, códigos usados, etc. Página 71 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Informe de exploración de datos Este informe describe la exploración de datos y sus resultados. Temas a ser cubiertos: Contexto, incluyendo los amplios objetivos de exploración de datos. Para cada área de exploración emprendida: • • • • • • • Las regularidades esperadas o patrones. Método de detección. Regularidades o patrones encontrados, esperados e inesperados. Cualquier otra sorpresa. Conclusiones para transformación de datos, limpieza de datos, y cualquier otro proceso previo. Conclusiones relacionadas con datos que extraen objetivos u objetivos de negocio. Sumario de conclusiones. Informe de calidad de datos Este informe describe lo completo y la exactitud de los datos. Temas a ser cubiertos: Contexto, incluyendo amplias expectativas sobre calidad de datos. Para cada conjunto de datos: • • • Acercar temas para evaluar la calidad de datos. Los resultados de evaluación de calidad de datos. Sumario de conclusiones de calidad de datos. 4.4.3. Preparación de Datos Los informes en la fase de Preparación de Datos se enfocan en los pasos de pre-proceso que producen los datos para ser minados. Informe de descripción de conjunto de datos Este informe proporciona una descripción del conjunto de datos (después del pre-proceso) y el proceso por el que fue producido. Temas a ser cubiertos: Contexto, incluyendo objetivos amplios y plan para el pre-proceso. Razonamiento para inclusión/exclusión de conjunto de datos. Para cada conjunto de datos incluir: • • La descripción del pre-proceso, incluyendo las acciones que fueron necesarias para dirigir cualquier cuestión de calidad de datos. Descripción detallada del conjunto de datos resultante, tabla por tabla y campo por campo. Página 72 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • Razonamiento para inclusión/exclusión de atributos. Descubrimientos de hechos durante el pre-proceso, y cualquier implicación para futuros trabajos. Sumario y conclusiones. 4.4.4. Modelado Las salidas producidas durante la fase Modelado pueden ser combinadas en un informe. Se sugieren las secciones siguientes. Modelado de presunciones Esta sección define cualquier presunción explícita hecha sobre los datos y cualquier presunción que está implícita en la técnica de modelado a ser usado. Diseño de prueba Esta sección describe como los modelos son construidos, probados, y evaluados. Temas a ser cubiertos: Contexto de fondo para la ocupación del modelo y su relación a los objetivos de minería de datos. Para cada tarea de modelado: • • • • • • Ampliación de la descripción del tipo de modelo y los datos que se entrenan para ser usado. La explicación de como el modelo será probado o evaluado. Descripción de cualquier dato requerido para las pruebas. Plan para producción de los datos de prueba si hay. Descripción de cualquier examen planeado de modelos por expertos en dominio o de datos. Sumario de plan de prueba. Descripción del modelo Este informe describe los modelos entregados y las descripciones del proceso por el que ellos fueron producidos. Temas a ser cubiertos: Descripción de modelos producidos. Para cada modelo: • • • • Tipo de modelo y la relación a los objetivos de minería de datos. Los parámetros de ajustes usados para producir el modelo. Descripción detallada del modelo y cualquier rasgo especial. Por ejemplo: para modelos basados por regla, listar las reglas producidas más cualquier evaluación de precisión por regla o el modelo completo y el alcance; para modelos no transparentes, listar cualquier información técnica sobre el modelo (como la topología de red de los nervios) y algunas descripciones de comportamiento producidas por el proceso de modelado (como la precisión o la sensibilidad). Descripción del comportamiento del modelo e interpretación. Página 73 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • Conclusiones en cuanto a los patrones en los datos (si hay). A veces el modelo revelará hechos importantes sobre los datos sin un proceso de evaluación separado (por ejemplo, que la salida o la conclusión están duplicadas en una de las entradas). Sumario de conclusiones. Evaluación del modelo Esta sección describe los resultados de prueba de los modelos según el diseño de prueba. Temas a ser cubiertos: Descripción de los procesos de evaluación y los resultados, incluyendo cualquier desviación del plan de prueba. Para cada modelo: • • • • • Evaluación detallada, incluyendo medidas como precisión e interpretación del comportamiento. Cualquier comentario sobre los modelos por expertos en el dominio o de datos. Evaluación resumida de modelos. Ideas en por qué una cierta técnica de modelado y ciertos ajustes de parámetro conducen a resultados buenos/malos. Evaluación sumaria del conjunto de modelos completos. 4.4.5. Evaluación Evaluación de los resultados de minería de datos en lo que respecta a criterios de éxito de negocio Este informe compara los objetivos de minería de datos con los objetivos de negocio y los criterios de éxito de negocio. Temas a ser cubiertos: Revisión de objetivos de negocio y criterios de éxito de negocio (qué podría haberse cambiado durante y/o como consecuencia de la minería de datos). Para cada criterio de éxito de negocio: • • • • • • Comparación detallada entre criterio de éxito y resultados de minería de datos. Conclusiones sobre aceptabilidad (achievability) de criterios de éxitos y conveniencia del proceso de minería de datos. Revisión del éxito de proyecto: ¿El proyecto ha alcanzado los objetivos originales de negocio? ¿Objetivos nuevos de negocio deben ser dirigidos después en el proyecto o en nuevos proyectos? Conclusiones para futuros proyectos de minería de datos. Revisión de proceso Esta sección evalúa la eficacia del proyecto e identifica cualquier factor que podría haber sido pasado por alto y que debería ser tenido en cuenta si el proyecto es repetido. Página 74 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Lista de posibles acciones Esta sección hace recomendaciones en cuanto a los siguientes pasos en el proyecto. 4.4.6. Desarrollo Plan de desarrollo Este informe especifica el desarrollo de los resultados de minería de datos. Temas a ser cubiertos: • • Resumen de los resultados desarrollados (derivado de los informes de Próximos Pasos). Descripción de plan de desarrollo. Supervisión y plan de mantenimiento La supervisión y el plan de mantenimiento especifican como los resultados desarrollados deben ser mantenidos. Temas a ser cubiertos: Descripción de los resultados de desarrollo y la indicación de que los resultados pueden requerir la actualización (y el por qué). Para cada resultado desarrollado: • • • Descripción de como la actualización será provocada (por una normal actualización, por un acontecimiento de activación, por la ejecución de una supervisión). Descripción de cómo la actualización será realizada. Resumen de los procesos de actualización de los resultados. Informe definitivo El informe definitivo es usado para resumir el proyecto y sus resultados. Contenido: • • • • • • • • Resumen de la Comprensión del Negocio: contexto, objetivos, y criterios de éxito. Sumario de proceso de minería de datos. Resumen de los resultados de minería de datos. Sumario de la evaluación de resultados. Resumen del desarrollo y de los planes de mantenimiento. Análisis Costo/Beneficio. Conclusiones para el negocio. Conclusiones para futura minería de datos. 4.4.7. Resumen de dependencias Página 75 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS La siguiente tabla (Tabla 3) resume las entradas principales para los operadores. Esto no significa que solo las listas de entradas puestas deberían ser consideradas, por ejemplo, los objetivos de negocio deberían ser distribuidos a todo los operadores. Sin embargo, el operador debería dirigir cuestiones específicas elevadas por sus entradas. Frase Entregable Entender el negocio Background Referido a Relacionado a Objetivo de negocio Backgorund Terminología Creterio de éxito de negocio Objetivo de negocio Inventario de recursos Requerimientos, asunciones y restricciones Objetivo de negocio Riesgos y contingencias Objetivo de negocio - Criterio de éxito de negocio Terminología Backgorund Objetivo de negocio Costos y beneficios Objetivo de negocio Plan de proyecto Metas de minería de datos Objetivo de negocio - Requerimientos, asunciones y restricciones Criterio de éxito de minería de datos Criterio de éxito de negocio - Requerimientos, asumciones y restricciones - Metas de minería de datos Plan de proyecto Objetivo de negocio - Inventario de recursos - Requerimientos, asunciones y restricciones - Riesgos y contingencias Objetivo de negocio - Inventario de recursos - Objetivos de minería de datos Costos y beneficios Reporte de descripción de datos Objetivo de negocio - Reporte de colección inicial de datos Reporte de calidad de datos Reporte de exploración de datos Objetivo de negocio - Reporte de colección inicial de datos Reporte de descripción de datos Reporte de calidad de datos Objetivo de negocio - Reporte de colección inicial de datos Preparar datos Set de datos y descripción de set de datos Modelar Diseño de test Objetivo de negocio - Objetivo de minería de datos - Reporte de descripción de datos - Reporte de calidad de datos - Reporte de exploración de datos Objetivo de minería de datos - Criterio de éxito de minería de datos Comprender datos Evaluación Desarrollo Reporte de colección inicial de datos Modelos Objetivo de minería de datos Setear parámetros Setear parámetros Objetivo de minería de datos Modelos Descripción de modelo Modelos - Setear parámetros - Diseño de test Evaluación de modelo Criterio de éxito de negocio - Diseño de test - Modelos Evaluar resultado de minería de datos - Criterio de éxito de negocio Criterio de éxito de negocio - Terminología Revisión de proceso Objetivo de negocio - Evaluación de resultado de minería de datos - Criterio de éxito de negocio Pasos a seguir Plan de proyecto - Evaluación de resultado de minería de datos Criterio de éxito de negocio Desarrollo de plan Objetivo de negocio - Requerimientos, asunciones y restricciones Plan de mantenimiento Plan de mantenimiento Objetivo de negocio - Requerimientos, asunciones y restricciones Desarrollo de plan Reporte final y presentación Objetivo de negocio - Terminología - Evaluación de resultado de minería de datos - Criterio de éxito de negocio Plan de proyecto - Revisión de proceso Documentación de experiencia Tabla 3: Entradas principales de los operadores Página 76 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4.5. Apéndice 4.5.1. Glosario/Terminología • • • • • • • • • • • • • • Actividad: Es parte de una tarea en la Guía de Usuario; describe las acciones para realizar una tarea. Metodología de CRISP-DM: El término general para todos los conceptos desarrollados y definidos en el CRISP-DM. Contexto de minería de datos: Un conjunto de restricciones y presunciones, tales como el tipo de problema, las técnicas o herramientas, el dominio de aplicación. Tipos de problemas de minería de datos: Una clase de típicos problemas de minería de datos, tales como la descripción de datos y el resumen, la segmentación, las descripciones de conceptos, la clasificación, la predicción, el análisis de dependencia. Genérico: Una tarea que mantiene un cruce con todos los proyectos de minería de datos posibles. Modelo: La capacidad de aplicar algoritmos a un conjunto de datos para predecir atributos objetivos; ejecutable. Salida: El resultado tangible de la ejecución de una tarea. Fase: Un término para la parte de alto nivel del modelo de proceso CRISP-DM; consiste en tareas relacionadas. Caso del proceso: Un proyecto específico descrito en términos del modelo de proceso Modelo de proceso: Define la estructura de proyectos de minería de datos y proporciona la guía para su ejecución; consiste en el modelo de referencia y en la guía de usuario. Modelo de referencia: Descomposición de proyectos de minería de datos en fases, tareas, y salidas. Especializado: Una tarea que hace presunciones específicas en contextos específicos de minería de datos. Tarea: Una serie de actividades para producir una o más salidas; parte de una fase Guía de usuario: Asesoramiento específico sobre como realizar proyectos de minería de datos. 4.5.2. Tipos de problemas de minería de datos Por lo general, los proyectos de minería de datos implican una combinación de diferentes tipos de problema, que juntos solucionan el problema de negocio. 4.5.2.1. Descripción de datos y resumen La descripción y el resumen de datos apuntan a la descripción concisa de las características de los datos, típicamente en forma elemental y agregada. Esto da al usuario una descripción de la estructura de los datos. A veces, una descripción y resumen de los datos solo puede ser un objetivo de un proyecto de minería de datos. Por ejemplo, un minorista podría estar interesado en el volumen de ventas de todas las salidas separado por categorías. Los cambios y diferencias de un período anterior podrían ser resumidos y destacados. Esta clase de problema estaría en lo mas bajo de la escala de problemas de minería de datos. En casi todos los proyectos de minería de datos, sin embargo, la descripción y resumen de los datos son un objetivo subordinado en el proceso, típicamente en sus tempranas etapas. En el principio de un proceso de minería de datos, el usuario a menudo no conoce, ni el objetivo preciso del análisis, Página 77 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS ni la naturaleza exacta de los datos. La exploración inicial del análisis de datos puede ayudar a los usuarios a entender la naturaleza de los datos y formar hipótesis potenciales de la información oculta. La estadística descriptiva simple y las técnicas de visualización proporcionan las primeras ideas sobre los datos. Por ejemplo, la distribución de clientes por edad y regiones geográficas sugiere que partes de un grupo de clientes necesita para ser dirigida para futuras estrategias de comercialización (marketing). La descripción y el resumen de datos típicamente ocurren en combinación con otros tipos de problemas de minería de datos. Por ejemplo, la descripción de datos puede conducir a la postulación (presunción) de segmentos interesantes en los datos. Una vez que los segmentos son identificados y definidos, una descripción y un resumen de estos segmentos son útiles. Es aconsejable llevar a cabo una descripción y resumen de datos antes de que cualquier otro tipo de problema de minería de dato sea especificado (dirigido). En este documento, esto se refleja en el hecho que la descripción y resumen de datos es una tarea en la fase de Comprensión de Datos. El resumen también juega un papel importante en la presentación de los resultados finales. Los resultados de otros tipos de problemas de minería de datos (por ejemplo, las descripciones de conceptos o los modelos de predicción) también pueden ser considerados resumen de datos, pero sobre un nivel conceptual más alto. Muchos sistemas de informe, paquetes estadísticos, OLAP, y sistemas EIS pueden cubrir la descripción y resumen de datos, pero hacerlo usualmente no proporciona algunos métodos para realizar modelado más avanzado. Si la descripción y resumen de datos son considerados un tipo de problema independiente y ningún modelado futuro es requerido, entonces estas herramientas pueden ser apropiadas para realizar los compromisos de minería de datos. 4.5.2.2. Segmentación La segmentación apunta a la separación de los datos en subgrupos o clase significativos e interesantes. Todos los miembros de un subgrupo comparten características comunes. Por ejemplo, en el análisis de cesta de compras, uno podría definir los segmentos de cestas según los artículos que ellos contienen. La segmentación puede ser realizada a mano o semi-automáticamente. El analista puede suponer ciertos subgrupos como relevantes para la pregunta de negocio, basada sobre un conocimiento previo o sobre el resultado de la descripción y el resumen de datos. En adición, hay también técnicas automáticas de agrupamiento (clustering) que pueden descubrir las estructuras antes insospechadas y ocultas en datos que permite la segmentación. La segmentación a veces puede ser un objetivo de minería de datos. Entonces la detección de segmentos sería el objetivo principal de un proyecto de minería de datos. Por ejemplo, todas las direcciones en áreas de código postal con la edad mas alta que el promedio y un ingreso podrían ser seleccionadas para enviar publicidad para seguro de clínica de ancianos. Muy a menudo, sin embargo, la segmentación es un paso hacia la solución de otros tipos de problema. Entonces, el objetivo es de guardar (mantener) el tamaño de los datos manejables o encontrar los subconjuntos de datos homogéneos que son más fáciles para analizar. Típicamente en grandes conjuntos de datos variados afectan el alcance de cada uno y obscurece los patrones interesantes. Entonces, la segmentación apropiada hace la tarea más fácil. Por ejemplo, analizar las dependencias entre artículos en millones de cestas de compras es muy difícil. Esto es mucho más Página 78 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS fácil (y más significativo, generalmente) para identificar dependencias en los segmentos interesantes de cestas de compras -por ejemplo, cestas de alto valor, cestas que contienen bienes de confort, o cestas de un día o de un periodo particular. Nota: En la literatura, hay algo de ambigüedad en el significado de ciertos términos. A veces llaman a la segmentación agrupamiento (clustering) o clasificación (classification). El último término es confuso porque algunas personas lo usan para referirse a la creación de clases, mientras que otros piensan en la creación de modelos para predecir las clases conocidas para casos antes no vistos. En este documento, restringimos el término de clasificación al último significado (ver más abajo) y usar el término segmentación con el antiguo significado, aunque las técnicas de clasificación puedan ser usadas para obtener descripciones de los segmentos descubiertos. Técnicas apropiadas: • • • Técnicas de agrupamiento (clustering) Redes Neuronales Visualización Ejemplo: Una empresa de venta de autos con regularidad recoge información sobre sus clientes acerca de sus características socioeconómicas como el ingreso, la edad, el sexo, la profesión, etc. Usando análisis de agrupamiento, la empresa puede dividir a sus clientes en subgrupos más comprensibles y analizar la estructura de cada subgrupo. Estrategias de control de comercialización (marketing) específicas son desarrolladas para cada grupo separado. 4.5.2.3. Descripciones de conceptos La descripción de concepto apunta a una descripción comprensible de conceptos o clases. El objetivo no es para completar el desarrollo de modelos con predicción de exactitud alta, sino para ganar ideas. Por ejemplo, una empresa puede estar interesada en el estudio sobre sus clientes más leales y desleales. De una descripción de concepto de estos conceptos (clientes leales y desleales) la compañía infiere que podría estar hecho para encontrar clientes leales o transformar clientes desleales a clientes leales. Una descripción de concepto tiene una conexión cercana tanto a la segmentación como a la clasificación. La segmentación puede conducir a una enumeración de objetos que pertenecen a un concepto o clase sin proporcionar cualquier descripción comprensible. Típicamente la segmentación es llevada a cabo antes de que la descripción de concepto sea realizada. Algunas técnicas -técnicas de agrupamiento conceptuales, por ejemplo-ejecutan la segmentación y descripción de concepto al mismo tiempo. Las descripciones de concepto también pueden ser usadas para objetivos de clasificación. Por otra parte, algunas técnicas de clasificación producen modelos de clasificación comprensibles, que pueden entonces ser consideradas descripciones de concepto. La distinción importante es que la clasificación apunta a ser completa en algún sentido. El modelo de clasificación tiene que aplicarse a todos los casos en la población seleccionada. Página 79 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS De otra manera, las descripciones de concepto no tienen que ser completas. Es suficiente si ellos describen las partes importantes de los conceptos o clases. En el ejemplo mencionado, puede ser suficiente conseguir las descripciones de conceptos de aquellos clientes que son claramente leales. Técnicas apropiadas: • • Métodos de inducción de reglas Agrupamiento conceptual Ejemplo: Usando datos sobre los compradores de coches nuevos y una técnica de inducción de regla, una empresa de coche podría generar las reglas que describen sus clientes leales y desleales. Debajo están los ejemplos de las reglas generadas: • • • • Si SEXO = macho y EDAD > 51 entonces CLIENTE = leal Si SEXO = hembra y EDAD > 21 entonces CLIENTE = leal Si PROFESIÓN = gerente y EDAD < 51 entonces CLIENTE = desleal Si ESTADO CIVIL = soltero y EDAD < 51 entonces CLIENTE = desleal 4.5.2.4. Clasificación La clasificación asume que hay un conjunto de objetos caracterizados por algún atributo o rasgo que pertenece a diferentes clases. La etiqueta de clase es un valor (simbólico) discreto y es conocido para cada objeto. El objetivo es para construir los modelos de clasificación (a veces llamados clasificadores), que asigna la etiqueta de clase correcta a objetos antes no vistos y sin etiquetas. Los modelos de clasificación sobre todo son usados para el modelado predictivo. Las etiquetas de clase pueden ser presentadas en el avance -definida por el usuario, por ejemplo, o derivadas de la segmentación. La clasificación es uno de los tipos de problemas más importantes de minería de datos que ocurren en una amplia gama de aplicaciones. Muchos problemas de minería de datos pueden ser transformados a problemas de clasificación. Por ejemplo, intentando guardar créditos para evaluar el riesgo de acreditar a un cliente nuevo. Esto puede ser transformado a un problema de clasificación para crear dos clases, clientes buenos y clientes malos. Un modelo de clasificación puede ser generado de los datos de cliente existentes de acuerdo a su comportamiento crediticio. Este modelo de clasificación puede entonces ser usado para asignar a clientes nuevos a una de las dos clases y aceptarlo o rechazarlo. La clasificación tiene conexiones a casi todos los otros tipos de problemas. Los problemas de predicción pueden ser transformados a los problemas de clasificación por discretización de etiquetas de clase continuas, porque las técnicas de discretización permiten transformar rangos continuos en intervalos discretos. Estos intervalos discretos, más que los valores numéricos exactos, son usados como etiquetas de clase, y de ahí conducen a un problema de clasificación. Algunas técnicas de clasificación producen una clase comprensible o descripciones de concepto. Hay también una conexión al análisis de dependencia porque los modelos de clasificación típicamente usan (explotan) y aclaran las dependencias entre atributos. Página 80 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS La segmentación puede también proporcionar las etiquetas de clase o restringir el conjunto de datos para que buenos modelos de clasificación puedan ser construidos. Es útil analizar desviaciones antes de que un modelo de clasificación sea construido. Las desviaciones y contingencias (cosas fuera de lugar-outliers) pueden obscurecer el patrón que podría permitir un buen modelo de clasificación. De otro modo, un modelo de clasificación también puede ser usado para identificar desviaciones y otros problemas con los datos. Técnicas apropiadas: • • • • • • • Análisis de discriminante Métodos de inducción de regla Aprendizaje por árboles de Decisión Redes neuronales La K más cercana Razonamiento basado en caso Algoritmos genéticos Ejemplo: Los bancos generalmente tienen información sobre el comportamiento de pago de sus aspirantes de crédito. Combinando esta información financiera con otra información sobre los clientes, como el sexo, la edad, el ingreso, etc., es posible desarrollar un sistema para clasificar a clientes nuevos como clientes buenos o malos (esto es, el riesgo de crédito en la aceptación de un cliente es alto o bajo). 4.5.2.5. Predicción Otro tipo de problema importante que ocurre en una amplia gama de usos es la predicción. La predicción es muy similar a la clasificación. La única diferencia es que en la predicción el atributo objetivo (la clase) no es un atributo cualitativo discreto, sino es uno continuo. El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no vistos. En la literatura, este tipo de problema es a veces llamado regresión. Si la predicción trata con datos de serie tiempo, entonces a menudo lo llaman pronosticación. Técnicas apropiadas: • • • • • • Análisis de regresión Árboles de regresión Redes neuronales La K más cercana Métodos de la Caja-Jenkins Algoritmos genéticos Ejemplo: Página 81 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El rédito anual de una empresa internacional esta correlacionado con otros atributos como la promoción, la tasa de cambio, la tasa de inflación, etc. Teniendo estos valores (o estimaciones confiables), la empresa puede predecir su rédito esperado durante el próximo año. 4.5.2.6. Análisis de dependencia El análisis de dependencia consiste en encontrar un modelo que describe dependencias significativas (o asociaciones) entre artículos de datos o acontecimientos. Las dependencias pueden ser usadas para predecir el valor de unos datos de artículo dada la información sobre otros artículos de datos. Aunque las dependencias pueden ser usadas para el modelado predictivo, aquellos son mas usados por su comprensión. Las dependencias pueden ser estrictas o probabilísticas. Las asociaciones son un caso especial de dependencias, que recientemente se han hecho muy populares. Las asociaciones describen las afinidades de artículos de datos (esto es, artículos de datos o los acontecimientos que con frecuencia ocurren juntos). Un típico escenario de aplicación para asociaciones es el análisis de cestas que hacen compras. Allí, una regla como “en el 30 por ciento de todas las compras, la cerveza y cacahuetes han sido comprados juntos” es un ejemplo típico para una asociación. Los algoritmos para detectar asociaciones son muy rápidos y producen muchas asociaciones. Seleccionar el más interesante es un desafío. El análisis de dependencia tiene conexiones cercanas a la predicción y a la clasificación, ya que las dependencias implícitamente son usadas para la formulación de modelos predictivos. Hay también una conexión a descripciones de concepto, que a menudo destacan dependencias. En aplicaciones, el análisis de dependencia a menudo co-ocurre con la segmentación. En grandes conjunto de datos, las dependencias son raras veces significativas porque muchas influencias cubren el uno al otro. En tales casos, se aconseja realizar un análisis de dependencia sobre más segmentos homogéneos de datos. El modelo secuencial es una clase especial de dependencia en las que el orden de acontecimientos es considerado. En un análisis de cesta de compras, las asociaciones describen dependencias entre artículos en un tiempo dado. El patrón secuencial describe el modelo que hace compras de un cliente particular o un grupo de clientes en el tiempo. Técnicas Apropiadas: • • • • • • Análisis de correlación Análisis de regresión Reglas de asociación Redes bayesianas Programación de lógica inductiva Técnicas de visualización Ejemplo 1: Usando el análisis de regresión, un analista de negocio ha encontrado que hay dependencias significativas entre las ventas totales de un producto y tanto en su precio como en la cantidad de Página 82 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS gastos de publicidad. Este conocimiento permite al negocio alcanzar el nivel deseado de las ventas por cambio del precio del producto y/o el gasto de publicidad. Ejemplo 2: Aplicando algoritmos de regla de asociación a datos sobre accesorios de coche, una empresa de coches ha encontrado que en el 95 por ciento de casos, si un CD player es ordenado, una transmisión automática es ordenada también. Basado en esta dependencia, la empresa de coche decide ofrecer estos accesorios como un paquete, que conduce a la reducción del costo. Página 83 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 84 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 5. Descripción y desarrollo de la industria. 5.1. La industria automotriz y el control de daños y/o averías El nuevo orden internacional que comenzó a gestarse en la década del 70 y que luego fue impulsado por la terminación de la guerra fría y la oleada de internacionalización de las economías ha dado lugar a un nuevo paradigma en la división de trabajo. La especialización del trabajo no se realiza solo a nivel empresa o región sino a nivel mundial y puede involucrar tanto a regiones como a países e inclusive a continentes. Con el desarrollo de las tecnologías de las comunicaciones y los transportes desde hace dos décadas se asiste a un nuevo sistema de producción en la industria automotriz que se sostiene en base a la distribución de la producción de las diferentes marcas y modelos en masa al rededor del mundo. Todas las compañías automotrices hoy en día no producen todos sus modelos en una sola región o país sino que las mismas realizan acuerdos multinacionales para producir determinados modelos en determinados lugares para luego intercambiarlos entre los diferentes puntos de producción. De esta manera para asistir a cada mercado en cada región se realizan los convenios internacionales de intercambio de unidades necesarios para satisfacer las demandas. Este movimiento de intercambio de unidades entre las diferentes regiones del mundo ha llevado a esta industria a desarrollar un estricto control en el seguimiento e identificación del estado de las mismas a lo largo de su recorrido. Como consecuencia inmediata de este traslado de los productos surge que los costos por movimiento, reparación y puesta a punto de los automóviles es mayor a los costos de producción. Esto es, el costo por unidad producida es inferior al costo de la misma desde que sale de planta hasta que llega al cliente final. Las unidades pueden ser movilizados por diferentes tipos de transportes: aéreos, marítimos o terrestres (camiones o tren). El traslado de los autos puede ser con almacenamiento en contenedores o trincados independientemente uno de otro. También son estoqueados/almacenados en diferentes playas o patios con el objeto de ser reparados o simplemente por cuestiones comerciales previas a la distribución. Las cantidades transportadas en masa varían desde unos pocos (7, 11 o 13 unidades por transportes terrestre, por ejemplo bateas) a cientos (por ejemplo por tren) o inclusive a miles de unidades (por ejemplo buques equipados según normas internacionales para transportar desde cientos a miles de unidades). Para el control y la verificación del estado de cada unidad las diferentes empresas (marcas) han creado sus propios estándares de inspección o peritaje o verificación. Cada unidad es inspeccionada según los estándares impuesto por cada compañía en cada uno de los lugares por donde pasan o bien donde se estacionan. El camino que recorre cada unidad desde que sale de planta hasta que llega a un cliente final es lo que se denomina en la industria como “circuito logístico” o “cadena logística”. En cada circuito intervienen una o varias empresas denominadas operadoras logísticas. Cada operador logístico puede contratar (tercerizar) a otras empresas para el transporte de las unidades de punto a punto. Además también es frecuente la tercerización en el desarrollo de las inspecciones o peritajes que es realizado normalmente en los lugares donde se produce el intercambio de responsabilidad de una Página 85 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS empresa a otra. Así es que como ejemplos estándares de lugares o puntos de inspección se pueden nombrar: • • • • • • • controles a la bajada o subida de buque; controles dentro de los buques; controles a la entrada o salida de un puerto; controles dentro de los puertos (estiba); controles a la salida de una planta de producción; controles a la entrada o salida de un patio / playa (stock) comercial o por reparación; controles a la subida o bajada de bateas (camiones). 5.2. Circuitos logísticos Los elementos que lo componen son los diferentes medios de transporte (podrían ser llamados enlaces) y los puntos (podrían ser denominados nodos) por donde transitan o se estacionan los autos. Tanto los transportes como los lugares por donde pasan pueden ser lugares de distintas compañías, transportes de distintas compañías e inclusive el traspaso de un trasporte a un lugar o a otro trasporte puede ser realizado por otra empresa. La verificación o control de una unidad en sus diferentes puntos se desarrolla en función de los estándares de cada empresa. Las empresas pueden ser certificadas según normas internacionales o no, esto todavía en esta industria es irrelevante para algunas compañías. Ejemplo 1: Exportación Argentina Figura 1: Circuito exportación Ejemplo 2: Importación Argentina Figura 2: Circuito importación Página 86 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 5.3. Transportes y lugares de almacenamiento Como se ha mencionado anteriormente cada transporte puede tener diferentes capacidades. Normalmente el transporte terrestre se realiza a través de camiones o bateas. Pero también existe la posibilidad de ser realizado a través de trenes para lo cual con frecuencia se utilizan contenedores para resguardar la estructura del auto. Los transportes marítimos son todavía el medio de transporte más rentable para este negocio. Todo buque o barcaza está equipada con la tecnología y herramientas necesarias para transportar algunos miles de autos (hasta 4.000 unidades). Para el transporte de las unidades en el interior de un barco se realiza lo que en el medio se denomina trincado que consiste en amarrar desde diferentes puntos del auto (ruedas o parte de la estructura del auto) al piso del buque. De esta forma se evita el movimiento de los productos cuando el transporte es movilizado a través de un océano o río. El trasporte por vía aérea es el menos frecuente por razones de costo. Pero al igual que con el transporte marítimo las unidades pueden ir trincadas o bien también se suele utilizar contenedores. Página 87 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 88 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 6. Procesos a analizar, límites y alcance 6.1. Puntos de Control • Puntos de control y transporte Para el desarrollo del presente proyecto se definirán y tomarán muestras de puntos y transportes estándares en la industria; esto es, se trabajará con muestras tomadas de inspecciones realizadas frecuentemente por cualquier marca. A continuación se describen los puntos de control que intervienen en este proyecto. • Despacho de planta de producción Inspecciones realizadas sobre todas las unidades que salen de planta de producción y se dirigen por transporte terrestre (camiones) a patios o puertos. La imputabilidad de las observaciones notadas corresponde a planta de producción (normalmente denominada origen o averías de calidad). • Ingreso a puerto Procedente de diferentes lugares y trasladadas a través de camiones. La responsabilidad es imputada a transporte terrestre. • Subida a buque Luego de estadio en playa de puerto toda unidad es embarcada. Las inspecciones son realizadas previas a la entrada a rampa. La imputabilidad corresponde a patio de puerto. • Descarga de buque Unidades inspeccionadas a la descarga de un barco. Los daños y/o averías son imputados a las empresas de transporte marítimo. • Salida de puerto Luego de una determinada cantidad de tiempo las unidades son despachadas de puerto con destinos diferentes. Las unidades son cargadas a camiones. 6.2. Estándares de inspección Las observaciones realizadas son parametrizadas según los estándares impuestos por las compañías que intervienen como operadoras logísticas. Los daños y/o averías constan de tres partes claramente diferenciables: parte (área), avería (tipo de daño) y gravedad (severidad): • Parte: o denominada frecuentemente área, es un código alfanumérico de dos dígitos que identifica una de las partes del auto. Página 89 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • Avería: está compuesto por un código alfanumérico de dos dígitos y es utilizado para definir el tipo de daño. Gravedad: o severidad compuesto por un código alfanumérico definido para especificar la gravedad del daño o avería descubierto. Un campo de observación es también considerado como parte de la codificación estándar. Sirve para realizar cualquier aclaración sobre un daño que no se ha podido parametrizar directamente debido a la falta de los códigos que lo pueden definir. Algunos estándares incluyen un cuarto código compuesto por tres o cuatro dígitos alfanuméricos definidos para realizar una observación referente a la avería y que sirve para especificar que la avería fue descubierta en un lugar dos o tres puntos antes de la inspección en ese CP (check point). Página 90 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 7. Información y datos 7.1. Proceso de inspección y captura de datos El proceso de inspección se realiza solo sobre las partes visibles de la unidad. El presente proyecto no incluye todas las fallas o desperfectos mecánicos del auto. Cada perito o inspector aplica la norma estándar para observar y recorrer el vehículo en búsqueda de daños y/o averías. Las inspecciones sobre cada unidad pueden ser realizadas por uno o más peritos. La cantidad de inspectores depende de los acuerdos realizados entre las empresas y de las verificaciones posteriores o anteriores que se realizan a cada unidad. Los automóviles transitan por las diferentes cadenas logísticas con la documentación correspondiente. Esta documentación incluye lo que se denomina VIN (Vehicle Identification Number) que es un código alfanumérico de 17 o 18 dígitos. El VIN tiene una estructura estándar en la industria y a partir de este se pueden conocer datos del vehículo como el origen, la marca, el modelo, el color, etc. Este número alfanumérico viene impreso en la documentación en código de barras. La gran mayoría de las marcas trabaja con el código de barras denominado 128. Pero también se usan otras normas como la 3 de 9 o 3 de 6. Siempre el auto tiene impreso el VIN en código de barras de 17 o 18 dígitos. Del procedimiento de inspección realizado surge un código de avería si es observada en la unidad. La misma, según un proceso estándar, hoy en día, es cargada manualmente por cada perito. Luego esta información es almacenada en una base de datos la cual es alimentada diariamente por todas las inspecciones realizadas. En algunos procesos de carga masiva de datos se utilizan colectores electrónicos de datos y en otros simplemente se transforma o procesa la información suministrada por la compañía interesada en verificar las unidades (entrega lo que se denomina parking list de vehículos). Los procesos de carga masiva se realizan en proceso batch o por radio frecuencia. Este último va almacenando on line en la base de datos unidad por unidad inspeccionada. 7.2. Sistema normalizado de codificación de daños y/o averías Los datos cargados (los cuales son utilizados en este proyecto) son: VIN, parte, avería, gravedad, observación y código de clave (o código que especifica el origen real de la avería). 7.3. Proceso de educción de requerimientos del proyecto Comprensión del dominio El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. Más detalles sobre la determinación de los objetivos se encontrarán en el módulo de “Comprensión del Negocio” de la metodología CRISP-DM detallada más adelante. Los actores involucrados para la obtención de los datos necesarios para el desarrollo del presente trabajo son: Página 91 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • Especialistas en consultoría marítima y peritajes navales Especialistas en inspección de unidades automotrices Especialistas en desarrollo de tecnología para la captura de datos y desarrollo de base de datos para el almacenamiento de los mismos. En referencia a los límites del proyecto se puede hacer referencia al hecho de explotar la información almacenada en las base de datos desde el período 2002 a 2008. Se cuenta con dos cadenas logísticas de exportación, dos cadenas logísticas de importación y puntos de control de carga y descarga de autos en puertos de Argentina y Brasil. Identificación de necesidades El objetivo del requisito es la búsqueda e identificación de los diferentes tipos de averías y/o daños en las unidades. Esta necesidad surge de las compañías que intervienen en el proceso como consecuencia del movimiento fluido de unidades de lugar en lugar. Es necesario también por cuestiones operacionales debido a que en toda la cadena de suministro es necesario poder establecer los recursos consumidos para el movimiento de las unidades. Con la posibilidad de asignar recursos es posible establecer los costos que demandará el sistema logístico. Con el establecimiento de los patrones buscado es posible para cada parte interesada poder presupuestar en función de las cantidades movilizadas los costos por reparación de los daños. El equipamiento de los sistemas de transporte es otro ítem a cubrir como consecuencia del descubrimiento de patrones de producción de daños y averías. Todo proveedor de servicio de transporte debe cumplir con determinadas condiciones para asegurar la conducción segura de las unidades. El origen de la información para este proyecto se encuentra en bases de datos normalizadas. Las mismas son alimentadas diariamente por personal capacitado y experto en la identificación de daños. Se cuenta con equipamiento electrónico para la captura automática de datos por lo que la posibilidad de errores en la información es mínima. Del mismo modo la consistencia de la información es controlada diariamente tanto por el personal responsable directamente de la misma como de los clientes que acceden para verificar el estado de las unidades movilizadas a los largo de los circuitos y/o en los diferentes puntos de control. Para la realización de la búsqueda de la información se cuenta con información detallada de: • • • • • • • Cantidad de unidades transportadas Lugares por donde pasan las unidades Trasportes, tipos y compañías Partes averiadas Tipos de averías Severidad de averías Responsables de averías Página 92 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Identificación de riesgos y contingencias Al momento de desarrollar el presente proyecto no se detectan riesgos para su desarrollo y por lo tanto no es necesario definir planes de contingencia. Se cuenta con la información electrónicamente tomada y con el personal capacitado para el análisis de la información. El hecho de no ver en este momento del proyecto riesgos potenciales no significa que no existan puesto que al tratarse específicamente de una minería de datos (definida como el intento por descubrir información oculta en los datos) es probable que los resultados obtenidos coincidan con trabajos relacionados por empresas privadas con el objetivo de reducir o presupuestar costos. En función de esto último se puede describir como plan de contingencia ante este probable riesgo el desarrollo de un informe parametrizado con datos precisos y/o la valorización de los patrones de daños y/o averías detectadas. Evaluación de herramientas de explotación de información Por cuestiones de índole práctico y a los efectos de llevar acabo el presente trabajo de tesis de maestría se utilizan herramientas de explotación de datos suministradas por los Directores de Tesis, las mismas son: • • • Software para Construcción de Árboles de Decisión utilizando un Modelo de Clasificación. Software para Agrupamiento usando Mapas Autoorganizados. Software para Construcción de Modelos de Predicción. Página 93 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 94 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8. Aplicación de la metodología propuesta. 8.1. Comprensión del Negocio 8.1.1. Objetivos del negocio El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. De esto último también se puede inferir que es de utilidad para la toma de decisiones el poder determinar o definir los lugares donde se producen los daños y las imputaciones de las mismas. Descubrir donde se producen los siniestro conduce a la definición de políticas para la prevención de las fallas en el sistema. De esto último surgen las medidas correctivas a llevar a cabo. Los objetivos pueden ser resumidos en: • • • • • • • • • Identificar daños y/o averías. Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de transporte. Imputar incidentes según el tipo de transporte. Determinar tipos de averías y/o daños. Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento. Especificar gravedad de daños y/o averías. Especificar lugares donde se producen daños y/o averías tratando de definir patrones de comportamiento. Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así también, partes, tipos de averías, gravedades, lugares donde se producen. Descubrir información “oculta” en función de los modelos generados a partir de los datos disponibles. Contexto actual En referencia a la situación global del negocio se puede decir que toda la información necesaria para la explotación de datos se encuentra disponible electrónicamente pero en forma dispersa. Esto es, cada organización que interviene en cada circuito logístico tiene su propia sistema de análisis de daños y/o averías e inclusive los estándares con los cuales se parametriza la información es distinta una de otra. No hay en el medio un estudio en profundidad sobre el comportamiento de los estados por los que atraviesa una unidad automotriz en referencia al estudio de daños, averías, responsables e imputaciones. Departamentos involucrados en cada compañía Los departamentos involucrados en el desarrollo en el control y seguimiento de unidades automotrices de los cuales surge la información y hacia los cuales está destinado el resultado del proyecto son: • • Departamento de calidad Departamento de ventas Página 95 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • Departamento de operaciones Departamento de sistemas Departamento de logística y distribución Área del problema La producción de daños y averías es prácticamente inevitable debido al movimiento de las unidades y al traspaso de empresa a empresa y de medio a medio de trasporte. Del mismo modo es vital para la industria la especificación y determinación clara de las responsabilidades por cada siniestro. De lo afinado que se encuentre el sistema depende el abastecimiento de unidades a los mercados objetivos. La minería de datos debe ser promovida en esta actividad debido a que no existen registros documentados de comportamientos estándares en la producción de siniestros. Todo lo relacionado con cantidades tanto de producción, como exportación o importación están claramente detalladas tanto para las compañías que intervienen en la industria como en los organismos gubernamentales y no gubernamentales. Todo análisis de siniestros y especificación de tiempos de abastecimiento y reparación de unidades se realiza individualmente y en forma reactiva. Solución actual Actualmente se recurre a las consultas manuales (por ejemplo SQL) para obtener los datos necesarios para tener conocimiento de la situación de las unidades. En el caso de que haya discrepancias en cuanto a las responsabilidades o imputabilidad de daños y/o averías se realiza un cruce de información entre las compañías que intervienen la operatoria logística. Objetivo primario de negocio El objetivo primario de negocio para el presente proyecto es la posibilidad de detectar el comportamiento de los daños y/o averías que se producen en las unidades automotrices 0 kilómetro a lo largo de su circuito logístico. Actividades Cumplir con los objetivos propuestos por la aplicación de la metodología de explotación de datos dará respuesta a las siguientes preguntas: • • • • • • • • • ¿Cuáles son las partes de los vehículos con mayor y menor incidencia de daños? ¿Cuáles son los tipos de daños de mayor y menor frecuencia? ¿Qué gravedad tienen frecuentemente las averías producidas? ¿Cuáles son la mayor y menor cantidad de partes faltantes? ¿Cuáles son los lugares donde se producen la mayor y menor cantidad de daños? ¿Cuáles son los trasportes que provocan la mayor y menor cantidad de daños? ¿Qué marcas y modelos son dañados con mayor y menor frecuencia? ¿Cuáles son las mayores y menores combinaciones de partes y averías producidas? ¿Cuáles son los mayores y menores combinaciones de partes y faltantes producidos? Página 96 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • • ¿Cuáles son las mayores y menores combinaciones de partes, averías y gravedades producidas? ¿Cuáles son los periodos de mayor flujo de exportación e importación de unidades vía marítima? ¿Cuáles son los porcentajes de siniestralidad producidas por cantidad de unidades movilizadas? ¿Cuáles son los porcentajes de más de una averías en las unidades automotrices? ¿Cuáles son los porcentajes de unidades dañadas por cantidad de unidades inspeccionadas? Criterios de éxito Desde el punto de vista del negocio se establece como criterio de éxito el poder: • • • • • • • Especificar daños y/o averías; cantidades, tipos y severidad. Establecer responsabilidades específicas. Especificar tipos de transportes que producen las averías y tipos de avería. Establecer claramente averías y tipos de averías. Definir comportamientos de averías y daños. Especificar lugares de producción de daños. Definir estadísticamente tipos de transportes, partes, tipos de averías, gravedades e imputabilidad de daños y/o averías. El criterio de éxito del proyecto estará definido por personal experto en el desarrollo de las actividades de inspección, captura de datos, análisis de información y tecnología con experiencia comprobable en el negocio. Expertos en el proceso operativo y tecnológico llevarán adelante todo el proceso de establecimiento de criterio de éxito del proyecto. 8.1.2. Evaluación de la situación Situación Se cuenta con información detallada de las operaciones vinculadas a las inspecciones de unidades automotrices desde 2002 a la fecha. Todas las bases de información se encuentran normalizadas y con la documentación vinculada a las mismas. Actualmente las bases de datos se encuentran en línea y funcionando bajo un desarrollo Web. Está están siendo utilizadas y alimentadas diariamente. Recursos de software Se cuenta con los siguientes sistemas: • • • • Servidor de base de datos. Software para la Construcción de un Árbol de Decisión utilizando un Modelo de Clasificación. Software para Agrupamiento usando Mapas Autoorganizados. Software para la Construcción de un Modelo de Predicción. Página 97 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Recursos de hardware Están a disposición los siguientes sistemas de hardware: • • • • Equipamiento para la producción y almacenamiento de la base de datos, y el entrenamiento de los modelos: 1. CPU Microprocesador Intel ® Core ™ 2, 1.7 GHz, 512 MB RAM, 60 GB HD. 2. CPU Microprocesador Intel ® Pentium ® 4, 1.7 GHz, 640 MB RAM, 80 GB HD. 3. Monitor 17’’. 4. Monitores 17’’. 5. Impresora Láser. Servidor de base de datos local instalado para el resguardo de las base de información en línea. 1. Servidor Microprocesador Intel ® Pentium ®, 3 GHz, 1 GB RAM, 160 GB HD. 2. Servidor Microprocesador Intel ® Pentium ®, Dual, 1.8 GHz, 1.5 GB RAM, 320GB HD. 3. Monitor 15’’. Acceso irrestricto a las base de datos en línea y publicadas por Web. Sistema de banda ancha 3 MB conectado directamente a los servicios publicados en producción. Además se cuenta con personal experimentado en inspecciones a los cuales se puede acceder para realizar las consultas necesarias para aclarar cualquier inquietud. Fuentes de datos y conocimiento Se cuenta con la siguiente información: • • • • • Base de datos con información vinculada a los movimientos de importación y exportación de vehículos (dos marcas del mercado argentino con destino y origen Brasil y Francia, año 2002 a 2008). Base de datos con información vinculada a los movimientos de exportación de vehículos (dos marcas del mercado brasileño con destino Argentina, año 2002 a 2008). Base de datos con información de empresa de transporte marítimo referida a los movimientos de unidades de importación y exportación de autos (varias marcas del mercado argentino con destino y origen de diferentes países, año 2006 a 2008). Base de datos con unidades de importación y exportación de empresa de transporte marítimo (varias marcas del mercado brasileño con destino y origen de diferentes países, año 2004 a 2008). Base de datos con información de movimientos de autos de una empresa de transporte terrestre (una marca del mercado argentino año 2004). Fuentes de personal Se cuenta con personal experto en inspecciones y con acceso a los mismos si restricciones de tiempo. Hay contacto directo y permanente con los administradores de sistemas, de personal y de soporte técnico. Página 98 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El proyecto cuenta con el apoyo técnico operativo y tecnológico en todo momento. Se tiene acceso inclusive a lugares donde se genera la información y se realiza su almacenamiento. Requerimientos, presunciones, y restricciones Los datos pueden ser usados transformando toda información relacionada directamente con: • Marcas de vehículos. • Modelos de vehículos. • Nombres de buques y compañías marítimas. • Números de batea y nombre de compañías de transporte terrestre. • Nombres de todas las empresas vinculadas a las operaciones en cualquier punto de control. Para el uso de la información se procederá a desarrollar un sistema de codificación alfanumérica para evitar inconvenientes legales. La validez de los resultados obtenidos puede ser verificada directamente consultando sobre las bases de datos. Terminología Ver Anexo 1: Glosario de terminología relevante de negocio. Ver Anexo 2: Glosario de terminología de minería de datos. 8.1.3. Objetivos de minería de datos Los objetivos en términos de minería de datos son: • • • • • • • • • • • • • Determinar el comportamiento de partes de vehículos con mayor y menor incidencia de daños. Determinar el comportamiento de tipos de daños de mayor y menor frecuencia. Determinar el comportamiento de gravedades que tienen frecuentemente las averías producidas. Especificar el comportamiento de partes faltantes con mayor y menor incidencia. Determinar lugares donde se producen la mayor y menor cantidad de daños. Especificar el comportamiento que provoca la mayor y menor cantidad de daños según los tipos de transporte. Definir el comportamiento de marcas y modelos dañados con mayor y menor frecuencia. Definir el comportamiento de las mayores y menores combinaciones de partes y averías producidas. Definir el comportamiento de las mayores y menores combinaciones de partes y faltantes producidos. Determinar el comportamiento de las mayores y menores combinaciones de partes, averías y gravedades producidas. Determinar el comportamiento de los flujos de exportación e importación de unidades vía marítima. Determinar el comportamiento de siniestralidad producidas por cantidad de unidades movilizadas. Determinar el comportamiento de más de una avería en las unidades automotrices. Página 99 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Definir el comportamiento de unidades dañadas por cantidad de unidades inspeccionadas. Actividades Clasificación: Por año 2003, 2004, 2005, 2006, 2007, 2008. • • • • • • • • • • • Mes de operación Mes de producción Puntos de control Empresa de transporte marítimo Empresa de almacenamiento Empresa de producción de autos Número de batea Modelo de vehículos Parte de vehículos Tipo de averías Gravedad Agrupamiento: Por año 2003, 2004, 2005, 2006, 2007, 2008. • • • • • • • • • • • Mes de operación Mes de producción Puntos de control Empresa de transporte marítimo Empresa de almacenamiento Empresa de producción de autos Número de batea Modelo de vehículos Parte de vehículos Tipo de averías Gravedad Predicción: Por año 2003, 2004, 2005, 2006, 2007, 2008. • • • • • • • • • • • Mes de operación Mes de producción Puntos de control Empresa de transporte marítimo Empresa de almacenamiento Empresa de producción de autos Número de batea Modelo de vehículos Parte de vehículos Tipo de averías Gravedad Página 100 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Criterios de éxitos de la minería de datos Los resultados serán evaluados y controlados contra consultas SQL directas sobre la base de datos. En función de las muestras de consultas manuales a cada base de datos se establecerán los criterios de éxitos de cada resultado. Para cada resultado se especificará un patrón manual de consulta. 8.1.4. Producción del plan del proyecto Plan de proyecto Se tomarán muestras de las bases de datos en producción según los puntos descritos en los ítems del presente proyecto vistos anteriormente. A cada una de las muestras tomadas se analizará el contenido y se realizarán trabajos de normalización de información y adaptación para su mejor interpretación. En forma paralela se irá describiendo en detalle en diccionario de terminología de negocio (Anexo 1) todo el vocabulario usado en la industria. • Etapa 1: Análisis de la estructura de datos e información de las bases de datos en producción. Tiempo estimado 3 semanas. • Etapa 2: Ejecución de consultas para la captura de muestras representativas para lograr los objetivos del proyecto. Tiempo estimado 1 semana. • Etapa 3: Conversión y normalización de datos según estructura requerida por los sistemas donde los datos será procesados. Tiempo estimado 3 semanas. • Etapa 4: Ejecución de los procesos de explotación de datos sobre toda la información obtenida y parametrizada. Tiempo estimado 1 semana. • Etapa 5: Análisis de los resultados obtenidos en función de los procesos ejecutados en el punto anterior. Tiempo estimado 2 semanas. • Etapa 6: Según los resultados obtenidos se procederá a ejecutar nuevamente los procesos de explotación de datos. Tiempo estimado 1 semana. • Etapa 7: Desarrollo de reportes en función de los resultados obtenidos y considerando los objetivos de negocios del presente proyecto. Tiempo estimado 1 semana. • Etapa 8: Análisis y desarrollo de las conclusiones obtenidas según los resultados de cada proceso. Tiempo estimado 2 semanas. • Etapa 9: Desarrollo de presentación de los resultados obtenidos a los participantes del proyecto. Tiempo estimado 1 semana. Página 101 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Nota: Durante cada una de las etapas del proyecto se irá desarrollando en paralelo el diccionario de terminología de negocio (Anexo 1) y de minería de datos (Anexo 2). Evaluación inicial de herramientas y técnicas Construcción de árboles basado en modelo de clasificación. Los Árboles de clasificación, o también llamados modelos basados en árboles, se fundamentan en el principio de “divide y vencerás”, construyendo un árbol que en cada nodo establece unas condiciones sobre un atributo, dividiendo así el conjunto de casos en subconjuntos que cumplen cada condición. Los subconjuntos se vuelven a dividir añadiendo nuevos niveles al árbol hasta detenerse mediante algún criterio. Agrupamiento usando mapas autoorganizados Técnicas que agrupan los datos en función de una distancia sin utilizar ningún tipo de información externa para organizar los grupos. Clustering no supervisado. Conjunto de técnicas que agrupan los datos en función de una distancia sin utilizar ningún tipo de información externa para organizar los grupos. Dependiendo de la forma en la que los datos son agrupados, podemos distinguir dos tipos de clustering: • Jerárquico: El clustering jerárquico aglomeratico es un método determinista basado en una matriz de distancias. Establece pequeños grupos de genes/condiciones que tienen un patrón de expresión común y posteriormente construye un dendograma (representación grafica de un grupo de relaciones basadas en la cercanía o similitud entre los datos) de forma secuencial. El árbol o dendograma, establece una relación ordenada de los grupos previamente definidos y la longitud de sus ramas es una representación de la distancia entre los distintos nodos del mismo. En el desarrollo del clustering jerárquico se han utilizado diferentes algoritmos (UPGMA, Ward, etc.) aunque todos siguen la misma estrategia en general: separan cada gen en un nodo diferente, calculan la distancia entre los dos genes más próximos y los juntan en un cluster. Entonces se vuelve a calcular la matriz de distancias sustituyendo los dos patrones que se han unido por el promedio de ambos. En cada paso, los algoritmos son capaces de juntar los genes no solo de dos en dos sino muchos más a la vez. Muchos de ellos simplemente se diferencian en la forma en la que calculan la distancia del nuevo cluster formado al resto de los elementos de la matriz, y en este sentido, la aproximación del “Average linkage” (algoritmo que opera agrupando iterativamente los genes o clusters que presentan la distancia media mas pequeña en cada paso sucesivo del calculo de la matriz de distancias) es la mas utilizada. • Por otro lado existe el clustering jerárquico divisivo que es similar al anterior pero agrupa los genes de forma inversa. Mientras que el clustering aglomerativo separa inicialmente todos los genes y posteriormente los va agrupando para construir clusters más grandes, el clustering divisivo agrupa inicialmente todos los genes en un único cluster y sucesivamente los va separando hasta que cada uno se encuentre aislado como una entidad. Es decir, el método divisivo va identificando aquellos genes con un patrón más diferente para separarlos en el espacio lo más posible. Este es el caso de SOTA (Self-Organizing Tree Algorithm). A pesar de que no esta exento de problemas, el clustering es una herramienta poderosa para la reducción de los datos obtenido de microarrays y para el estudio de posibles hipótesis que Página 102 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS relacionan los clusters de genes obtenidos con el fenotipo. Sin embargo, este tipo de relaciones deben ser formalmente validadas por otros experimentos adicionales. • No jerárquico: En este caso los algoritmos comienzan a calcular la matriz de distancias a partir de un numero predefinido de clusters y van recolocando de forma iterativa los genes en los diferentes grupos hasta minimizar la dispersión interna de cada cluster. Los dos algoritmos más representativos de este tipo de clustering son: 1. K-Medias: es un algoritmo que comienza con una muestra de “k” genes elegidos al azar de la matriz original de datos. Cada uno de ellos se utiliza como el centroide inicial de los “k” clusters que se van a formar. La matriz de distancias se calcula desde dicho centroide hasta cada uno de los genes de la matriz de datos y cada uno de ellos será asignado de esta forma al centroide más cercano. Entonces la matriz de distancias se recalcula reemplazando cada centroide por la media de los genes asignados a él y el algoritmo repite entonces el proceso anterior. El mapa de clusters que ofrece este algoritmo carece de topología. 2. SOM: los mapas auto-organizados (Self-Organising Maps) son redes neuronales. El algoritmo permite, de forma iterativa, que los patrones mas parecidos se vayan juntando entre si y alejándose de aquellos otros que son mas diferentes. Este tipo de algoritmos son más fiables y robustos puesto que se basan en redes neuronales que por definición son capaces de trabajar con grandes cantidades de datos con ruido. Sin embargo, no carece de ciertos inconvenientes. SOM es una herramienta particularmente útil en el tratamiento de datos procedentes de series temporales. El gran problema que presentan estos métodos no jerárquicos es que al no generar un dendograma no permiten hacerse una idea de la representación espacial de los genes, la cual suele ofrecer un conocimiento intuitivo de cómo analizar los datos de microarrays. Clustering supervisado: se basa en la idea de que para la clasificación de la mayoría de muestras biológicas ya existe información preliminar que puede utilizarse para agrupación de nuevos datos en clusters. Los métodos supervisados aprenden de esta información previa, generalmente ofrecida por un conjunto de datos de “entrenamiento”, la forma en que deben clasificar los nuevos datos (genes o condiciones) que se les presentan. SVM (Supported Vector Machines): es una técnica lineal que utiliza hiperplanos para separar los datos en el espacio como puntos negativos o positivos. Los datos de estudio son clasificados respecto de otro conjunto de datos previamente conocido. Preceptrones: están basados en redes neuronales. Tienen algunas ventajas sobre las SVM como por ejemplo la capacidad de clasificar muchas muestras al mismo tiempo y discriminar entre varias clases diferentes. Construcción de un modelo de predicción Otro tipo de problema importante que ocurre en una amplia gama de usos es la predicción. La predicción es muy similar a la clasificación. La única diferencia es que en la predicción el atributo objetivo (la clase) no es un atributo cualitativo discreto, sino es uno continuo. Página 103 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no vistos. En la literatura, este tipo de problema es a veces llamado regresión. Si la predicción trata con datos de serie tiempo, entonces a menudo lo llaman pronosticación. 8.2. Comprensión de Datos 8.2.1. Recolección de datos iniciales 8.2.1.1. Informe de la recolección de datos inicial • Identificación de autos Cada unidad automotriz se identifica con un número el cual se específica en cada uno de los registros que componen el presente trabajo. Toda unidad está relacionada con una avería la cual es producida en un determinado lugar, por una determinada empresa responsable. • Modelos Los datos relacionados con el nombre real del modelo son reemplazados por códigos numéricos los cuales son extraídos directamente de cada consulta a la base de datos. • Lugares Los diferentes tipos de lugares están codificados. Los lugares están relacionados con los sitios donde las unidades son estacionadas transitoriamente. • Tipos de transporte Los transportes también están codificados por un número y los mismos son de diferente tipo. Esta información es referida a los transportes y tipos de transporte que trasladan los vehículos de un sitio a otro. • Empresas Cada empresa responsable por un siniestro es extraída con un código numérico. Todo sitio o transporte están vinculados a una empresa. • Partes Cada parte de una unidad automotriz es identificada con un número que usualmente está compuesto por dos dígitos alfanuméricos. Cada número representa una parte de un auto. • Averías Cada tipo de avería de cada siniestro está representado por un número. Normalmente es un código compuesto por dos dígitos alfanuméricos. • Gravedades Los diferentes niveles de avería son también extraídos con un número. Representan la severidad que tiene una avería en una determinada parte del auto. • Observación También referida a cada avería y tiene como objetivo el describir un daño que no puede ser codificado en función del estándar de inspección especificado. Es un campo alfanumérico de N cantidad de caracteres. Página 104 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Fechas Las fechas son extraídas en formato numérico con el formato aaaammdd: 4 caracteres numéricos correspondientes al año, 2 al mes y 2 al día. Requerimientos de información La información necesaria para el logro de los objetivos del proyecto son los descritos en el ítem anterior y lo mismos se encuentran disponibles en las bases de datos. Criterio de selección de los datos Los atributos específicos necesarios para la minería de datos son: • • • • • • • • Identificador de autos Fecha de operación en la que se detecta el daño Modelo de cada unidad Lugar Parte del auto donde se produce la avería Tipo de avería producida en cada unidad Severidad o gravedad de avería producida Observaciones por cada unidad Tablas seleccionadas para la extracción de datos: • • • • • • • • • • • • • Autos Operaciones Daños Autos – Operaciones Modelos Marcas Lugares Empresas Partes Averías Gravedades Compañías Buques Los datos se extraerán según la fecha de operación en la que se ha detectado cada avería. Los periodos establecidos para realizar las particiones de datos extraídos es anual des el año 2003 hasta el año 2008. Todos los datos son extraídos de un sistema estándar como lo es el SQL Server. La estructura de cada base de datos esta normalizada. Inserción y transformación de datos Los datos que contienen solo descripciones compuestas por caracteres alfanuméricos son los relacionados con las observaciones. Página 105 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS En cuanto a la transformación de datos se encuentra la necesidad de codificar los datos de modelos debido a que los mismos se encuentran (en dos de las marcas incluidas en el presente proyecto) en formato de caracteres. Para cada una de las consultas realizadas en la generación del código seleccionador se procede a la transformación automática de los modelos en códigos numéricos. 8.2.2. Descripción de datos En lineamientos generales todos los datos extraídos están codificados numéricamente por lo tanto la necesidad de manipulación de los mismos es mínima a la hora de llevarlos a los modelos a utilizar en el proyecto. Los tipos de datos extraídos son: • • • • • • • • Identificador de autos: numérico Fecha de operación en la que se detecta el daño: numérico Modelo de cada unidad: numérico Lugar: numérico Parte del auto donde se produce la avería: numérico Tipo de avería producida en cada unidad: numérico Severidad o gravedad de avería producida: numérico Observaciones por cada unidad: alfanumérico Análisis volumétrico de datos Datos y métodos de captura Los datos son extraídos realizando consultas con tecnología SQL. Luego la información estructurada es almacenada en planillas de cálculo y posteriormente se cargan en los modelos para ser analizados. Si es necesario algún tipo de transformación para cada grupo de datos capturado el proceso para transformar los mismos se realiza con sentencias SQL. La disponibilidad de datos es 100 % accesible. Fuentes de datos Como lo mencionado en párrafos anteriores la fuente de datos se obtiene por en línea desde los sistemas en producción las cuales son alimentadas diariamente. Tablas y relaciones Autos – Operaciones: Estas tablas se relacionan para identificar las operaciones que son realizadas diariamente y la cantidad de unidades que contienen las mismas. Daños – Autos – Operaciones: Esta relación permite al sistema relacionar las averías tomadas a cada auto y para una operación especifica. Daños – Partes: Relacionadas para obtener los códigos y la descripción con la que se identifica cada parte en un daño determinado. Página 106 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Daños – Averías: Estas tablas están relacionadas para obtener los códigos y descripción de los diferentes tipos de averías contenidos en un daño. Daños – Gravedades: Relacionadas para detallar los códigos y la descripción de cada nivel de gravedad para un daño específico. Operaciones – Buques: Desde allí se obtienen los datos vinculados a los buques que forman parte de una operación determinada si la misma es realizada en puerto tanto a la bajada como a la subida de los autos a cada navío. Operaciones – Compañías: Relacionadas para obtener información vinculada a las empresas responsables por los daños u observaciones realizadas para cada unidad automotriz. Operaciones – Puntos de control: Toda operación está vinculada a un lugar específico en la cadena. Esta relación permite al sistema obtener información detallada de lugar donde se realizó la inspección del auto. Operaciones – Imputaciones: Estas tablas están relacionadas para poder saber cuales es el tipo de transporte o bien el tipo de lugar donde se produce una determinada avería. 8.2.3. Exploración de datos • Árboles de Decisión con Modelo de Clasificación. El algoritmo de construcción de árboles de decisión trabaja sobre la cantidad de registros tomadas sin especificación de cantidad máxima y el objetivo inicial es el descubrimiento de patrones para el comportamiento de las averías en lugares, tipos de transporte, modelos y marcas. El procesamiento de datos se realiza según los periodos definidos. • Agrupamiento con Mapas Autoorganizados. El agrupamiento de información se realiza con 5000 registros como máximo y se toman matrices de 3 x 3, 4 x 4, y 10 x 10. Del mismo modo que en el algoritmo anterior el proceso de la información se realiza en función de los periodos establecidos. Los agrupamientos se realizan sobre modelos, lugares, partes, averías y severidades. • Modelos de Predicción. La construcción de los modelos de predicción se desarrolla sobre 2000 registros como cantidad máxima. Se procesan corridas para el análisis de datos de partes, averías, lugares, modelos, severidades y marcas. Con esta información se puede obtener el comportamiento de las averías en relación a determinadas partes, lugares, y tipos de transporte. En este caso también los registros son procesados según los periodos establecidos. Informe de exploración de datos Se realiza la exploración de datos sobre información extraída desde el año 2003 al 2008. Los primeros resultados van a mostrar información estadística y principalmente sirve para determinar la consistencia y completitud de datos. Página 107 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS También en esta etapa se va ha poder ver la necesidad de extraer de la base de datos atributos que posiblemente fueron omitidos y los cuales a partir de esta primera exploración se pueden vislumbrar. De la exploración inicial de toda la información disponible para el presente estudio se define la división de los periodos de procesamiento de datos de la siguiente forma: • Muestra 1: Año 2003, 16 modelos. • Muestra 2: Primer semestre año 2004, 11 modelos. • Muestra 3: Segundo semestre año 2004, 13 modelos. • Muestra 4: Primer semestre año 2005, 19 modelos. • Muestra 5: Segundo semestre año 2005, 18 modelos. • Muestra 6: Primer semestre año 2006, 18 modelos. • Muestra 7: Segundo semestre año 2006, 22 modelos. • Muestra 8: Primer semestre año 2007, 20 modelos. • Muestra 9: Segundo semestre año 2007, 22 modelos. • Muestra 10: Primer semestre año 2008, 22 modelos. Para cada uno de los periodos establecidos el estudio comprende los siguientes lugares: • • Importación: salida de planta de origen, subida a buque puerto de origen, bajada de buque puerto de destino, salida de puerto de destino. Exportación: salida de planta, ingreso a puerto, subida a buque. En referencia a las empresas y tipos de transporte por cada lugar se encuentran: • • • Transporte terrestre: 4 empresas. Transporte marítimo: 92 buques correspondientes a 21 compañías. Puertos: 3 empresas. Para concluir con el presente informe de exploración de datos se detallan las diferentes cantidades de datos a analizar y los gráficos donde corresponden. • • • • Cantidad total de registros explotar: 50246 Cantidad total de modelos que intervienen: 22 Cantidad de partes de autos: 99 Cantidad de tipos de averías: 11 Página 108 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS En los gráfico siguientes se muestran resultados de la exploración de datos inicial sobre al totalidad de la información con la que se desarrolla el presente proyecto. Los gráficos muestran la información den dibujo de barras y de tortas para una mejor interpretación de los resultados. El Gráfico 1 muestra las cantidades de unidades producidas en función de los lugares donde se producen y del recorrido que realizan. 25000 22075 20000 15000 10000 5070 5000 2390 1544 0 Retiro Fábrica de Subida Buque Bajada de Buque Origen Puerto de Origen Retiro de Puerto Gráfico 1: Cantidad de averías por lugar (Importación de vehículos) En el Gráfico 2 se muestran las mismas cantidades del gráfico 1 en dibujo de tortas. Allí también se puede observar el porcentaje de averías en función de los lugares en un circuito común de importación de vehículos. Retiro de Puerto; 1544; 5% Retiro Fábrica de Origen; 2390; 8% Bajada de Buque; 5070; 16% Subida Buque Puerto de Origen; 22075; 71% Gráfico 2: Cantidad de averías por lugar, cantidades y porcentajes (Importación de vehículos) El Gráfico 3 permite ver las cantidades por lugares de detección de averías en un circuito estándar de exportación de autos. Página 109 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 12000 10137 10000 8000 6647 6000 4000 2383 2000 0 T ransferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Gráfico 3: Cantidad de averías por lugar (Exportación de vehículos) El Gráfico 4 detalla las cantidades de averías en función de los lugares y permite ver los porcentajes y cantidades en un circuito estándar de exportación. Subida a Buque; 2383; 12% T ransferencia ubicación y línea de carga; 10137; 53% Ingreso a Puerto; 6647; 35% Gráfico 4: Cantidad de averías por lugar, cantidades y porcentajes (Exportación de vehículos) El Gráfico 5 muestra los 10 modelos de vehículos con mayor cantidad de dañados. 16000 14060 14000 11890 12000 9129 10000 8000 6000 4814 3734 4000 2612 1577 2000 798 17 20 9 5 7 13 8 18 6 434 5 253 0 1 2 3 4 5 6 7 8 9 10 Gráfico 5: Los 10 modelos con mayor cantidad de averías El Gráfico 6 permite ver los 10 modelos con mayor cantidad de averías especificando cantidades y porcentajes del total tomado como referencia. Página 110 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 9; 6; 6% 10; 5; 5% 1; 17; 16% 8; 18; 17% 2; 20; 18% 7; 8; 7% 3; 9; 8% 6; 13; 12% 4; 5; 5% 5; 7; 6% Gráfico 6: Los 10 modelos con mayor cantidad de averías, porcentajes y cantidades El Gráfico 7 muestra las 10 partes de vehículos dañadas más frecuentemente. Solo se toman estás 10 áreas para tener referencia y como consecuencia de la primera exploración de datos. 5000 4500 4403 4401 4286 3926 4000 3568 3500 3029 3000 2500 1975 2000 1906 1744 1296 1500 1000 500 0 Puerta d elantera Parag o lp e Puerta d elant era Derecha tras ero / Sp o iler izq uierd a t ras ero Puerta tras era izq uierd a Parag o lp e d elantero / Pro tecto r d elantero Puerta tras era Derecha M anual Ot ro s Sp o iler d elantero Llant a d elant era izq uierd a Gráfico 7: Las 10 partes con mayor incidencia de averías Concluyendo con la exploración de datos se muestra a continuación el Gráfico 8 con las 10 averías producidas en los vehículos con mayor frecuencia. Página 111 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 25000 20061 20000 17824 15000 10000 5219 5082 5000 819 577 Arra nc a do R o to F is ura do M a nc ha do 283 223 79 70 9 De s ga rra do C o rta do Que m a do 0 R a ya do R o za do Abo lla do P intura s a lta da F a lta nte R e ve nta do Exc e s o P ro ye c c ió n Es ta lla do kilo m e tra je Gráfico 8: Las 10 partes con mayor incidencia de averías 8.2.4. Verificación de la calidad de datos En función de la exploración inicial de datos se concluye que estos son completos. Los datos cubren los casos requeridos para la obtención de los resultados necesarios para el logro de los objetivos del presente proyecto. Los datos provienen del mismo sistema de base datos el cual no contiene errores, con excepción de los errores gramaticales en los campos que permiten el ingreso de texto, pero esos campos no son requeridos para el presente proyecto. En referencia a los valores omitidos hasta este punto ellos no fueron encontrados. Del mismo modo hasta este ítemes del proyecto no se presentó la necesidad de excluir datos. 8.3. Preparación de Datos 8.3.1. Datos seleccionados Los datos seleccionados para el análisis son los siguientes: • • • • • • • • Número de chasis: tipo entero. Modelo: tipo entero. Fecha: tipo entero, formado año (4 dígitos), mes (2 dígitos) y día (2 dígitos). Lugar: tipo entero. Parte: tipo entero. Tipo Avería: tipo entero. Gravedad: tipo entero. Observación: tipo carácter. El volumen de datos a explotar varía en función del software a utilizar, esto es: Página 112 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Modelo de Clasificación: El software no tiene límite especificado por lo que los datos a extraer para el análisis depende exclusivamente del contenido en la base de datos en la división de períodos establecidos. • Modelo de Clustering: El límite del software es 5000 registros. Si el grupo de datos tomados en cada periodo supera la restricción establecida por el software se procede a tomar el grupo de valor fecha más bajo. Esto es, se toma la primera parte de los registros del periodo. • Modelo de Predicción: El límite del software es de 2000 registros. En el caso de superar las cantidades de datos restringidas por el software se toma como criterio de selección el mismo que para el punto anterior a los efectos de normalizar las consultas (SQL) de extracción de datos. En referencia a importancia de datos se puede dividir en tres niveles: • • • Primaria: Los datos de Modelo, Lugar, Parte, Avería. Estos son los datos en función de los cuales se realizar las explotaciones. Secundaria: Los atributos referidos a Fecha y Gravedad. En cuanto a las fechas solo son utilizadas a los efectos de la toma de datos y para establecer un criterio de normalización de las consultas para la extracción de los datos. En cuanto a los datos de gravedad los mismos no tienen variación significativa. Inclusive la variación más alta, que son cuatro, solo la presentan en los dos o tres primeros periodos de selección puesto que luego se achican solo a dos tipos. Terciaria: El atributo Observación entra en esta clasificación puesto que el mismo no interviene en la evaluación directa de los modelos. 8.3.2. Limpieza de datos La base de datos con la se cuenta para el presente trabajo contiene información relacionada con operaciones de 4 marcas de automóviles. Pero solo 2 de las marcas contienen información relevante y representativa por su cantidad y diversidad de movimientos. Por este motivo se procedió a eliminar del presente proyecto las otras dos marcas como así también los puntos por donde pasan los cuales no agregan valor al proyecto. Los datos de las marcas que quedan fuera del proyecto pueden ser objeto de un estudio posterior para continuar con esta línea de investigación en la industria automotriz. Los datos de las marcas que quedan excluías del proyecto no tienen importancia relevante para los períodos de distribución de las extracciones realizadas pero si pueden ser relevantes si los períodos establecidos son más prolongados (por ejemplo cada dos años). También por motivos de normalización para el ingreso de información a los modelos de software con los que se cuenta se ha realizado por SQL la codificación de los modelos puesto que los mismos están disponibles en la base de datos en formato de caracteres alfanuméricos. El campo Gravedad puede ser irrelevante en alguno de los períodos iniciales del presente estudio debido a la cantidad de variaciones. Inicialmente son 1, 2, 3 y 4 y al final se reduce solo a dos 1 y 2. Página 113 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8.3.3. Construcción de datos Como se ha mencionado en el ítem anterior se ha realizado la transformación del atributo Modelo a formato numérico debido a que los mismos se encontraban en formato alfanumérico. Lo recomendable para el proceso de transformación es la programación de una consulta SQL con las sentencias correspondientes para la transformación de los datos. Todos los datos extraídos previos a la incorporación de los mismos en el software de análisis de datos pasan a un archivo de planilla de cálculo. La explotación de los datos se realizará sobre información codificada en formato numérico y luego de realizar el estudio del significado de los resultados se procede a la captura del significado en la base de datos. Las marcas y modelos excluidos según lo dicho previamente también son filtrados en las consultas estructuradas. Los números de VIN que contiene cada unidad permiten realizar el filtro apropiadamente puesto que es único y universal para cada uno. La estructura del número de identificación del auto permite saber dentro de si mismo a que marca y modelo pertenece, por lo tanto en cada consulta SQL se incorpora la sentencia correspondiente para efectivizar el filtro. 8.3.4. Integración de datos Los datos son extraídos y combinados a partir de tres tablas relacionadas por sus respectivas claves. Los atributos finales se obtienen de las siguientes tablas: • • • Chasis Número de identificación de un auto Modelo del vehiculo Operaciones Fecha en que se realiza la operación donde interviene el vehículo que sufre la avería. Daños Código de parte averiada Código de avería Código de gravedad Observación Las consultas SQL son capaces de integrar toda la información requerida para el presente proyecto. Todas las líneas de código para la generación de los archivos en función de los períodos establecidos quedan almacenadas en archivos con formato de query. Las consultas programadas se encuentran almacenadas en el Anexo 3. 8.3.5. Formateo de datos Las herramientas exigen que los datos a explotar sean numéricos. En cuanto al orden en el que debe ir cada columna los programas no requieren una posición específica pero a los efectos de normalizar el presente proceso de trabajo se define el siguiente orden: Página 114 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS a. b. c. d. e. f. g. h. Chasis Modelo Fecha Lugar Parte Avería Gravedad Observación 8.4. Modelado 8.4.1. Selección de las técnicas de modelado • Árboles de Clasificación • Agrupamiento con Mapas Autoorganizados • Modelo de Predicción La documentación necesaria para la utilización de las herramientas de software que se utilizan en este proyecto de tesis se encuentra disponible en la misma aplicación. La información brindada por cada herramienta es técnicamente precisa y detallada lo cual permite su aplicabilidad sin mayores inconvenientes. Las aplicaciones han sido desarrolladas con tecnologías de planilla de cálculos programadas con uno de los lenguajes de programación estándares en informática. 8.4.2. Generación de la prueba de diseño El conjunto de datos de entrenamiento es almacenado en archivos con formato de hoja de cálculo y se dividen en función de los períodos establecidos previamente para el presente proyecto. Se capturan y almacenan todos los datos según cada período preestablecido. Las cantidades de datos de entrenamiento para los respectivos modelos también es variable en función del software a usar, lo cual se especificó previamente en párrafos anteriores. Las pruebas se han realizado con muestras reducidas de los datos a ser explotados con el formato que se utilizará en los modelos reales. En referencia a la validación de la calidad de datos cada aplicación solicita como parámetros iniciales previos a cada proceso la especificación de los mismos. Cada validación especificada queda almacenada en la aplicación ejecutada. Durante las pruebas de diseño de los modelos se desestimaron los campos de identificación de chasis, fecha de producción de la avería y observación. La decisión fue tomada en función de lo que se conoce hasta este momento de desarrollo del proyecto y no se descarta la posibilidad de recurrir a esta información como consecuencia de un estudio o análisis futuro. De las pruebas también podemos concluir que en función de los resultados que se puedan llegar a obtener del presente estudio, se podría hacer necesario o bien podría ser caso de futuras líneas de Página 115 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS investigación el desarrollo de la detección de patrones específicamente en uno de los más importantes medios de transporte de autos como lo son los buques. 8.4.3. Construcción de los modelos A continuación se describe la parametrización y ejecución de los modelos en función de las tres herramientas utilizadas por el proyecto. 8.4.3.1. Modelo de Clasificación Construcción de un Modelo de Clasificación para el analizar el comportamiento de los Tipos de Averías. Variables de entrada: • Código de Parte: Continuous Predictor. • Código de Gravedad: Continuous Predictor. Variables de salida: • Código de Avería: Categorical Predictor. Construcción de un Modelo de Clasificación para el análisis del comportamiento donde (CP) se producen las averías en un automóvil. Variables de entrada: • Código de Parte: Continuous Predictor. • Código de Avería: Continuous Predictor. • Código de Gravedad: Continuous Predictor. Variables de salida: • Código de lugar (punto de control): Categorical Predictor. Construcción de un Modelo de Clasificación para analizar las averías producidas en modelos. Variables de entrada: • Código de Parte: Continuous Predictor. • Código de Avería: Continuous Predictor. • Código de Gravedad: Continuous Predictor. Variables de salida: • Código de modelo de auto: Categorical Predictor. El procesamiento de datos de estos modelos permite determinar los niveles de siniestralidad por lugar y modelos de unidades automotrices. Otra información que se obtiene a partir de estos modelos es la imputación de los incidentes y la determinación de los tipos de transportes que los provocan. 8.4.3.2. Modelo de Clustering Construcción de un Modelo de Clustering para establecer el agrupamiento de daños. Página 116 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Variables de entrada: • Código de Parte. • Código de Avería. • Código de Gravedad. Variables de salida: • Formación de grupos. Construcción de un Modelo de Clustering para el agrupamiento de datos en relación a daños y los lugares donde se producen sin considerar la gravedad del daño. Variables de entrada: • Código de CP. • Código de Parte. • Código de Avería. Variables de salida: • Formación de grupos. Construcción de un Modelo de Clustering para el agrupamiento de datos de averías en lugares considerando la severidad de los daños. Variables de entrada: • Código de CP. • Código de Parte. • Código de Avería. • Código de Gravedad. Variables de salida: • Formación de grupos. Construcción de un Modelo de Clustering para el agrupamiento de datos de averías producidas en modelos sin considerar la gravedad de los daños. Variables de entrada: • Código de Modelo. • Código de Parte. • Código de Avería. Variables de salida: • Formación de grupos. Construcción de un Modelo de Clustering para el agrupamiento de datos de averías producidas en modelos especificando la severidad de los daños. Variables de entrada: • Código de Modelos. • Código de Parte. • Código de Avería. Página 117 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Código de Gravedad. Variables de salida: • Formación de grupos. La ejecución de estos agrupamientos identifica los daños producidos relacionados con los lugares y modelos de unidades. También permite ver la relación entre las partes averiadas, los tipos de averías producidos y la severidad de los mismos. Del análisis de la relación entre los daños y los lugares se puede establecer el comportamiento de los daños en función del tipo de transporte. 8.4.3.3. Modelo de Predicción Construcción de un Modelo de Predicción para determinar el comportamiento de las partes en función del tipo de avería y gravedad de la misma. Variables de entrada: • Código de Avería: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de Parte: Output. Construcción de un Modelo de Predicción para determinar el comportamiento de los tipos de avería en función de las partes donde se producen y la gravedad de la misma. Variables de entrada: • Código de Parte: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de Avería: Output. Construcción de un Modelo de Predicción para establecer el comportamiento de las averías en función del lugar donde se producen. Variables de entrada: • Código de Parte: Continuous. • Código de Avería: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de CP: Output. Construcción de un Modelo de Predicción para establecer el comportamiento de las averías en función de los modelos de vehículo. Variables de entrada: Página 118 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • Código de Parte: Continuous. Código de Avería: Continuous. Código de Gravedad: Continuous. Variables de salida: • Código de Modelo: Output. Con el procesamiento del Modelo de Predicción es posible encontrar los daños, lugares, tipos de transportes, y modelos donde se producen las averías. Los modelos trabajan sobre los códigos numéricos de las variables introducidas. La traducción de los códigos empleados en el procesamiento de datos se encuentra disponible en el Anexo 4. En el Anexo 4 se encuentra el detalle descriptivo de los modelos, lugares, tipos de transporte, código de área de un auto, tipo de avería de un auto y gravedad de una avería en un automóvil. 8.4.4. Descripción de los modelos 8.4.4.1. Modelo de Clasificación Se trabaja sobre tres categorías: Averías, Lugares y Modelos. El modelo de minería de datos permite visualizar la ocurrencia de los tipos de averías producidos sobre todas las partes y especificando las gravedades. Se observan las cantidades y porcentajes de ocurrencia a lo largo de cada periodo. El análisis de la clase lugares permite visualizar el comportamiento de las averías en los diferentes lugares por donde transitan las unidades automotrices. También permite ver cantidades y porcentajes mostrando una clara relación entre los diferentes lugares donde se producen. Por último se analiza la ocurrencia de las averías por modelos de autos. Al final también es posible encontrar información sobre cantidades y porcentajes por cada período. Para los tres tipos de análisis mencionados se crean los árboles de decisión con sus respectivas reglas. Finalmente este modelo muestra un detalle de los resultados obtenidos como la cantidad de hojas de los árboles generados, la cantidad de nodos, el tiempo de proceso de la herramienta, etc. A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer período. • Averías (Período 1 – Año 2003) Avería Arrancado - Roto – Fisurado Desgarrado – Cortado Reventado – Estallado Pintura saltada Abollado Página 119 de287 Cantidad 136 23 12 935 5338 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Faltante Proyección Rayado – Rozado Manchado Exceso kilometraje 494 9 2023 84 223 Tabla 4: Cantidad de daños y sus códigos correspondientes Exceso kilometraje 2% Manchado 1% Rayado - Rozado 22% Arrancado - Roto Fisurado Desgarrado - Cortado 1% 0% Reventado - Estallado 0% Pintura saltada 10% Proyección 0% Faltante 5% Abollado 59% Gráfico 9: Porcentajes de ocurrencia de averías • Lugares (Período 1 – Año 2003) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 87 6925 942 352 424 443 104 Tabla 5: Cantidad de averías por lugar Página 120 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Subida a Buque 1% Retiro Fábrica de Origen 1% Transferencia Ingreso a Puerto ubicación y línea de 5% carga 5% Retiro de Puerto 4% Bajada de Buque 10% Subida Buque Puerto de Origen 74% Gráfico 10: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 1 – Año 2003) Modelo Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 9 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15 Modelo 16 Modelo 17 Modelo 18 Modelo 19 Modelo 20 Cantidad 33 33 194 8 595 4143 33 13 436 67 12 13 2662 467 22 546 Tabla 6: Cantidad de averías por modelo Página 121 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 19 0% Modelo 20 6% Modelo 1 0% Modelo 2 Modelo 3 0% 2% Modelo 4 0% Modelo 18 5% Modelo 5 6% Modelo 17 29% Modelo 9 46% Modelo 16 0% Modelo 15 0% Modelo 14 1% Modelo 13 5% Modelo 11 0% Modelo 12 0% Gráfico 11: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo período. • Averías (Período 2 – Semestre 1 Año 2004) Avería Quemado Arrancado - Roto – Fisurado Desgarrado – Cortado Reventado – Estallado Pintura saltada Abollado Faltante Proyección Rayado – Rozado Manchado Cantidad 2 31 6 14 790 2855 184 2 1628 155 Tabla 7: Cantidad de daños y sus códigos correspondientes Página 122 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Quemado 0% Manchado 3% Arrancado - Roto Fisurado Reventado - Estallado 1% 0% Desgarrado - Cortado 0% Pintura saltada 14% Rayado - Rozado 29% Proyección 0% Faltante 3% Abollado 50% Gráfico 12: Porcentajes de ocurrencia de averías • Lugares (Período 2 – Semestre 1 Año 2004) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 87 6925 942 352 424 443 104 Tabla 8: Cantidad de averías por lugar Página 123 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Transferencia Ingreso a Puerto ubicación y línea de 6% carga 1% Retiro de Puerto 2% Subida a Buque 1% Retiro Fábrica de Origen 1% Bajada de Buque 6% Subida Buque Puerto de Origen 83% Gráfico 13: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 2 – Semestre 1 Año 2004) Modelo 1 Modelo 2 Modelo 3 Modelo 5 Modelo 9 Modelo 11 Modelo 13 Modelo 14 Modelo 16 Modelo 17 Modelo 18 Modelo 20 15 9 52 244 1785 5 562 10 22 2616 28 319 Tabla 9: Cantidad de averías por modelo Página 124 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 20 6% Modelo 1 0% Modelo 2 0% Modelo 18 0% Modelo 3 1% Modelo 5 4% Modelo 9 32% Modelo 17 47% Modelo 11 0% Modelo 13 10% Modelo 16 0% Modelo 14 0% Gráfico 14: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer período. • Averías (Período 3 – Semestre 2 Año 2004) Avería Quemado Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Abollado Faltante Rayado - Rozado Manchado Cantidad 4 46 8 13 812 2375 274 1794 29 Tabla 10: Cantidad de daños y sus códigos correspondientes Página 125 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Quemado 0% Manchado 1% Arrancado - Roto Fisurado Reventado - Estallado 1% 0% Desgarrado - Cortado 0% Pintura saltada 15% Rayado - Rozado 34% Abollado 44% Faltante 5% Gráfico 15: Porcentajes de ocurrencia de averías • Lugares (Período 3 – Semestre 2 Año 2004) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 33 4008 505 71 20 491 228 Tabla 11: Cantidad de averías por lugar Subida a Buque 4% Transferencia ubicación y línea de carga 0% Ingreso a Puerto 9% Retiro Fábrica de Origen 1% Retiro de Puerto 1% Bajada de Buque 9% Subida Buque Puerto de Origen 76% Página 126 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Gráfico 16: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 3 – Semestre 2 Año 2004) Modelo Modelo 1 Modelo 2 Modelo 3 Modelo 5 Modelo 6 Modelo 8 Modelo 9 Modelo 11 Modelo 13 Modelo 14 Modelo 16 Modelo 17 Modelo 18 Modelo 20 Cantidad 30 8 6 252 14 2 833 8 457 4 29 3041 40 632 Tabla 12: Cantidad de averías por modelo Modelo 1 1% Modelo 3 0% Modelo 2 0% Modelo 5 5% Modelo 8 0% Modelo 6 0% Modelo 9 15% Modelo 20 12% Modelo 11 0% Modelo 18 1% Modelo 13 9% Modelo 14 0% Modelo 16 1% Modelo 17 56% Gráfico 17: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto período. • Averías (Período 4 – Semestre 1 Año 2005) Avería Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Abollado Página 127 de287 Cantidad 66 2 25 598 1099 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Faltante Rayado - Rozado Manchado 264 1792 61 Tabla 13: Cantidad de daños y sus códigos correspondientes Arrancado - Roto Fisurado 2% Manchado 2% Desgarrado - Cortado 0% Reventado - Estallado 1% Pintura saltada 15% Rayado - Rozado 45% Abollado 28% Faltante 7% Gráfico 18: Torta especificando porcentajes de ocurrencia de averías • Lugares (Período 4 – Semestre 1 Año 2005) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 603 1849 570 137 39 510 201 Tabla 14: Cantidad de averías por lugar Página 128 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Subida a Buque 5% Ingreso a Puerto 13% Retiro Fábrica de Origen 15% Transferencia ubicación y línea de carga 1% Retiro de Puerto 4% Subida Buque Puerto de Origen 47% Bajada de Buque 15% Gráfico 19: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 4 – Semestre 1 Año 2005) Modelo Modelo 1 Modelo 2 Modelo 5 Modelo 6 Modelo 8 Modelo 9 Modelo 13 Modelo 16 Modelo 17 Modelo 18 Modelo 20 Cantidad 20 3 200 72 465 433 35 18 2002 86 574 Tabla 15: Cantidad de averías por modelo Página 129 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 1 1% Modelo 20 15% Modelo 2 0% Modelo 5 5% Modelo 6 2% Modelo 18 2% Modelo 8 12% Modelo 9 11% Modelo 13 1% Modelo 16 0% Modelo 17 51% Gráfico 20: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto período. • Averías (Período 5 – Semestre 2 Año 2005) Avería Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Abollado Faltante Proyección Rayado - Rozado Manchado Cantidad 67 6 28 490 1126 240 6 1887 21 Tabla 16: Cantidad de daños y sus códigos correspondientes Arrancado - Roto Fisurado 2% Desgarrado - Cortado 0% Reventado - Estallado 1% Manchado 1% Pintura saltada 13% Abollado 29% Rayado - Rozado 48% Proyección 0% Faltante 6% Gráfico 21: Porcentajes de ocurrencia de averías Página 130 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Lugares (Período 5 – Semestre 2 Año 2005) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 909 1208 758 248 94 550 104 Tabla 17: Cantidad de averías por lugar Subida a Buque 3% Ingreso a Puerto 14% Retiro Fábrica de Origen 23% Transferencia ubicación y línea de carga 2% Retiro de Puerto 6% Subida Buque Puerto de Origen 32% Bajada de Buque 20% Gráfico 22: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 5 – Semestre 2 Año 2005) Modelo Modelo 1 Modelo 2 Modelo 5 Modelo 6 Modelo 8 Modelo 9 Modelo 13 Modelo 16 Modelo 17 Modelo 18 Modelo 19 Modelo 20 Cantidad 48 8 398 85 608 469 70 4 1795 39 80 266 Tabla 18: Cantidad de averías por modelo Página 131 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 19 2% Modelo 20 7% Modelo 1 1% Modelo 2 0% Modelo 5 10% Modelo 6 2% Modelo 18 1% Modelo 8 16% Modelo 17 47% Modelo 9 12% Modelo 16 0% Modelo 13 Gráfico 23: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto período. • Averías (Período 6 – Semestre 1 Año 2006) Avería Arrancado - Roto - Fisurado Reventado - Estallado Pintura saltada Abollado Faltante Rayado - Rozado Manchado Cantidad 34 17 271 1681 247 1499 4 Tabla 19: Cantidad de daños y sus códigos correspondientes Manchado 0% Arrancado - Roto Fisurado 1% Reventado - Estallado 0% Pintura saltada 7% Rayado - Rozado 40% Faltante 7% Abollado 45% Gráfico 24: Porcentajes de ocurrencia de averías Página 132 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Lugares (Período 6 – Semestre 1 Año 2006) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 631 1585 580 187 136 497 138 Tabla 20: Cantidad de averías por lugar Subida a Buque 4% Ingreso a Puerto 13% Retiro Fábrica de Origen 17% Transferencia ubicación y línea de carga 4% Retiro de Puerto 5% Subida Buque Puerto de Origen 42% Bajada de Buque 15% Gráfico 25: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 6 – Semestre 1 Año 2006) Modelo Modelo 1 Modelo 2 Modelo 5 Modelo 6 Modelo 8 Modelo 9 Modelo 11 Modelo 13 Modelo 16 Modelo 17 Modelo 18 Modelo 19 Modelo 20 Cantidad 4 4 533 69 285 789 2 125 8 1482 10 2 441 Tabla 21: Cantidad de averías por modelo Página 133 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 19 0% Modelo 20 12% Modelo 1 0% Modelo 2 0% Modelo 5 14% Modelo 6 2% Modelo 18 0% Modelo 8 8% Modelo 17 40% Modelo 9 21% Modelo 16 0% Modelo 13 3% Modelo 11 0% Gráfico 26: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo período. • Averías (Período 7 – Semestre 2 Año 2006) Avería Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Abollado Faltante Proyección Rayado - Rozado Manchado Cantidad 80 5 18 140 781 353 2 1208 11 Tabla 22: Cantidad de daños y sus códigos correspondientes Página 134 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Arrancado - Roto Fisurado 3% Manchado 0% Reventado - Estallado 1% Desgarrado - Cortado 0% Pintura saltada 5% Abollado 30% Rayado - Rozado 47% Faltante 14% Proyección 0% Gráfico 27: Porcentajes de ocurrencia de averías • Lugares (Período 7 – Semestre 2 Año 2006) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 39 144 547 119 415 1069 265 Tabla 23: Cantidad de averías por lugar Retiro Fábrica de Origen Subida a Buque 2% 10% Subida Buque Puerto de Origen 6% Bajada de Buque 21% Retiro de Puerto 5% Ingreso a Puerto 40% Transferencia ubicación y línea de carga 16% Gráfico 28: Porcentajes de ocurrencia de avería en diferentes lugares Página 135 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Modelos (Período 7 – Semestre 2 Año 2006) Modelo Modelo 1 Modelo 2 Modelo 5 Modelo 6 Modelo 7 Modelo 8 Modelo 9 Modelo 10 Modelo 11 Modelo 13 Modelo 15 Modelo 16 Modelo 17 Modelo 18 Modelo 20 Cantidad 21 12 565 76 2 28 170 4 2 106 32 3 260 29 1288 Tabla 24: Cantidad de averías por modelo Modelo 1 1% Modelo 2 0% Modelo 5 22% Modelo 6 3% Modelo 7 0% Modelo 8 1% Modelo 9 7% Modelo 10 0% Modelo 11 0% Modelo 20 50% Modelo 13 4% Modelo 18 1% Modelo 17 10% Modelo 16 0% Modelo 15 1% Gráfico 29: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo período. • Averías (Período 8 – Semestre 1 Año 2007) Avería Arrancado - Roto - Fisurado Desgarrado - Cortado Página 136 de287 Cantidad 62 4 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Reventado - Estallado Pintura saltada Abollado Faltante Proyección Rayado - Rozado Manchado 21 237 761 605 40 1278 11 Tabla 25: Cantidad de daños y sus códigos correspondientes Arrancado - Roto Fisurado 2% Manchado Reventado - Estallado 1% 0% Desgarrado - Cortado 0% Pintura saltada 8% Abollado 25% Rayado - Rozado 43% Proyección 1% Faltante 20% Gráfico 30: Porcentajes de ocurrencia de averías • Lugares (Período 8 – Semestre 1 Año 2007) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 20 517 219 156 1437 575 95 Tabla 26: Cantidad de averías por lugar Página 137 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Retiro Fábrica de Origen 1% Subida a Buque 3% Ingreso a Puerto 19% Subida Buque Puerto de Origen 17% Bajada de Buque 7% Retiro de Puerto 5% Transferencia ubicación y línea de carga 48% Gráfico 31: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 8 – Semestre 1 Año 2007) Modelo Modelo 1 Modelo 5 Modelo 6 Modelo 7 Modelo 8 Modelo 9 Modelo 13 Modelo 15 Modelo 16 Modelo 17 Modelo 18 Modelo 20 Cantidad 5 712 43 94 88 209 270 11 22 125 37 1403 Tabla 27: Cantidad de averías por modelo Página 138 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 5 24% Modelo 1 0% Modelo 6 1% Modelo 7 3% Modelo 20 47% Modelo 8 3% Modelo 9 7% Modelo 13 9% Modelo 18 1% Modelo 17 4% Modelo 15 0% Modelo 16 1% Gráfico 32: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno período. • Averías (Período 9 – Semestre 2 Año 2007) Avería Quemado Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Abollado Faltante Proyección Rayado - Rozado Manchado Cantidad 2 146 10 59 609 1016 641 2 4689 14 Tabla 28: Cantidad de daños y sus códigos correspondientes Página 139 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Quemado 0% Arrancado - Roto Fisurado 2% Desgarrado - Cortado 0% Reventado - Estallado 1% Manchado 0% Pintura saltada 8% Abollado 14% Faltante 9% Proyección 0% Rayado - Rozado 66% Gráfico 33: Porcentajes de ocurrencia de averías • Lugares (Período 9 – Semestre 2 Año 2007) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 18 635 282 60 4503 1167 523 Tabla 29: Cantidad de averías por lugar Subida a Buque 7% Retiro Fábrica de Origen 0% Ingreso a Puerto 16% Subida Buque Puerto de Origen 9% Bajada de Buque 4% Retiro de Puerto 1% Transferencia ubicación y línea de carga 63% Gráfico 34: Porcentajes de ocurrencia de avería en diferentes lugares Página 140 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Modelos (Período 9 – Semestre 2 Año 2007) Modelo Modelo 2 Modelo 5 Modelo 6 Modelo 7 Modelo 8 Modelo 9 Modelo 13 Modelo 15 Modelo 16 Modelo 17 Modelo 18 Modelo 20 Cantidad 1 839 18 1747 75 156 358 100 9 30 36 3819 Tabla 30: Cantidad de averías por modelo Modelo 5 12% Modelo 2 0% Modelo 6 0% Modelo 7 24% Modelo 20 54% Modelo 8 1% Modelo 18 1% Modelo 17 0% Modelo 9 2% Modelo 13 5% Modelo 15 1% Modelo 16 0% Gráfico 35: Porcentajes de ocurrencia de avería en modelos A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo período. • Averías (Período 10 – Semestre 1 Año 2008) Avería Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Abollado Faltante Proyección Página 141 de287 Cantidad 144 5 76 334 751 1771 16 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Rayado - Rozado Manchado 2223 187 Tabla 31: Cantidad de daños y sus códigos correspondientes Arrancado - Roto - Desgarrado - Cortado 0% Fisurado 3% Reventado - Estallado 1% Manchado 3% Pintura saltada 6% Abollado 14% Faltante 32% Rayado - Rozado 41% Proyección 0% Gráfico 36: Porcentajes de ocurrencia de averías • Lugares (Período 10 – Semestre 1 Año 2008) Lugar Retiro Fábrica de Origen Subida Buque Puerto de Origen Bajada de Buque Retiro de Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Subida a Buque Cantidad 12 454 318 124 3008 958 633 Tabla 32: Cantidad de averías por lugar Página 142 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Retiro Fábrica de Origen Subida a Buque 0% 11% Subida Buque Puerto de Origen 8% Bajada de Buque 6% Ingreso a Puerto 17% Retiro de Puerto 2% Transferencia ubicación y línea de carga 56% Gráfico 37: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 10 – Semestre 1 Año 2008) Modelo Modelo 2 Modelo 5 Modelo 6 Modelo 7 Modelo 8 Modelo 9 Modelo 13 Modelo 15 Modelo 16 Modelo 17 Modelo 18 Modelo 20 Cantidad 46 433 57 1883 26 142 190 74 26 38 21 2571 Tabla 33: Cantidad de averías por modelo Página 143 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 2 1% Modelo 5 8% Modelo 6 1% Modelo 7 34% Modelo 20 48% Modelo 8 0% Modelo 18 0% Modelo 17 1% Modelo 16 0% Modelo 13 3% Modelo 15 1% Modelo 9 3% Gráfico 38: Porcentajes de ocurrencia de avería en modelos 8.4.4.2. Modelo de Clustering El análisis es realizado agrupando: Parte – Avería – Gravedad, Lugar – Parte – Avería, Lugar – Parte – Avería – Gravedad, Modelo – Parte – Avería, Modelo – Parte – Avería – Gravedad. El agrupamiento de partes, averías y gravedades permite visualizar el comportamiento de los siniestros ocurridos separando los daños en función del formato establecido por el estándar utilizado. El análisis es realizado por cada período en el presente proyecto. Para el segundo caso se toman el agrupamiento considerando el lugar donde se produce una avería, el tipo de avería y la parte del automóvil que es afectado. Al igual que para el anterior agrupamiento este análisis se realiza para cada uno de los periodos. En el siguiente proceso al agrupamiento se suma la gravedad del siniestro. Luego, el análisis posterior de los datos tiene en cuenta el agrupamiento de la información considerando el modelo averiado y la parte del auto y tipo de avería producido. Finalmente al agrupamiento anterior y al igual que en el caso de los lugares el agrupamiento de los modelos incluye la gravedad de cada siniestro. Cada uno de los procesos realizados muestra al final el resultado estadístico logrado. Allí se especifican cantidades por grupos, cantidad de grupos formados, porcentajes, etc. El proceso de agrupamiento es realizado con matrices cuadradas de 10 x 10 en todos los casos. A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer período. • Parte – Avería – Gravedad (Período 1 – Año 2003) Overall Parte Tapa acceso gancho remolque Avería Faltante Gravedad Mediano Página 144 de287 Cantidad Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 1 Puerta delantera derecha Cluster 2 Escape Arrancado - Roto Fisurado Abollado Intolerable 99 1 1 Grave 779 1 2 Cluster 3 Alfombra suplementarias Cluster 4 Parabrisa Rayado - Rozado Grave 455 1 3 Proyección Mediano 362 1 4 Cluster 5 Luz trasera izquierda Faltante Mediano 626 1 5 Cluster 6 Puerta delantera derecha Cluster 7 Cubierta delantera izquierda Cluster 8 Panel lateral izquierdo Cluster 9 Panel lateral derecho Faltante Leve 1130 1 6 Rayado - Rozado Mediano 138 1 7 Abollado Leve 1057 1 9 Abollado Mediano 354 1 10 Tabla 7: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 1 – Año 2003) Overall Lugar Retiro de Puerto Cluster 4 Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Ingreso a Puerto Cluster 5 Ingreso a Puerto Cluster 6 Ingreso a Puerto Cluster 7 Transferencia ubicación y línea de carga Ingreso a Puerto Cluster 1 Cluster 2 Cluster 3 Cluster 8 Parte Tapa acceso gancho remolque Manijas externas de puertas delanteras Avería Faltante Rayado – Rozado 1 1 1 Panel trasero bajo baúl Rayado – Rozado 12 1 2 Capot Rayado – Rozado 11 1 3 Paragolpe delantero / Superior Techo corredizo Rayado – Rozado Faltante 38 1 4 55 1 5 Cubierta delantera derecha Luz de neblina trasera Abollado 111 1 6 Exceso kilometraje 299 1 7 Luz trasera izquierda Luz de neblina trasera Abollado 63 1 8 Abollado 76 1 9 4334 1 10 Transferencia ubicación y línea de carga Cluster 10 Subida Buque Puerto Bolsa de de Origen herramientas Cluster 9 Cantidad Fila Faltante Columna Tabla 8: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 1 – Año 2003) Lugar Parte Avería Gravedad Cantidad Fila Columna Página 145 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Retiro de Puerto Tapa acceso gancho remolque Faltante Mediano Cluster 1 Bajada de Buque Tapizado interno puerta delantera izquierda Cristales de parante delantero Rayado Rozado Mediano Abollado Cluster 3 Subida Buque Puerto de Origen Cluster 4 Ingreso a Puerto Sistema de navegación Cluster 5 Subida Buque Puerto de Origen Cluster 6 Transferencia ubicación y línea de carga Cluster 7 Subida Buque Puerto de Origen Cluster 8 Subida Buque Puerto de Origen Cluster 9 Subida Buque Puerto de Origen Overall Cluster 2 Retiro de Puerto 596 1 1 Grave 1007 1 2 Proyección Grave 15 1 3 Moldura protectora lateral derecha Rayado Rozado Leve 488 1 4 Cable de carga Faltante Mediano 582 1 5 Insignia Faltante Leve 99 1 6 Llave Abollado Leve 2120 1 7 Guardabarro delantero izquierdo Rayado Rozado Leve 14 1 8 Guardabarro delantero izquierdo Rayado Rozado Mediano 79 1 9 Tabla 9: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 1 – Año 2003) Overall Modelo Modelo 12 Parte Tapa acceso gancho remolque Avería Faltante Cantidad Cluster 1 Modelo 4 Faltante 636 1 1 Cluster 2 Modelo 10 Moldura protectora lateral derecha Manual Abollado 1267 1 2 Cluster 3 Modelo 18 Cubierta delantera derecha 879 1 3 Cluster 4 Modelo 10 121 1 4 Cluster 5 Modelo 10 Giro Delantero (derecho / izquierdo) Panel lateral izquierdo Rayado – Rozado Rayado – Rozado Abollado 1113 1 5 Cluster 6 Modelo 9 Cerraduras de puertas 295 1 6 Cluster 7 Modelo 17 Cubierta delantera izquierda 689 1 8 Rayado – Rozado Abollado Fila Columna Tabla 10: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 1 – Año 2003) Overall Modelo Modelo 12 Parte Tapa acceso gancho remolque Avería Faltante Página 146 de287 Gravedad Cantidad Fila Columna Mediano Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 1 Modelo 5 Cluster 2 Modelo 15 Cluster 3 Modelo 18 Cluster 4 Giro Delantero (derecho / izquierdo) Puerta trasera derecha Faltante Intolerable 389 1 1 Faltante Grave 792 1 2 Faltante Mediano 110 1 3 Modelo 16 Paragolpe trasero / Spoiler trasero Bolsa de herramientas Abollado Mediano 231 1 4 Cluster 5 Modelo 17 Panel lateral derecho 290 1 5 Cluster 6 Modelo 9 168 1 6 Cluster 7 Modelo 15 8 1 7 Cluster 8 Modelo 11 Manijas externas de puertas traseras Apoya cabezas delantero / izquierdo / derecho Luz de neblina trasera Rayado - Mediano Rozado Rayado - Mediano Rozado Faltante Mediano 2945 1 8 Cluster 9 Modelo 13 2 1 9 Cluster 10 Modelo 14 65 1 10 Faro delantero izquierdo / derecho Retrovisor externo derecho Faltante Leve Abollado Mediano Pintura saltada Mediano Tabla 11: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo período. • Parte – Avería – Gravedad (Período 2 – Semestre 1 Año 2004) Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Parte Tapa acceso gancho remolque Cristales de parante delantero Guardabarro trasero derecho Cerraduras de puertas Otros Cable de carga Antena Bolsa de herramientas Tapa de Baúl o Puerta Trasera Avería Faltante Gravedad Mediano Cantidad Fila Columna Faltante Intolerable 317 1 1 Faltante Grave 756 1 2 Rayado - Rozado Mediano 374 1 3 Abollado Rayado - Rozado Rayado - Rozado Abollado Leve Leve Mediano Mediano 1864 223 520 932 1 1 1 1 4 5 7 9 Abollado Mediano 14 1 10 Tabla 12: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 2 – Semestre 1 Año 2004) Overall Lugar Retiro de Puerto Parte Tapa acceso gancho remolque Página 147 de287 Avería Faltante Cantidad Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Llanta trasera izquierda Faltante 9 1 1 Puerta delantera izquierda Rayado Rozado 31 1 2 Techo corredizo Rayado Rozado 17 1 3 Cluster 4 Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Ingreso a Puerto Techo corredizo 97 1 4 Cluster 5 Ingreso a Puerto 62 1 5 Cluster 6 Ingreso a Puerto 23 1 6 Cluster 7 Transferencia ubicación y línea de carga Ingreso a Puerto Puerta trasera derecha Tapa posterior de techo Otros Rayado Rozado Rayado Rozado Pintura saltada Abollado 167 1 7 Abollado 14 1 8 4580 1 10 Cluster 1 Cluster 2 Cluster 3 Cluster 8 Cluster 9 Subida Buque Puerto de Origen Llanta delantera derecha Bolsa de herramientas Faltante Tabla 13: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 2 – Semestre 1 Año 2004) Overall Lugar Retiro de Puerto Cluster 1 Bajada de Buque Cluster 2 Retiro de Puerto Cluster 3 Bajada de Buque Cluster 4 Ingreso a Puerto Cluster 5 Bajada de Buque Cluster 6 Transferencia ubicación y línea de carga Bajada de Buque Llanta delantera derecha Retiro de Puerto Techo (inclusive convertible) Cluster 7 Cluster 8 Parte Tapa acceso gancho remolque Cristales de parante delantero Guardabarro trasero derecho Panel lateral izquierdo Tapa posterior de techo Llanta delantera derecha Parrilla delantera Avería Faltante Gravedad Cantidad Fila Columna Mediano Faltante Intolerable 259 1 1 Faltante Grave 627 1 2 Faltante Leve 1961 1 3 Pintura saltada Mediano 82 1 4 Abollado Leve 1642 1 5 Abollado Leve 15 1 6 Faltante Grave 405 1 7 9 1 10 Proyección Mediano Tabla 14: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad Página 148 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Modelo – Parte – Avería (Período 2 – Semestre 1 Año 2004) Overall Modelo Modelo 14 Parte Tapa acceso gancho remolque Aerosol antipinchazos Avería Faltante Cluster 1 Modelo 17 Cluster 2 Modelo 10 Cluster 3 Cantidad Fila Columna Proyección 1010 1 1 Abollado 1695 1 2 Modelo 17 Guardabarro delantero izquierdo Puerta delantera derecha Abollado 614 1 3 Cluster 4 Modelo 8 Panel lateral izquierdo 243 1 4 Cluster 5 Modelo 13 Manual 12 1 5 Cluster 6 Modelo 6 192 1 6 Cluster 7 Modelo 7 1 7 Modelo 17 382 1 8 Cluster 9 Modelo 12 8 1 9 Cluster 10 Modelo 17 Rayado Rozado Rayado Rozado Pintura saltada Faltante 131 Cluster 8 Limpiador y lavador de parabrisas Zócalo interno puerta delantera izquierda Cubierta delantera izquierda Paragolpe trasero / Spoiler trasero Alfombra baúl / caja de carga Rayado Rozado Rayado Rozado Abollado 713 1 10 Tabla 15: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 2 - Semestre 1 Año 2004) Overall Modelo Modelo 14 Parte Tapa acceso gancho remolque Guardabarro trasero derecho Cristales de parante delantero Barras de techo Avería Faltante Gravedad Cantidad Fila Columna Mediano Cluster 1 Modelo 16 Faltante Grave 800 1 1 Cluster 2 Modelo 8 Faltante Grave 273 1 2 Cluster 3 Modelo 10 111 1 3 Cluster 4 Modelo 12 Rayado Rozado Faltante Mediano 7 1 4 2341 1 5 Faltante Mediano 350 1 6 Pintura saltada Faltante Mediano 11 1 7 Modelo 17 Alfombra suplementarias Puerta delantera izquierda Giro Delantero (derecho / izquierdo) Cubierta delantera derecha Aleron Cluster 5 Modelo 13 Cluster 6 Modelo 8 Cluster 7 Modelo 9 Cluster 8 Mediano 1085 1 8 Cluster 9 Modelo 17 Otros Rayado Rozado Mediano 22 1 10 Proyección Mediano Leve Tabla 16: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer período. Página 149 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004) Overall Cluster 1 Cluster 2 Cluster 3 Parte Tapa acceso gancho remolque Paragolpe delantero / Superior Paragolpe delantero / Protector delantero Capot Avería Faltante Gravedad Cantidad Fila Columna Leve Rayado - Rozado Mediano 4 1 1 Rayado - Rozado Mediano 4 1 3 Rayado - Rozado Grave 23 1 4 Rayado - Rozado Grave 58 1 5 Cluster 5 Paragolpe trasero / Zona contacto Aleron Proyección Grave 78 1 6 Cluster 6 Luz de neblina trasera Abollado Grave 401 1 7 Cluster 7 Tapa acceso gancho remolque Faltante - 4432 1 10 Cluster 4 Tabla 17: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 3 – Semestre 2 Año 2004) Overall Lugar Retiro de Puerto Parte Avería Tapa acceso gancho Faltante remolque Cantidad Fila Columna Cluster 1 Ingreso a Puerto Barras de techo Pintura saltada 46 1 1 Cluster 2 Ingreso a Puerto Guardabarro trasero Pintura derecho saltada 40 1 2 Cluster 3 Ingreso a Puerto Luz de neblina trasera Abollado 147 1 3 Cluster 4 Ingreso a Puerto Bolsa de herramientas Faltante 6 1 4 Cluster 5 Ingreso a Puerto Luz de patente trasera Rayado Rozado 72 1 5 Cluster 6 Ingreso a Puerto Tapa acceso gancho Faltante remolque 10 1 6 Cluster 7 Subida a Buque Retrovisor externo izquierdo Rayado Rozado 36 1 7 Cluster 8 Ingreso a Puerto Paragolpe trasero / Zona contacto Rayado Rozado 299 1 8 Cluster 9 Transferencia ubicación y línea de carga Taza Proyección 13 1 9 Cluster 10 Transferencia ubicación y línea de carga Bolsa de herramientas Faltante 4331 1 10 Tabla 18: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004) Página 150 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Overall Lugar Retiro de Puerto Parte Tapa acceso gancho remolque Spoiler delantero Avería Faltante Gravedad Cantidad Fila Columna Leve Cluster 1 Subida a Buque Rayado Rozado Mediano Cluster 2 Ingreso a Puerto Parante delantero Rayado Rozado Cluster 3 3 1 1 Grave 15 1 3 Ingreso a Puerto Alfombra Proyección Grave suplementarias 48 1 4 Cluster 4 Ingreso a Puerto Luz de neblina Faltante trasera Grave 54 1 5 Cluster 5 Subida Buque Giro Delantero Puerto de Origen (derecho / izquierdo) Ingreso a Puerto Retrovisor externo derecho Moldura Transferencia ubicación y línea protctora lateral de carga izquierda Subida Buque Otros Puerto de Origen Grave 448 1 6 548 1 8 Cluster 6 Cluster 7 Cluster 8 Faltante Proyección - Pintura saltada - 1 1 9 Faltante - 3883 1 10 Tabla 19: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 3 – Semestre 2 Año 2004) Overall Modelo Modelo 15 Cluster 1 Modelo 17 Cluster 2 Modelo 17 Cluster 3 Modelo 9 Cluster 4 Modelo 13 Cluster 5 Modelo 17 Cluster 6 Modelo 17 Cluster 7 Modelo 18 Cluster 8 Modelo 17 Parte Tapa acceso gancho remolque Llave de rueda Avería Faltante Cantidad Faltante Cubierta delantera Faltante izquierda Giro Delantero Abollado (derecho / izquierdo) Puerta trasera izquierda Abollado Guardabarro trasero derecho Luz de neblina trasera Abollado Desgarrado Cortado Limpiador y lavador de Proyección parabrisas Tapa posterior de techo Faltante Fila Columna 556 1 1 1084 1 2 1409 1 3 89 1 4 849 1 6 15 1 7 712 1 8 286 1 9 Tabla 20: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004) Overall Modelo Modelo 15 Parte Avería Tapa acceso Faltante gancho remolque Página 151 de287 Gravedad Leve Cantidad Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 1 Modelo 5 Capot Cluster 2 Modelo 4 Cluster 3 Modelo 7 Retrovisor externo derecho Insignia Cluster 4 Modelo 15 Plip Cluster 5 Modelo 10 Cluster 6 Modelo 17 Cluster 7 Modelo 17 Faro de stop luneta Puerta trasera izquierda Manual Cluster 8 Modelo 15 Rayado Rozado Faltante Grave 11 1 1 Grave 63 1 2 Rayado Rozado Rayado Rozado Abollado Grave 23 1 3 Grave 12 1 4 Grave 128 1 5 Faltante Grave 72 1 6 Faltante Grave 259 1 7 4432 1 10 Tapa acceso Faltante gancho remolque - Tabla 21: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto período. • Parte – Avería – Gravedad (Período 4 – Semestre 2 Año 2005) Parte Guardabarro trasero derecho Spoiler delantero Avería Faltante Gravedad Cantidad Fila Columna - Manchado Observada 1 1 1 Manchado Observada 4 1 2 Manchado Observada 2 1 3 Cluster 4 Paragolpe delantero / Protector delantero Paragolpe delantero / Superior Capot Rayado - Rozado Observada 77 1 4 Cluster 5 Panel trasero bajo baúl Rayado - Rozado Observada 134 1 5 Cluster 6 Aleron Proyección Observada 172 1 6 Cluster 7 Panel trasero bajo baúl Pintura saltada Observada 16 1 7 Cluster 8 Llanta delantera izquierda Abollado Observada 703 1 8 Cluster 9 Zócalo izquierdo Manchado Observada 31 1 9 Faltante - 2779 1 10 Overall Cluster 1 Cluster 2 Cluster 3 Cluster 10 Zócalo derecho Tabla 22: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 4 – Semestre 1 Año 2005) Cluster 3 Lugar Retiro de Puerto Ingreso a Puerto Ingreso a Puerto Subida a Buque Cluster 4 Ingreso a Overall Cluster 1 Cluster 2 Parte Avería Guardabarro trasero derecho Faltante Paragolpe trasesro / Zona contacto Paragolpe trasero / Spoiler trasero Paragolpe delantero / Protector delantero Capot Página 152 de287 Rayado Rozado Rayado Rozado Rayado Rozado Rayado - Cantidad Fila Columna 3 1 1 6 1 4 9 1 5 72 1 6 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 5 Cluster 6 Cluster 7 Cluster 8 Puerto Subida Buque Puerto de Origen Retiro de Puerto Retiro de Puerto Retiro de Puerto Tapa posterior de techo Rozado Rayado Rozado 131 1 7 Taza Faltante 226 1 8 Llanta delantera izquierda Faltante 311 1 9 Puerta trasera derecha Faltante 3161 1 10 Tabla 23: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 4 – Semestre 1 Año 2005) Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Cluster 9 Lugar Retiro de Puerto Subida a Buque Subida a Buque Ingreso a Puerto Ingreso a Puerto Ingreso a Puerto Ingreso a Puerto Bajada de Buque Subida Buque Puerto de Origen Subida Buque Puerto de Origen Parte Guardabarro trasero derecho Zócalo interno puerta delantera izquierda Paragolpe trasero / Spoiler trasero Capot Avería Faltante Gravedad Cantidad Fila Columna - Rayado Rozado Observada 3 1 1 Rayado Rozado Rayado Rozado Faltante Observada 10 1 3 Observada 64 1 4 Observada 43 1 5 Luz de neblina Proyección trasera Cubierta delantera Faltante derecha Zócalo derecho Faltante Observada 165 1 6 - 436 1 7 - 2342 1 8 Escape Faltante Observada 855 1 9 Luneta trasera / Cristal puerta trasera Arrancado Roto Fisurado - 1 1 10 Parabrisa Tabla 24: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 4 – Semestre 1 Año 2005) Overall Modelo Modelo 15 Parte Guardabarro trasero derecho Parante delantero Avería Faltante Cluster 1 Modelo 9 Cluster 2 Modelo 6 Modelo 18 Limpiador de Faros (derecho / izquierdo) Llanta delantera izquierda Panel trasero bajo baúl Cluster 3 Modelo 8 Cluster 4 Cluster 5 Modelo 15 Capot Reventado Estallado Rayado - Rozado Cantidad Fila Columna 42 1 1 Proyección 380 1 2 Abollado 812 1 3 1250 1 4 13 1 5 Rayado - Rozado Página 153 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 6 Modelo 17 Cluster 7 Modelo 18 Cluster 8 Modelo 17 Cluster 9 Modelo 17 Cluster 10 Modelo 17 Paragolpe trasero / Spoiler trasero Escape Arrancado - Roto Fisurado Proyección 4 1 6 583 1 7 Guardabarro delantero izquierdo Separador interno de carga Llanta delantera derecha Pintura saltada 533 1 8 Proyección 237 1 9 65 1 10 Pintura saltada Tabla 25: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 4 – Semestre 1 Año 2005) Cluster 5 Modelo 9 Parte Avería Guardabarro trasero Faltante derecho Batería Rayado Rozado Luz de patente Proyección trasera Tapa acceso gancho Abollado remolque Alfombra Faltante suplementarias Zócalo derecho Manchado Cluster 6 Modelo 12 Parante delantero Faltante Observada Cluster 7 Modelo 15 Zócalo derecho Faltante - Overall Modelo Modelo 15 Cluster 1 Modelo 16 Cluster 2 Modelo 18 Cluster 3 Modelo 8 Cluster 4 Modelo 18 Gravedad Cantidad Fila Columna Observada 22 1 1 Observada 146 1 2 Observada 382 1 3 Observada 518 1 4 Observada 67 1 6 5 1 8 2779 1 10 Tabla 26: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto período. • Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005) Avería Faltante Gravedad Cantidad Fila Columna - Cluster 1 Parte Guardabarro delantero derecho Capot Abollado Observada 14 1 1 Cluster 2 Barras de techo Pintura saltada Observada 38 1 3 Cluster 3 Barras de techo Rayado - Rozado Observada 108 1 4 Cluster 4 Retrovisor externo izquierdo Tapa tanque combustible Bolsa de herramientas Pintura saltada Observada 146 1 6 Rayado - Rozado Observada 30 1 7 Rayado - Rozado Observada 81 1 8 Guardabarro delantero derecho Faltante - 3464 1 10 Overall Cluster 5 Cluster 6 Cluster 7 Página 154 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Tabla 27: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 5 – Semestre 2 Año 2005) Lugar Overall Retiro de Puerto Parte Guardabarro delantero derecho Cluster Subida Buque Puerto Paragolpe delantero / de Origen Superior 1 Cluster Subida Buque Puerto Paragolpe delantero / de Origen Protector delantero 2 Paragolpe delantero / Cluster Bajada de Buque Protector delantero 3 Paragolpe delantero / Cluster Bajada de Buque Superior 4 Paragolpe trasero / Spoiler Cluster Retiro Fábrica de Origen trasero 5 Antena Cluster Bajada de Buque 6 Cristales de parante Cluster Retiro de Puerto delantero 7 Avería Faltante Cantidad Fila Columna Rayado Rozado Rayado Rozado Rayado Rozado Rayado Rozado Rayado Rozado Proyección Faltante 13 1 1 29 1 5 63 1 6 44 1 7 993 1 8 177 1 9 2562 1 10 Tabla 28: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005) Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Lugar Retiro de Puerto Ingreso a Puerto Ingreso a Puerto Ingreso a Puerto Subida a Buque Ingreso a Puerto Subida Buque Puerto de Origen Bajada de Buque Ingreso a Puerto Parte Guardabarro delantero derecho Techo (inclusive convertible) Otros Avería Faltante Gravedad Cantidad Fila Columna - Pintura saltada Abollado - 67 1 1 - 177 1 2 Techo (inclusive convertible) Bolsa de herramientas Llanta delantera izquierda Guardabarro delantero derecho Rayado Rozado Proyección - 142 1 3 12 1 4 Proyección - 111 1 5 Faltante - 2955 1 6 Zócalo derecho Faltante Observada 168 1 7 Llanta delantera derecha Proyección Observada 249 1 8 Tabla 29: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 5 – Semestre 2 Año 2005) Overall Modelo Modelo 13 Cluster 1 Modelo 18 Parte Guardabarro delantero derecho Guardabarros y parante Avería Faltante Cantidad Rayado – 269 Página 155 de287 Fila Columna 1 1 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 2 Cluster 3 Modelo 17 Modelo 7 Cluster 4 Modelo 17 Cluster 5 Modelo 13 Cluster 6 Modelo 6 Cluster 7 Modelo 9 trasero izquierdo Faro de stop luneta Tapa acceso gancho remolque Tapa de Baúl o Puerta Trasera Techo (inclusive convertible) Paragolpe trasero / Zona contacto Paragolpe delantero / Superior Rozado Abollado Abollado 669 1290 1 1 2 3 Rayado Rozado Abollado 1307 1 5 24 1 6 Rayado Rozado Rayado Rozado 263 1 8 59 1 10 Tabla 30: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005) Avería Faltante Gravedad Cantidad Fila Columna - Rayado Rozado Rayado Rozado Abollado Observada 7 1 1 Observada 53 1 2 Cluster 3 Modelo Parte Modelo 13 Guardabarro delantero derecho Modelo 20 Paragolpe delantero / Protector delantero Modelo 19 Tapizado interno puerta delantera izquierda Modelo 18 Llave Observada 123 1 3 Cluster 4 Modelo 9 Parrilla delantera Proyección Observada 6 1 4 Cluster 5 Modelo 6 Taza Proyección Observada Cluster 6 Modelo 13 Techo (inclusive convertible) Modelo 8 Guardabarro delantero izquierdo Modelo 13 Guardabarro delantero derecho Overall Cluster 1 Cluster 2 Cluster 7 Cluster 8 167 1 5 Abollado Observada 11 1 7 Abollado Observada 50 1 8 Faltante - 3464 1 10 Tabla 31: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto período. • Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006) Cluster 3 Retiro de Puerto Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Ingreso a Puerto Cluster 4 Ingreso a Puerto Cluster 5 Cluster 6 Ingreso a Puerto Transferencia ubicación y línea de carga Subida Buque Puerto de Origen Overall Cluster 1 Cluster 2 Cluster 7 Zócalo derecho Spoiler delantero Faltante Rayado Rozado Paragolpe delantero / Rayado Protector delantero Rozado Paragolpe delantero / Rayado Protector delantero Rozado Zócalo interno puerta Rayado delantera izquierda Rozado Tapa acceso gancho remolque Faltante Llave Abollado Guardabarro trasero derecho Página 156 de287 Faltante 42 1 2 27 1 5 74 1 6 114 1 7 470 53 1 1 8 9 2983 1 10 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Tabla 32: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 6 – Semestre 1 Año 2006) Lugar Retiro de Puerto Parte Zócalo derecho Avería Faltante Cantidad Fila Columna Spoiler delantero Rayado Rozado 42 1 2 Paragolpe delantero / Protector delantero Rayado Rozado 27 1 5 Cluster 3 Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Ingreso a Puerto 1 6 Ingreso a Puerto 114 1 7 Cluster 5 Ingreso a Puerto Rayado Rozado Rayado Rozado Faltante 74 Cluster 4 470 1 8 Cluster 6 Paragolpe delantero / Protector delantero Zócalo interno puerta delantera izquierda Tapa acceso gancho remolque Llave Transferencia ubicación y línea de carga Subida Buque Puerto Guardabarro trasero de Origen derecho Abollado 53 1 9 Faltante 2983 1 10 Overall Cluster 1 Cluster 2 Cluster 7 Tabla 33: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006) Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Lugar Parte Retiro de Puerto Zócalo derecho Avería Faltante Gravedad Cantidad Fila Columna - Bajada de Spoiler delantero Buque Retiro de Puerto Paragolpe delantero / Protector delantero Bajada de Spoiler delantero Buque Ingreso a Puerto Tapa posterior de techo Bajada de Moldura protectora Buque lateral derecha Transferencia Puerta trasera ubicación y izquierda línea de carga Bajada de Tapa acceso gancho Buque remolque Bajada de Zócalo derecho Buque Rayado Rozado Rayado Rozado Rayado Rozado Rayado Rozado Faltante Observada 7 1 1 Observada 1 1 4 Observada 9 1 5 Observada 35 1 6 Observada 103 1 7 Abollado Observada 33 1 8 Abollado Observada 274 1 9 3301 1 10 Faltante - Tabla 34: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 6 – Semestre 1 Año 2006) Modelo Parte Avería Página 157 de287 Cantidad Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Overall Cluster 1 Modelo 13 Modelo 20 Cluster 2 Modelo 17 Zócalo derecho Paragolpe delantero / Protector delantero Panel trasero bajo baúl Cluster 3 Cluster 4 Modelo 7 Modelo 17 Escape Otros Cluster 5 Modelo 18 Cluster 6 Modelo 16 Cluster 7 Modelo 13 Giro Delantero (derecho / izquierdo) Guardabarros y parante trasero izquierdo Barras de techo Faltante Rayado Rozado Rayado Rozado Faltante Rayado Rozado Abollado 124 1 1 901 1 2 1695 110 1 1 3 6 577 1 7 Abollado 318 1 8 Abollado 38 1 9 Tabla 35: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006) Overall Modelo Modelo 13 Parte Zócalo derecho Avería Faltante Gravedad Cantidad Fila Columna - Cluster 1 Modelo 20 Cluster 2 Modelo 20 Paragolpe delantero / Superior Spoiler delantero Cluster 3 Modelo 19 Rayado Observada Rozado Rayado Observada Rozado Proyección Observada Cluster 4 Modelo 19 Cluster 5 Modelo 7 Bolsa de herramientas Faltante Observada 260 1 5 Cluster 6 Modelo 11 Observada 5 1 6 Cluster 7 Modelo 16 Manijas externas de puertas delanteras Parrilla delantera Observada 74 1 8 Cluster 8 Modelo 13 Zócalo derecho 3301 1 10 Paragolpe trasero / Spoiler trasero Bolsa de herramientas Proyección Observada Pintura saltada Pintura saltada Faltante - 1 1 1 20 1 2 45 1 3 57 1 4 Tabla 36: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo período. • Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006) Parte Avería Guardabarro delantero Faltante derecho Cluster 1 Llanta trasera derecha Pintura saltada Gravedad Cantidad Observada 1 1 1 Cluster 2 Cubierta trasera derecha Cluster 3 Bajo chasis delantero Reventado - Estallado Observada 1 1 2 Observada 2 1 3 Observada 15 1 4 Cluster 5 Luz de neblina trasera Arrancado - Roto Fisurado Arrancado - Roto Fisurado Abollado Observada 94 1 5 Cluster 6 Faro de stop luneta Rayado - Rozado Observada 94 1 6 Overall Cluster 4 Bolsa de herramientas Página 158 de287 Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Proyección Cluster 7 Tapa posterior de techo Abollado Cluster 8 Alfombra suplementarias Cluster 9 Guardabarro delantero Faltante derecho Observada 128 1 7 Observada 22 1 8 2271 1 10 - Tabla 37: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 7 – Semestre 2 Año 2006) Cluster 1 Lugar Transferencia ubicación y línea de carga Retiro de Puerto Cluster 2 Bajada de Buque Cluster 3 Bajada de Buque Cluster 4 Ingreso a Puerto Cluster 5 Bajada de Buque Cluster 6 Cluster 7 Overall Parte Guardabarro delantero derecho Avería Faltante Paragolpe delantero / Protector delantero Paragolpe delantero / Protector delantero Manijas externas de puertas traseras Parabrisa Rayado Rozado Rayado Rozado Proyección Cantidad Fila Columna 11 1 1 41 1 2 326 1 3 Proyección 865 1 4 Abollado 473 1 5 Ingreso a Puerto Guardabarro delantero izquierdo Faro de stop luneta Abollado 483 1 7 Ingreso a Puerto Llave Rayado Rozado 429 1 8 Tabla 38: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006) Overall Cluster 1 Cluster 2 Lugar Transferencia ubicación y línea de carga Bajada de Buque Bajada de Buque Cluster 3 Retiro de Puerto Cluster 4 Bajada de Buque Bajada de Buque Bajada de Buque Ingreso a Puerto Cluster 5 Cluster 6 Cluster 7 Parte Avería Guardabarro Faltante delantero derecho Gravedad Cantidad Fila Columna - Spoiler delantero Rayado Rozado Rayado Rozado Observada 1 1 1 Observada 3 1 3 Rayado Rozado Observada 1 1 4 Rayado Observada Rozado Proyección Observada 14 1 5 21 1 6 Abollado Observada 67 1 7 Observada 250 1 8 Paragolpe delantero / Protector delantero Paragolpe delantero / Protector delantero Panel trasero bajo baúl Alfombra suplementarias Parrilla delantera Guardabarro Faltante delantero derecho Página 159 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 8 Transferencia ubicación y línea de carga Guardabarro Faltante delantero derecho - 2271 1 10 Tabla 39: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 7 – Semestre 2 Año 2006) Overall Modelo Modelo 15 Parte Guardabarro delantero derecho Parrilla delantera Avería Faltante Cluster 1 Modelo 20 Cluster 2 Modelo 19 Cluster 3 Modelo 6 Cluster 4 Modelo 11 Retrovisor externo izquierdo Puerta delantera derecha Barras de techo Proyección Cluster 5 Modelo 20 Barras de techo Proyección Cluster 6 Modelo 13 Cluster 7 Modelo 18 Cluster 8 Modelo 13 Tapa acceso gancho remolque Retrovisor externo derecho Llanta delantera derecha Rayado Rozado Reventado Estallado Abollado Cantidad Fila Columna Rayado Rozado Abollado 252 1 1 553 1 2 Faltante 868 1 3 91 1 4 714 1 5 4 1 6 114 1 7 32 1 10 Tabla 40: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006) Overall Modelo Modelo 15 Avería Faltante Modelo 5 Parte Guardabarro delantero derecho Otros Cluster 1 Cluster 2 Modelo 5 Zócalo izquierdo Cluster 3 Modelo 7 Zócalo izquierdo Rayado Rozado Abollado Cluster 4 Modelo 6 Cluster 5 Modelo 8 Cluster 6 Modelo 19 Cluster 7 Modelo 13 Cluster 8 Modelo 15 Manijas externas de puertas traseras Retrovisor externo derecho Retrovisor externo derecho Giro Delantero (derecho / izquierdo) Guardabarro delantero derecho Gravedad Cantidad Fila Columna - Manchado Observada 2 1 1 Observada 22 1 3 Observada 42 1 4 Proyección Observada 42 1 5 Pintura saltada Faltante Observada 20 1 6 Observada 224 1 7 Abollado Observada 5 1 8 Faltante - 2271 1 10 Tabla 41: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo período. • Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007) Página 160 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Parte Zócalo derecho Spoiler delantero Avería Faltante Rayado Rozado Rayado Rozado Rayado Rozado Abollado Paragolpe delantero / Protector delantero Paragolpe trasero / Spoiler trasero Tapa posterior de techo Manual Luz de neblina trasera Pintura saltada Faltante Zócalo derecho Faltante Gravedad Cantidad Observada 2 Observada 64 Observada 68 Observada 76 Observada 5 Observada 437 2377 Fila Columna 1 1 1 4 1 5 1 6 1 7 1 8 1 10 Tabla 42: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 8 – Semestre 1 Año 2007) Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Lugar Transferencia ubicación y línea de carga Ingreso a Puerto Transferencia ubicación y línea de carga Bajada de Buque Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Parte Zócalo derecho Avería Faltante Cantidad Fila Columna Puerta trasera izquierda Guardabarro trasero derecho Proyección 599 1 1 Pintura saltada 288 1 2 Moldura protectora lateral derecha Techo (inclusive convertible) Faltante 910 1 3 Rayado Rozado 510 1 4 Manual Faltante 722 1 5 Tabla 43: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007) Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Lugar Transferencia ubicación y línea de carga Ingreso a Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Transferencia Parte Zócalo derecho Avería Faltante Paragolpe delantero / Pintura Protector delantero saltada Faldillas para barro Pintura saltada Gravedad Cantidad Fila Columna - Observada 2 1 1 Observada 6 1 3 Zócalo izquierdo Abollado Observada 57 1 4 Puerta trasera Rayado - Observada 68 1 5 Página 161 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 5 Cluster 6 Cluster 7 Cluster 8 ubicación y línea de carga Transferencia ubicación y línea de carga Bajada de Buque Subida Buque Puerto de Origen Transferencia ubicación y línea de carga izquierda Rozado Tapizado interno puerta delantera izquierda Capot Rayado - Observada Rozado 160 1 6 Rayado - Observada Rozado Panel lateral derecho Abollado Observada 10 1 7 349 1 8 2377 1 10 Zócalo derecho Faltante - Tabla 44: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 8 – Semestre 1 Año 2007) Overall Cluster 1 Modelo Modelo 14 Modelo 5 Parte Zócalo derecho Capot Cluster 2 Modelo 5 Cluster 3 Cluster 4 Modelo 7 Modelo 13 Cluster 5 Cluster 6 Modelo 19 Modelo 13 Cluster 7 Modelo 13 Cluster 8 Modelo 20 Manijas externas de puertas traseras Parrilla delantera Retrovisor externo izquierdo Zócalo izquierdo Guardabarro delantero izquierdo Tapa de Baúl o Puerta Trasera Limpiador y lavador de parabrisas Techo corredizo Puerta delantera derecha Cluster 9 Modelo 14 Cluster 10 Modelo 13 Avería Faltante Rayado Rozado Proyección Cantidad Fila Columna 105 1 1 316 1 2 Faltante Rayado Rozado Abollado Abollado 730 1 1 1 3 4 455 206 1 1 5 6 Abollado 15 1 7 1110 1 8 90 1 1 1 9 10 Proyección Faltante Rayado Rozado Tabla 45: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007) Overall Modelo Modelo 14 Cluster 1 Modelo 20 Cluster 2 Modelo 20 Cluster 3 Modelo 20 Cluster 4 Modelo 17 Cluster 5 Modelo 20 Cluster 6 Modelo 11 Parte Zócalo derecho Avería Faltante Gravedad Cantidad Fila Columna - Paragolpe delantero / Superior Paragolpe delantero / Protector delantero Tapa de Baúl o Puerta Trasera Manijas externas de puertas traseras Cubierta delantera izquierda Panel lateral derecho Rayado Rozado Rayado Rozado Rayado Rozado Proyección Observada 1 1 1 Observada 20 1 2 Observada 45 1 3 Observada 57 1 4 Observada 260 1 5 Observada 5 1 6 Rayado Rozado Faltante Página 162 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 7 Modelo 14 Zócalo derecho Faltante - 74 1 8 Tabla 46: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno período. • Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007) Parte Avería Proyección Gravedad Cantidad - Cluster 1 Conjunto carrocería Manchado Observada Cluster 2 Llanta trasera izquierda Observada Cluster 4 Guardabarros y parante trasero izquierdo Cluster 5 Panel lateral derecho Rayado Rozado Rayado Rozado Rayado Rozado Faltante Observada Cluster 6 Techo corredizo Proyección Observada Cluster 7 Limpiador y lavador de parabrisas Proyección - Overall Taza Cluster 3 Cubierta trasera derecha Fila Columna 2 1 1 67 1 5 76 1 6 176 1 7 438 1 8 275 1 9 3966 1 10 Observada Observada Tabla 47: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 9 – Semestre 2 Año 2007) Cluster 1 Lugar Parte Transferencia Taza ubicación y línea de carga Retiro de Puerto Capot Cluster 2 Bajada de Buque Spoiler delantero Cluster 3 Bajada de Buque Capot Cluster 4 Bajada de Buque Cluster 5 Cluster 6 Bajada de Buque Bajada de Buque Cluster 7 Zócalo interno puerta delantera izquierda Barras de techo Tapa acceso gancho remolque Llanta trasera izquierda Abollado Transferencia ubicación y línea de carga Ingreso a Puerto Manijas externas de puertas delanteras Transferencia Faro de stop luneta ubicación y línea de carga Overall Cluster 8 Cluster 9 Avería Cantidad Fila Columna Proyección Rayado Rozado Rayado Rozado Rayado Rozado Rayado Rozado Abollado Abollado 1 1 1 3 1 3 27 1 4 30 1 5 147 520 1 1 6 7 21 1 8 Proyección 3082 1 9 Rayado Rozado 1169 1 10 Tabla 48: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007) Página 163 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Overall Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Cluster 9 Lugar Transferencia ubicación y línea de carga Bajada de Buque Transferencia ubicación y línea de carga Ingreso a Puerto Transferencia ubicación y línea de carga Ingreso a Puerto Transferencia ubicación y línea de carga Subida Buque Puerto de Origen Subida Buque Puerto de Origen Transferencia ubicación y línea de carga Parte Avería Gravedad Cantidad Fila Columna Proyección - Taza Zócalo izquierdo Observada 11 1 1 Observada 72 1 2 Tapizado interno puerta delantera izquierda Tapa tanque combustible Proyección Observada 239 1 3 Rayado Rozado Observada 233 1 4 Escape Rayado Rozado Rayado Rozado Observada 51 1 5 Observada 100 1 6 Abollado Observada 62 1 7 Limpiador y lavador Abollado de parabrisas Observada 266 1 8 3966 1 10 Llanta trasera izquierda Zócalo derecho Puerta delantera izquierda Rayado Rozado Rayado Rozado Limpiador y lavador Proyección de parabrisas Tabla 49: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 9 – Semestre 2 Año 2007) Modelo Modelo 14 Cluster 1 Modelo 7 Overall Cluster 2 Modelo 6 Cluster 3 Modelo 7 Cluster 4 Modelo 14 Cluster 5 Modelo 20 Cluster 6 Modelo 9 Cluster 7 Modelo 13 Cluster 8 Modelo 13 Cluster 8 Modelo 13 Parte Avería Proyección Taza Cable de carga Tapizado interno puerta delantera izquierda Guardabarro trasero derecho Luz de neblina trasera Rayado Rozado Rayado Rozado Pintura saltada Abollado Cantidad Fila Columna 356 1 1 782 1 2 704 1 3 112 1 4 Limpiador y lavador de parabrisas Techo corredizo Faro de stop luneta Proyección 2716 1 5 Proyección Faltante 15 27 1 1 6 7 Guardabarro trasero derecho Abollado 144 1 10 Techo (inclusive convertible) Abollado 144 1 10 Tabla 50: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería Página 164 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Modelo – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007) Overall Cluster 1 Modelo Modelo 14 Modelo 20 Cluster 2 Modelo 20 Cluster 3 Modelo 8 Cluster 4 Modelo 16 Cluster 5 Modelo 15 Cluster 6 Modelo 7 Cluster 7 Modelo 20 Parte Taza Llanta trasera izquierda Alfombra baúl / caja de carga Alfombra suplementarias Llanta delantera derecha Techo (inclusive convertible) Llanta delantera derecha Transponder Avería Proyección Rayado Rozado Rayado Rozado Proyección Faltante Proyección Faltante Proyección Gravedad Cantidad Fila Columna Observada 65 1 1 Observada 165 1 3 Observada 450 1 4 Observada 354 1 5 22 1 7 1598 1 8 2346 1 9 Tabla 51: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo período. • Parte – Avería – Gravedad (Período 10 – Semestre 1 Año 2008) Overall Parte Zócalo derecho Avería Faltante Gravedad Cantidad Fila Columna - Cluster 1 Spoiler delantero Rayado - Rozado Observada 5 1 1 Cluster 2 Paragolpe delantero / Protector delantero Paragolpe delantero / Superior Paragolpe trasero / Spoiler trasero Moldura protctora lateral izquierda Retrovisor externo derecho Rayado - Rozado Observada 75 1 5 Rayado - Rozado Observada 15 1 6 Proyección Observada 145 1 7 Rayado - Rozado Observada 828 1 8 Faltante - 3932 1 10 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Tabla 52: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad • Lugar – Parte – Avería (Período 10 – Semestre 1 Año 2008) Overall Cluster 1 Cluster 2 Lugar Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Parte Zócalo derecho Avería Faltante Paragolpe delantero / Protector delantero Rayado Rozado 176 1 1 Tapa posterior de techo Rayado Rozado 717 1 2 Página 165 de287 Cantidad Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 3 Bajada de Buque Panel lateral derecho Faltante 834 1 3 Cluster 4 Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Transferencia ubicación y línea de carga Manijas externas de puertas traseras Reventado Estallado 204 1 4 3031 1 5 38 1 6 Cluster 5 Cluster 6 Giro Delantero (derecho Faltante / izquierdo) Llanta trasera izquierda Rayado Rozado Tabla 53: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería • Lugar – Parte – Avería – Gravedad (Período 10 – Semestre 1 Año 2008) Lugar Overall Transferencia ubicación y línea de carga Cluster Transferencia ubicación y línea 1 de carga Cluster Subida a Buque 2 Cluster Subida a Buque 3 Cluster Ingreso a Puerto 4 Cluster Ingreso a Puerto 5 Cluster Bajada de Buque 6 Cluster Transferencia ubicación y línea 7 de carga Cluster Ingreso a Puerto 8 Cluster Transferencia ubicación y línea 9 de carga Parte Zócalo derecho Avería Faltante Gravedad Cantidad Fila Columna - Paragolpe delantero / Protector delantero Paragolpe delantero / Protector delantero Bolsa de herramientas Arrancado Roto Fisurado Arrancado Roto Fisurado Arrancado Roto Fisurado Pintura saltada Observada 1 1 1 Observada 3 1 3 Observada 12 1 4 Observada 44 1 5 Rayado Rozado Abollado Observada 255 1 6 Observada 116 1 7 Rayado Rozado Observada 402 1 8 Manchado Observada 235 1 9 3932 1 10 Giro Delantero (derecho / izquierdo) Paragolpe trasero / Spoiler trasero Moldura protectora lateral derecha Llanta delantera izquierda Encendedor Retrovisor externo Faltante derecho - Tabla 54: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad • Modelo – Parte – Avería (Período 10 – Semestre 1 Año 2008) Modelo Parte Overall Modelo 13 Zócalo derecho Cluster 1 Modelo 20 Paragolpe delantero / Protector delantero Cluster 2 Modelo 20 Manijas externas de puertas delanteras Cluster 3 Modelo 15 Cable de carga Avería Faltante Rayado Rozado Proyección 181 1 1 290 1 2 Proyección 5 1 3 Página 166 de287 Cantidad Fila Columna Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Cluster 4 Modelo 13 Techo corredizo Cluster 5 Modelo 8 Capot Cluster 6 Modelo 10 Cristales de parante delantero Cluster 7 Modelo 19 Puerta trasera derecha Cluster 8 Modelo 13 Faro de stop luneta Cluster 9 Modelo 7 Panel lateral derecho Pintura saltada Faltante Reventado Estallado Faltante Rayado Rozado Proyección 186 35 60 1 1 1 4 5 6 2040 4 1 1 7 9 2199 1 10 Tabla 55: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería • Modelo – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007) Overall Cluster 1 Modelo Modelo 13 Modelo 20 Cluster 2 Cluster 3 Modelo 20 Modelo 20 Cluster 4 Modelo 6 Cluster 5 Cluster 6 Modelo 7 Modelo 7 Cluster 7 Modelo 16 Cluster 8 Modelo 14 Parte Zócalo derecho Llanta trasera izquierda Conjunto carrocería Guardabarro delantero izquierdo Luz de patente trasera Conjunto carrocería Giro Delantero (derecho / izquierdo) Limpiador y lavador de parabrisas Retrovisor externo derecho Avería Faltante Rayado Rozado Manchado Rayado Rozado Rayado Rozado Manchado Rayado Rozado Faltante Gravedad Cantidad Fila Columna Observada 11 1 1 Faltante - Observada Observada 18 102 1 1 2 3 Observada 12 1 4 Observada Observada 163 560 1 1 5 6 Observada 202 1 7 3932 1 10 Tabla 56: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad 8.4.4.3. Modelo de Predicción Al igual que con el análisis del modelo anterior este se realiza sobre diferentes variables de ingreso: Parte – Avería – Gravedad con predicción de la Parte, Parte – Avería – Gravedad con predicción de la Avería, Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar, y finalmente Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo. El primer análisis permite ver o predecir la ocurrencia que una avería sea producida en una determinada parte. Del análisis del segundo grupo se obtiene información sobre la ocurrencia de una determinada avería teniendo en cuenta la parte de un auto y la gravedad del daño. El siguiente proceso permite ver la ocurrencia de una avería en un determinado lugar. Para finalizar esta etapa se toma como referencia de predicción el modelo de auto que es averiado. La herramienta nos permite ver por cada análisis y procesamiento de datos la respectiva curva de entrenamiento para cada modelo y la correspondiente curva de validación de datos de cada modelo. Página 167 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer período. • Parte – Avería – Gravedad con predicción de la Parte (Período 1 – Año 2003) Variable Tipo de Avería Parte predictiva: Puerta delantera Derecha Tipo de Avería: Exceso kilometraje Gravedad: Mediano Partes predictivas: Puerta delantera Derecha Puerta trasera Derecha Panel lateral derecho Moldura protector lateral derecha Giro Delantero (D/I) Cristales de parante delantero. Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Variable Gravedad Parte predictiva: Tapa acceso gancho remolque Tipo Avería: Faltante Gravedad: Leve Partes predictivas: Moldura protector lateral derecha Giro Delantero (D/I) Cristales de parante delantero Escape Tapa acceso gancho remolque • Parte – Avería – Gravedad con predicción de la Avería (Período 1 – Año 2003) Variable Parte Avería predictiva: Faltante Parte: Rueda de Auxilio Gravedad: Mediano Averías predictivas: Abollado Faltante Proyección Variable Gravedad Avería predictiva: Techo corredizo Parte: Exceso kilometraje Gravedad: Leve Averías predictivas: Abollado Faltante Página 168 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 1 – Año 2003) Variable Parte Lugar predictivo: Retiro de Puerto Parte: Rueda de Auxilio Tipo de avería: Faltante Gravedad: Mediano Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Tapa acceso gancho remolque Tipo Avería: Exceso kilometraje Gravedad: Mediano Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Tapa acceso gancho remolque Tipo Avería: Faltante Gravedad: Leve • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 1 – Año 2003) Variable Parte Modelo predictivo: Modelo 9 Parte: Rueda de Auxilio Tipo de avería: Faltante Gravedad: Mediano Modelos predictivos: Modelo 8 Modelo 9 Modelo 10 Modelo 11 Modelo 12 Variable Avería Modelo predictivo: Modelo 11 Parte: Tapa acceso gancho remolque Tipo de avería: Exceso kilometraje Gravedad: Mediano Modelos predictivos: Modelo 8 Modelo 9 Modelo 10 Modelo 11 Modelo 12 Variable Gravedad Modelo predictivo: Modelo 10 Página 169 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Parte: Tapa acceso gancho remolque Tipo de avería: Faltante Gravedad: Leve Modelos predictivos: Modelo 9 Modelo 10 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo período. • Parte – Avería – Gravedad con predicción de la Parte (Período 2 – Semestre 1 Año 2004) Variable Tipo de Avería Parte predictiva: Escape Tipo de Avería: Abollado Gravedad: Mediano Partes predictivas: Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave Parrilla delantera Luz de neblina trasera Faro de stop luneta Retrovisor externo izquierdo Guardabarro delantero izquierdo Variable Gravedad Parte predictiva: Llave Tipo Avería: Abollado Gravedad: Mediano Partes predictivas: Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave • Parte – Avería – Gravedad con predicción de la Avería (Período 1 – Semestre 1 Año 2004) Variable Parte Avería predictiva: Abollado Parte: Llave Gravedad: Mediano Página 170 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Averías predictivas: Abollado Variable Gravedad Avería predictiva: Abollado Parte: Llave Gravedad: Mediano Averías predictivas: Abollado Faltante • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 2 – Semestre 1 Año 2004) Variable Parte Lugar predictivo: Bajada de Buque Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Llave Tipo Avería: Abollado Gravedad: Mediano Variable Gravedad Lugar predictivo: Bajada de buque Parte: Llave Tipo Avería: Abollado Gravedad: Mediano • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 2 – Semestre 1 Año 2004) Variable Parte Modelo predictivo: Modelo 11 Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Modelos predictivos: Modelo 11 Variable Avería Modelo predictivo: Modelo 11 Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Modelos predictivos: Modelo 11 Página 171 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Variable Gravedad Modelo predictivo: Modelo 11 Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Modelos predictivos: Modelo 11 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer período. • Parte – Avería – Gravedad con predicción de la Parte (Período 3 – Semestre 2 Año 2004) Variable Tipo de Avería Parte predictiva: Llanta delantera derecha Tipo de Avería: Faltante Gravedad: Observada Partes predictivas: Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Variable Gravedad Parte predictiva: Puerta trasera derecha Tipo Avería: Faltante Gravedad: Observada Partes predictivas: Puerta delantera derecha • Parte – Avería – Gravedad con predicción de la Avería (Período 3 – Semestre 2 Año 2004) Variable Parte Avería predictiva: Abollado Parte: Giro Delantero (D/I) Gravedad: Observada Averías predictivas: Abollado Página 172 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Faltante Variable Gravedad Avería predictiva: Abollado Parte: Giro Delantero (D/I) Gravedad: Observada Averías predictivas: Abollado Faltante • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 3 – Semestre 2 Año 2004) Variable Parte Lugar predictivo: Bajada de Buque Parte: Giro Delantero (D/I) Tipo de avería: Faltante Gravedad: Observada Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Giro Delantero (D/I) Tipo Avería: Faltante Gravedad: Observada Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Giro Delantero (D/I) Tipo Avería: Faltante Gravedad: Observada • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 3 – Semestre 2 Año 2004) Variable Parte Modelo predictivo: Modelo 14 Parte: Giro Delantero (D/I) Tipo de avería: Abollado Gravedad: Observada Modelos predictivos: Modelo 14 Variable Avería Modelo predictivo: Modelo 16 Parte: Giro Delantero (D/I) Tipo de avería: Abollado Gravedad: Observada Modelos predictivos: Modelo 12 Modelo 13 Página 173 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 14 Modelo 15 Variable Gravedad Modelo predictivo: Modelo 14 Parte: Giro Delantero (D/I) Tipo de avería: Abollado Gravedad: Observada Modelos predictivos: Modelo 13 Modelo 14 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto período. • Parte – Avería – Gravedad con predicción de la Parte (Período 4 – Semestre 1 Año 2005) Variable Tipo de Avería Parte predictiva: Alerón Tipo de Avería: Faltante Gravedad: Partes predictivas: Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Variable Gravedad Parte predictiva: Cubierta delantera derecha Tipo Avería: Faltante Gravedad: Partes predictivas: Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Página 174 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape • Parte – Avería – Gravedad con predicción de la Avería (Período 4 – Semestre 1 Año 2005) Variable Parte Avería predictiva: Abollado Parte: Panel lateral derecho Gravedad: Averías predictivas: Abollado Faltante Proyección • Variable Gravedad Avería predictiva: Faltante Parte: Panel lateral derecho Gravedad: Averías predictivas: Abollado Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 4 – Semestre 1 Año 2005) Variable Parte Lugar predictivo: Retiro de Puerto Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Panel lateral derecho Tipo Avería: Faltante Gravedad: Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Panel lateral derecho Tipo Avería: Faltante Gravedad: - • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 4 – Semestre 1 Año 2005) Variable Parte Página 175 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo predictivo: Modelo 15 Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 14 Modelo 15 Variable Avería Modelo predictivo: Modelo 17 Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 13 Modelo 14 Modelo 15 Modelo 16 Variable Gravedad Modelo predictivo: Modelo 15 Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto período. • Parte – Avería – Gravedad con predicción de la Parte (Período 5 – Semestre 2 Año 2005) Variable Tipo de Avería Parte predictiva: Aerosol antipinchazos Tipo de Avería: Faltante Gravedad: Partes predictivas: Aerosol antipinchazos Transponder Antena Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros Página 176 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave Parrilla delantera Luz de neblina trasera Faro de stop luneta Variable Gravedad Parte predictiva: Guardabarro trasero derecho Tipo Avería: Faltante Gravedad: Partes predictivas: Zócalo derecho Guardabarro trasero derecho • Parte – Avería – Gravedad con predicción de la Avería (Período 5 – Semestre 2 Año 2005) Variable Parte Avería predictiva: Abollado Parte: Zócalo derecho Gravedad: Averías predictivas: Abollado Faltante Proyección Variable Gravedad Avería predictiva: Proyección Parte: Zócalo derecho Gravedad: Averías predictivas: Página 177 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Faltante • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 5 – Semestre 2 Año 2005) Variable Parte Lugar predictivo: Retiro de Puerto Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: Variable Gravedad Lugar predictivo: Ingreso a Puerto Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: - • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 5 – Semestre 2 Año 2005) Variable Parte Modelo predictivo: Modelo 14 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 13 Variable Avería Modelo predictivo: Modelo 16 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15 Variable Gravedad Modelo predictivo: Modelo 13 Parte: Zócalo derecho Página 178 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 12 Modelo 13 Modelo 14 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto período. • Parte – Avería – Gravedad con predicción de la Parte (Período 6 – Semestre 1 Año 2006) Variable Tipo de Avería Parte predictiva: Panel trasero bajo baúl Tipo de Avería: Faltante Gravedad: Partes predictivas: Panel trasero bajo baúl Paragolpe trasero / Zona contacto Tapizado interno puerta delantera izquierda Zócalo interno puerta delantera izquierda Manijas externas de puertas delanteras Manijas externas de puertas traseras Aerosol antipinchazos Transponder Antena Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Página 179 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Otros Llave Parrilla delantera Luz de neblina trasera Variable Gravedad Parte predictiva: Puerta delantera derecha Tipo Avería: Faltante Gravedad: Partes predictivas: Guardabarro trasero derecho Puerta delantera derecha • Parte – Avería – Gravedad con predicción de la Avería (Período 6 – Semestre 1 Año 2006) Variable Parte Avería predictiva: Abollado Parte: Cubierta delantera derecha Gravedad: Averías predictivas: Abollado Faltante Proyección Variable Gravedad Avería predictiva: Faltante Parte: Cubierta delantera derecha Gravedad: Averías predictivas: Abollado • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 6 – Semestre 1 Año 2006) Variable Parte Lugar predictivo: Retiro de Puerto Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Cubierta delantera derecha Tipo Avería: Faltante Gravedad: Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Cubierta delantera derecha Página 180 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Tipo Avería: Faltante Gravedad: • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 6 – Semestre 1 Año 2006) Variable Parte Modelo predictivo: Modelo 11 Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Variable Avería Modelo predictivo: Modelo 14 Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Variable Gravedad Modelo predictivo: Modelo 12 Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 10 Modelo 11 Modelo 12 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo período. • Parte – Avería – Gravedad con predicción de la Parte (Período 7 – Semestre 2 Año 2006) Variable Tipo de Avería Parte predictiva: Manijas externas de puertas traseras Tipo de Avería: Faltante Gravedad: Página 181 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Partes predictivas: Manijas externas de puertas traseras Aerosol antipinchazos Transponder Antena Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Variable Gravedad Parte predictiva: Cubierta delantera derecha Tipo Avería: Faltante Gravedad: Partes predictivas: Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho • Parte – Avería – Gravedad con predicción de la Avería (Período 7 – Semestre 2 Año 2006) Variable Parte Avería predictiva: Faltante Parte: Guardabarro delantero derecho Gravedad: Averías predictivas: Abollado Faltante Página 182 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Variable Gravedad Avería predictiva: Faltante Parte: Guardabarro delantero derecho Gravedad: Averías predictivas: Abollado • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 7 – Semestre 2 Año 2006) Variable Parte Lugar predictivo: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Tipo Avería: Faltante Gravedad: Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Tipo Avería: Faltante Gravedad: - • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 7 – Semestre 2 Año 2006) Variable Parte Modelo predictivo: Modelo 15 Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 14 Modelo 15 Modelo 16 Variable Avería Modelo predictivo: Modelo 16 Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 15 Variable Gravedad Página 183 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo predictivo: Modelo 15 Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 15 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo período. • Parte – Avería – Gravedad con predicción de la Parte (Período 8 – Semestre 1 Año 2007) Variable Tipo de Avería Parte predictiva: Manual Tipo de Avería: Faltante Gravedad: Partes predictivas: Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Variable Gravedad Parte predictiva: Guardabarro delantero derecho Tipo Avería: Faltante Gravedad: Partes predictivas: Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha • Parte – Avería – Gravedad con predicción de la Avería (Período 8 – Semestre 1 Año 2007) Variable Parte Avería predictiva: Faltante Parte: Zócalo derecho Gravedad: Averías predictivas: Faltante Variable Gravedad Avería predictiva: Faltante Parte: Zócalo derecho Página 184 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Gravedad: Averías predictivas: Faltante • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 8 – Semestre 1 Año 2007) Variable Parte Lugar predictivo: Retiro de Puerto Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: - • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 8 – Semestre 1 Año 2007) Variable Parte Modelo predictivo: Modelo 13 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 13 Modelo 14 Modelo 15 Variable Avería Modelo predictivo: Modelo 16 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15 Modelo 16 Página 185 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Variable Gravedad Modelo predictivo: Modelo 15 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: Modelos predictivos: Modelo 13 Modelo 14 Modelo 15 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno período. • Parte – Avería – Gravedad con predicción de la Parte (Período 9 – Semestre 2 Año 2007) Variable Tipo de Avería Parte predictiva: Cubierta delantera derecha Tipo de Avería: Proyección Gravedad: Partes predictivas: Guardabarro delantero derecho Llanta delantera derecha Variable Gravedad Parte predictiva: Cubierta delantera derechacho Tipo Avería: Proyección Gravedad: Partes predictivas: Guardabarro delantero derecho Llanta delantera derecha • Parte – Avería – Gravedad con predicción de la Avería (Período 9 – Semestre 2 Año 2007) Variable Parte Avería predictiva: Faltante Parte: Cubierta delantera derecha Gravedad: Averías predictivas: Faltante Variable Gravedad Avería predictiva: Faltante Parte: Cubierta delantera derecha Gravedad: Averías predictivas: Faltante Página 186 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 9 – Semestre 2 Año 2007) Variable Parte Lugar predictivo: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Tipo Avería: Proyección Gravedad: Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Tipo Avería: Proyección Gravedad: - • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 9 – Semestre 2 Año 2007) Variable Parte Modelo predictivo: Modelo 12 Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: Modelos predictivos: Modelo 12 Variable Avería Modelo predictivo: Modelo 13 Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: Modelos predictivos: Modelo 10 Modelo 11 Modelo 12 Modelo 13 Variable Gravedad Modelo predictivo: Modelo 13 Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: Modelos predictivos: Modelo 13 Página 187 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo período. • Parte – Avería – Gravedad con predicción de la Parte (Período 10 – Semestre 1 Año 2008) Variable Tipo de Avería Parte predictiva: Manual Tipo de Avería: Proyección Gravedad: Partes predictivas: Taza Alfombra suplementarias Manual Variable Gravedad Parte predictiva: Taza Tipo Avería: Proyección Gravedad: Partes predictivas: Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha • Parte – Avería – Gravedad con predicción de la Avería (Período 10 – Semestre 1 Año 2008) Variable Parte Avería predictiva: Faltante Parte: Puerta delantera derecha Gravedad: Averías predictivas: Faltante Abollado Variable Gravedad Avería predictiva: Faltante Parte: Puerta delantera derecha Gravedad: Averías predictivas: Faltante Abollado Página 188 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 10 – Semestre 1 Año 2008) Variable Parte Lugar predictivo: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Tipo Avería: Proyección Gravedad: Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Tipo Avería: Proyección Gravedad: - • Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo (Período 10 – Semestre 1 Año 2008) Variable Parte Modelo predictivo: Modelo 10 Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: Modelos predictivos: Modelo 9 Modelo 10 Variable Avería Modelo predictivo: Modelo 10 Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: Modelos predictivos: Modelo 9 Modelo 10 Variable Gravedad Modelo predictivo: Modelo 10 Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: Modelos predictivos: Modelo 9 Modelo 10 Página 189 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8.4.5. Dificultades encontradas La única dificultad encontrada en el procesamiento de los modelos desarrollados fue que en cuatro de los diez períodos ejecutados se encontraron cuatro eventos que se producían una sola vez en el período respectivo. Por lo tanto en la ejecución del Modelo de Clasificación al contener una sola clasificación para poder correr la aplicación esos registros debían ser eliminados. 8.5. Evaluación Los modelos generados y los resultados obtenidos para cada período han sido satisfactorios. Los modelos de Predicción y Clasificación han tenido un tiempo promedio de proceso de algunos minutos (entre 5 y 10 minutos). En cuanto al modelo de Agrupamiento el tiempo insumido fue de 7 u 8 horas en promedio. Los resultados obtenidos de los diferentes modelos tienen relación entre si y en un primer análisis aproximado se puede deducir que los mismos has sido los esperados especialmente en lo que respecta a cantidades y promedios. La ejecución de los modelos ha generado los datos esperados en función de los objetivos de negocio establecidos previamente para el presente proyecto. Si bien en este primer análisis se puede decir que se han cubierto todas las alternativas para lograr los objetivos de negocio y de minería de datos no se descarta la posibilidad de arribar a nuevas preguntas de negocio o nuevas aproximaciones de resultados. Podemos concluir que los modelos están conectados directamente a los objetivos de negocio y de minería de datos. 8.5.1. Evaluación de los resultados en términos de minería de datos A continuación se desarrolla un resumen de los resultados obtenidos para cada período y para cada modelo de minería de datos. 8.5.1.1. Período 1: Año 2003. Clasificación Averías: 59 % de averías “Abollado”. 22 % de averías “Rayado – Rozado”. 10 % de averías “Pintura saltada”. Lugares: 74 % de averías en “Subida a Buque Puerto de Origen”. Imputación transporte terrestre. 10 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Transferencia Ubicación y Línea de Carga”. Imputación planta de producción. Modelos: 46 % de averías en Modelo 9. 29 % de averías en Modelo 17. 6 % de averías en Modelo 5. Página 190 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 6 % de averías en Modelo 20. 5 % de averías en Modelo 18. 5 % de averías en Modelo 13. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Area - Avería – Gravedad: Puerta delantera derecha, Arrancado - Roto – Fisurado, Intolerable: 99 - 2 % Escape, Abollado, Grave: 779 - 16 %. Alfombra suplementarias, Rayado – Rozado, Grave: 455 - 9 % Parabrisa, Proyección, Mediano: 362 – 7 %. Luz trasera izquierda, Faltante, Mediano: 626 – 13 %. Puerta delantera derecha, Faltante, Leve: 1130 – 23 %. Cubierta delantera izquierda, Rayado – Rozado, Mediano: 138 – 3 %. Panel lateral izquierdo, Abollado, Leve: 1057 - 21 %. Panel lateral derecho, Abollado, Mediano: 354 – 7 %. General: Tapa acceso gancho remolque, Faltante, Mediano. Lugar - Parte – Avería: Ingreso a Puerto, Paragolpe delantero / Superior, Rayado – Rozado: 38 – 1 %. Ingreso a Puerto, Techo corredizo, Faltante: 55 – 1 %. Ingreso a Puerto, Cubierta delantera derecha, Abollado: 111 – 2 %. Transferencia ubicación y línea de carga, Luz de neblina trasera, Exceso kilometraje: 299 – 6 %. Ingreso a Puerto, Luz trasera izquierda, Abollado: 63 – 1 %. Transferencia ubicación y línea de carga, Luz de neblina trasera, Abollado: 76 – 2 %. Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante: 4334 – 87 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Lugar - Parte - Avería – Gravedad: Bajada de Buque, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Mediano: 596 – 12 %. Retiro de Puerto, Cristales de parante delantero, Abollado, Grave: 1007 – 20 %. Ingreso a Puerto, Moldura protectora lateral derecha, Rayado – Rozado, Leve: 488 – 10 %. Subida Buque Puerto de Origen, Cable de carga, Faltante, Mediano: 582 – 12 %. Transferencia ubicación y línea de carga, Insignia, Faltante, Leve: 99 – 2 %. Subida Buque Puerto de Origen, Llave, Abollado, Leve: 2120 – 42 %. Subida Buque Puerto de Origen, Guardabarro delantero izquierdo, Rayado – Rozado, Mediano: 79 – 2 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Mediano. Página 191 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo - Area – Avería: Modelo 4, Moldura protectora lateral derecha, Faltante: 636 – 13 %. Modelo 10, Manual, Abollado: 1267 – 25 %. Modelo 18, Cubierta delantera derecha, Rayado – Rozado: 879 – 18 %. Modelo 10, Giro Delantero (derecho / izquierdo), Rayado – Rozado: 121 – 2 %. Modelo 10, Panel lateral izquierdo, Abollado: 1113 – 22 %. Modelo 9, Cerraduras de puertas, Rayado – Rozado: 295 – 6 %. Modelo 17, Cubierta delantera izquierda, Abollado: 689 – 14 %. General: Modelo 12, Tapa acceso gancho remolque, Faltante. Modelo - Area - Avería – Gravedad: Modelo 5, Giro Delantero (derecho / izquierdo), Faltante, Intolerable: 389 – 8 %. Modelo 15, Puerta trasera derecha, Faltante, Grave: 792 – 16 %. Modelo 18, Paragolpe trasero / Spoiler trasero, Faltante, Mediano: 110 – 2 %. Modelo 16, Bolsa de herramientas, Abollado, Mediano: 231 – 5 %. Modelo 17, Panel lateral derecho, Rayado – Rozado, Mediano: 290 – 6 %. Modelo 9, Manijas externas de puertas traseras, Rayado – Rozado, Mediano: 168 - 3 %. Modelo 11, Luz de neblina trasera, Faltante, Leve: 2945 – 59 %. Modelo 14, Retrovisor externo derecho, Pintura saltada, Mediano: 65 – 1 %. General: Modelo 12, Tapa acceso gancho remolque, Faltante, Mediano. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Puerta delantera derecha Avería: Exceso kilometraje Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Parte: Tapa acceso gancho remolque Avería: Faltante Gravedad: Leve Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Rueda de auxilio Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Tapa acceso gancho remolque Gravedad: Leve Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Rueda de auxilio Avería: Faltante Página 192 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Gravedad: Mediano Con variación de Avería los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Tapa acceso gancho remolque Avería: Exceso kilometraje Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Tapa acceso gancho remolque Avería: Faltante Gravedad: Leve Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 9 Parte: Rueda de auxilio Avería: Faltante Gravedad: Mediano Con variación de Avería los valores predictivos resultan: Modelo: Modelo 11 Parte: Tapa acceso gancho remolque Avería: Exceso kilometraje Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 10 Parte: Tapa acceso gancho remolque Avería: Faltante Gravedad: Leve 8.5.1.2. Período 2: Año 2004 semestre 1. Clasificación Averías: 50 % de averías “Abollado”. 29 % de averías “Rayado – Rozado”. 14 % de averías “Pintura saltada”. 3 % de averías “Faltante” 3 % de averías “Manchado”. Lugares: 83 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 6 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 2 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 47 % de averías en Modelo 17. 32 % de averías en Modelo 9. 10 % de averías en Modelo 13. 6 % de averías en Modelo 20. Página 193 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 4 % de averías en Modelo 18. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Cristales de parante delantero, Faltante, Intolerable: 317 – 6 %. Guardabarro trasero derecho, Faltante, Grave: 756 – 15 %. Cerraduras de puertas, Rayado – Rozado, Mediano: 374 – 7 %. Otros, Abollado, Leve: 1864 – 37 %. Cable de carga, Rayado – Rozado, Leve: 223 – 4 %. Antena, Rayado – Rozado, Mediano: 520 – 10 %. Bolsa de herramientas, Abollado, Mediano: 932 – 19 %. General: Tapa acceso gancho remolque, Faltante, Mediano. Lugar - Parte – Avería: Transferencia ubicación y línea de carga, Puerta delantera izquierda, Rayado – Rozado: 31 – 1 %. Ingreso a Puerto, Techo corredizo, Rayado – Rozado: 97 - 2 %. Ingreso a Puerto, Puerta trasera derecha, Rayado – Rozado: 62 – 1 %. Transferencia ubicación y línea de carga, Otros, Abollado: 167 – 3 %. Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante: 4580 – 92 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Lugar - Parte - Avería – Gravedad: Bajada de Buque, Cristales de parante delantero, Faltante, Intolerable: 259 – 5 Retiro de Puerto, Guardabarro trasero derecho, Faltante, Grave: 627 – 13 %. Bajada de Buque, Panel lateral izquierdo, Faltante, Leve: 1961 – 39 %. Ingreso a Puerto, Tapa posterior de techo, Pintura saltada, Mediano: 82 – 2 %. Bajada de Buque, Llanta delantera derecha, Abollado, Leve: 1642 – 33 % Bajada de Buque, Llanta delantera derecha, Faltante, Grave: 405 – 8 %. %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Mediano. Modelo - Parte – Avería: Modelo 17, Aerosol antipinchazos, Proyección: 1010 – 20 %. Modelo 10, Guardabarro delantero izquierdo, Abollado: 1695 – 34 %. Modelo 17, Puerta delantera derecha, Abollado: 614 – 12 %. Modelo 8, Panel lateral izquierdo, Rayado – Rozado: 243 – 5 %. Modelo 6, Limpiador y lavador de parabrisas, Abollado: 192 – 4 %. Modelo 7, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 131 – 3 %. Modelo 17, Cubierta delantera izquierda, Rayado – Rozado: 382 – 8 %. Modelo 17, Alfombra baúl / caja de carga, Faltante: 713 – 14 %. Página 194 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS General: Modelo 14, Tapa acceso gancho remolque, Faltante. Modelo - Parte - Avería – Gravedad: Modelo 16, Guardabarro trasero derecho, Faltante, Grave: 800 – 16 %. Modelo 8, Cristales de parante delantero, Faltante, Grave: 273 – 5 %. Modelo 10, Barras de techo, Proyección, Mediano: 111 – 2 %. Modelo 13, Puerta delantera izquierda, Faltante, Leve: 2341 – 47 %. Modelo 8, Giro Delantero (derecho / izquierdo), Faltante, Mediano: 350 – 7 %. Modelo 17, Aleron, Faltante, Mediano: 1085 – 22 %. General: Modelo 14, Tapa acceso gancho remolque, Faltante, Mediano. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Escape Avería: Abollado Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Parte: Llave Avería: Abollado Gravedad: Mediano Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Llave Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Avería: Abollado Parte: Llave Gravedad: Mediano Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Baja de Buque Parte: Llave Avería: Abollado Gravedad: Mediano Con variación de Avería los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Llave Avería: Abollado Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Lugar: Bajada de Buque Parte: Llave Avería: Abollado Gravedad: Mediano Página 195 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 11 Parte: Llave Avería: Abollado Gravedad: Mediano Con variación de Avería los valores predictivos resultan: Modelo: Modelo 11 Parte: Llave Avería: Abollado Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 11 Parte: Llave Avería: Abollado Gravedad: Mediano 8.5.1.3. Período 3: Año 2004 semestre 2. Clasificación Averías: 44 % de averías “Abollado”. 34 % de averías “Rayado – Rozado”. 15 % de averías “Pintura saltada”. 5 % de averías “Faltante” Lugares: 76 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 9 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 9 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 4 % de averías en “Subida a Buque”. Imputación puerto. Modelos: 56 % de averías en Modelo 17. 15 % de averías en Modelo 9. 12 % de averías en Modelo 20. 9 % de averías en Modelo 13. 5 % de averías en Modelo 5. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Paragolpe trasero / Zona contacto, Rayado – Rozado, Grave: 58 – 1 %. Alerón, Proyección, Grave: 78 – 2 %. Luz de neblina trasera, Abollado, Grave: 401 – 8 %. Tapa acceso gancho remolque, Faltante: 4432 – 89 %. Página 196 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS General: Tapa acceso gancho remolque, Faltante, Leve. Lugar - Parte – Avería: Ingreso a Puerto, Barras de techo, Pintura saltada: 46 – 1 %. Ingreso a Puerto, Guardabarro trasero derecho, Pintura saltada: 40 – 1 %. Ingreso a Puerto, Luz de neblina trasera, Abollado: 147 – 3 %. Ingreso a Puerto, Luz de patente trasera, Rayado – Rozado: 72 – 1 %. Transferencia ubicación y línea de carga, Retrovisor externo izquierdo, Rayado – Rozado: 36 – 1 %. Ingreso a Puerto, Paragolpe trasero / Zona contacto, Rayado – Rozado: 299 – 6 %. Transferencia ubicación y línea de carga, Bolsa de herramientas, Faltante: 4331- 87 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Lugar - Parte - Avería – Gravedad: Ingreso a Puerto, Alfombra suplementarias, Proyección, Grave: 48 – 1 %. Ingreso a Puerto, Luz de neblina trasera, Faltante, Grave: 54 – 1 %. Subida Buque Puerto de Origen, Giro Delantero (derecho / izquierdo), Faltante, Grave: 448 – 9 %. Ingreso a Puerto, Retrovisor externo derecho, Proyección: 548 – 11 %. Subida Buque Puerto de Origen, Otros, Faltante: 3883 – 78 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Leve. Modelo - Área – Avería: Modelo 17, Llave de rueda, Faltante: 556 – 11 %. Modelo 17, Cubierta delantera izquierda, Faltante: 1084 – 22 %. Modelo 9, Giro Delantero (derecho / izquierdo), Abollado: 1409 – 28 %. Modelo 13, Puerta trasera izquierda, Abollado: 89 – 2 %. Modelo 17, Guardabarro trasero derecho, Abollado: 849 – 17 %. Modelo 18, Limpiador y lavador de parabrisas, Proyección: 712 – 14 %. Modelo 17, Tapa posterior de techo, Faltante: 286 – 6 %. General: Modelo 15, Tapa acceso gancho remolque, Faltante. Modelo - Área - Avería – Gravedad: Modelo - Área - Avería – Gravedad: Modelo 4, Retrovisor externo derecho, Faltante, Grave: 63 – 1 %. Modelo 10, Faro de stop luneta, Abollado, Grave: 128 – 3 %. Modelo 17, Puerta trasera izquierda, Faltante, Grave: 72 – 1 %. Modelo 17, Manual, Faltante, Grave: 259 – 5 %. Modelo 15, Tapa acceso gancho remolque, Faltante: 4432 – 89 %. General: Modelo 15, Tapa acceso gancho remolque, Faltante, Leve. Página 197 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Llanta delantera derecha Avería: Faltante Gravedad: Observada Con variación de Gravedad los valores predictivos resultan: Parte: Puerta trasera derecha Avería: Faltante Gravedad: Observada Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Giro Delantero (derecho / izquierdo) Gravedad: Observada Con variación de Gravedad los valores predictivos resultan: Avería: Abollado Parte: Giro Delantero (derecho / izquierdo) Gravedad: Observada Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Baja de Buque Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada Con variación de Avería los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 14 Parte: Giro Delantero (derecho / izquierdo) Avería: Abollado Gravedad: Observada Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 14 Parte: Giro Delantero (derecho / izquierdo) Página 198 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Avería: Faltante Gravedad: Observada 8.5.1.4. Período 4: Año 2005 semestre 1. Clasificación Averías: 45 % de averías “Rayado – Rozado”. 28 % de averías “Abollado”. 15 % de averías “Pintura saltada”. 7 % de averías “Faltante” Lugares: 47 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 15 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. Modelos: 51 % de averías en Modelo 17. 15 % de averías en Modelo 20. 12 % de averías en Modelo 8. 11 % de averías en Modelo 9. 5 % de averías en Modelo 5. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Capot, Rayado – Rozado, Observada: 77 – 2 %. Panel trasero bajo baúl, Rayado – Rozado, Observada: 134 – 3%. Alerón, Proyección, Observada: 172 – 4 %. Llanta delantera izquierda, Abollado, Observada: 703 – 18 %. Zócalo izquierdo, Manchado, Observada: 31 – 1 %. Zócalo derecho, Faltante: 2779 – 71 %. General: Guardabarro trasero derecho, Faltante. Lugar - Parte – Avería: Ingreso a Puerto, Capot, Rayado – Rozado: 72 – 2 %. Subida Buque Puerto de Origen, Tapa posterior de techo, Rayado – Rozado: 131 – 3 %. Retiro de Puerto, Taza, Faltante: 226 – 6 %. Retiro de Puerto, Llanta delantera izquierda, Faltante: 311 – 8 %. Retiro de Puerto, Puerta trasera derecha, Faltante: 3161 – 81 %. General: Retiro de Puerto, Guardabarro trasero derecho, Faltante. Página 199 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Lugar - Parte - Avería – Gravedad: Bajada de Buque, Capot, Rayado – Rozado, Observada: 64 – 2 %. Ingreso a Puerto, Parabrisa, Faltante, Observada: 43 – 1 %. Bajada de Buque, Luz de neblina trasera, Proyección, Observada: 165 – 4 %. Transferencia ubicación y línea de carga, Cubierta delantera derecha, Faltante: 436 – 11 %. Bajada de Buque, Zócalo derecho, Faltante: 2342, - 60 %. Bajada de Buque, Escape, Faltante, Observada: 855 – 22 %. General: Retiro de Puerto, Guardabarro trasero derecho, Faltante. Modelo - Área – Avería: Modelo 9, Parante delantero, Rayado – Rozado: 42 – 1 %. Modelo 6, Limpiador de Faros (derecho / izquierdo), Proyección: 380 – 10 %. Modelo 8, Llanta delantera izquierda, Abollado: 812 – 21 %. Modelo 18, Panel trasero bajo baúl, Rayado – Rozado: 1250 – 32 %. Modelo 18, Escape, Proyección, 583 – 15 %. Modelo 17, Guardabarro delantero izquierdo, Pintura saltada: 533 – 14 %. Modelo 17, Separador interno de carga, Proyección: 237 – 6 %. Modelo 17, Llanta delantera derecha, Pintura saltada: 65 – 2 %. General: Modelo 15, Guardabarro trasero derecho, Faltante. Modelo - Área - Avería – Gravedad: Modelo 16, Batería, Rayado – Rozado, Observada: 22 – 1 %. Modelo 18, Luz de patente trasera, Proyección, Observada: 146 – 4 %. Modelo 8, Tapa acceso gancho remolque, Abollado, Observada: 382 – 10 %. Modelo 18, Alfombra suplementarias, Faltante, Observada: 518 – 13 %. Modelo 9, Zócalo derecho, Manchado, Observada: 67 – 2 %. Modelo 15, Zócalo derecho, Faltante: 2779 – 71 %. General: Modelo 15, Guardabarro trasero derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Alerón Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Panel lateral derecho Página 200 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Panel lateral derecho Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Giro Panel lateral derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Panel lateral derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Panel lateral derecho Avería: Faltante Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 15 Parte: Panel lateral derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 17 Parte: Panel lateral derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 15 Parte: Panel lateral derecho Avería: Faltante Gravedad: 8.5.1.5. Período 5: Año 2005 semestre 2. Clasificación Averías: 48 % de averías “Rayado – Rozado”. 29 % de averías “Abollado”. 13 % de averías “Pintura saltada”. 6 % de averías “Faltante” Lugares: 32 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. Página 201 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 23 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 20 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 14 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 6 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 47 % de averías en Modelo 17. 16 % de averías en Modelo 8. 12 % de averías en Modelo 9. 10 % de averías en Modelo 5. 7 % de averías en Modelo 20. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Barras de techo, Pintura saltada, Observada: 38 – 1 %. Barras de techo, Rayado – Rozado, Observada: 108 – 3 %. Retrovisor externo izquierdo, Pintura saltada, Observada: 146 – 4 %. Tapa tanque combustible, Rayado – Rozado, Observada: 30 – 1 %. Bolsa de herramientas, Rayado – Rozado, Observada: 81 – 2 %. Guardabarro delantero derecho, Faltante: 3464 – 89 %. General: Guardabarro delantero derecho, Faltante. Lugar - Parte – Avería: Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero Rayado – Rozado: 29 – 1 %. Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado - Rozado 63 – 2 %. Bajada de Buque, Paragolpe delantero / Superior, Rayado – Rozado: 44 – 1 %. Retiro Fábrica de Origen, Paragolpe trasero / Spoiler trasero, Rayado – Rozado: 993 – 26 %. Bajada de Buque, Antena, Proyección: 177 – 5 %. Retiro de Puerto, Cristales de parante delantero, Faltante: 2562 – 66 %. General: Retiro de Puerto, Guardabarro delantero derecho, Faltante. Lugar - Parte - Avería – Gravedad: Ingreso a Puerto, Techo (inclusive convertible), Pintura saltada: 67 – 2 %. Ingreso a Puerto, Otros, Abollado: 177 – 5 %. Ingreso a Puerto, Techo (inclusive convertible), Rayado – Rozado: 142 – 4 %. Ingreso a Puerto, Llanta delantera izquierda, Proyección: 111 – 3 %. Subida Buque Puerto de Origen, Guardabarro delantero derecho, Faltante: 2955 - 76 %. Bajada de Buque, Zócalo derecho, Faltante, Observada: 168 – 4 %. Ingreso a Puerto, Llanta delantera derecha, Proyección, Observada: 249 – 6 %. General: Página 202 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Retiro de Puerto, Guardabarro delantero derecho, Faltante. Modelo - Área – Avería: Modelo 18, Guardabarros y parante trasero izquierdo, Rayado – Rozado: 269 – 7 %. Modelo 17, Faro de stop luneta, Abollado: 669 – 17 %. Modelo 7, Tapa acceso gancho remolque, Abollado: 1290 – 33 %. Modelo 17, Tapa de Baúl o Puerta Trasera, Rayado – Rozado: 1307 – 34 %. Modelo 13, Techo (inclusive convertible), Abollado: 24 – 1 %. Modelo 6, Paragolpe trasero / Zona contacto, Rayado – Rozado: 263 – 7 %. Modelo 9, Paragolpe delantero / Superior, Rayado – Rozado: 59 – 2 %. General: Modelo 13, Guardabarro delantero derecho, Faltante. Modelo - Área - Avería – Gravedad: Modelo 19, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada: 53 – 1 %. Modelo 18, Llave, Abollado, Observada: 123 – 3 %. Modelo 6, Taza, Proyección, Observada: 167 – 4 %. Modelo 8, Guardabarro delantero izquierdo, Abollado, Observada: 50 – 1 %. Modelo 13, Guardabarro delantero derecho, Faltante: 3464 – 89 %. General: Modelo 13, Guardabarro delantero derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Aerosol antipinchazos Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Guardabarro trasero derecho Avería: Faltante Gravedad: Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Zócalo derecho Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Proyección Parte: Zócalo derecho Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Zócalo derecho Avería: Faltante Página 203 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Ingreso a Puerto Parte: Zócalo derecho Avería: Faltante Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 14 Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 13 Parte: Zócalo derecho Avería: Faltante Gravedad: 8.5.1.6. Período 6: Año 2006 semestre 1. Clasificación Averías: 45 % de averías “Abollado”. 40 % de averías “Rayado – Rozado”. 7 % de averías “Pintura saltada”. 7 % de averías “Faltante” Lugares: 42 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 17 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 40 % de averías en Modelo 17. 21 % de averías en Modelo 9. 14 % de averías en Modelo 5. 12 % de averías en Modelo 20. Página 204 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8 % de averías en Modelo 8. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Capot, Rayado – Rozado, Observada: 24 – 1 %. Panel trasero bajo baúl, Rayado – Rozado, Observada: 37 – 1 %. Manijas externas de puertas delanteras, Faltante, Observada: 40 – 1 %. Luz de neblina trasera, Abollado, Observada: 340 – 9 %. Zócalo derecho, Faltante: 3301 – 88 %. General: Zócalo derecho, Faltante. Lugar - Parte – Avería: Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado: 42 – 1 %. Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado: 27 – 1 %. Ingreso a Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado: 74 – 2 %. Ingreso a Puerto, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 114 – 3 %. Ingreso a Puerto, Tapa acceso gancho remolque, Faltante: 470 – 12 %. Transferencia ubicación y línea de carga, Llave, Abollado: 53 – 1 %. Subida Buque Puerto de Origen, Guardabarro trasero derecho, Faltante: 2983- 79 %. General: Retiro de Puerto, Zócalo derecho, Faltante. Lugar - Parte - Avería – Gravedad: Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada: 7 – 1 %. Retiro de Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 1 – 4 %. Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada: 9 – 5 %. Ingreso a Puerto, Tapa posterior de techo, Rayado – Rozado, Observada: 35 – 6 %. Bajada de Buque, Moldura protectora lateral derecha, Faltante, Observada: 103 – 7 %. Transferencia ubicación y línea de carga, Puerta trasera izquierda, Abollado, Observada: 33 – 8 %. Bajada de Buque, Tapa acceso gancho remolque, Abollado, Observada: 274 – 9 %. Bajada de Buque, Zócalo derecho, Faltante: 3301 – 10 %. General: Retiro de Puerto, Zócalo derecho, Faltante. Modelo - Área – Avería: Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado: 124 – 3 %. Modelo 17, Panel trasero bajo baúl, Rayado – Rozado: 901 – 24 %. Modelo 7, Escape, Faltante: 1695 – 45 %. Modelo 17, Otros, Rayado – Rozado: 110 – 3 %. Modelo 18, Giro Delantero (derecho / izquierdo), Abollado: 577 – 15 %. Página 205 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 16, Guardabarros y parante trasero izquierdo, Abollado: 318 – 8 %. Modelo 13, Barras de techo, Abollado: 38 – 1 %. General: Modelo 13, Zócalo derecho, Faltante. Modelo - Área - Avería – Gravedad: Modelo 20, Spoiler delantero, Rayado – Rozado, Observada: 20 – 1 %. Modelo 19, Paragolpe trasero / Spoiler trasero, Proyección, Observada: 45 – 1 %. Modelo 19, Bolsa de herramientas, Proyección, Observada: 57 – 2 %. Modelo 7, Bolsa de herramientas, Faltante, Observada: 260 – 7 %. Modelo 16, Parrilla delantera, Pintura saltada, Observada: 74 – 2 %. Modelo 13, Zócalo derecho, Faltante: 3301 – 88 %. General: Modelo 13, Zócalo derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Panel trasero bajo baúl Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Puerta delantera derecha Avería: Faltante Gravedad: Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Cubierta delantera derecha Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Cubierta delantera derecha Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Página 206 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 11 Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 14 Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 12 Parte: Cubierta delantera derecha Avería: Faltante Gravedad: 8.5.1.7. Período 7: Año 2006 semestre 2. Clasificación Averías: 47 % de averías “Rayado – Rozado”. 30 % de averías “Abollado”. 14 % de averías “Faltante”. 5 % de averías “Pintura saltada” Lugares: 40 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 21% de averías en “Bajada de Buque”. Imputación transporte marítimo. 16 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 10 % de averías en “Subida a Buque”. Imputación puerto. 6 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. Modelos: 50 % de averías en Modelo 20. 22 % de averías en Modelo 5. 10 % de averías en Modelo 10. 7 % de averías en Modelo 9. 4 % de averías en Modelo 13. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Página 207 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Bolsa de herramientas, Arrancado - Roto – Fisurado, Observada: 15 – 1 %. Luz de neblina trasera, Abollado, Observada: 94 – 4 %. Faro de stop luneta, Rayado – Rozado, Observada: 94 – 4 %. Tapa posterior de techo, Proyección, Observada: 128 – 5 %. Alfombra suplementarias, Abollado, Observada: 22 - 1 %. Guardabarro delantero derecho, Faltante: 2271 – 86 %. General: Guardabarro delantero derecho, Faltante. Lugar - Parte – Avería: Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado: 41 – 2 %. Bajada de Buque, Manijas externas de puertas traseras, Proyección: 326 – 12 %. Ingreso a Puerto, Parabrisa, Proyección: 865 – 33 %. Bajada de Buque, Guardabarro delantero izquierdo, Abollado: 473 – 18 %. Ingreso a Puerto, Faro de stop luneta, Abollado: 483 – 18 %. Ingreso a Puerto, Llave, Rayado – Rozado: 429 – 16 %. General: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Lugar - Parte - Avería – Gravedad: Bajada de Buque, Panel trasero bajo baúl, Rayado – Rozado, Observada: 14 – 1 %. Bajada de Buque, Alfombra suplementarias, Proyección, Observada: 21 – 1 %. Bajada de Buque, Parrilla delantera, Abollado, Observada: 67 – 3 %. Ingreso a Puerto, Guardabarro delantero derecho, Faltante, Observada: 250 – 10 %. Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante: 2271 – 86 %. General: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Modelo - Área – Avería: Modelo 20, Parrilla delantera, Rayado – Rozado: 252 – 10 %. Modelo 19, Retrovisor externo izquierdo, Abollado: 553 – 21 %. Modelo 6, Puerta delantera derecha, Faltante: 868 – 33 %. Modelo 11, Barras de techo, Proyección: 91 – 3 %. Modelo 20, Barras de techo, Proyección: 714 – 27 %. Modelo 18, Retrovisor externo derecho, Reventado – Estallado: 114 – 4 %. Modelo 13, Llanta delantera derecha, Abollado: 32 – 1 %. General: Modelo 15, Guardabarro delantero derecho, Faltante. Modelo - Área - Avería – Gravedad: Modelo 5, Zócalo izquierdo, Rayado – Rozado, Observada: 22 – 1 %. Modelo 7, Zócalo izquierdo, Abollado, Observada: 42 – 2 %. Modelo 6, Manijas externas de puertas traseras, Proyección, Observada: 42 – 2 %. Modelo 8, Retrovisor externo derecho, Pintura saltada, Observada: 20 – 1 %. Modelo 19, Retrovisor externo derecho, Faltante, Observada: 224 – 9 %. Página 208 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 15, Guardabarro delantero derecho, Faltante: 2271 – 86 %. General: Modelo 15, Guardabarro delantero derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Manijas externas de puertas traseras Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Faltante Gravedad: Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Guardabarro delantero derecho Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Guardabarro delantero derecho Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 15 Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Guardabarro delantero derecho Página 209 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 15 Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: 8.5.1.8. Período 8: Año 2007 semestre 1. Clasificación Averías: 43 % de averías “Rayado – Rozado”. 25 % de averías “Abollado”. 20 % de averías “Faltante”. 8 % de averías “Pintura saltada” Lugares: 48 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 19 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 17 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 7 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 47 % de averías en Modelo 20. 24 % de averías en Modelo 5. 9 % de averías en Modelo 13. 7 % de averías en Modelo 9. 4 % de averías en Modelo 17. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 64 – 2 %. Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada: 68 – 2 %. Tapa posterior de techo, Abollado, Observada: 76 – 3 %. Luz de neblina trasera, Faltante, Observada: 437 – 14 %. Zócalo derecho, Faltante: 2377 – 78 %. General: Zócalo derecho, Faltante. Lugar - Parte – Avería: Ingreso a Puerto, Puerta trasera izquierda, Proyección: 599 – 20 %. Página 210 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Transferencia ubicación y línea de carga, Guardabarro trasero derecho, Pintura saltada: 288 – 10 %. Bajada de Buque, Moldura protectora lateral derecha, Faltante: 910 – 30 %. Transferencia ubicación y línea de carga, Techo (inclusive convertible), Rayado – Rozado: 510 – 17 %. Transferencia ubicación y línea de carga, Manual, Faltante: 722 – 24 %. General: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Lugar - Parte - Avería – Gravedad: Ingreso a Puerto, Zócalo izquierdo, Abollado, Observada: 57 – 2 %. Transferencia ubicación y línea de carga, Puerta trasera izquierda, Rayado – Rozado, Observada: 68 – 2 %. Transferencia ubicación y línea de carga, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada: 160 – 5 %. Subida Buque Puerto de Origen, Panel lateral derecho, Abollado, Observada: 349 – 12 %. Transferencia ubicación y línea de carga, Zócalo derecho, Faltante: 2377 - 78 %. General: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Modelo - Área – Avería: Modelo 5, Capot, Rayado – Rozado: 105 – 3 %. Modelo 5, Manijas externas de puertas traseras, Proyección: 316 – 10 %. Modelo 7, Parrilla delantera, Faltante: 730 – 24 %. Modelo 19, Zócalo izquierdo, Abollado: 455 – 15 %. Modelo 13, Guardabarro delantero izquierdo, Abollado: 206 – 7 %. Modelo 20, Limpiador y lavador de parabrisas, Proyección: 1110 – 37 %. Modelo 14, Techo corredizo, Faltante: 90 – 3 %. General: Modelo 14, Zócalo derecho, Faltante. Modelo - Área - Avería – Gravedad: Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 20 – 4 %. Modelo 20, Tapa de Baúl o Puerta Trasera, Rayado – Rozado, Observada: 45 – 10 %. Modelo 17, Manijas externas de puertas traseras, Proyección, Observada: 57 – 12 %. Modelo 20, Cubierta delantera izquierda, Rayado – Rozado, Observada: 260 – 56 %. Modelo 11, Panel lateral derecho, Faltante, Observada: 5 – 1 %. Modelo 14, Zócalo derecho, Faltante: 74 – 16 %. General: Modelo 14, Zócalo derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Página 211 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Parte: Manual Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Zócalo derecho Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Zócalo derecho Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Zócalo derecho Avería: Faltante Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 13 Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Zócalo derecho Avería: Faltante Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 15 Parte: Zócalo derecho Avería: Faltante Gravedad: - Página 212 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8.5.1.9. Período 9: Año 2007 semestre 2. Clasificación Averías: 66 % de averías “Rayado – Rozado”. 14 % de averías “Abollado”. 9 % de averías “Faltante”. 8 % de averías “Pintura saltada” Lugares: 63 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 16 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 7 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 4 % de averías en “Bajada de Buque”. Imputación transporte marítimo. Modelos: 54 % de averías en Modelo 20. 24 % de averías en Modelo 7. 12 % de averías en Modelo 5. 5 % de averías en Modelo 13. 2 % de averías en Modelo 9. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Llanta trasera izquierda, Rayado – Rozado, Observada: 67 – 1 %. Cubierta trasera derecha, Rayado – Rozado, Observada: 76 – 2 %. Guardabarros y parante trasero izquierdo, Rayado – Rozado, Observada: 176 – 4 Panel lateral derecho, Faltante, Observada: 438 – 9 %. Techo corredizo, Proyección, Observada: 275 – 6 %. Limpiador y lavador de parabrisas, Proyección: 3966 – 79 %. %. General: Taza, Proyección. Lugar - Parte – Avería: Bajada de Buque, Capot, Rayado – Rozado: 27 – 1 %. Bajada de Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 30 – 1 %. Bajada de Buque, Barras de techo, Abollado: 147 – 3 %. Bajada de Buque, Tapa acceso gancho remolque, Abollado: 520 – 10 %. Ingreso a Puerto, Manijas externas de puertas delanteras, Proyección: 3082 – 62 %. Transferencia ubicación y línea de carga, Faro de stop luneta, Rayado – Rozado: 1169- 23 %. General: Transferencia ubicación y línea de carga, Taza, Proyección. Página 213 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Lugar - Parte - Avería – Gravedad: Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado, Observada: 72 – 1 %. Ingreso a Puerto, Tapizado interno puerta delantera izquierda, Proyección, Observada: 239 – 5 %. Transferencia ubicación y línea de carga, Tapa tanque combustible, Rayado – Rozado, Observada: 233 – 5 %. Ingreso a Puerto, Escape, Rayado – Rozado, Observada: 51 – 1 %. Transferencia ubicación y línea de carga, Zócalo derecho, Rayado – Rozado, Observada: 100 – 2 %. Subida Buque Puerto de Origen, Puerta delantera izquierda, Abollado, Observada: 62 – 1 %. Subida Buque Puerto de Origen, Limpiador y lavador de parabrisas, Abollado, Observada: 266 – 5 %. Transferencia ubicación y línea de carga, Limpiador y lavador de parabrisas, Proyección: 3966 – 79 %. General: Transferencia ubicación y línea de carga, Taza, Proyección. Modelo - Área – Avería: Modelo 7, Cable de carga, Rayado – Rozado: 356 – 7 %. Modelo 6, Tapizado interno puerta delantera izquierda, Rayado – Rozado: 782 – 16 % Modelo 7, Guardabarro trasero derecho, Pintura saltada: 704 – 14 %. Modelo 14, Luz de neblina trasera, Abollado: 112 – 2 %. Modelo 20, Limpiador y lavador de parabrisas, Proyección: 2716 – 54 %. Modelo 13, Faro de stop luneta, Faltante: 27 – 1 %. Modelo 13, Guardabarro trasero derecho, Abollado: 144 – 3 %. Modelo 13, Techo (inclusive convertible), Abollado: 144 – 3 %. General: Modelo 14, Taza, Proyección. Modelo - Área - Avería – Gravedad: Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada: 65 – 1 %. Modelo 20, Alfombra baúl / caja de carga, Rayado – Rozado, Observada: 165 - 3 %. Modelo 8, Alfombra suplementarias, Proyección, Observada: 450 – 9 %. Modelo 16, Llanta delantera derecha, Faltante, Observada: 354 – 7 %. Modelo 7, Llanta delantera derecha, Faltante: 1598 – 32 %. Modelo 20, Transponder, Proyección: 2346 – 47 %. General: Modelo 14, Taza, Proyección. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Proyección Página 214 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Proyección Gravedad: Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Cubierta delantera derecha Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Cubierta delantera derecha Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Avería: Proyección Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Avería: Proyección Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Avería: Proyección Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 12 Parte: Cubierta delantera derecha Avería: Proyección Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 13 Parte: Cubierta delantera derecha Avería: Proyección Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 13 Parte: Cubierta delantera derecha Avería: Proyección Gravedad: - Página 215 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8.5.1.10. Período 10: Año 2008 semestre 1. Clasificación Averías: 41 % de averías “Rayado – Rozado”. 32 % de averías “Faltante”. 14 % de averías “Abollado”. 6 % de averías “Pintura saltada” Lugares: 56 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 17 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 11 % de averías en “Subida a Buque”. Imputación puerto. 8 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. Modelos: 48 % de averías en Modelo 20. 34 % de averías en Modelo 7. 8 % de averías en Modelo 5. 3 % de averías en Modelo 13. 3 % de averías en Modelo 9. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 75 – 2 %. Paragolpe trasero / Spoiler trasero, Proyección, Observada: 145 – 3 %. Moldura protctora lateral izquierda, Rayado – Rozado, Observada: 828 - 17 %. Retrovisor externo derecho, Faltante: 3932 - 79 %. General: Zócalo derecho, Faltante. Lugar - Parte – Avería: Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado: 176 – 4 %. Transferencia ubicación y línea de carga, Tapa posterior de techo, Rayado – Rozado: 717 – 14 %. Bajada de Buque, Panel lateral derecho, Faltante: 834 – 17 %. Transferencia ubicación y línea de carga, Manijas externas de puertas traseras, Reventado – Estallado: 204 – 4 %. Transferencia ubicación y línea de carga, Giro Delantero (derecho / izquierdo), Faltante: 3031 – 61 %. Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado: 38 – 1 %. Página 216 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS General: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante. Lugar - Parte - Avería – Gravedad: Ingreso a Puerto, Giro Delantero (derecho / izquierdo), Pintura saltada, Observada: 44 – 1 %. Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada: 255 – 5 %. Bajada de Buque, Moldura protectora lateral derecha, Abollado, Observada: 116 – 2 %. Transferencia ubicación y línea de carga, Llanta delantera izquierda, Rayado – Rozado, Observada: 402 – 8 %. Ingreso a Puerto, Encendedor, Manchado, Observada: 235 – 5 %. Transferencia ubicación y línea de carga, Retrovisor externo derecho, Faltante: 3932 – 79 %. General: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante. Modelo - Área – Avería: Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado: 181 - 4 %. Modelo 20, Manijas externas de puertas delanteras, Proyección: 290 - 6 %. Modelo 13, Techo corredizo Pintura saltada, 186 - 4 %. Modelo 8, Capot, Faltante: 35 - 1 %. Modelo 10, Cristales de parante delantero, Reventado – Estallado: 60 - 1 %. Modelo 19, Puerta trasera derecha, Faltante: 2040 - 41 %. Modelo 7, Panel lateral derecho, Proyección: 2199 - 44 %. General: Modelo 13, Zócalo derecho, Faltante. Modelo - Área - Avería – Gravedad: Modelo 20, Guardabarro delantero izquierdo, Rayado – Rozado, Observada: 102 - 2 %. Modelo 7, Conjunto carrocería, Manchado, Observada: 163 - 3 %. Modelo 7, Giro Delantero (derecho / izquierdo), Rayado – Rozado, Observada: 560 - 11 %. Modelo 16, Limpiador y lavador de parabrisas, Faltante, Observada: 202 - 4 %. Modelo 14, Retrovisor externo derecho, Faltante: 3932 - 79 %. General: Modelo 13, Zócalo derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Manual Avería: Proyección Gravedad: Con variación de Gravedad los valores predictivos resultan: Parte: Taza Avería: Proyección Gravedad: Página 217 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Puerta delantera derecha Gravedad: Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Puerta delantera derecha Gravedad: Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Avería: Proyección Gravedad: Con variación de Avería los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Avería: Proyección Gravedad: Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Avería: Proyección Gravedad: Modelos: Con variación de Parte los valores predictivos resultan: Modelo: Modelo 10 Parte: Puerta delantera derecha Avería: Proyección Gravedad: Con variación de Avería los valores predictivos resultan: Modelo: Modelo 10 Parte: Puerta delantera derecha Avería: Proyección Gravedad: Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 10 Parte: Puerta delantera derecha Avería: Proyección Gravedad: 8.5.2. Evaluación de los resultados en términos de objetivos de negocio. En este ítems se van a describir los resultados obtenidos de la explotación de datos en función de los objetivos de negocio propuesto para el presente estudio. Cada período analizado contiene como resultado información detallada sobre daños, tipo de daños, lugares, transportes y modelos de autos, los cuales se encuentran relacionados entre si y permiten ver un comportamiento que se va a tratar de describir claramente. Página 218 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Existen objetivos de negocios específicamente vinculados con resultados estadísticos como cantidades, cantidades totales, porcentajes, máximos, mínimos, etc. los cuales fueron explicitados en los puntos desarrollados por el proyecto en la parte de exploración de datos, evaluación de resultados y resumen de los resultados obtenidos. Ahora se va a tratar de describir los comportamientos y conductas de los datos explotados para de esta forma concluir con la evaluación final de la minería de datos desarrollada. 8.5.2.1. Tipos de averías. Los Tipos de Averías predominantes a lo largo de los períodos analizados son abollados, rayados o rozados, pinturas saltadas y faltantes. Entre estos 4 Tipos de Averías se encuentra más del 90 % de los siniestros en cada período. El período 1 y 2 se caracteriza en primer lugar por el Tipo de Avería abollado con 59 y 50 % respectivamente, luego el rayado o rozado con 22 y 29 % respectivamente y luego el pintura saltada con el 10 % y 14 % respectivamente. En el segundo período aparece la avería faltante con el 3 % de ocurrencia. Y finalmente en el período 2 aparece por única vez a un nivel aceptable de ocurrencia para ser mencionado el Tipo de Avería manchado con un 3 %. Luego analizando el período 3 se puede ver que los niveles de ocurrencia de las averías cambia teniendo en primer lugar los abollados con 44 %, luego el 34 % para rayados o rozados, en tercer lugar el 15 % de averías son pintura saltada y finalmente el 5 % de tipo de averías son faltantes. El cuarto y quinto período contienen exactamente los mismos tipos de averías con un leve cambio en la distribución de los porcentajes de ocurrencia. Esto es, en primer lugar el Tipo de Avería rayado o rozado con 45 y 48 % para cada período respectivamente, luego aparecen los abollados con 28 y 29 % respectivamente, en tercer lugar se encuentra el Tipo de Avería pintura saltada con el 15 y 13 % respectivamente, y para terminar, en ambos períodos aparece la ocurrencia de los faltantes con el 7 y el 6 % respectivamente. El período 6 presenta en la ocurrencia de los Tipos de Averías la misma distribución en cuanto a porcentajes del período 3. O sea que en primer lugar se ve un 45 % de averías abollado, luego un 40 % de Tipos de Averías rayado o rozado, en tercer lugar pintura saltada con un 7 % y finalmente otro 7 % para los faltantes. Los períodos 7, 8 y 9 presentan la ocurrencia exactamente de los mismos tipos de averías. Los porcentajes se distribuyen de la siguiente forma: en primer lugar rayado o rozado con el 47, 43 y 66 % respectivamente, luego en segundo lugar los abollados con el 30, 25 y 14 % respectivamente, en tercer lugar aparecen los faltantes con el 14, 20 y 9 % respectivamente, y finalmente se observan los tipos de averías de pintura saltada con el 5 % para el período 7 y el 8 % para los períodos 8 y 9. Para concluir con el análisis de los resultados de los Tipos de Averías ocurridos de éste punto se puede ver que en el período 10 con un particular cambio en la posición de los porcentajes de ocurrencia en el segundo lugar aparecen los faltantes con un 32 %. En primer lugar tenemos el rayado – rozado con el 41 %. Y en el tercer y cuarto lugar se encuentran los abollados y pintura saltada con el 14 y 6 % respectivamente. Página 219 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8.5.2.2. Lugares. Para los 6 primeros períodos del presente estudio los lugares predominantes donde ocurrieron las averías son a la Subida de Buque en Puerto de Origen con el 74, 83, 76, 47, 32 y 42 respectivamente. Los motivos por los cuales se produjo el cambio son fundamentalmente por la decisión política de la empresa vinculada a la implementación de mayores controles debido al alto porcentaje de siniestralidad. Ese motivo no es incumbencia del presente estudio por lo cual solo es mencionado sin realizar el estudio y/o análisis del cambio ejecutado por la compañía. Los tres primeros períodos se caracterizan en segundo lugar por la ocurrencia de las averías en las operaciones de Bajada de Buque con el 10, el 6 y el 9 % respectivamente. Los siguientes tres períodos el segundo lugar de ocurrencia es Retiro Fábrica de Origen 15, 23 y 17 % respectivamente. Para el tercer lugar en la ocurrencia de averías se haya el mismo comportamiento que para el segundo lugar para los 6 primeros períodos. Esto es, los tres primeros períodos tienen como tercer lugar de ocurrencia de averías el Ingreso a Puerto con el 5, el 6 y el 9 % respectivamente. Luego en los siguientes tres períodos cambia por Bajada de Buque con 15, 20 y 15 % respectivamente. Para concluir con el análisis de los 6 primeros períodos se ve que en el cuarto lugar para el período 1, 2 y 3 se encuentran los lugares de Transferencia Ubicación y Línea de Carga (5 %), Retiro de Puerto (2 %) y Subida a Buque (4 %). Luego para los períodos 4, 5 y 6 se encuentra en cuarto lugar la ocurrencia de averías en Ingreso a Puerto con el 13, 14 y 13 % de ocurrencia respectivamente. Para los períodos 7, 8, 9 y 10 se produce un cambio en los porcentajes de ocurrencia de mayor a menor nivel de averías. En el período 7 el mayor nivel de ocurrencia se ve en el Ingreso a Puerto con el 40 %. Luego se reduce a un 21 % en la Bajada de Buque. En tercer lugar en el período 7 se encuentra la Transferencia Ubicación y Línea de Carga y finalmente con un porcentaje mínimo del 10 % y 6 % se encuentran la Subida a Buque y Subida a Buque Puerto de Origen respectivamente. Básicamente estos dos últimos lugares son similares operativamente pero se diferencian específicamente por el lugar físico. Esta similitud será evaluada en los puntos siguientes donde se analiza la imputabilidad de las averías en función de los tipos de transportes. El período 8 y 9 coinciden en cuatro lugares con el mismo nivel de ocurrencia en porcentajes. En primer término el lugar Transferencia Ubicación y Línea de Carga con el 48 y el 63 % respectivamente. Luego en el segundo puesto el lugar Ingreso a Puerto con el 19 y 16 % respectivamente. En tercer lugar las ocurrencias se producen en la Bajada de Buque con el 7 % en ambos períodos. Para concluir el análisis de estos dos períodos se ve que en el período hay un pequeño porcentaje (5 %) correspondiente al lugar Retiro de Puerto. Para terminar con el análisis de los lugares donde se producen las averías se ve que en el período 10 el 56 % de ocurrencia de averías se produce en el lugar Transferencia Ubicación y Línea de Carga, luego el segundo lugar donde se producen las averías con mayor frecuencia en es Ingreso a Puerto con el 17 %. En tercer lugar se observa que la Subida a Buque tiene el 11 % de ocurrencia de averías. Finalmente los lugares Subida a Buque Puerto de Origen y Bajada de Buque son los de menor ocurrencia con el 8 y el 6 % respectivamente. 8.5.2.3. Modelos. Como particular comportamiento se puede ver que en 9 de los 10 períodos analizados un 50 % ± 6 % de los datos explotados giran en torno a un solo modelo. Página 220 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El primer período tiene al Modelo 9 (46 %) como de mayor ocurrencia de averías, seguido por el Modelo 17 con el 29 %. En tercer lugar se encuentra el Modelo 5 y 20 con el 6 %, y finalmente con el 5 % se ve la ocurrencia de averías sobre el Modelo 18 y 13. Los períodos 2 y 3 tienen en primera instancia con mayor nivel de ocurrencia de averías al Modelo 17 (47 y 56 % respectivamente) y luego al Modelo 9 (32 y 15 % respectivamente). Luego en el período 2 sigue el Modelo 13 con el 10 %, en cuarto lugar el Modelo 20 con el 6 % y finalmente el Modelo 18 con el 4 %. Para el período 3 se ve que en el tercer lugar se encuentra el Modelo 20 con el 12 %, luego el Modelo 13 con el 9 % y finalmente el Modelo 5 con el 5 % de ocurrencia de averías. En los períodos 4, 5 y 6 el Modelo con mayor cantidad de ocurrencia de averías es el 17 (51, 47 y 40 % respectivamente). Luego en el período 4 se ve el Modelo 20 con el 15 %, en tercer lugar el Modelo 8 con el 12 % y en cuarto y quinto lugar los Modelos 9 y 5 con el 11 y el 5 % respectivamente. El período 5 tiene en segundo lugar de ocurrencia de averías al Modelo 8 con el 16 %, luego el Modelo 9 con el 12 %, y finalmente el Modelo 5 y 20 con el 10 y el 5 % respectivamente. El período 6 tiene en segundo lugar al Modelo 9 con el 21 %, luego en tercer lugar el Modelo 5 con el 14 %, en cuarto lugar el Modelo 20 con el 12 % y finalmente el Modelo 8 con el 8 %. Los períodos 7 y 8 se caracterizan por la mayor ocurrencia de averías en los Modelos 20 (50 y 47 % respectivamente) y 5 (22 y 24 % respectivamente) en primer y segundo lugar respectivamente. En el período 7 se ve en tercer lugar al Modelo 10 con el 10 % de ocurrencia de averías y luego los Modelos 9 y 13 con el 7 y 4 % respectivamente. En el período 8 se encuentra en el tercer lugar de ocurrencia de averías el Modelo 13 con el 9 % y luego los Modelos 9 y 17 con el 7 y el 4 % respectivamente. Finalmente analizados los datos del período 9 y 10 considerando la ocurrencia de averías en los Modelos se puede ver que tienen la misma ubicación en porcentajes de ocurrencia. El Modelo 20 es el de mayor ocurrencia con el 54 % para el período 9 y el 48 % para el período 10. En segundo lugar en ambos períodos se encuentra el Modelo 7 con el 24 y el 34 % respectivamente para cada período. Luego en tercer lugar se encuentra el Modelo número 5 con el 12 y el 8 % respectivamente para cada período. El Modelo 13 ocupa el cuarto lugar de ocurrencia de averías con el 5 y 3 % respectivamente. Para terminar se menciona con el menor porcentaje de ocurrencia el Modelo 9 con el 2 y el 3 % de nivel de ocurrencia para los períodos 9 y 10 respectivamente. 8.5.2.4. Partes, Averías y Gravedad. La estructura de las averías estudiadas en el presente proyecto es Parte + Avería + Gravedad. En este punto se evalúan los resultados de la explotación de datos combinando los tres parámetros en cada uno de los períodos. Para el primer período se puede ver que la media general es: Tapa acceso gancho remolque, Faltante, Mediano. Es un tipo de daño válido y está relacionada con el robo de esa parte. Los centroides que pueden representar un tipo de ocurrencia de avería mínimo son: Luz trasera izquierda, Faltante, Mediano (13 %). Cubierta delantera izquierda, Rayado – Rozado, Mediano (3 %). En ambos casos su ocurrencia es poco probable y los porcentajes arrojados por la explotación de datos no tienen relación con la realidad. Página 221 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Finalmente para el primer período se observan los centroides compuesto por: Panel lateral izquierdo, Abollado, Leve (21 %) Panel lateral derecho, Abollado, Mediano (7 %) Se puede concluir para este período que hay un comportamiento particular debido a que la media global de daño no se corresponde con ninguno de los centroides formados. Posiblemente el resultado se debe al hecho que el número que caracteriza al Tipo de Avería Faltante (7) se encuentra entre los dos Tipos de Avería de mayor ocurrencia en el período (Abollado 6 y Rozado – Rayado 9). El período dos está caracterizado por la media global igual al periodo anterior: Tapa acceso gancho remolque, Faltante, Mediano. Al igual que en el periodo anterior se puede ver que la media global no tiene relación con los datos generados por los centroides que participan con resultado válido. El centroide compuesto por: Cristales de parante delantero, Faltante, Intolerable (6 %). Tiene poco grado de ocurrencia en la realidad, pero puede llegar a tener aparición entre los siniestros. En cuanto al centroide real representativo de este periodo se encuentra: Otros, Abollado, Leve (37 %). Este tipo de daños está vinculado directamente a la posibilidad de encontrar abolladuras en diferentes partes de las unidades. Como conclusión de este periodo también se puede decir que el hecho de no haber relación entre la media global y los resultados posibles obtenidos se debe a una cuestión específicamente matemática. Siguiendo con los centroides del periodos 3 se puede ver que la media global continúa siendo: Tapa acceso gancho remolque, Faltante, Leve. Pero la característica distintiva de la media para este período es que su gravedad es leve y no mediana como en los dos períodos anteriores. Este periodo se caracteriza por estos dos tipos de daños: Paragolpe trasero / Zona contacto, Rayado – Rozado, Grave (1 %). Tapa acceso gancho remolque, Faltante (89 %). Aquí si se puede ver la relación directa entre la avería con nivel porcentual más alto ocurrido en el período y la media global. Sin embargo no hay correspondencia entre el tipo de avería con mayor cantidad de ocurrencia y el tipo de avería que compone el daño que caracteriza al centroide de mayor porcentaje. El periodo cuatro contiene como media global: Guardabarro trasero derecho, Faltante. Al evaluar la ocurrencia de este evento en la base de datos se puede ver que no tiene posibilidad real de combinación. Posiblemente su aparición en la media es solo a los efectos de cálculos matemáticos. Analizando el centroide: Zócalo izquierdo, Manchado, Observada (1 %). Se puede concluir que el porcentaje de ocurrencia en la realidad es mínimo como está representado por el porcentaje de la explotación de los datos. En cuanto a los centroides que caracterizan a este periodo: Capot, Rayado – Rozado, Observada (2 %). Panel trasero bajo baúl, Rayado – Rozado, Observada (3%). Llanta delantera izquierda, Abollado, Observada (18 %). Página 222 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Se puede ver que las mismas son solo averías del tipo leve debido a que las mismas solo aparecen como observaciones. En el quinto periodo el daño con media global es: Guardabarro delantero derecho, Faltante. Este daño coincide con el daño de centroide de mayor ocurrencia de este periodo pero el mismo no aparece en la base de datos estudiada. Al igual que en los casos anteriores posiblemente su aparición solo se debe a cuestiones de cálculo matemático. Y para reforzar la conclusión también se debe mencionar que la mayor cantidad de tipos de avería para este periodo no es el Faltante sino el Abollado. En cuanto a los centroides que aparecen con posibilidad de ocurrencia baja en la realidad se encuentra: Barras de techo, Rayado – Rozado, Observada (3 %). El 3 % indica cantidad de ocurrencia numerosa en relación a la cantidad verificada sobre la base de datos. Los centroides que caracterizan este periodo son: Retrovisor externo izquierdo, Pintura saltada, Observada (4 %). Tapa tanque combustible, Rayado – Rozado, Observada (– 1 %). Si bien no representan un porcentaje importante de ocurrencia son los únicos cuyo resultado en la verificación de datos tienen ocurrencia válida. Como en el periodo 5, en el periodo 6 la media global de daño ocurrido no encuentra validez cruzando los datos de la base de datos explotada: Zócalo derecho, Faltante. Este daño no tiene posibilidad de ocurrencia real. En cuanto a los centroides que caracterizan al periodo: Capot, Rayado – Rozado, Observada (1 %). Panel trasero bajo baúl, Rayado – Rozado, Observada (1 %). Estos dos centroides representan un porcentaje mínimo de ocurrencia en función de la cantidad de datos introducidos en el modelo. En el periodo 7 tampoco se encuentra correspondencia entre la media global y los datos explotados: Guardabarro delantero derecho, Faltante. En cuanto al centroide que caracteriza este periodo se ve: Bolsa de herramientas, Arrancado - Roto – Fisurado, Observada (1 %). El porcentaje de ocurrencia es mínimo. El periodo 8 tiene como media global: Zócalo derecho, Faltante. Y al igual que en el periodo anterior este centroide no represente ocurrencia real en la base datos. En cuanto a los centroides representativo de este periodo: Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (2 %). Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada (2 %). Luz de neblina trasera, Faltante, Observada (14 %). El periodo 9 tiene como media global: Taza, Proyección. El centroide más importante no representa una avería real. El cluster representativo de este periodo es: Guardabarros y parante trasero izquierdo, Rayado – Rozado, Observada (4 %). Página 223 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Llanta trasera izquierda, Rayado – Rozado, Observada (1 %). Este representa un porcentaje mínimo de ocurrencia en la base de datos explotada. La media global que representa este periodo es: Zócalo derecho, Faltante. Tampoco es una combinación de daño válida y además no se corresponde con el tipo de avería más producido en este periodo. Los centroides que representan este periodo son más representativos y arrojan mayor probabilidad de ocurrencia que en los periodos anteriores: Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (2 %). Moldura protectora lateral izquierda, Rayado – Rozado, Observada (17 %). Retrovisor externo derecho, Faltante (79 %). Para finalizar con el desarrollo de este punto del Clustering de daños considerando Parte + Tipo de Avería + Gravedad es difícil tomar como valores válidos factibles de dar algún tipo de información en relación al comportamiento de las averías debido específicamente a que la combinación de los parámetros que definen un daño es excluyente. Es decir que hay combinaciones de códigos de partes, averías y gravedades que en la realidad no se van a producir e inclusive en la práctica algunas veces son poco frecuentes y no justifican su estudio. El desarrollo del Clustering evaluando cada uno de los grupos separando por cada una de sus partes si resulta de validez para el modelo y si arroja resultados factibles de ser estudiados para determinar un comportamiento de los siniestros. En los puntos que continúan en el presente trabajo se seguirá evaluando la información suministrada por el agrupamiento de datos considerando los daños imputables a un modelo o a un determinado lugar, por lo tanto es viable la posibilidad que el agrupamiento de datos arroje resultados que permitan representar fehacientemente el comportamiento de los daños en las unidades automotrices. 8.5.2.5. Lugares, Partes y Tipos de Averías. Analizando el resultado del primer periodo podemos ver que la media global contemplando la gravedad de una avería y sin contemplarla arrojan como daño: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. La gravedad de la media global es: Mediano. En cuanto a los resultados sin contemplar la gravedad de la avería podemos ver: Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante (87 %). Luego se puede visualizar el siguiente resultado: Transferencia ubicación y línea de carga, Luz de neblina trasera, Exceso kilometraje (6 %). Transferencia ubicación y línea de carga, Luz de neblina trasera, Abollado (2 %). Si bien tanto el lugar como la parte averiada suman un 8 % de ocurrencia, los porcentajes se dividen entre el 6 % y 2 % para diferentes tipos de averías. Finalmente se puede ver que los daños: Ingreso a Puerto, Cubierta delantera derecha, Abollado (2 %). Ingreso a Puerto, Paragolpe delantero / Superior, Rayado – Rozado (1 %). Ingreso a Puerto, Techo corredizo, Faltante (1 %). Ingreso a Puerto, Luz trasera izquierda, Abollado (1 %). El 5 % del total de averías ocurren en el ingreso a puerto, pero las partes se distribuyen en tres grupos 3 % de abolladuras, 1 % de rayados o rozados y 1 % de faltantes. Página 224 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Si los datos procesados contemplan la gravedad de una avería los resultados cambian. Los daños que encabezan el mayor porcentaje de ocurrencias son: Subida Buque Puerto de Origen, Llave, Abollado, Leve (42 %). Retiro de Puerto, Cristales de parante delantero, Abollado, Grave (20 %). Subida Buque Puerto de Origen, Cable de carga, Faltante, Mediano (12 %). Subida Buque Puerto de Origen, Guardabarro delantero izquierdo, Rayado – Rozado, Mediano (2 %). Analizando estos datos se puede ver que las averías ocurren en un 56 % en la subida a buque. Pero los tipos de averías se dividen solo en tres, por un lado el 62 % de abolladuras, el 12 % son faltantes y por otro solo el 2 % corresponde a rayados o rozados. Y en cuanto a las partes no sucede lo mismo puesto que se dividen en 4 partes, el 42 % corresponden a llaves, el 20 % a los cristales de parante delantero, el 12 % se refiere a los cables de carga o bien en un 2 % a guardabarros delantero izquierdo. Finalmente se ve que los las gravedades varían en leves 42 %, graves 20 % y medianos en un 2 %. Luego se ve la siguiente distribución de ocurrencia de averías donde es considerada la gravedad: Bajada de Buque, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Mediano (12 %). Ingreso a Puerto, Moldura protectora lateral derecha, Rayado – Rozado, Leve (10 %). Transferencia ubicación y línea de carga, Insignia, Faltante, Leve (2 %). Solo se puede hacer la observación referida a que solo participa de esta distribución dos tipos de averías por un lado el 22 % de rayados o rozados leves y por otro el 2 % de faltantes leves. El segundo periodo tiene menor cantidad de centroides. En cuanto a la media global también como en el periodo anterior con la participación y sin la participación de la severidad de los daños, la avería es la misma y en el mismo lugar: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Si se especifica la gravedad esta es media. Sin la consideración de los datos de gravedad se observa: Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante (92 %). Además el resultado en evaluación tiene coherencia entre la avería y la parte del auto involucrada. Para concluir con esta parte se pueden ver porcentajes mínimos en: Transferencia ubicación y línea de carga, Otros, Abollado (3 %). Transferencia ubicación y línea de carga, Puerta delantera izquierda, Rayado – Rozado (1 %). Ingreso a Puerto, Techo corredizo, Rayado – Rozado (2 %). Ingreso a Puerto, Puerta trasera derecha, Rayado – Rozado (1 %). Aquí se puede agrupar los lugares de averías en dos, el primero referido a la transferencia en línea de carga (4 %) y el segundo en el ingreso a puerto (3 %). Mientras que los tipos de averías son también son dos, rayados o rozados con un 4 % y los abollados con un 3 %. Las partes si están divididas en cuatro partes en función de los centroides definidos. Pasando a la evaluación de los resultados considerando la gravedad de las averías en los lugares en estudio se ve que produce una dispersión de los porcentajes de mayor ocurrencia: Bajada de Buque, Panel lateral izquierdo, Faltante, Leve (39 %). Bajada de Buque, Llanta delantera derecha, Abollado, Leve (33 %). El 72 % se produce en la bajada de un buque. En cuanto a los tipos de averías se observa faltantes con el 39 % y abollados con el 33 %. Y en relación a las partes involucradas se puede ver que ocurren en el panel lateral izquierdo y las llantas delanteras derechas. En los dos casos la gravedad es solo leve. Finalmente se ve que los porcentajes mínimos de ocurrencia de avería se producen según la siguiente distribución: Página 225 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Bajada de Buque, Cristales de parante delantero, Faltante, Intolerable (5 %). Bajada de Buque, Llanta delantera derecha, Faltante, Grave (8 %). Retiro de Puerto, Guardabarro trasero derecho, Faltante, Grave (13 %). Ingreso a Puerto, Tapa posterior de techo, Pintura saltada, Mediano (2 %). Se observa que el 13 % ocurren en la bajada de un buque, un 13 % en el retiro de un puerto y solo un 2 % en ele ingreso a un puerto. En canto a los tipos de averías solo se presentan dos, los faltantes con el 26 % y un 2 % para pinturas saltadas. En referencia a las partes involucradas estás se distribuyen en cuatro en función de los centroides generados, un 13 % de guardabarros traseros derechas, un 8 % de llantas delanteras derechas, un 5 % de cristales de parantes delanteros y un 2 % de tapas posteriores de techo. Finalmente se observa que las gravedades encontradas se dividen en tres grupos, 21 % de graves, 5 % de intolerables y 2 % de medias. El tercer periodo se caracteriza por el daño global: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Y si se contempla la gravedad, esta es leve. El lugar más importante donde ocurren las averías sin considerar su gravedad es: Transferencia ubicación y línea de carga, Bolsa de herramientas, Faltante (87 %). Luego en porcentajes mínimos se puede ver: Ingreso a Puerto, Paragolpe trasero / Zona contacto, Rayado – Rozado (6 %). Ingreso a Puerto, Luz de neblina trasera, Abollado (3 %). Ingreso a Puerto, Barras de techo, Pintura saltada (1 %). Ingreso a Puerto, Guardabarro trasero derecho, Pintura saltada (1 %). Ingreso a Puerto, Luz de patente trasera, Rayado – Rozado (1 %). Transferencia ubicación y línea de carga, Retrovisor externo izquierdo, Rayado – Rozado (1 %). Se observa que el 12 % de averías se produce en el ingreso a un puerto y solo el 1 % a los lugares vinculados a la transferencia y línea de carga. En cuanto a las apartes afectadas se puede ver otra distribución entre los porcentajes mínimos, esto es: un 6 % para los paragolpes traseros, un 3 % para las luces de neblina trasera, un 1 % para las barras de techo al igual que los guardabarros traseros derechos, las luces de patente traseras y los retrovisores externos izquierdos. En cuanto a los tipos de averías se observa que el 8 % son rayados o rozados, el 3 % son abollados y solo un 1 % para pintura saltada. Analizado los datos considerando la gravedad de las averías se observa: Subida Buque Puerto de Origen, Otros, Faltante (78 %). Se ve que el mayor porcentaje de incidentes se realiza a la subida a un buque. Los porcentajes mínimos de ocurrencia se observan en: Ingreso a Puerto, Retrovisor externo derecho, Proyección (11 %). Subida Buque Puerto de Origen, Giro Delantero (derecho / izquierdo), Faltante, Grave (9 %). Ingreso a Puerto, Alfombra suplementarias, Proyección, Grave (1 %). Ingreso a Puerto, Luz de neblina trasera, Faltante, Grave (1 %). El 13 % ocurre al ingreso a un puerto mientras que un 9 % ocurre a la subida a un buque. En cuanto a las partes que intervienen se observa que el 11 % se produce en retrovisores externos derechos, un 9 % en giros delanteros derechos o izquierdos, un 1 % son sobre las alfombras suplementarias y un 1 % sobre las luces de neblina trasera. En relación a los tipos de averías se observa que el 12 % son de tipo proyección y un 10 % de faltantes. Finalmente se observa que las averías ocurridas son graves. Página 226 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS El cuarto periodo se caracteriza por averías global en retiro de puerto. Las partes que hacen a la media global son el guardabarros trasero derecho. En cuanto al tipo de avería de la media son los faltantes. La severidad de las averías de la media si es considerada es grave. Los porcentajes de averías si la consideración de la gravedad no es tenida en cuenta es la siguiente: Retiro de Puerto, Puerta trasera derecha, Faltante (81) %) El mayor índice de siniestralidad no coincide con la media global solo en la parte dañada pero si en el lugar y el tipo de daño. Luego los porcentajes de siniestralidad bajan agrupándose de la siguiente manera: Ingreso a Puerto, Capot, Rayado – Rozado (2 %). Subida Buque Puerto de Origen, Tapa posterior de techo, Rayado – Rozado (3 %). Retiro de Puerto, Taza, Faltante (6 %). Retiro de Puerto, Llanta delantera izquierda, Faltante (8 %). El 3 % se producen en la subida al buque, el 2 % en el ingreso a puerto y el 14 % en el retiro de puerto. Las averías en los dos primero lugares son rayados y rozados y en retiro de puerto son faltantes. Y las partes de los autos involucradas se dividen en un 2 % capot, un 3 % a las tapas posteriores de techos, un 6 % a las tazas y 8 % a las llantas delanteras izquierdas. Si la gravedad es considerada el mayor porcentaje de ocurrencia es en: Bajada de Buque, Zócalo derecho, Faltante (60 %). Luego los porcentajes se agrupan de la siguiente forma: Subida Buque Puerto de Origen, Escape, Faltante, Observada (22 %). Ingreso a Puerto, Cubierta delantera derecha, Faltante (11 %). Ingreso a Puerto, Luz de neblina trasera, Proyección, Observada (4 %). Ingreso a Puerto, Capot, Rayado – Rozado, Observada (2 %). Ingreso a Puerto, Parabrisa, Faltante, Observada (1 %). El 22 % se produce en la subida a buque y el 18 % en el ingreso a puerto. En referencia a las partes se distribuyen en 11 % cubiertas delanteras derechas, 4 % luces de neblina traseras, 2 % en capot y el 1 % en parabrisas. En relación a los tipos de averías se dividen en faltantes con un 34 %, un 4 % proyecciones y un 2 % rayados o rozados. Y finalmente la severidad de las averías se distribuye en un 29 % de solo observaciones y 11 % graves. La media global para el quinto periodo se define en: Retiro de Puerto, Guardabarro delantero derecho, Faltante. La severidad es grave si es considerada. Si no se considera la gravedad de las averías la ocurrencia de los siniestros se desarrolla de la siguiente manera: Retiro de Puerto, Cristales de parante delantero, Faltante (66 %). Luego el porcentaje baja y se distribuye como sigue: Retiro Fábrica de Origen, Paragolpe trasero / Spoiler trasero, Rayado – Rozado (26 %). Bajada de Buque, Antena, Proyección (5 %). Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado - Rozado (2 %). Bajada de Buque, Paragolpe delantero / Superior, Rayado – Rozado (1 %). Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero Rayado – Rozado (1 %). En retiro de fábrica se produce el 26 % de las averías de este periodo, en bajada de buque el 8 % y el 1 % en subida a buque. Luego analizando los resultados de las partes se ve que el paragolpe delantero o protector delantero tiene un 3 %, antenas un 5 % y el 26 % los paragolpes traseros o Página 227 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS spoilers traseros. En cuanto a las averías estás se caracterizan por rayado o rozado 30 % y el 5 % proyecciones. Considerando la gravedad de las averías se observa que el mayor porcentaje de siniestralidad de este periodo es: Subida Buque Puerto de Origen, Guardabarro delantero derecho, Faltante (76 %). Luego los menores porcentajes se definen en los siguientes centroides: Ingreso a Puerto, Llanta delantera derecha, Proyección, Observada (6 %). Bajada de Buque, Zócalo derecho, Faltante, Observada (4 %). Ingreso a Puerto, Llanta delantera izquierda, Proyección (3 %). Ingreso a Puerto, Techo (inclusive convertible), Rayado – Rozado (2 %). Ingreso a Puerto, Otros, Abollado (5 %). Ingreso a Puerto, Techo (inclusive convertible), Pintura saltada (4 %). En ingreso a puerto se produce el 20 % y el 4 % en la bajada de buque. En referencia a los tipos de averías se subdividen en 9 % proyecciones, faltantes 4 %, rayados o rozados 2 %, un 5 % de abollados y el 4 % pinturas saltadas. Observando las partes afectadas éstas se dividen en llantas delanteras derechas el 6 %, llanta delanteras izquierdas 3 %, zócalos derechos 4 %, techos (inclusive convertibles) 2 % y otros el 5 %. Finalmente se observa que el 10 % son solo observaciones y el 14 % A continuación se realiza la evaluación de los datos explotados para el periodo seis. Se puede ver que la media global está constituida por: Retiro de Puerto, Zócalo derecho, Faltante. Y si la severidad es considerada esta es grave. Analizados los datos del periodo seis sin la consideración de la gravedad de las averías se observa como ocurrencia predominante: Subida Buque Puerto de Origen, Guardabarro trasero derecho, Faltante (79 %). El lugar especificado y el daño no coincide con la media global salvo en el tipo de avería que es Faltante. En cuanto a los porcentajes de ocurrencia menor esos se distribuyen de la siguiente manera: Ingreso a Puerto, Tapa acceso gancho remolque, Faltante (12 %). Ingreso a Puerto, Zócalo interno puerta delantera izquierda, Rayado – Rozado (3 %). Ingreso a Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado (2 %). Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado (1 %). Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado (1 %). Transferencia ubicación y línea de carga, Llave, Abollado (1 %). Se observa que el 15 % de las averías se producen en el ingreso a un puerto. Las partes intervinientes son las tapas de acceso a gancho de remolque con un 12 %, luego los zócalos internos de puerta delantera izquierda con el 3 %, el paragolpe delantero o protector delantero con un 3 %, el spoiler delantero con el 1 % al igual que las llaves con el 1 %. Luego se observa que las averías se distribuyen en: un 7 % de rayados o rozados, un 12 % de faltantes y solo un 1 % de abollados. Pasando al caso donde las severidades son consideradas se observa lo siguiente: Bajada de Buque, Zócalo derecho, Faltante (88 %). El mayor porcentaje de ocurrencia tampoco coincide con la media global del periodo salvo en el tipo de averías que es Faltante. Luego en porcentajes inferiores se observa: Bajada de Buque, Tapa acceso gancho remolque, Abollado, Observada (7 %). Bajada de Buque, Moldura protectora lateral derecha, Faltante, Observada (3 %). Ingreso a Puerto, Tapa posterior de techo, Rayado – Rozado, Observada (1 %). Página 228 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Transferencia ubicación y línea de carga, Puerta trasera izquierda, Abollado, Observada (1 %). Los daños ocurren en un 10 % a la bajada del buque, en un 1 % en el ingreso al puerto y al igual que en la transferencia de ubicación y línea de carga. En referencia a los tipos de averías se observa que el 8 % son abollados, el 3 % faltantes y el 1 % rayados o rozados. En cuanto a las partes observadas se ve que el 7 % pertenece a las tapas de acceso a gancho de remolque, el 3 % a moldura protectora lateral derecha, y el 1 % para tapa posterior de techo al igual que la puerta trasera izquierda. Finalmente se observa que la severidad de la avería es solamente observable en todos los casos (12 %). La media global del séptimo periodo está caracterizada por los daños: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Si la gravedad es considerada entonces esta es grave. Observando los resultados del procesamiento sin considerar la gravedad de los daños se puede ver que hay una distribución homogénea de los centroides. Esto es: Ingreso a Puerto, Parabrisa, Proyección (33 %). Bajada de Buque, Guardabarro delantero izquierdo, Abollado (18 %). Ingreso a Puerto, Faro de stop luneta, Abollado (18 %). Ingreso a Puerto, Llave, Rayado – Rozado (16 %). Bajada de Buque, Manijas externas de puertas traseras, Proyección (12 %). Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado (2 %). Las averías son producidas en un 67 % en el ingreso a puerto y el 32 % en la bajada de buque. En referencia a las partes afectadas se divide en: un 33 % de parabrisas, 18 % guardabarros delanteros izquierdos al igual que los faros de stop de luneta, el 17 % de llaves, el 12 % de manijas externas de puertas traseras y el 2 % de paragolpes delanteros o protectores delanteros. Finalmente los tipos de averías son de proyección en un 45 %, un 36 % de abollados y el 18 de rayados o rozados. Luego analizando los resultados del proceso contemplando la severidad de las averías el resultado es: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante (86 %). En esta parte si el resultado muestra un mayor predominio en un centroide con casi un 90 % de ocurrencia. Además se observa que tanto el lugar como la avería coinciden con la media global. Luego los centroides se dividen en menor porcentaje de la siguiente manera: Ingreso a Puerto, Guardabarro delantero derecho, Faltante, Observada (10 %). Bajada de Buque, Parrilla delantera, Abollado, Observada (3 %). Bajada de Buque, Panel trasero bajo baúl, Rayado – Rozado, Observada (1 %). Bajada de Buque, Alfombra suplementarias, Proyección, Observada (1 %). Los lugares de ocurrencia se mantienen como en el ítem anterior. El 10 % suceden en el ingreso al puerto y el 5 % en la bajada de buque. En cuanto a las partes que intervienen se observa el 10 % son guardabarros delanteros derechos, el 3 % en parrillas delanteras, y el 1 % tanto para los paneles traseros bajo baúl como para alfombras suplementarias. En referencia al tipo de averías estas se subdividen en 10 % de faltantes, 3 % de abollados, y 1 % de rayados y rozados al igual que proyecciones. Finalmente se ve que la gravedad de las averías son solo observadas (15 %). El octavo periodo es caracterizado por la media global: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Esta es la misma que para el periodo anterior tanto en el lugar de ocurrencia como el tipo de avería y la gravedad de la misma. Página 229 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Luego si se analiza detalladamente la distribución de las averías sin considerar la gravedad del mismo se observa una distribución pareja entre los diferentes centroides generados. Esto es: Bajada de Buque, Moldura protectora lateral derecha, Faltante (30 %). Transferencia ubicación y línea de carga, Manual, Faltante (24 %). Ingreso a Puerto, Puerta trasera izquierda, Proyección (20 %). Transferencia ubicación y línea de carga, Techo (inclusive convertible), Rayado – Rozado (17 %). Transferencia ubicación y línea de carga, Guardabarro trasero derecho, Pintura saltada (10 %). Los lugares de ocurrencia se distribuyen entre un 30 % en la bajada de buque, el 51 % en la transferencia de ubicación de línea de carga y el 20 en el ingreso a puerto. En referencia a las partes averiadas se observa el 30 % en moldura protectora lateral derecha, el 24 % de manuales, el 20 de puertas traseras izquierdas, el 17 % techos (inclusive convertibles) y el 10 % de guardabarros traseros derechos. En relación a los tipos de averías se observa que el 54 % son faltantes, el 20 % son proyecciones, el 17 % de rayados y rozados y el 10 de pinturas saltadas. Analizando los datos considerando la gravedad de las averías se observa que, al igual que en el periodo anterior, se centralizan en un centroide. Esto es: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante (78 %). Donde la misma coincide con la media global en el lugar, el tipo de avería y la gravedad. Luego se observa que: Subida Buque Puerto de Origen, Panel lateral derecho, Abollado, Observada (12 %). Transferencia ubicación y línea de carga, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada (5 %). Ingreso a Puerto, Zócalo izquierdo, Abollado, Observada (2 %). Transferencia ubicación y línea de carga, Puerta trasera izquierda, Rayado – Rozado, Observada (2 %). Los lugares se distribuyen en el 12 % en subida a buque, el 7 % en transferencia ubicación y línea de carga, y el 2 % en el ingreso a puerto. Las partes afectadas se subdividen en 12 % de paneles laterales derechos, 5 % de tapizados internos de puertas delanteras izquierdas, 2 % en zócalos izquierdos y el 2 % en puertas traseras izquierdas. En referencia a los tipos de averías son el 14 % de abollados y el 7 % de rayados y rozados. Por último la severidad es grave. El penúltimo periodo en estudio se caracteriza por la media de ocurrencia global: Transferencia ubicación y línea de carga, Taza, Proyección. Con gravedad si es tenida en cuenta, grave. Si la gravedad no es considerada el centroide más importante es: Ingreso a Puerto, Manijas externas de puertas delanteras, Proyección (62 %). Luego se dividen de la siguiente forma: Transferencia ubicación y línea de carga, Faro de stop luneta, Rayado – Rozado (23 %). Bajada de Buque, Tapa acceso gancho remolque, Abollado (10 %). Bajada de Buque, Barras de techo, Abollado (3 %). Bajada de Buque, Capot, Rayado – Rozado (1 %). Bajada de Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado (1 %). El 23 % se produce en la transferencia ubicación y línea de carga y el 15 % en la bajada de buque. Las partes afectadas son: un 23 % de faros de stop de lunetas, 10 % tapas de ganchos de remolque, 3 % barras de techos, 1 % en capot y zócalo interno de puertas delanteras izquierdas. Mientras que el tipo de avería es 25 % de rayados o rozados y el 13 % de abollados. Si la gravedad del daño es considerada entonces el centroide más importante es: Página 230 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Transferencia ubicación y línea de carga, Limpiador y lavador de parabrisas, Proyección (79 %). No coincide totalmente con la media global. Luego los porcentajes mínimos ocurren de la siguiente forma: Subida Buque Puerto de Origen, Limpiador y lavador de parabrisas, Abollado, Observada (5 %). Transferencia ubicación y línea de carga, Tapa tanque combustible, Rayado – Rozado, Observada (5 %). Ingreso a Puerto, Tapizado interno puerta delantera izquierda, Proyección, Observada (5 %). Transferencia ubicación y línea de carga, Zócalo derecho, Rayado – Rozado, Observada (2 %). Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado, Observada (1 %). Ingreso a Puerto, Escape, Rayado – Rozado, Observada (1 %). Subida Buque Puerto de Origen, Puerta delantera izquierda, Abollado, Observada (1 %). El 6 % se observa en la subida a buque de puerto de origen, luego el 8 % en la transferencia ubicación y línea de carga, el 6 % en el ingreso a puerto. Las partes que intervienen son: el 5 % el limpiador y lavador de parabrisas, el 5 % de tapas de tanque de combustible, el 5 % de tapizado interno de la puerta delantera izquierda, el 2 % del zócalo derecho, el 1 % de las llantas traseras izquierdas, el 1 % del escape y el 1 % puertas delanteras izquierdas. Luego el tipo de avería se divide en un 6 % de abollados, 9 % rayados o rozados y 5 % de proyecciones. El último periodo se caracteriza por la media: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante. Con el tipo de severidad grave si es considerada. Si no se considera la severidad entonces el centroide de mayor peso es: Transferencia ubicación y línea de carga, Giro Delantero (derecho / izquierdo), Faltante (61 %). Luego baja de forma considerable y se distribuye de la siguiente forma: Bajada de Buque, Panel lateral derecho, Faltante (17 %). Transferencia ubicación y línea de carga, Tapa posterior de techo, Rayado – Rozado (14 %). Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado (4 %). Transferencia ubicación y línea de carga, Manijas externas de puertas traseras, Reventado – Estallado (4 %). Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado (1 %). El 17 % se producen en la bajada del buque y el 23 % en transferencia ubicación y línea de carga. Las partes afectadas son: 17 % de paneles laterales derechos, 14 % de tapa posterior de techo, 4 % de paragolpe delantero y protector delantero, 4 % de manijas externas de puertas traseras y el 1 % de llantas traseras izquierdas. Lo tipos de averías son: 19 % de rayados o rozados y el 4 % de estallados. Si los datos de la gravedad de las averías son considerados entonces la ocurrencia de los daños es la siguiente. El máximo porcentaje está centralizado en Transferencia ubicación y línea de carga, Retrovisor externo derecho, Faltante: (79 %). Como en el punto anterior no coincide con la media global. Página 231 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Luego los porcentajes se reducen y queda conformado de la siguiente manera: Transferencia ubicación y línea de carga, Llanta delantera izquierda, Rayado – Rozado, Observada (8 %). Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada (5 %). Ingreso a Puerto, Encendedor, Manchado, Observada (5 %). Bajada de Buque, Moldura protectora lateral derecha, Abollado, Observada (2 %). Ingreso a Puerto, Giro Delantero (derecho / izquierdo), Pintura saltada, Observada (1 %). El 8 % ocurre en la transferencia de ubicación y línea de carga, el 11 % en el ingreso a puerto y el 2 % en la bajada de buque. Las partes afectadas se dividen en 8 % llanta delantera izquierda, 5 % de paragolpes traseros o spoilers traseros, 5 % de encendedores, 2 % de molduras protectoras laterales derechas, y 1 % giro delantero (derecho o izquierdo). Los tipos de averías son rayados o rozados 13 %, manchados 5 %, abollados 2 % y pintura saltada un 1 %. 8.5.2.6. Modelos, Partes y Tipos de Averías. A continuación se realiza una evaluación de los resultados vinculados con la ocurrencia de averías en los modelos de autos en estudio. Se contemplan como en el ítem anterior el análisis de daños con consideración de la severidad y sin la consideración de ella. El primer periodo tiene como media global: Modelo 12, Tapa acceso gancho remolque, Faltante. Y si la gravedad es considerada esta es mediana. Luego se observa la siguiente distribución de los centroides formados: Modelo 10, Manual, Abollado (25 %). Modelo 10, Panel lateral izquierdo, Abollado (22 %). Modelo 18, Cubierta delantera derecha, Rayado – Rozado (18 %). Modelo 17, Cubierta delantera izquierda, Abollado (14 %). Modelo 4, Moldura protectora lateral derecha, Faltante (13 %). Modelo 9, Cerraduras de puertas, Rayado – Rozado (6 %). Modelo 10, Giro Delantero (derecho / izquierdo), Rayado – Rozado (2 %). El modelos 10 tiene el 49 % de participación entre los daños detectados, luego el modelo 18 tiene el 18 %, el modelo 17 con un 14 %, el modelo 4 con un 13 % y finalmente el modelo 9 con solo un 6 %. En referencia a las partes que intervienen estas se subdividen en: 25 % manual, 22 % panel lateral izquierdo, 18 % cubierta delantera derecha, 14 % cubierta delantera izquierda, 13 % en moldura protectora lateral derecha, 6 % en cerraduras de puertas, y el 6 % en giros delanteros (derechos o izquierdos). Finalmente el tipo de avería se divide en: 61 % de abollados, 26 % rayados y rozados y el 13 % de faltantes. La producción de averías considerando la gravedad tiene el siguiente el siguiente comportamiento: Modelo 11, Luz de neblina trasera, Faltante, Leve (59 %). Modelo 15, Puerta trasera derecha, Faltante, Grave (16 %). Modelo 5, Giro Delantero (derecho / izquierdo), Faltante, Intolerable (8 %). Modelo 17, Panel lateral derecho, Rayado – Rozado, Mediano (6 %). Modelo 16, Bolsa de herramientas, Abollado, Mediano (5 %). Modelo 9, Manijas externas de puertas traseras, Rayado – Rozado, Mediano (3 %). Modelo 18, Paragolpe trasero / Spoiler trasero, Faltante, Mediano (2 %). Modelo 14, Retrovisor externo derecho, Pintura saltada, Mediano (1 %). El modelo 11 tiene el 59 % de participación, el modelo 15 le sigue con un 16 %, luego se observa el modelo 5 con el 8 %, el modelo 17 con el 6 %, el modelo 16 con el 5 %, el modelo 9 con el 3 %, el Página 232 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS modelo 18 con el 2 % y al final el modelo 14 con un 1 %. Las partes afectadas son: 59 % luces de neblinas traseras, puertas traseras derechas con el 16 %, los giros delanteros (derechos o izquierdos) con el 8 %, el panel lateral derecho con el 6 %, bolsas de herramientas con un 5 %, manijas externas de puertas traseras con el 3 %, el 2 para los paragolpes traseros o spoilers traseros y el 1 % para los retrovisores externos derechos. En cuanto a los tipos de averías estos se subdividen en: faltantes con el 85 %, 9 % los rayados o rozados, abollados el 5 % y pintura saltada el 1 %. Luego la severidad tiene el siguiente comportamiento: el 59 % con leves, 16 % graves, intolerables 8 %, y finalmente medianos 12 %. El segundo periodo se caracteriza por la combinación: Modelo 14, Tapa acceso gancho remolque, Faltante. Y cuando la severidad es considerada esta es media. Luego los centroides quedan conformados de la siguiente manera: Modelo 10, Guardabarro delantero izquierdo, Abollado (34 %). Modelo 17, Aerosol antipinchazos, Proyección (20 %). Modelo 17, Alfombra baúl / caja de carga, Faltante (14 %). Modelo 17, Puerta delantera derecha, Abollado (12 %). Modelo 17, Cubierta delantera izquierda, Rayado – Rozado (8 %). Modelo 8, Panel lateral izquierdo, Rayado – Rozado (5 %). Modelo 6, Limpiador y lavador de parabrisas, Abollado (4 %). Modelo 7, Zócalo interno puerta delantera izquierda, Rayado – Rozado (3 %). El modelo 10 participa con el 34 %, el modelo 17 tiene el 54 % de las averías, el modelo 8 con el 5 %, el modelo 6 con el 4 % y el modelo 7 con el 3 %. Luego las partes involucradas son: guardabarros delanteros izquierdos con el 34 %, aerosol antipinchazos 20 %, alfombra baúl o caja de carga con el 14 %, puerta delantera derecha con el 12 %, cubierta delantera izquierda con el 8 %, panel lateral izquierdo el 5 %, limpiador y lavador de parabrisas con el 4 % y al final zócalo interno de puerta delantera izquierda con el 3 %. En cuanto a los tipos de averías se dividen de la siguiente forma: abollados 50 %, proyección el 20 %, faltantes el 14 % y rayados o rozados con el 16 %. Luego con la consideración de las gravedades los daños se distribuyen del siguiente modo: Modelo 13, Puerta delantera izquierda, Faltante, Leve (47 %). Modelo 17, Alerón, Faltante, Mediano (22 %). Modelo 16, Guardabarro trasero derecho, Faltante, Grave (16 %). Modelo 8, Giro Delantero (derecho / izquierdo), Faltante, Mediano (7 %). Modelo 8, Cristales de parante delantero, Faltante, Grave (5 %). Modelo 10, Barras de techo, Proyección, Mediano (2 %). El modelo 13 con el 47 % de ocurrencia, luego el modelo 17 con el 22 %, el modelo 16 el 16 %, el modelo 8 con el 12 % y finalmente el modelo 10 con el 2 %. Los tipos de averías se subdividen en: faltantes 97 % y proyección con el 2 %. Las partes se subdividen en: 47 % de puertas delanteras izquierdas, 22 % de alerones, con el 16 % guardabarros traseros derechos, el 7 % de giros delanteros (derecho o izquierdo), el 5 % de cristales de parante delantero y el 2 % de barras de techo. Finalmente la severidad de las averías se distribuye en: 47 % leves, 31 % medios y graves 21 %. La media global del tercer periodo es: Modelo 15, Tapa acceso gancho remolque, Faltante. Y la severidad de la avería es leve si es considerada en el procesamiento. Luego los centroides arrojan la siguiente información: Modelo 9, Giro Delantero (derecho / izquierdo), Abollado (28 %). Modelo 17, Cubierta delantera izquierda, Faltante (22 %). Modelo 17, Guardabarro trasero derecho, Abollado (17 %). Página 233 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 18, Limpiador y lavador de parabrisas, Proyección (14 %). Modelo 17, Llave de rueda, Faltante (11 %). Modelo 17, Tapa posterior de techo, Faltante (6 %). Modelo 13, Puerta trasera izquierda, Abollado (2 %). El modelo 9 ocurre en un 28 %, el modelo 17 el 56 %, el modelo 18 ocurre en un 14 % y las avería en el modelo 13 se producen en un 2 %. Luego se observa que el comportamiento de las parte se distribuye de la siguiente manera: 28 % en giros delanteros (derechos o izquierdos), 22 % en cubierta delantera izquierda, el 17 % en guardabarros traseros derechos, el 14 % en limpiador y lavador de parabrisas, 11 % en llaves de ruedas, el 6 % en tapa posterior de techo y el 2 % en puertas traseras izquierdas. Finalmente se observa que el 47 % son tipos de averías abollados, el 37 % de faltantes y el 14 % de proyecciones. Considerando las severidades de las averías se observa el siguiente comportamiento: Modelo 15, Tapa acceso gancho remolque, Faltante (89 %). En casi un 90 % de ocurrencia el modelo 15 es el más afectado. Y coincide ciento por ciento con la media global. Luego los porcentajes mínimos quedan distribuidos de la siguiente forma: Modelo 17, Manual, Faltante, Grave (5 %). Modelo 10, Faro de stop luneta, Abollado, Grave (3 %). Modelo 4, Retrovisor externo derecho, Faltante, Grave (1 %). Modelo 17, Puerta trasera izquierda, Faltante, Grave (1 %). 6 % modelo 17, modelo 10 el 3 % y el modelo 4 el 1 %. Luego se observa que las partes afectadas son: manuales el 5 %, faros de stop de luneta el 3 %, 1 % de retrovisor externo derecho y también el mismo porcentaje para las puertas traseras izquierdas. Luego se observa que el 7 % son faltantes y el 3 % abollados. Finalmente el tipo de avería entre los porcentajes mínimos es siempre grave. El cuarto periodo está caracterizado por el centroide. Modelo 15, Guardabarro trasero derecho, Faltante. Con severidad grave si es considerada. Luego sin la consideración de la gravedad de averías los centroides dan la siguiente información: Modelo 18, Panel trasero bajo baúl, Rayado – Rozado (32 %). Modelo 8, Llanta delantera izquierda, Abollado (21 %). Modelo 18, Escape, Proyección (15 %). Modelo 17, Guardabarro delantero izquierdo, Pintura saltada (14 %). Modelo 6, Limpiador de Faros (derecho / izquierdo), Proyección (10 %). Modelo 17, Separador interno de carga, Proyección (6 %). Modelo 17, Llanta delantera derecha, Pintura saltada (2 %). Modelo 9, Parante delantero, Rayado – Rozado (1 %). El 47 % corresponde al modelo 18, el modelo 8 el 21 %, el modelo 17 con el 22 %, el modelo 6 con el 10 % y el modelo 9 con el 1 %. Las partes se subdividen en: 32 % el panel trasero bajo baúl, el 21 % las llantas delanteras izquierdas, el 15 % de escapes, el 14 % de guardabarros delanteros izquierdos, el 10 % limpiador de faros, el 6 % separador interno de carga, el 2 % de llanta delantera derecha y el 1 % en los parantes delanteros. Luego se observa que los tipos de averías se distribuyen de la siguiente forma: rayados o rozados 33 %, abollados con el 21 %, proyecciones con el 21 % y pinturas saltadas con el 16 %. Pasando a los resultados obtenidos con la consideración de la gravedad del daño se observa que el mayor índice de ocurrencia es: Modelo 15, Zócalo derecho, Faltante (71 %). Luego los porcentajes bajan de forma importante y quedan distribuidos de la siguiente forma: Modelo 18, Alfombra suplementarias, Faltante, Observada (13 %). Modelo 8, Tapa acceso gancho remolque, Abollado, Observada (10 %). Página 234 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 18, Luz de patente trasera, Proyección, Observada (4 %). Modelo 9, Zócalo derecho, Manchado, Observada (2 %). Modelo 16, Batería, Rayado – Rozado, Observada (1 %). El modelo 18 con el 17 %, luego el modelo 8 con el 10 %, el modelo 9 con el 2 % y al final el modelo 16 con el 1 %. Las partes que intervienen se dividen en: 13 % alfombras suplementarias, 10 % tapas de acceso gancho de remolque, 4 $ de luz de patente trasera, 2 % de zócalos derechos y 1 % en baterías. Los tipos de averías observados son: faltantes el 13 %, abollados con el 10 %, proyecciones con el 4 %, manchados con el 2 % y rayados o rozados con el 1 %. En todos los casos las averías son solo observables. El quinto periodo está caracterizado por la media global: Modelo 13, Guardabarro delantero derecho, Faltante. Donde cuando se considera la severidad esta es grave. Luego pasando a la evaluación de los resultados si la consideración de la gravedad de los daños se observa: Modelo 17, Tapa de Baúl o Puerta Trasera, Rayado – Rozado (34 %). Modelo 7, Tapa acceso gancho remolque, Abollado (33 %). Modelo 17, Faro de stop luneta, Abollado (17 %). Modelo 18, Guardabarros y parante trasero izquierdo, Rayado – Rozado (7 %). Modelo 6, Paragolpe trasero / Zona contacto, Rayado – Rozado (7 %). Modelo 9, Paragolpe delantero / Superior, Rayado – Rozado (2 %). Modelo 13, Techo (inclusive convertible), Abollado (1 %). El 51 % de ocurrencias en el modelo 17, el 33 % en el modelo 7, luego el modelo 18 con el 7 %, el modelo 6 con el 7 %, el modelo 9 con el 2 % y el modelo 13 con el 1 %. Las partes se agrupan en los siguientes porcentajes según lo descrito en la lista previa. Los tipos de averías se subdividen en: rayados o rozados el 50 % y abollados el 51 %. Luego los datos a avaluar considerando la gravedad de los daños ocurre con el mayor porcentaje en: Modelo 13, Guardabarro delantero derecho, Faltante (89 %). Luego los porcentajes se reducen a los siguientes centroides: Modelo 6, Taza, Proyección, Observada (4 %). Modelo 18, Llave, Abollado, Observada (3 %). Modelo 19, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada (1 %). Modelo 8, Guardabarro delantero izquierdo, Abollado, Observada (1 %). Donde le modelo 6 aparece en un 4 %, el modelo 18 en el 4 %, el modelo 19 en el 1 % al igual que el modelo 8. Los tipos de averías se dividen en: 4 % proyecciones, 4 % abollados y 1 % en rayados o rozados. Las partes se distribuyen en: 4 % tazas, 3 % llaves, 3 % tapizados internos de puerta delanteras izquierdas y 1 % en guardabarros delanteros izquierdos. Finalmente se debe mencionar que en todos los casos las averías son solo observaciones. El periodo seis tiene como media global: Modelo 13, Zócalo derecho, Faltante. Si se considera la severidad esta es grave. Los porcentajes de ocurrencia en los centroides se dividen en: Modelo 7, Escape, Faltante (45 %). Modelo 17, Panel trasero bajo baúl, Rayado – Rozado (24 %). Modelo 18, Giro Delantero (derecho / izquierdo), Abollado (15 %). Modelo 16, Guardabarros y parante trasero izquierdo, Abollado (8 %). Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado (3 %). Modelo 17, Otros, Rayado – Rozado (3 %). Página 235 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelo 13, Barras de techo, Abollado (1 %). El modelo 7 con el 45 %, el modelo 17 con el 27 %, el modelo 18 con el 15 %, el modelo 16 con el 8 %, el modelo 20 con el 3 % y el modelo 13 con el 1 %. Luego las partes que intervienen se subdividen de la forma descrita en el listado anterior. En cuanto a loas tipos de averías estas se distribuyen de la siguiente forma: faltantes el 45 %, rayados o rozados el 27 % y abollados el 24 %. Los resultados del proceso considerando la gravedad de las averías se distribuyen como sigue: Modelo 13, Zócalo derecho, Faltante (88 %). El mayor porcentaje de ocurrencia es el modelo 13. Luego se distribuye en forma mínima entre los siguientes centroides: Modelo 7, Bolsa de herramientas, Faltante, Observada (7 %). Modelo 19, Bolsa de herramientas, Proyección, Observada (2 %). Modelo 16, Parrilla delantera, Pintura saltada, Observada (2 %). Modelo 20, Spoiler delantero, Rayado – Rozado, Observada (1 %). Modelo 19, Paragolpe trasero / Spoiler trasero, Proyección, Observada (1 %). El modelo 7 con el 7 %, el modelo 19 con un 3 %, el modelo 16 con un 2 % y el modelo 20 con el 1 %. Luego las partes se distribuyen en: un 9 % bolsas de herramientas, el 2 % en parrilla delantera, el 1 % en spoilers delanteros y el 1 % para los paragolpes traseros o spoilers traseros. Los tipos de averías observados son: el 7 % de faltantes, proyección el 3 %, pinturas saltadas en un 2 % y un 1 % para rayados o rozados. Finalmente se debe mencionar que la severidad de las averías mínimas es solo observación. Los resultados del periodo siete tienen como media global: General: Modelo 15, Guardabarro delantero derecho, Faltante. Y cuando la gravedad es considerada esta es grave. Si no se considera la gravedad de las averías la distribución es la siguiente: Modelo 6, Puerta delantera derecha, Faltante (33 %). Modelo 20, Barras de techo, Proyección (27 %). Modelo 19, Retrovisor externo izquierdo, Abollado (21 %). Modelo 20, Parrilla delantera, Rayado – Rozado (10 %). Modelo 18, Retrovisor externo derecho, Reventado – Estallado (4 %). Modelo 11, Barras de techo, Proyección (3 %). Modelo 13, Llanta delantera derecha, Abollado (1 %). Donde el modelo 6 tiene el 33 % de participación, el modelo 20 el 37 %, el modelo 19 el 21 %, el modelo 18 con el 4 %, el modelo 11 con el 3 % y modelo 13 con el 1 %. Luego las partes son distribuidas de la siguiente forma: 33 % de puerta delantera derecha, 30 % de barras de techo, 21 % de retrovisor externo izquierdo, 10 % de parrilla delantera, 4 % de retrovisor externo derecho y 1 % de llanta delantera derecha. Finalmente los tipos de averías se distribuyen de la siguiente manera: 33 % de faltantes, 30 % de proyecciones, 22 % de abollados, 10 % de rayados o rozados y el 4 % de reventado o estallado. Sin considerar las severidades el mayor porcentaje de averías es: Modelo 15, Guardabarro delantero derecho, Faltante (86 %). Luego los porcentajes mínimos de ocurrencia son: Modelo 19, Retrovisor externo derecho, Faltante, Observada (9 %). Modelo 7, Zócalo izquierdo, Abollado, Observada (2 %). Modelo 6, Manijas externas de puertas traseras, Proyección, Observada (2 %). Modelo 5, Zócalo izquierdo, Rayado – Rozado, Observada (1 %). Modelo 8, Retrovisor externo derecho, Pintura saltada, Observada (1 %). El modelo 19 con el 9 %, el 7 % con el 2 % al igual que el modelo 6, el modelo 5 y el modelo 8 con el 1 %. Las partes averiadas tienen los siguientes porcentajes: 10 % retrovisor externo derecho, 3 % Página 236 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS zócalo izquierdo y 2 % de manijas externas de puertas traseras. Los tipos de averías que participan son: 9 % faltantes, abollados 2 %, proyecciones 2 %, rayados o rozados 1 % al igual que pintura saltada. Finalmente el tipo de severidad es observado. El periodo ocho tiene como media global: Modelo 14, Zócalo derecho, Faltante. Con severidad grave. En referencia a los resultados sin considerar la gravedad de la misma se divide de a siguiente forma: Modelo 20, Limpiador y lavador de parabrisas, Proyección (37 %). Modelo 7, Parrilla delantera, Faltante (24 %). Modelo 19, Zócalo izquierdo, Abollado (15 %). Modelo 5, Manijas externas de puertas traseras, Proyección (10 %). Modelo 13, Guardabarro delantero izquierdo, Abollado (7 %). Modelo 5, Capot, Rayado – Rozado (3 %). Modelo 14, Techo corredizo, Faltante (3 %). El 37 % para el modelo 20, el 24 % el modelo 7, el modelo 19 con el 15 %, el modelo 5 el 13 %, el modelo 13 el 7 % y el modelo 14 con el 3 %. Las partes se subdividen según los porcentajes es pacificados en el listado previo. En cuanto a los tipos de avería se puede observar: el 47 % son proyecciones, el 27 % faltantes, el 22 % de abollados y el 3 % de rayados o rozados. Considerando las severidades se observa la siguiente distribución: Modelo 20, Cubierta delantera izquierda, Rayado – Rozado, Observada (56 %). Modelo 14, Zócalo derecho, Faltante (16 %). Modelo 17, Manijas externas de puertas traseras, Proyección, Observada (12 %). Modelo 20, Tapa de Baúl o Puerta Trasera, Rayado – Rozado, Observada (10 %). Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (4 %). Modelo 11, Panel lateral derecho, Faltante, Observada (1 %). El 70 % para el modelo 20, el modelo 14 el 16 %, el modelo 17 con el 12 % y el modelo 11 con el 1 %.Las partes afectadas se distribuyen según los datos especificados en el listado anterior. En cuanto a los tipos de averías estos son: rayados o rozados con el 70 %, faltantes con el 17 % y el 12 % proyecciones. Finalmente el tipo de severidad se divide en un 16 % de graves y un 83 % de solo observaciones. El noveno periodo se caracteriza por el siguiente centroide: Modelo 14, Taza, Proyección. Y el tipo de severidad es grave. Luego si la gravedad no es considerada la distribución de los centroides es como sigue a continuación: Modelo 20, Limpiador y lavador de parabrisas, Proyección (54 %). Modelo 6, Tapizado interno puerta delantera izquierda, Rayado – Rozado (16 %). Modelo 7, Guardabarro trasero derecho, Pintura saltada (14 %). Modelo 7, Cable de carga, Rayado – Rozado (7 %). Modelo 13, Guardabarro trasero derecho, Abollado (3 %). Modelo 13, Techo (inclusive convertible), Abollado (3 %). Modelo 14, Luz de neblina trasera, Abollado (2 %). Modelo 13, Faro de stop luneta, Faltante (1 %). El modelo 20 con el 54 %, el modelo 6 con el 16 %, el modelo 7 con el 21 %, el modelo 13 con el 5 % y el modelo 14 con el 2 %. Luego se observa la siguiente distribución entre las partes: 54 % limpiador y lavador de parabrisas, tapizado interno puerta delantera izquierda el 17 %, guardabarros trasero derecho con el 17 %, cable de carga 7 %, techo (inclusive convertible) 3 %, luz de neblina Página 237 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS trasera el 2 % y el faro de stop de luneta el 1 %. Luego el tipo de avería se subdivide en: pintura saltada 14 %, rayados o rozados el 7 %, el 8 % de abollados y el 1 % de faltantes. En referencia a la evaluación de los resultados considerando su gravedad es la siguiente: Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada (1 %). Modelo 20, Alfombra baúl / caja de carga, Rayado – Rozado, Observada (3 %). Modelo 8, Alfombra suplementarias, Proyección, Observada (9 %). Modelo 16, Llanta delantera derecha, Faltante, Observada (7 %). Modelo 7, Llanta delantera derecha, Faltante (32 %). Modelo 20, Transponder, Proyección (47 %). El modelo 20 con el 51 %, luego los modelos 8 con el 9 %, el modelo 16 con el 7 % y el modelo 7 con el 32 % son los resultados obtenidos. En cuanto a las partes averiadas se subdividen en rayados o rozados con el 4 %, proyección con el 56 % y faltante con con el 39 %. Luego se observa que el 20 % son solo observaciones y averías el 80 %. El último periodo en estudio muestra la media global: Modelo 13, Zócalo derecho, Faltante. Con severidad grave. Sin la consideración de la severidad el proceso arroja los siguientes valores: Modelo 7, Panel lateral derecho, Proyección (44 %). Modelo 19, Puerta trasera derecha, Faltante (41 %). Modelo 20, Manijas externas de puertas delanteras, Proyección (6 %). Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado (4 %). Modelo 13, Techo corredizo Pintura saltada (4 %). Modelo 8, Capot, Faltante (1 %). Modelo 10, Cristales de parante delantero, Reventado – Estallado (1 %). El modelo 7 con el 44 %, el modelo 19 con el 41 %, luego el modelo 20 con el 10 %, el modelo 13 con el 4 %, el modelo 8 con el 1 % al igual que el modelo 10. Luego las partes afectadas se distribuyen según se especificó el listado expuesto previamente. Los tipos de averías se distribuyen de la siguiente forma: proyección con el 50 %, faltante con el 41 %, rayado o rozado con el 4 %, pintura saltada con el 4 % y reventado o estallado con el 1 %. Con la gravedad considerada el mayor índice de ocurrencia ocurre como sigue: Modelo 14, Retrovisor externo derecho, Faltante (79 %). Luego los porcentajes mínimos se dividen de la siguiente forma: Modelo 7, Giro Delantero (derecho / izquierdo), Rayado – Rozado, Observada (11 %). Modelo 16, Limpiador y lavador de parabrisas, Faltante, Observada (4 %). Modelo 7, Conjunto carrocería, Manchado, Observada (3 %). Modelo 20, Guardabarro delantero izquierdo, Rayado – Rozado, Observada (2 %). El modelo 7 con el 14 %, el modelo 16 con el 4 % y el modelo 20 con el 2 %. Las partes se subdividen según se ha definido en el listado previo. Los tipos de averías son: rayados o rozados con el 13 %, faltante con el 4 % y manchados con el 3 %. Luego la gravedad de las averías es solo observable en todos los casos (21 %). 8.5.2.7. Imputación Tipo de Transporte. En este punto se van a evaluar los resultados obtenidos en cada periodo relacionados con el lugar donde se producen los daños y a partir de estos se especificará el tipo de imputación al que corresponde. Página 238 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS En el periodo uno se observa que el 79 % de las averías corresponden al transporte terrestre. Luego el 10 % transportes marítimos y finalmente el 5 % a la salida de planta. El detalle del resultado del proceso es el siguiente: 74 % de averías en “Subida a Buque Puerto de Origen”. Imputación transporte terrestre. 10 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Transferencia Ubicación y Línea de Carga”. Imputación planta de producción. En el segundo periodo también el mayor índice de daños es realizado por el transporte terrestre con un 89 % del total de datos explotados. Luego le sigue el transporte marítimo con el 6 % y finalmente el puerto (averías en la playa de puerto) con solo el 2 %. El detalle porcentual de los datos explotados es el siguiente: 83 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 6 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 2 % de averías en “Retiro de Puerto”. Imputación puerto. Los datos del periodo tres muestran que todavía existe un predominio de las averías producidas por el transporte terrestre con el 85 %. Luego las averías de trasporte marítimo con el 9 % y finalmente el la playa de puerto con el 4 %. Este periodo coincide con las imputaciones del periodo anterior pero los porcentuales son distintos. En cuanto a los detalles del periodo es el siguiente: 76 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 9 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 9 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 4 % de averías en “Subida a Buque”. Imputación puerto. La información del periodo cuatro muestra que el 60 % solo es de trasporte terrestre. Luego el 15 % son daños de salida de planta de producción. Y finalmente el 13 % son producidos en el transporte marítimo. El detalle es el siguiente: 47 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 15 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. El comportamiento de los resultados del periodo cinco también muestra en el primer lugar a las averías imputables al transporte terrestre con un 46 %. Luego le siguen las averías producidas en planta con el 23 %. En tercer lugar aparecen las averías producidas por las compañías marítimas con el 20 % y finalmente con un porcentaje mínimo se observan las averías en playa de puerto con el 6 %. El detalle porcentual es el siguiente: 32 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 23 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 20 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 14 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 6 % de averías en “Retiro de Puerto”. Imputación puerto. Página 239 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS En el periodo seis todavía existe el predominio de las averías imputables al transporte terrestre con el 55 %. Luego, al igual que en el periodo anterior, las averías de planta de producción con el 17 %. En tercer lugar las averías de transporte terrestre con el 13 % y finalmente con solo un 5 % las averías imputables a la playa de puerto. 42 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 17 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Retiro de Puerto”. Imputación puerto. El resultado de los procesos del periodo siete muestra que el transporte terrestre aparece con un 46 % de participación. Luego en el segundo lugar se observan las averías de transporte marítimo con el 21 %. En tercer lugar están las averías imputables a planta con el 16 %. Y finalmente se observan los daños imputables a la playa de puerto con el 10 %. El detalle porcentual es el siguiente: 40 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 21% de averías en “Bajada de Buque”. Imputación transporte marítimo. 16 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 10 % de averías en “Subida a Buque”. Imputación puerto. 6 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. En el periodo ocho se observa el cambio del primer lugar de imputabilidad. En este periodo el porcentaje más alto de daños se encuentra en la salida de planta, o sea daños en producción con el 48 %. Luego con el 36 % le siguen los daños imputables al transporte terrestre. El transporte marítimo tiene el 7 % de incidencia en los daños y finalmente el 5 % de los daños de este periodo fueron producidos por la playa de puerto. El detalle es el siguiente: 48 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 19 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 17 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 7 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Retiro de Puerto”. Imputación puerto. Las averías en el periodo nueve mantienen el primer lugar de imputación del periodo anterior. Los daños producidos en planta y detectados en la transferencia y línea de carga tienen el 63 % de ocurrencia. Luego sigue el trasporte terrestre con el 23 % y finalmente el 4 % son averías producidas por el transporte marítimo. 63 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 16 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 7 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 4 % de averías en “Bajada de Buque”. Imputación transporte marítimo. El último periodo en estudio tiene como mayor porcentaje de incidencia de las averías a la planta de producción con el 56 %. Luego le siguen los daños de transporte terrestre con el 25 %. En el tercer Página 240 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS lugar se encuentran las averías de playa de puerto con el 11 %. Y finalmente las averías de transporte marítimo con el 6 %. 56 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 17 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 11 % de averías en “Subida a Buque”. Imputación puerto. 8 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 8.6. Desarrollo En esta fase se realiza la evaluación de los resultados y la misma concluye con una estrategia para el desarrollo de los resultados de la minería de datos en el negocio. 8.6.1. Plan de desarrollo Resumen de resultados. El Árbol de Clasificación arroja el siguiente resultado que es ilustrado resumidamente en el Gráfico 39. Se puede ver claramente los resultados obtenido sobre las cantidades de tipos de averías producidos a lo largo de cada periodo. En el gráfico se han introducido solo los cuatro principales tipos de averías: Faltante, Pintura Saltada, Rayado o Rozado y Abollado. Estos cuatro tipos de averías constituyen el 96,04 por ciento en promedio del total de datos explotados. Tipos de Averías 6000 5000 4000 3000 2000 1000 0 2003 Semest re 1-04 Semest re 2-04 Semest re 1-05 Semest re 2-05 Semest re 1-06 Semest re 2-06 Semestre 1-07 Semest re 2-07 Faltant e 494 184 274 264 240 247 339 605 641 Semestre 1-08 1771 Pintura salt ada 935 790 812 598 490 271 136 237 609 334 Rayado - Rozado 2023 1628 1794 1792 1887 1499 1207 1278 4689 2223 Abollado 5338 2855 2375 1099 1126 1681 780 761 1016 751 Per io d o Gráfico 39: Barras detallado cantidades por tipo de avería Con el Árbol de Clasificación también se proceso la información relacionada con los lugares donde se producen las averías. En el Gráfico 40 se muestra el detalle de los resultados obtenidos. En este caso a diferencia del resultado anterior, la información que se puede visualizar es el 100 % de los resultados. Página 241 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Un detalle a tener presente en el resultado que muestra a lugar “Subida a Buque en Puerto de Origen” como el de mayor producción de daños es que la información procesada en la práctica pertenece a dos cambios de responsabilidad. Esto es, las averías detectadas en la subida a un buque son imputables tanto al transporte terrestre como a playa de puerto. Además, especialmente en los periodos iniciales del presente proyecto también hubo cambios a nivel empresas que por motivos políticos o internos. Es difícil estimar un porcentaje el cual sea representativo de lo que sucedió en la realidad en el punto de control en cuestión pero esto nos lleva a deducir que como línea futura de investigación se puede trabajar con los datos agrupados en función de los lugares de control y no por periodos de tiempo como es estudio actual. Lugares 8000 7000 6000 5000 4000 3000 2000 1000 0 2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08 Subida a Buque 104 82 228 201 104 138 265 95 523 633 Retiro de Puerto 352 89 71 137 248 187 119 156 60 Ingreso a Puerto 443 343 491 510 550 497 1069 575 1167 958 Salida de Planta 511 69 53 642 1003 767 454 1457 4521 3020 580 547 219 282 318 1585 144 517 635 454 Bajada de Buque 942 343 505 570 758 Subida Buque Puerto de Origen 6925 4741 4008 1849 1208 124 Per io d o Gráfico 40: Barras detallado cantidades por lugares de ocurrencia de averías El resultado de la explotación de datos con Árbol de Clasificación también fue realizado sobre los modelos de autos que participan proyecto de minería de datos. El Gráfico 41 muestra el resumen de los resultados obtenidos. En este caso como en el de los tipos de averías también se ha reducido la cuestión a los modelos que participan en un 96,65 % de los registros explotados. Como en el caso de los lugares de producción de averías aquí también hay una observación válida que se puede realizar. Existen modelos que debido a que no están incluidos en determinados periodos no porque no hayan tenido averías sino porque todavía no participaban del proceso o porque no se fabricaban o porque no entraban en la cadena logística. Esto también lleva a determinar la necesidad de realizar estudios futuros de minería de datos sobre la producción de averías de determinados modelos. Posiblemente un agrupamiento interesante puede ser por modelo. De esto se hablará en ítems posteriores cuando se especifiquen planes alternativos de explotación de datos o líneas futuras de investigación. Página 242 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Modelos 4500 4000 3500 3000 2500 2000 1500 1000 500 0 Semestre 2-06 Semest re 1-07 Semest re 2-07 Semest re 1-08 M odelo 9 4143 1785 833 433 469 789 170 209 156 142 M odelo 17 2003 2662 Semestre 1-04 2616 Semestre 2-04 3041 Semest re 1-05 2002 Semest re 2-05 1795 Semest re 1-06 1482 260 125 30 M odelo 5 595 244 252 200 398 533 565 712 839 433 M odelo 20 546 319 632 574 266 441 1268 1403 3819 2571 M odelo 18 467 28 40 86 39 10 29 37 M odelo 13 436 562 457 35 70 125 106 270 358 190 M odelo 7 0 0 0 0 0 0 2 94 1747 1883 M odelo 8 0 0 0 465 608 285 28 88 75 26 36 38 21 Per io d o Gráfico 41: Barras detallado cantidades por modelos averiados Para cada uno resultados obtenidos de la explotación de datos aplicando los modelos de clasificación se han obtenido los conjuntos de reglas necesarios para establecer la ocurrencia de los resultados linealmente. Por razones prácticas no se exponen en el proyecto el detalle de las reglas pero las mismas pueden formar parte de futuras líneas de desarrollo de minería de datos para la identificación de las reglas que llevan a la ocurrencia de las averías. Resumiendo el resultado de los agrupamientos generados a partir del algoritmo de Clustering se observan los siguientes patrones de comportamiento. Estos resultados pueden ser diferenciados para los tipos de averías de mayor ocurrencia en todo el conjunto de datos estudiado. Por cuestiones de practicidad los patrones expuestos a continuación representan el más alto porcentaje de probabilidad de ocurrencia en relación a los datos analizados. Debido a que la herramienta de clustering utilizada en el proyecto se basa específicamente en el valor de los atributos y no en las relaciones entre los mismos sería necesario para afinar los resultados introducirlos o analizarlos a través de algoritmos de inducción. La aplicación de algoritmos de inducción sobre los resultados del agrupamiento por cada periodo o cada explotación de datos en esta industria puede formar parte de líneas futuras de investigación muy interesantes a desarrollar. Como resultado del agrupamiento de averías se pueden especificar los siguientes patrones: • • • • • • • Capot, Abollado, Observada. Abollado, Leve. Abollado, Observada. Ingreso a Puerto, Abollado. Transferencia ubicación y línea de carga, Abollado. Abollado. Subida Buque Puerto de Origen, Luneta trasera / Cristal puerta trasera, Arrancado - Roto – Fisurado, Grave. Página 243 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Arrancado - Roto – Fisurado, Observada. Paragolpe delantero / Protector delantero, Arrancado - Roto – Fisurado, Observada. Arrancado - Roto – Fisurado, Observada. Modelo 17, Arrancado - Roto – Fisurado. Manijas externas de puertas delanteras, Faltante, Observada. Subida a Buque, Tapa acceso gancho remolque, Faltante. Faltante, Grave. Faltante, Leve. Modelo 8, Faltante. Faltante. Modelo 13, Faltante. Conjunto carrocería, Manchado, Observada. Modelo 5, Otros, Manchado, Observada. Paragolpe delantero / Protector delantero, Manchado, Observada. Spoiler delantero, Manchado, Observada. Manchado, Observada. Guardabarro trasero derecho, Pintura saltada. Modelo 17, Llanta delantera derecha, Pintura saltada. Llanta trasera derecha, Pintura saltada, Observada. Paragolpe delantero / Protector delantero, Pintura saltada, Observada. Modelo 9, Pintura saltada, Mediano. Pintura saltada, Observada. Cable de carga, Proyección. Retiro de Puerto, Proyección, Mediano. Proyección, Observada. Proyección. Retiro de Puerto, Capot, Rayado – Rozado. Llanta trasera izquierda, Rayado – Rozado, Observada. Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada. Transferencia ubicación y línea de carga, Manijas externas de puertas delanteras, Rayado - Rozado Manijas externas de puertas traseras, Rayado – Rozado, Mediano. Modelo 17, Otros, Rayado – Rozado. Panel trasero bajo baúl, Rayado – Rozado, Observada. Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada. Retiro de Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada. Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada. Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada. Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada. Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero, Rayado – Rozado. Página 244 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado. Paragolpe delantero / Superior, Rayado – Rozado, Mediano. Modelo 20, Paragolpe delantero / Superior, Rayado – Rozado, Observada. Subida Buque Puerto de Origen, Paragolpe delantero / Superior, Rayado – Rozado. Paragolpe delantero / Superior, Rayado – Rozado. Modelo 13, Puerta delantera derecha, Rayado – Rozado. Retiro de Puerto, Rayado – Rozado. Modelo 13, Retrovisor externo izquierdo, Rayado – Rozado. Subida a Buque, Spoiler delantero, Rayado – Rozado, Mediano. Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada. Ingreso a Puerto, Spoiler delantero, Rayado – Rozado, Observada. Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado, Observada. Spoiler delantero, Rayado – Rozado, Observada. Bajada de Buque, Spoiler delantero, Rayado – Rozado. Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado. Tapa posterior de techo, Rayado – Rozado, Observada. Tapizado interno puerta delantera izquierda, Rayado – Rozado. Subida a Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado, Observada. Rayado – Rozado, Grave. Rayado – Rozado, Leve. Rayado – Rozado, Mediano. Modelo 20, Rayado – Rozado, Observada. Subida a Buque, Rayado – Rozado, Observada. Rayado – Rozado, Observada. Modelo 20, Rayado – Rozado, Observada. Rayado – Rozado, Observada. Modelo 20, Rayado – Rozado, Observada. Rayado – Rozado, Observada. Bajada de Buque, Rayado – Rozado. Ingreso a Puerto, Rayado – Rozado. Paragolpe trasero / Spoiler trasero, Rayado – Rozado. Transferencia ubicación y línea de carga, Rayado - Rozado. Modelo 10, Rayado - Rozado. Rayado – Rozado. Modelo 5, Rayado – Rozado. Modelo 13, Rayado – Rozado. Moldura protectora lateral derecha, Rayado – Rozado. Modelo 20, Rayado – Rozado. Cubierta trasera derecha, Reventado – Estallado, Observada. Reventado - Estallado. Alerón. Barras de techo. Capot, Observada. Conjunto carrocería, Observada. Página 245 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Cubierta delantera izquierda. Faro delantero izquierdo / derecho, Mediano. Subida Buque Puerto de Origen, Guardabarro trasero derecho. Llanta trasera izquierda, Observada. Manijas externas de puertas traseras, Observada. Manijas externas de puertas traseras. Panel lateral derecho, Observada. Parante delantero, Observada. Modelo 9, Parrilla delantera, Observada. Parrilla delantera. Retrovisor externo derecho, Grave. Retrovisor externo derecho, Observada. Separador interno de carga. Tapa acceso gancho remolque, Observada. Tapa posterior de techo, Mediano. Tapa posterior de techo, Observada. Tapa posterior de techo. Techo (inclusive convertible) . Techo corredizo, Observada. Zócalo derecho, Grave. Zócalo derecho, Observada. Zócalo derecho, Grave. Modelo 13, Grave. Transferencia ubicación y línea de carga, Leve. Modelo 16, Mediano. Subida Buque Puerto de Origen, Observada. Transferencia ubicación y línea de carga, Observada. Modelo 13, Observada. Modelo 7, Observada. Modelo 13, Observada. Modelo 20, Observada. Modelo 16, Observada. Subida a Buque. Transferencia ubicación y línea de carga. Modelo 17. Modelo 9. Modelo 13. Ingreso a Puerto, Capot, Rayado – Rozado. Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado. Ingreso a Puerto, Paragolpe trasesro / Zona contacto, Rayado – Rozado. Subida a Buque, Rayado – Rozado, Grave. El resumen expuesto anteriormente incluye todos los resultados coherentes en función de la relación entre sus atributos. La lista anterior muestra todos los resultados de la explotación de datos de clustering; esto es partes, averías y gravedades; daños por lugar y daños por modelos. Página 246 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Para resumir los resultados del Modelo de Predicción se puede decir que se hicieron los siguientes procesos y los mismos agruparon la ocurrencia de partes averiadas, tipos de averías, lugares donde se producen las averías y modelos con averías como se especifica a continuación. Al igual que en el caso de los agrupamientos en los modelos de predicción empleados sería viable y necesaria el estudio y aplicación de algoritmos de inducción debido a que los resultados generados por sus atributos se basan en el valor numérico y no en la relación entre ellos. Las partes predictivas resultantes a lo largo de los 10 periodos son: • • • • • • • • • • • • • • • Manual Cubierta delantera derecha Escape Guardabarro delantero derecho Guardabarro trasero derecho Llanta delantera derecha Llave Manijas externas de puertas traseras Panel trasero bajo baúl Puerta delantera derecha Puerta trasera derecha Tapa acceso gancho remolque Taza Alerón Aerosol antipinchazos Estos resultados fueron obtenidos realizando la variación del tipo de avería y la gravedad de los mismos por cada periodo. Estas partes resultantes de los procesamientos de datos representan el 15 % de la cantidad de partes posibles de participación en un siniestro. En cuanto a los tipos de averías se puede ver un comportamiento mucho más acotado en cantidad: • • • Faltante Abollado Proyección A pesar que la cantidad resultante resumida es menor que en el análisis de partes, en este caso los tipos de averías representan el 27 % del total de tipos de averías entre las cuales se puede encontrar un siniestro. En referencia a los lugares donde se producen las averías el resultado arrojó el siguiente valor: • • • • Bajada de Buque Ingreso a Puerto Retiro de Puerto Salida de Planta En este caso se puede ver que la posibilidad que se encuentre una avería en la subida a un buque es tan baja como para que el modelo de predicción no la considere como resultado posible. Lo mismo Página 247 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS sucede con las averías encontradas en la subida a un buque en puerto de origen, si bien en ese punto de control se han encontrado gran porcentaje de las averías en estudio el modelo no arroja como resultado posible de ocurrencia en su predicción. Finalmente se observa que de los modelos de auto explotados en el presente estudio el resultado se resume a la ocurrencia de: • • • • • • • • • Modelo 9 Modelo 17 Modelo 16 Modelo 15 Modelo 14 Modelo 13 Modelo 12 Modelo 11 Modelo 10 En este caso representan el 45 % de la cantidad de modelos posibles de aparecer. Procesamiento de información La información fue procesada según la siguiente distribución de datos dentro de cada software: • • • Explotación de datos usando Árbol de Clasificación: Tipo de Averías, Lugares y Modelos de autos. Para cada herramienta se ingresan las columnas de daños distribuidas según el formato parte + avería + gravedad. Explotación de datos usando Clustering de Averías, Modelos averiados y Lugares donde se producen las averías. La distribución de datos se realiza encolumnando las averías en función del formato parte más avería y más gravedad. Explotación de datos usando Modelo de Predicción de Averías, Lugares donde se producen las averías, y Modelos averiados. El ingreso de datos a cada modelo se realiza según el formato parte + avería + gravedad. En el procesamiento de datos vinculado directamente a los lugares donde se producen las averías se realizan dos actividades: 1. Agrupar en función de la imputabilidad a la salida de planta dos de los puntos de control. Estos puntos se identifican en el proyecto como Salida de Planta y la imputabilidad es a Calidad o Línea de Producción. 2. Y para el caso específico de los datos relacionados con el punto de control Subida a Buque en Puerto de Origen se realiza la salvedad que la imputabilidad del daño está distribuida entre los daños producidos por el transporte terrestre y la playa de puerto (donde también se debe incluir la estiba). Todos los modelos de datos son explotados para cada periodo desde el año 2003 hasta mediados del año 2008. El proyecto se ha desarrollado sobre 7 puntos de control. El total global de inspecciones realizadas para obtener la información es de 595393 inspecciones distribuidas entre los 7 puntos de control. El número total de autos es de 183926 unidades inspeccionadas a lo largo de las cadenas de logísticas, estas unidades corresponden a 20 tipos de modelos de autos diferentes. Finalmente y Página 248 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS como se mencionó en la etapa de Preparación de Datos el número total de registro de daños explotados en el proyecto es de 50246. Planes alternativos Un plan alternativo de desarrollo de minería de datos puede ser el que se detalla a continuación. - Extracción de datos en formato SQL desde las bases de datos. Normalización y transformación de datos si es necesario. Generación de registros con el formato: parte, avería, gravedad, modelo, y lugar. Distribución de las tablas para introducir los datos en función de periodos por columna. El modelo de Clustering se forma por las columnas: • • • • • • • • • • - Periodo 1 Periodo 2 Periodo 3 Periodo 4 Periodo 5 Periodo 6 Periodo 7 Periodo 8 Periodo 9 Periodo 10 Luego para cada periodo / columna introducir los registros extraídos de la base de datos. O sea que se puede invertir la introducción de los datos a ser explotados para procesar por separado partes, luego averías, luego lugares, etc. Otro plan alternativo que puede resultar interesante para la industria es el de separar la información por lugar y luego procesar cada lugar independientemente. Esto quedaría conformado de la siguiente forma: • • • • • Punto de control salida de línea de producción. Punto de control ingreso a puerto. Punto de control despachos de puerto. Punto de control subidas a buque. Punto de control bajada de buque. Luego para cada lugar donde se produce la información se ingresa en cada modelo según el procesamiento actual los datos vinculados a las averías en formato parte más avería y más gravedad. Dentro de cada uno de los puntos de control se pueden encontrar más de una compañía responsable por el movimiento de la unidad automotriz por lo que también puede ser una línea de análisis valida para llevar a la práctica la realización de una subdivisión por cada lugar en función de la compañía que interviene. Continuando con ese análisis la minería de datos también puede ser llevada a cabo distribuyendo los grupos de datos por imputabilidad. Esto sería: Página 249 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • Averías provocadas por líneas marítimas. Averías producidas por transportes terrestres. Averías de calidad. Averías de puerto o playa. Y cada grupo contendría en la explotación de datos los códigos de averías en formato parte más avería más gravedad. En resumen y concluyendo con la mención de los planes alternativos que se podrían llevar a la práctica en un proyecto de minería de datos se puede decir que al contar con la información normalizada desde la producción de la misma (inspecciones según los estándares) pasando por la captura de datos y llegando a su almacenamiento en bases de datos centralizadas las estrategias para un futuro procesamiento de datos aplicando técnicas de minería de datos solo depende de los requerimientos de las partes interesadas en la industria y la creatividad de los responsables de llevar a cabo el proyecto. El descubrimiento de la información obtenida a partir del presente proyecto directamente podría ser usado para consolidar prácticas empíricas realizadas en la industria. Se puede dar un marco teórico por ejemplo al hecho de trabajar siempre sobre la base que el comportamiento de los tipos de averías siempre esta vinculado directamente a 4 tipos del total que impone el estándar de inspección de este estudio. Esto está justificado debido a que la ocurrencia de averías se produce con cuatro tipos de averías que participan en un porcentaje medio del 96 % del total en explotación. 8.6.2. Supervisión y mantenimiento del plan La supervisión y el mantenimiento de la implementación del presente proyecto es importante debido a que los datos que se procesan diariamente pueden ser modificados por el personal operativo de la compañía. Los datos son modificados por diferentes motivos como puede ser haber realizado una codificación incorrecta, haber asignado una imputabilidad incorrecta, etc. El volumen de datos en movimiento diario es grande y dinámico motivo por el cual la extracción de las muestras debe ser realizada cuidadosamente y realizando backups de los datos explotados por cada proceso. La minería de datos debería ser realizada por periodos de 6 meses. En función del presente proyecto se puede establecer el semestre como una unidad de medida representativa importante para la obtención de resultados prácticos. Como plan de supervisión y mantenimiento se podría establecer: - - Extracción y almacenamiento semestral de datos guardando en formato de hoja de cálculo toda la información. Verificación de los modelos de autos y lugares de inspección que intervienen. Si aparecen nuevos puntos de control o nuevos modelos se debe proceder a su codificación. Distribución de los datos en función de los modelos de software de minería de datos a trabajar. Los archivos de la explotación de datos semestrales deben ser guardado en soporte magnético en la compañía. Lo conveniente es almacenar en carpetas y por procesos semestralmente. Página 250 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS - - Los resultados obtenidos por cada explotación de datos debe ser llevado a formato de hoja de cálculos con generación de gráficos de barras y tortas para una mejor visión e interpretación de los resultados obtenidos por cada periodo. Al final de cada proceso de minería de datos la evaluación de los resultados debe ser realizado por un equipo compuesto por la parte operación encargada de la captura de la información y el área de tecnología de la compañía. 8.6.3. Producción de Informe definitivo La utilización de la metodología CRISP-DM para este proyecto ha permitido encontrar un comportamiento predictivo de los daños y/o en función del estándar utilizado para la realización de la inspección de unidades. Se ha podido encontrar un plan de extracción, normalización, y codificación de datos para la realización de procesos de minería de datos semestrales. Como se ha mencionado en puntos anteriores además estos procesos de minería de datos pueden tener como objetivos otros aspectos como pueden ser: realizar procesos de minería sobre las averías producidas en determinados puntos de control, por determinadas compañías o por tipos de imputación. Entre los objetivos logrados por la aplicación de la metodología se puede mencionar: • • • • • • • • • • Se han determinado los daños y/o averías para cada periodo. Se han determinado responsabilidades en la siniestralidad en función del tipo de avería y tipo de transporte por cada periodo. El estudio de las averías ha permitido encontrar un referente de imputación estableciendo patrones de comportamiento. Se han podido encontrar los tipos de averías y sus porcentajes de ocurrencia por cada periodo. Las partes averiadas han sido identificadas como así también las cantidades y porcentajes de ocurrencia en cada periodo. El comportamiento de los daños ha sido establecido especificando la gravedad de los mismos. Se han establecido cuales son los modelos de autos más afectados por los daños como así también las partes que normalmente aparecen averiadas en las unidades. Los lugares donde se producen las averías han podido ser identificados como así también las partes y tipos de averías. Se han especificado las cantidades de averías por tipos de transportes, partes averías, tipos de averías, lugares donde se producen las averías y los modelos afectados. En referencia a información “oculta” descubierta en el proyecto lo más importante fue lo relacionado con la cantidad de tipos de avería normalmente producidos, las partes normalmente afectadas y los modelos mayoritariamente averiados. La presentación final del proyecto se encuentra en el anexo 5. En este se encuentra un subconjunto de resultados obtenidos como así también la explicación global de la metodología utilizada y los pasos a seguir en la implementación práctica. Página 251 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 8.6.4. Revisión del proyecto Entre las cosas acertadas para el desarrollo del proyecto actual se puede decir que la determinación de la división en periodos de tipo ha sido determinante para poder encontrar un estándar de cantidad de tiempo para realizar la explotación de los datos. Posiblemente uno de los errores en el proyecto fue el hecho de no invertir las columnas de datos a ser explotados dentro de cada modelo. Lo acertado dentro de la explotación de datos de proyecto se puede mencionar la Evaluar que fue lo correcto y que fue lo errado, cual fue el éxito obtenido, y que necesidades serán mejoradas. Posiblemente para futuros proyectos haya que analizar la posibilidad de evitar el procesamiento o la obtención de resultados inconsistentes debido a la combinación de partes con tipos de averías que en la realidad no aparecen. Este proyecto puede ser de utilidad para especificar en el software de captura o de almacenamiento en la base de datos todas las restricciones para el ingreso de averías con estructura inconsistente. Otro resultado interesante que se ha podido corroborar dentro de un contexto metodológico debido a la explotación de datos desde el 2003 a mediados del 2008 con la base de datos en cuestión es que el cambio de compañía de inspección en el punto de control “Subida a Buque en Puerto de Origen” ha generado un cambio significativo en la detección de daños y/o averías. Los motivos que provocaron ese comportamiento distintivo en los datos no son discutidos en el presente proyecto, pero si se puede decir que para evitar este inconveniente en futuros proyectos de minería de datos uno de los caminos factibles para explotar los datos puede ser el de agrupar la información por puntos de control o por tipo de imputación. Página 252 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 9. Conclusiones A partir del análisis de los diferentes métodos para el desarrollo de esta minería de datos se puede concluir que la metodología CRISP-DM es apropiada para la explotación de datos en esta industria. Posiblemente en futuros proyectos podrían utilizarse otras herramientas de software pero en términos generales es apropiado considerar al presente proyecto con todos los pasos y las herramientas de software para la minería de datos en la detección de patrones de daños y/o averías. Otro de los motivos por los cuales resulta apropiado trabajar con la metodología mencionada anteriormente es que es totalmente independiente de las herramientas de software. Esto último, característica particular de CRISP-DM, es una de las grandes ventajas sobre otras metodologías. Además, siguiendo los pasos según lo detalla la metodología se ha probado que es completa y flexible por lo cual es aconsejable recomendarla como base metodológica para futuros proyectos en la industria de automóviles. Como se ha mencionado a lo largo del presente trabajo en la industria automotriz a nivel global existen diferentes estándares de inspección, codificación y sistemas de captura de datos por lo tanto la generalidad que presenta la metodología CRISP-DM le permite hacerse recomendable para futuras implementaciones. Cambiar de un estándar a otro no representa inconvenientes importantes para la explotación de información. En referencia a la minería de datos realizada también se puede concluir que la misma puede tomar formas diferentes de explotación de datos tanto a nivel de formato de registros como a los periodos de tiempos en los cuales se puede distribuir la información. El sistema de datos está normalizado casi en su totalidad. En relación a las cantidades consideradas estadísticamente para la ocurrencia de los diferentes siniestros se observa de forma clara como es su distribución. Inclusive los resultados obtenidos desde el punto de vista práctico permiten establecer como patrones de comportamiento los tipos de averías y los modelos afectados en este nicho de mercado específico (considerando el estándar de inspección para la toma de datos y los modelos de autos que intervienen en este proyecto particularmente). Si bien los resultados del trabajo muestran patrones de comportamiento satisfactorios es interesante ver que se pueden realizar más combinaciones para la explotación de datos en lo que se refiere a los lugares, modelos de autos o tipo de formato de registros introducidos en cada modelo de software. Inclusive puede también considerarse como parámetro de separación las empresas responsables en cada punto de control. Teniendo en cuenta lo expuesto en los puntos iniciales de esta tesis se puede decir que cualquiera sea el problema a resolver y con cualquier estándar de inspección no existe una única técnica para solucionarlo, sino que puede ser resuelto con distintas herramientas. Los aspectos estadísticos de la minería de datos aquí pueden dar resultados globales que permitan guiar el proyecto en esta industria hacia los aspectos inteligentes de explotación de datos. Esto es, posiblemente sea conveniente comenzar los proyectos de data mining en esta industria con técnicas estadísticas y luego en la medida que se va profundizando en el análisis y conocimiento de los resultados se puede ir hacia la aplicación de sistemas inteligentes. La aplicación del Árbol de Clasificación es totalmente óptima para este proyecto y en futuros proyectos de minería de datos de esta industria. Inclusive independientemente de la distribución o el Página 253 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS agrupamiento de la información. Resulta de alta importancia siempre utilizarlo al inicio de cada explotación de datos para tener una referencia clara de la situación global de las cantidades de datos. El modelo gráfico de los resultados obtenidos detallando cantidades y porcentajes en toda la distribución en forma de tortas permite ver, seguir y analizar en todos los momentos del proyecto la información y coherencia con que se va trabajando. Cada Árbol de Clasificación del software utilizado genera las reglas de producción de cada nodo. Esas reglas pueden ser aplicables directamente al desarrollo de cualquier software para la administración de datos en el proceso de almacenamiento de información. Constituirían las denominadas reglas de negocio para la validación de datos de partes con tipos de averías y gravedades. En este trabajo las reglas no han sido incluidas debido a su gran cantidad y a que cada una tiene que ser sometida a un estudio previo para filtrarlas. En cuanto al Clustering quizás sea necesario estudiar la posibilidad de trabajar con matrices de menor tamaño puesto que este estudio ha demostrado que se necesita mucho tiempo de computación para el procesamiento de matrices de 10 x 10 y posiblemente no se justifique debido a la similitud obtenida en los resultados con otras matrices de menor tamaño. Otro factor a ser estudiado es la aplicación o no de la gravedad de las averías puesto que pueden no ser necesarias, pero no se debe dejar de lado que quizás el estándar lo precise. También se puede realizar la explotación de datos con está técnica considerando solamente datos relacionados con las partes por un lado por periodos, o bien por tipos de averías en determinados periodos, o por lugares o modelos en diferentes periodos. Es decir que la combinación de posibilidades en función de la gran cantidad de información disponible es muy alta y es posible considerar que lo más importante es que con este proyecto de tesis se ha podido demostrar la viabilidad de líneas de investigación futuras con la aplicación del agrupamiento como técnica de explotación de datos. Es interesante ver también que la combinación de posibilidades para la producción de los centroides es grande debido al sistema de codificación con el que se trabaja en el registro de averías en la industria y al sistema de datos normalizado desde donde se extraen los datos. O sea que es posible obtener resultados finales válidos y erróneos a partir de la explotación. Los errores son descubiertos a partir de la inconsistencia entre las combinaciones posibles de: partes más averías más gravedades. Si bien los resultados obtenidos son satisfactorios es importante destacar que es necesario trabajar, en etapas posteriores o en una futura implementación de esta metodología en la industria, con algoritmos de inducción para tratar de mejorar la explotación de datos en lo que respecta a la relación entre ellos. Como se ha mencionado a lo largo de este proyecto de tesis la tendencia de las técnicas empleadas hacia el valor de los atributos y no entre sus relaciones muestra que algunos de los datos resultantes son inconsistentes con la realidad. Algunas de las herramientas posibles de utilizar pueden ser árboles de decisión o de clasificación. En relación al Modelo de Predicción es importante su aplicación y determinante a la hora de encontrar los patrones de ocurrencia en las averías, lugares, partes averiadas y modelos de autos averiados. Al igual que con las otras dos herramientas utilizadas se han dejado fuera de este trabajo algunos de los resultados obtenidos. Esto es, para el caso de las variaciones posibles de realizar entre determinado rango de tipos de averías o partes la ocurrencia de los resultados predictivos puede variar. Las pendientes obtenidas sobre las tendencias pueden ser positivas o negativas, y también pueden tener como ocurrencia de resultados posibles un determinado rango de valores. Estos últimos son Página 254 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS aspectos matemáticos que estudiados profundamente pueden dar información útil sobre el comportamiento o la predictibilidad de las averías. Además, también como en el caso del Clustering es posible realizar la búsqueda de otro tipo de predicciones como por ejemplo determinados tipos de averías en determinados meses del año. O bien, se puede realizar la predicción sobre partes solamente en determinados periodos, o lugares o modelos de autos. Este software de predicción empleado también se basa fuertemente en el valor de sus atributos más que en la relación entre ellos en los resultados finales por lo que sería conveniente también como el caso del Clustering trabajar con algoritmos de inducción para mejorar los resultados. Concluyendo con el resultado de la utilización del software empleado la información de esta industria en su formato tradicional y con el sistema de seguimiento almacenado en una base de datos central puede ser explotada en un proyecto de minería de datos con la aplicación de técnicas como el clustering, la clasificación o la predicción. Los periodos de tiempo para el desarrollo de una minería de datos en la industria podría ser el semestre. La muestra semestral de datos es considerada suficiente como para lograr los objetivos según se plantearon en el presente proyecto de tesis, y teniendo en cuenta el movimiento de los vehículos de mercado argentino. Los tipos de transportes también pueden determinar los límites y alcances de un proyecto de minería de datos para detectar patrones de comportamiento. También es importante mencionar como conclusión de este proyecto que la estructura de las bases de datos desde donde se extrajo el mayor porcentaje de información contiene todas las relaciones y el formato necesarios para el desarrollo de cualquier tipo de herramienta de software para la gestión de la información. O sea que es recomendable para el desarrollo de aplicaciones de software de captura o almacenamiento de información para cada punto de control de una cadena logística, realizar un análisis detallado de las combinaciones posibles de averías o tipos de averías en función de esta base de datos. El mecanismo para la obtención de las reglas de negocios para aplicaciones informáticas en el seguimiento y control de siniestros de este estudio no esta desarrollada en este mercado, motivo por el cual este proyecto puede servir de antecedente para mostrar lo lineamientos generales a tener en cuenta para el desarrollo de la tecnología en la industria automotriz. El descubrimiento de patrones de comportamiento de las averías o los resultados estadísticos en la explotación de datos realizada en este trabajo permite definir el camino que se debe seguir para la realización de presupuestos y la definición de políticas de distribución de los operadores logísticos encargados de los movimientos de los automóviles 0 KM. Teniendo en consideración que el costo de producción de las unidades es menor al costo de su posterior distribución desde que sale de línea de producción hasta que llega a su destino final, hace de la minería de datos con técnicas estadísticas e inteligentes una alternativa más que importante para ser desarrollada por las empresas interesadas en el descubrimiento de patrones de comportamiento como así también en el control y asignación de responsabilidad por siniestralidad. Página 255 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 256 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 10. Líneas futuras de investigación Las líneas futuras de investigación pueden ser las siguientes: • • • • • • • Implementación de la metodología para el estudio de comportamiento de averías agrupando la información por empresas responsables de siniestros. Desarrollo de la metodología con información extraída de base de datos con otros estándares de inspección de unidades. Se recuerda que cada compañía puede tener su propio estándar de inspección el cual define el formato en el que los registros pueden ser explotados. Al igual que la implementación por empresas responsables también se puede procesar la información para determinadas marcas o modelos de autos. Implementación de proyecto con datos agrupados en función de la imputabilidad también es otra futura línea de investigación viable. Con la aplicación del Modelo de Clasificación se puede extraer todo el conjunto de reglas de negocio generado para ser aplicado en el software tanto de captura de datos como en la aplicación que alimenta la base de datos. Esto es, a partir de las reglas generadas por el modelo validar todos los datos que ingresan al sistema. Como se ha mencionado en otros ítems a lo largo de esta tesis también es viable la explotación de datos de este sistema de información considerando cada uno de los puntos de control por separado. El Modelo de Clstering también puede ser considerado definiendo matrices de menor tamaño. En cuanto a la utilización de nuevas herramientas o herramientas complementarias para el tratamiento de la información en esta industria es necesario hacer mención como posibles líneas futuras de investigación la utilización de algoritmos de inducción. Tanto en el Clustering como en el Modelo de Predicción los resultados obtenidos hacen hincapié fundamentalmente en sus valores numéricos y no en la relación entre los atributos. O sea que antes de dar los resultados finales de la aplicación de cada modelo sería conveniente una introducción previa de los mismos en algoritmos que permitan una aproximación más cercana a la realidad en lo referente a la relación entre los datos procesados. Concluyendo con los posibles caminos de investigación se puede hacer referencia a que en esta industria uno de los sistemas de información estándares en el mundo (seguimiento y control de unidades automotrices) es el que se ha expuesto en el presente proyecto. Con la información normalizada electrónicamente es posible su estudio y explotación con la aplicación de la metodología CRISP-DM considerando diferentes tipos de agrupación de datos y distintas herramientas de software para obtener resultados exitosos para los interesados. Página 257 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 258 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 11. Bibliografías y Documentación Britos, P., et al, Minería de Datos, Basada en Sistemas Inteligentes (Editorial Nueva Librería, 2005). De Ville, B., Microsoft Data Mining: Integrated Business Intelligence for e-Commerce and Knowledge Management (Butterworth-Heinemann, 2001). Diché, J., E-data, Transformando datos en información con Data Warehouse (Editorial Prentice Hall, 2001). Gill, H. y Rao, P., Data Warehousing, la integración de información para la mejor toma de decisiones (Editorial Prentice Hall 1996). Groth, R., Data Mining: A Hands-On Approach for Business Professionals (Editorial Prentice Hall PTR, 1998). Han, J. y Kamber, M., Data Mining: Concepts and Techniques (Editorial Morgan Kauffman Publishers, 2001). Hernández, O., Introducción a la Minería de Datos (Editorial Pearson Educion, 2004). Hornick, F., et al, Java Data Mining: Strategy, Standard, and Practice: A Practical Guide for architecture, design, and implementation (The Morgan Kaufmann Series in Data Management Systems) (Elsevier Inc., 2007). Inmon, W., Building the Data Warehouse (Editorial John Wiley & Sons, Inc., 2002). Jean-Michel Franco y EDS-Instituc Prometheus, El Data Warehouse, El Data Minning (Ediciones Gestión 2000, 1997). Jean-Pasal, A., Inteligencia Artificial (Editorial Paraninfo, 1986). Larose, T., Data Mining Methods and Models (John Wiley & Sons, Inc., 2006). Mccorduck, P., Máquinas que piensan, historia de la Inteligencia Artificial (Editorial Tecnos, 1991). Mundy, J., et al, The Microsoft Data Warehouse Toolkit: With SQL Server 2005 and the Microsoft Business Intelligence Toolset (Wiley Publishing, Inc., 2006). Nilsson Nils, J., Inteligencia Artificial Una Nueva Síntesis (Editorial MCGrow-Hill, 2001). Pajares Martinsanz, G., Inteligencia Artificial e Ingeniería del Conocimiento (Editorial Alfaomega Grupo Editor, 2006). Peña, D., Análisis de datos Multivariantes (Editorial McGraw Hill/Interamericana de España, 2002). Pérez López, C. y Santin Gonzalez, D., Minería de Datos, Técnicas y Herramientas (Editorial Paraninfo, 2007). Russel, S y Norvig P., Inteligencia Artificial - Un Enfoque Moderno (Editorial. Pearson Education, 2003). Singh, H., Data Warehousing (Editorial Prentice Hall, 1998). Sitio de ADEFA (Asociación de Fábricas de Automotores) http://www.adefa.com.ar (Octubre, 2007). Sitio de comunidad de personas interesadas en compartir conocimiento sobre temas relacionados con los datos, y como tratarlos para transformarlos en información que a su vez nos permita obtener conocimiento y saber: http://www.dataprix.com/categorias-de-dataprix. Sitio de Estadística (Metodología para el desarrollo de proyectos de Data Mining) http://www.estadistico.com/arts.html?20040426 (Septiembre, 2007). Sitio de ITBA (Instituto Tecnológico Buenos Aires, Centro de Ingeniería de Software e Ingeniería del Conocimiento, Escuela de Postgrado) http://www.itba.edu.ar/capis/webcapis/planma-esp.html (Septiembre de 2007). Sitio de Metodología CRISP-DM (Cross Industry Standard Process for Data Mining) http://www.crisp-dm.org (Agosto, 2007). Sitio de Microsoft http://technet.microsoft.com/es-es/library/ms174861.aspx (Octubre, 2007). Sitio de SAMAS (Sociedad Argentina de Mastología) http://www.samas.org.ar (Agosto, 2007). Página 259 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Sitio de SECYT (Biblioteca Electrónica de Ciencia y Tecnología) http://www.biblioteca.secyt.gov.ar (Agosto, 2007). Sitio de Universidad de Sevilla http://www.us.edu.es (Septiembre, 2007). Sitio de Universidad Politécnica de Madrid http://www.upm.es (Septiembre, 2007). Sitio de Universidad Politécnica de Valencia http://www.upv.es (Septiembre, 2007). Tang, Z. and MacLennan, J., (Author), Data Mining with SQL Server 2005 (Wiley Publishing, Inc., 2005). Página 260 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 12. Anexos Anexo 1: Terminología de negocio. Término Area Avería Bajada de buque Barcaza Batea Buque Cadena logística Check point Códificación de avería Colector de datos CP Dealer Estándar de inspección Gravedad Hand held Ingreso a puerto Línea de producción Línea de transferencia Patio Perito Perito naval Playa Proyección Retiro de puerto Severidad Spoiler Subida a buque Significado Parte de un vehículo. Tipo de daño. Operación de translado de un auto desde un barco hacia el puerto. Buque específicamente usado para transporte de autos. Camión con estructura para transporte de vehículos. Barco especial acondicionada y dimensionada para el transporte de automóviles, camiones, tractores, etc. Conjunto de lugares por donde va pasando una determinada unidad automotriz. Punto de control. Sistema de código establecido para tomar un daños. Por ej. Parte + Avería + Gravedad. Equipo electrónico de datos con lector de código de barras. Punto de control. Punto final de distribución de una cadena logística. Conjunto de reglas para establecer un criterio de inspección donde se especifica como inspeccionar y define como son las averías en función de un nivel de importancia. Nivel de un daño. Colector de datos elctrónico con lector de código de barras. Entrada de autos a la playa de un puerto. Fábrica donde se producen los autos. Lugar donde se transfiere una unidad luego de su salida de planta. Lugar donde se almacenan vehículos. Inspector que verifica estado de un vehículo. Persona que realiza inspección de barcos y sus cargas. Lugar donde se almacenan vehículos. Tipo de daño colectivo que provine de una variedad de acciones. Salida de autos de la playa de un puerto. Gravedad de un daño. Alerón u otro elemento de la carrocería de un automóvil que sirve para hacerlo más aerodinámico. Operación de translado de un auto desde la playade puerto hacia un barco. Página 261 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Survey Surveyor Transponder Operación de inspección autos. Persona que realiza un inspacción de un auto. Dispositivo a bordo de un auto que recibe señales de radio correspondientes a una banda de frecuencias determinada, las amplifica y desplaza su frecuencia a otra del espectro y la retransmite. Transporte marítimo Transporte terrestre Trincado Sistema de traslado de autos por mar. Sistema de traslado de autos por tierra. Forma de amarrar un auto al piso de un buque. Anexo 2: Terminología de minería de datos. Término Algoritmos genéticos Significado Técnicas de optimización que usan procesos tales como combinación genética, mutación y selección natural en un diseño basado en los conceptos de evolución natural. Análisis de series de tiempo (time-series) Análisis de una secuencia de medidas hechas a intervalos específicos. El tiempo es usualmente la dimensión dominanate de los datos. Análisis exploratorio de Uso de técnicas estadísticas tanto gráficas como descriptivas para datos aprender acerca de la estructura de un conjunto de datos. Análisis prospectivo de Análisis de datos que predice futuras tendencias, comportamientos datos o eventos basado en datos históticos. Análisis retrospectivo de Análisis de datos que provee una visión de las tendencias, datos comportamientos o eventos basado en datos históricos. Árbol de decisión Estructura en forma de árbol que representa un conjunto de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos. Base de datos multidimensional CART Árboles de clasificación y regresión Base de datos diseñada para procesamiento analítico on-line (OLAP). Estructurada como un hipercubo con un eje por dimensión. Una técnica de árbol de decisión usada para la clasificación de un conjunto da datos. Provee un conjunto de reglas que se pueden aplicar a un nuevo (sin clasificar) conjunto de datos para predecir cuáles registros darán un cierto resultado. Segmenta un conjunto de datos creando 2 divisiones. Requiere menos preparación de datos que CHAID . Una técnica de árbol de decisión usada para la clasificación de un CHAID Detección de interacción automática de conjunto da datos. Provee un conjunto de reglas que se pueden aplicar a un nuevo (sin clasificar) conjunto de datos para predecir Chi cuadrado cuáles registros darán un cierto resultado. Segmenta un conjunto de datos utilizando tests de chi cuadrado para crear múltiples divisiones. Antecede, y requiere más preparación de datos, que CART. Página 262 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Clasificación Proceso de dividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo "más cercano" posible a otro, y grupos diferentes estén lo "más lejos" posible uno del otro, donde la distancia está medida con respecto a variable(s) específica(s) las cuales se están tratando de predecir. Por ejemplo, un problema típico de clasificación es el de dividir una base de datos de compañías en grupos que son lo más homogéneos posibles con respecto a variables como "posibilidades de crédito" con valores tales como "Bueno" y "Malo". Clustering (agrupamiento) Proceso de dividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo "más cercano" posible a otro, y grupos diferentes estén lo "más lejos" posible uno del otro, donde la distancia está medida con respecto a todas las variables disponibles. Computadoras con multiprocesadores Data cleansing Una computadora que incluye múltiples procesadores conectados por una red. Proceso de asegurar que todos los valores en un conjunto de datos sean consistentes y correctamente registrados. La extracción de información predecible escondida en grandes bases de datos. Sistema para el almacenamiento y distribución de cantdades masivas de datos. Datos que resultan de errores (por ej. errores en el tipeado durante la carga) o que representan eventos inusuales. En una base de datos relacional o plana, cada campo en un registro representa una dimensión. En una base de datos multidimensional, una dimensión es un conjunto de entidades similares; por ej. una base de datos multidimensional de ventas podría incluir las dimensiones Producto, Tiempo y Ciudad. Data Mining Data Warehouse Datos anormales Dimensión Modelo analítico Una estructura y proceso para analizar un conjunto de datos. Por ejemplo, un árbol de decisión es un modelo para la clasificación de un conjunto de datos. Modelo lineal Un modelo analítico que asume relaciones lineales entre una variable seleccionada (dependiente) y sus predictores (variables independientes). Modelo no lineal Un modelo analítico que no asume una relación lineal en los coeficientes de las variables que son estudiadas. Modelo predictivo Estructura y proceso para predecir valores de variables especificadas en un conjunto de datos. Navegación de datos Proceso de visualizar diferentes dimensiones, "fetas" y niveles de una base de datos multidimensional. Se refiere a aplicaciones de bases de datos orientadas a array que OLAP Procesamiento permite a los usuarios ver, navegar, manipular y analizar bases de analítico on-line (On Line Analitic prossesing) datos multidimensionales. Página 263 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Outlier Un item de datos cuyo valor cae fuera de los límites que encierran a la mayoría del resto de los valores correspondientes de la muestra. Puede indicar datos anormales. Deberían ser examinados detenidamente; pueden dar importante información. Procesamiento paralelo Uso coordinado de múltiples procesadores para realizar tareas computacionales. El procesamiento paralelo puede ocurrir en una computadora con múltiples procesadores o en una red de estaciones de trabajo o PCs. RAID Formación redundante de discos baratos (Redundant Array of inexpensive disks). Tecnología para el almacenamiento paralelo eficiente de datos en sistemas de computadoras de alto rendimiento. Técnica estadística utilizada para encontrar la mejor relación lineal que encaja entre una variable seleccionada (dependiente) y sus predicados (variables independientes). Regresión lineal Regresión logística Una regresión lineal que predice las proporciones de una variable seleccionada categórica, tal como Tipo de Consumidor, en una población. SMP Multiprocesador simétrico (Symmetric multiprocessor) Tipo de computadora con multiprocesadores en la cual la memoria es compartida entre los procesadores. Vecino más cercano Técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases del/de los k registro (s) más similar/es a él en un conjunto de datos históricos (donde k = 1). Algunas veces se llama la técnica del vecino k-más cercano. Anexo 3: Consultas estructuradas para base de datos. /*cantidad de inspecciones total*/ select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') /*cantidad de inspecciones por periodo*/ select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20031231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') Página 264 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040101' and '20040631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040701' and '20041231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050101' and '20050631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050701' and '20051231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060101' and '20060631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or Página 265 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060701' and '20061231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070101' and '20070631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070701' and '20071231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080701' and '20081231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') /*cantidad de unidades total*/ select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') Página 266 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS /*cantidad de unidades por periodo*/ select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20031231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040101' and '20040631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040701' and '20041231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050101' and '20050631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050701' and '20051231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo Página 267 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060101' and '20060631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060701' and '20061231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070101' and '20070631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070701' and '20071231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080701' and '20081231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') Página 268 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS /*cantidad de modelos*/ select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20031231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') and chasis.modelo='307' /*cantidad de abollados*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=54 and idaveria=6 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=51 and idaveria=6 and chasis.modelo='boxer' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=3 and idaveria=6 and (operativos.idcp=30) Página 269 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=6 group by idaveria, idarea order by idaveria, idarea /*cantidad de rayados*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=13 and idaveria=9 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=51 and idaveria=9 and chasis.modelo='307' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=8 Página 270 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS and idaveria=9 and (operativos.idcp=10 or operativos.idcp=300) select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=9 group by idaveria, idarea order by idaveria, idarea /*cantidad de pintura*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=73 and idaveria=5 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis where idarea=35 and idaveria=5 and chasis.modelo='c4' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=6 Página 271 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS and idaveria=5 and (operativos.idcp=360 or operativos.idcp=360) select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=5 group by idaveria, idarea order by idaveria, idarea /*cantidad de faltantes*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=41 and idaveria=7 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=34 and idaveria=7 and chasis.modelo='c3' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis Página 272 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=43 and idaveria=7 and (operativos.idcp=420 or operativos.idcp=420) select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=7 group by idaveria, idarea order by idaveria, idarea Anexo 4: Codificación Modelos de autos. Código 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Desccripción Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 Modelo 7 Modelo 8 Modelo 9 Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15 Modelo 16 Modelo 17 Modelo 18 Modelo 19 Modelo 20 Códigos de puntos de control Página 273 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Código 30 300 420 60 10 25 360 Descripción Bajada de Buque Transferencia ubicación y línea de carga Subida a Buque Retiro de Puerto Retiro Fábrica de Origen Subida Buque Puerto de Origen Ingreso a Puerto Códigos de tipos de transportes. Código 30 300 420 60 10 25 360 Descripción Transporte marítimo Transporte terrestre Transporte terrestre Transporte terrestre Transporte terrestre Transporte terrestre Transporte terrestre Códigos de partes. Código 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Descripción Spoiler delantero Paragolpe delantero / Protector delantero Capot Paragolpe delantero / Superior Parante delantero Techo (inclusive convertible) Techo corredizo Barras de techo Tapa posterior de techo Parabrisa Tapa de Baúl o Puerta Trasera Paragolpe trasero / Spoiler trasero Panel trasero bajo baúl Paragolpe trasero / Zona contacto Tapizado interno puerta delantera izquierda Zócalo interno puerta delantera izquierda Manijas externas de puertas delanteras Manijas externas de puertas traseras Aerosol antipinchazos Transponder Antena Página 274 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave Parrilla delantera Luz de neblina trasera Faro de stop luneta Retrovisor externo izquierdo Guardabarro delantero izquierdo Llanta delantera izquierda Cubierta delantera izquierda Zócalo izquierdo Guardabarros y parante trasero izquierdo Puerta delantera izquierda Puerta trasera izquierda Panel lateral izquierdo Moldura protectora lateral izquierda Tapa tanque combustible Insignia Alfombra baúl / caja de carga Luz de patente trasera Cable de carga Luz trasera izquierda Página 275 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 Cristales parante trasero / fijos Cristales fijos / Móviles paneles Plip Cerraduras de puertas Bajo chasis trasero Bajo chasis delantero Asientos delanteros / traseros Llanta trasera derecha Cubierta trasera derecha Giro guardabarros delantero derecho / izquierdo Faro delantero izquierdo / derecho Faro antiniebla / largo alcance Rejilla retenedora de carga Separador interno de carga Luneta trasera / Cristal puerta trasera Llave de rueda Cristales de puertas delanteras Cristales de puertas traseras Encendedor Sistema de navegación Stereo / Radio Compactera / Porta CD Apoya cabezas delantero / izquierdo / derecho Apoya cabezas trasero / izquierdo / centro / derecho Conjunto carroceria Batería Críquet Llanta trasera izquierda Cubierta trasera izquierda Rueda de auxilio Gancho de remolque xxxxxxxxxx Botiquín - Códigos de tipos de averías. Código 1 2 3 4 5 Descripción Quemado Arrancado - Roto - Fisurado Desgarrado - Cortado Reventado - Estallado Pintura saltada Página 276 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 6 7 8 9 10 11 Abollado Faltante Proyección Rayado - Rozado Manchado Exceso kilometraje Códigos de gravedades. Código 1 2 3 4 20 21 Descripción Intolerable Grave Mediano Leve Observada - Anexo 5: Presentación final. Carátula Presentación Final Detección de Patrones para la Prevención de Daños y/o Averías Ing. Hugo Daniel Flores Página 1 Presentación • • • • • • • • Detección de Patrones para la Prevención de Daños y/o Averías en Automóviles 0 KM. Metodología de desarrollo de minería de datos. Metodología CRISP-DM. Desarrollo de la industria automotriz. Procesos en la industria automotriz Información de la industria automotriz Aplicación de metodología de desarrollo de minería de datos. Conclusión. Página 2 Objetivos 1. Identificar daños y/o averías. 2. Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de transporte. Página 277 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS 3. 4. 5. 6. 7. 8. Imputar incidentes según el tipo de transporte. Determinar tipos de averías y/o daños. Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento. Especificar gravedad de daños y/o averías. Definir e identificar modelos con daños especificando partes, tipo de daño y gravedad. Especificar lugares donde se producen daños y/o averías tratando de definir patrones de comportamiento. 9. Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así también, partes, tipos de averías, gravedades, lugares donde se producen. 10. Descubrir información “oculta” en función de los modelos generados a partir de los datos disponibles. Página 3 Tecnología Minería de Datos Es un proceso con el cual se pueden descubrir y cuantificar relaciones predictivas en los datos con la aplicación de un conjunto de técnicas, y del resultado de este proceso es posible obtener conocimiento útil para el negocio. Técnicas de Mineria de Datos Análisis estadístico Se preocupa por el poder de generalización de los resultados obtenidos para poder inferir los resultados a situaciones más generales que la estudiada. Análisis con sistemas inteligentes Se preocupa por ofrecer soluciones algorítmicas con un coste computacional aceptable. Página 4 Tecnología Metodologías de Minería de Datos Metodología SEMMA 1. Muestreo 2. Exploración 3. Manipulación 4. Modelado 5. Valoración Metodología MS 1. 2. 3. 4. 5. 6. Definición del problema Preparación de datos Exploración de datos Generación del modelos Validación del modelos Implementación y actualización de los modelos Página 5 Página 278 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Tecnología Metodología CRISP-DM 1. 2. 3. 4. 5. 6. Análisis del problema Análisis de datos Preparación de datos Modelado Explotación Evaluación Página 6 Metodología CRISP-DM Fue concebido a finales de 1996. Daimler Chrysler (entonces Daimler-Benz) estaba delante de la mayoría de las organizaciones industriales y comerciales en la aplicación de la minería de datos en sus operaciones de negocios. Introducción 1. La metodología CRISP-DM 2. Pasaje de modelos genéricos a modelos especializados Modelo de referencia 1. 2. 3. 4. 5. 6. Comprensión del negocio Comprensión de datos Preparación de datos Modelado Evaluación Desarrollo Página 7 Metodología CRISP-DM Guía de usuario Comprendiendo el negocio Comprensión de datos Preparación de los datos Modelado Evaluación Desarrollo Salidas Comprensión del negocio Comprensión de datos Preparación de los datos Modelado Evaluación Desarrollo Resumen de dependencias Página 279 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 8 Metodología CRISP-DM Apéndice Glosario/Terminología Tipos de problemas de minería de datos Página 9 Industria automotriz 1. La industria automotriz y la identificación de daños y/o averías. 2. Globalización de marcas. 3. Diversificación de modelos. 4. Especialización en producción de modelos. 5. Desarrollo de tecnología de las comunicaciones y medios de transportes. 6. Implementación de controles. 7. Reducción de costos. 8. Incorporación de operadores logísticos. 9. Tercerización de sistemas de transporte y lugares de almacenamiento. 10. Puntos de control estratégicos. 11. Creación de los estándares de inspección: 12. Procedimientos de inspección. 13. Sistemas codificación de daños y/o averías. 14. Circuitos logísticos Página 10 Industria Circuitos logísticos Exportación Importación Página 280 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 11 Procesos, Información y Datos Puntos de control Los check points son los nodos de las cadenas logísticas que conforman lo circuitos que recorren las unidades desde que salen de producción hasta que llegan a su destino final. Estándares de inspección En cada punto de control se realiza la inspección de unidades según un conjunto de reglas o procedimientos especificados por el estándar de isnepcción. Captura de datos Normalmente en la industria los datos son tomados por lectores de código de barras debido a que toda unidad viene con una hoja detallada donde se indica el código de barras con datos relacionados al vehículo. Procesamiento de datos Los datos son tomados donde se reliza cada inspección y luego son almacenados en una base de datos. Actualmente hay dos sistemas de almacenamiento uno en batch y otro de línea a través de radiofrecuencia. Base de datos Sistema de datos estructurado y normalizado. Página 12 Aplicación de la metodología CRISP-DM Comprensión del negocio El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. De esto último también se puede inferir que es de utilidad para la toma de decisiones el poder determinar o definir los lugares donde se producen los daños y las imputaciones de las mismas. Comprensión de datos Identificación de autos, modelos, lugares, tipos de trasportes, empresas, partes, averías, gravedades, observación, fechas. Preparación de datos Número de chasis, Modelo, Fecha, Lugar, Parte, Tipo Avería, Gravedad, Observación. Página 13 Aplicación de la metodología CRISP-DM Modelado El conjunto de datos de entrenamiento fue almacenado en archivos con formato de hoja de cálculo y se dividió en función de los períodos establecidos previamente para el presente proyecto. Las cantidades de datos de entrenamiento para los respectivos modelos es variable en función del software utilizado, lo cual fue especificado previamente. Evaluación La ejecución de los modelos ha generado los datos esperados en función de los objetivos de negocio establecidos previamente para el proyecto. Si bien en el primer análisis se pudo decir que Página 281 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS se han cubierto todas las alternativas para lograr los objetivos de negocio y de minería de datos no se descartó la posibilidad de arribar a nuevas preguntas de negocio o nuevas aproximaciones de resultados. Página 14 Aplicación de la metodología CRISP-DM Desarrollo Árbol de Clasificación Construcción de un árbol que en cada nodo establece condiciones sobre atributos, divide el conjunto de casos en subconjuntos que cumplen cada condición. Los subconjuntos se vuelven a dividir añadiendo nuevos niveles al árbol hasta detenerse mediante algún criterio. Agrupamiento Técnica que agrupa los datos en función de una distancia sin utilizar ningún tipo de información externa para organizar los grupos. Modelo de Clasificación La diferencia con la primera técnica está en que en la predicción el atributo objetivo no es un atributo cualitativo discreto, sino es uno continuo. El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no vistos. Página 15 Aplicación de la metodología CRISP-DM Desarrollo Tipos de Averías 6000 5000 4000 3000 2000 1000 0 2003 Semest re 1-04 Semest re 2-04 Semestre 1-05 Semestre 2-05 Semest re 1-06 Semest re 2-06 Semest re 1-07 Semest re 2-07 Semest re 1-08 Falt ant e 494 184 274 264 240 247 339 605 641 1771 Pint ura salt ada 935 790 812 598 490 271 136 237 609 334 Rayado - Rozado 2023 1628 1794 1792 1887 1499 1207 1278 4689 2223 Abollado 5338 2855 2375 1099 1126 1681 780 761 1016 751 Per i o d o Página 16 Aplicación de la metodología CRISP-DM Página 282 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Desarrollo Lugares 8000 7000 6000 5000 4000 3000 2000 1000 0 2003 Semest re 1-04 Semest re 2-04 Semestre 1-05 Semestre 2-05 Semest re 1-06 Semest re 2-06 Semestre 1-07 Semestre 2-07 Semest re 1-08 Subida a Buque 104 82 228 201 104 138 265 95 523 633 Retiro de Puert o 352 89 71 137 248 187 119 156 60 124 Ingreso a Puert o 443 343 491 510 550 497 1069 575 1167 958 3020 454 1457 4521 Bajada de Buque 942 343 505 570 758 580 547 219 282 318 Subida Buque Puert o de Origen 6925 511 4741 4008 1849 1208 1585 144 517 635 454 Salida de Planta 69 53 642 1003 767 Per i o d o Página 17 Aplicación de la metodología CRISP-DM Desarrollo Modelos 4500 4000 3500 3000 2500 2000 1500 1000 500 0 2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08 M odelo 9 4143 1785 833 433 469 789 170 209 156 142 M odelo 17 2662 2616 3041 2002 1795 1482 260 125 30 38 M odelo 5 595 244 252 200 398 533 565 712 839 433 M odelo 20 546 319 632 574 266 441 1268 1403 3819 2571 M odelo 18 467 28 40 86 39 10 29 37 36 M odelo 13 436 562 457 35 70 125 106 270 358 190 M odelo 7 0 0 0 0 0 0 2 94 1747 1883 M odelo 8 0 0 0 465 608 285 28 88 75 26 21 Per io d o Página 18 Aplicación de la metodología CRISP-DM Desarrollo Abollados Capot, Observada. Página 283 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Capot. Leve. Observada. Transferencia ubicación y línea de carga. Página 19 Aplicación de la metodología CRISP-DM Desarrollo Rayados o rozados Manijas externas de puertas traseras, Mediano. Panel trasero bajo baúl, Observada. Spoiler delantero, Observada. Tapa posterior de techo, Observada. Paragolpe delantero / Protector delantero, Observada. Paragolpe delantero / Superior, Mediano. Tapizado interno puerta delantera izquierda. Paragolpe delantero / Superior. Manijas externas de puertas traseras. Panel trasero bajo baúl. Paragolpe delantero / Protector delantero. Paragolpe delantero / Superior. Spoiler delantero. Tapa posterior de techo. Tapizado interno puerta delantera izquierda. Página 20 Aplicación de la metodología CRISP-DM Desarrollo Faltantes Manijas externas de puertas delanteras, Observada. Manijas externas de puertas delanteras. Grave. Leve. Observada. Modelo 8. Subida a Buque, Tapa acceso gancho remolque. Página 21 Aplicación de la metodología CRISP-DM Desarrollo Pintura saltada Llanta trasera derecha, Observada. Paragolpe delantero / Protector delantero, Observada. Guardabarro trasero derecho. Página 284 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Llanta trasera derecha. Paragolpe delantero / Protector delantero. Mediano. Observada. Modelo 17, Llanta delantera derecha. Modelo 9, Mediano. Página 22 Aplicación de la metodología CRISP-DM Desarrollo Predicción Aerosol antipinchazos Alerón Cubierta delantera derecha Escape Guardabarro delantero derecho Guardabarro trasero derecho Llanta delantera derecha Llave Manijas externas de puertas traseras Manual Panel trasero bajo baúl Puerta delantera derecha Puerta trasera derecha Tapa acceso gancho remolque Taza Página 23 Conclusión 1. La metodología CRISP DM es aplicable a la industria. 2. La aplicación de las técnicas de Árbol de Clasificación, Clustering y Modelo de Predicción permiten obtener resultados satisfactorios. 3. Resulta óptimo el desarrollo y ejecución de la metodología en periodos semestrales. 4. La explotación de datos puede tomar diferentes formas: por periodos diferentes, modelos o empresas específicas, puntos de control, tipos de averías o partes averiadas. 5. Los resultados obtenidos de la minería de datos pueden ser de utilidad para el desarrollo de sistemas de información. 6. En referencia a los datos y estructura de datos de los sistemas de base de datos desde donde se ha tomado la información se puede observar que los mismos son satisfactorios. Página 24 Conclusión En cuanto a los objetivos los mismos han sido logrados: • Se han identificado daños y/o averías. • Se han determinado las responsabilidades en función de la avería y tipos de transporte. Página 285 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS • • • • • • • Las imputaciones de los incidentes según el tipo de transporte se han establecido. Se han determinado los tipos de averías y/o daños. Se han determinado las partes averiadas y se ha podido establecer sus comportamientos. Se han especificado gravedades de daños y/o averías. Se han definido e identificado los modelos de autos con daños especificando partes, tipo de daño y gravedad. Se han especificado lugares donde se producen daños y/o averías y se han definido patrones de comportamiento. Se han especificado estadísticamente tipos de transporte que producen daños y/o averías como así también, partes, tipos de averías, gravedades, lugares donde se producen. Página 286 de287 Ing. Hugo Daniel Flores DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS Página 287 de287 Ing. Hugo Daniel Flores