Detección de Patrones de Daños y Averías en la

Anuncio
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Tesis de Magister en Ingeniería en Sistemas de Información
Detección de Patrones de Daños y Averías en la Industria
Automotriz
Ing. Hugo Daniel Flores
Directora: Dra. Paola V. Britos
Codirector: Dr. Ramón García Martínez
- 2009 -
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Resumen
En la industria automotriz uno de los temas relevantes en la producción y distribución de unidades
es la detección e identificación de daños y/o averías producidas a lo largo del circuito que recorren
los autos desde que salen de planta de producción hasta que llegan a su destino final.
Con el incremento de la globalización, los fabricantes de vehículos han ido rediseñando sus redes de
producción en todo el mundo. Para optimizar los costes, determinados países son escogidos para
especializarse en la producción de ciertos modelos. Esta situación ha dado lugar a un inevitable
aumento del transporte de los vehículos desde los países productores a los mercados finales.
Durante estos trayectos los vehículos se ven sometidos a daños, en grado variable, en toda la cadena
de suministro.
El objetivo del proyecto es utilizar la metodología CRISP-DM para detectar patrones en la
producción de daños y/o averías en la cadena de distribución para permitir a la industria:
•
•
•
•
•
•
•
•
•
•
Identificar daños y/o averías.
Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de
transporte.
Imputar incidentes según el tipo de transporte.
Determinar tipos de averías y/o daños.
Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento.
Especificar gravedad de daños y/o averías.
Definir e identificar modelos con daños especificando partes, tipo de daño y gravedad.
Especificar lugares donde se producen daños y/o averías tratando de definir patrones de
comportamiento.
Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así
también, partes, tipos de averías, gravedades, lugares donde se producen.
Descubrir información “oculta” en función de los modelos generados a partir de los datos
disponibles.
Página 1 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 2 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Dedicatoria
A mi esposa y familia
Sandra, María Elena, Paula y Marcos
Página 3 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 4 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Agradecimiento
A la Universidad Tecnológica Nacional, Facultad Regional Tucumán y por su intermedio al Estado
Nacional por darme la posibilidad de estudiar y acceder a un nivel académico superior.
A la Escuela de Posgrado de la Universidad Tecnológica Nacional, Facultad Regional Buenos Aires
por haberme permitido acceder a este nivel de estudio.
A mis tutores Dra. Paola Britos y Dr. Ramón García Martínez por haberme conducido a lo largo del
desarrollo de este trabajo de tesis.
A la Dra. Zulma Cataldi por su colaboración y asesoramiento en la especificación de los
lineamientos generales para el desarrollo de esta tesis.
A mis colegas y asociados por haber contribuido abierta y desinteresadamente en las pruebas y
consultas realizadas no solo para este proyecto en particular sino también por todos los
emprendimientos que vamos logrando.
A mi esposa por darme la confianza y el apoyo, y soportar diariamente la ardua labor que implica
mi desarrollo profesional permanente.
A mi madre por haberme inculcado desde niño a seguir el camino de la educación para mejorar mi
futuro como persona, como hijo, como hermano y como hombre de familia.
Espero que este trabajo y su propuesta de futuras líneas de investigación sirvan como
agradecimiento y devolución hacia la sociedad por las oportunidades que me brindó a través de la
Universidad Estatal.
Página 5 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 6 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Índice
1. Introducción .....................................................................................................................................9
1.1. Minería de Datos (Data Mining)...............................................................................................9
1.2. Lineamientos del documento de tesis .....................................................................................10
2. Técnicas de Minería de Datos........................................................................................................11
1. Análisis estadístico.....................................................................................................................11
2. Análisis a través de sistemas inteligentes ..................................................................................12
3. Conclusiones ..............................................................................................................................13
3. Metodologías de Minería de Datos ................................................................................................15
3.1. SEMMA ..................................................................................................................................15
3.2. CRISP-DM..............................................................................................................................16
3.3. Microsoft.................................................................................................................................18
3.4. Comparación de Metodologías ...............................................................................................21
4. La metodología CRISP-DM...........................................................................................................23
4.1. Introducción ............................................................................................................................23
4.1.1. La Metodología CRISP-DM ............................................................................................23
4.1.2. Pasaje de modelos genéricos a modelos especializados ..................................................24
4.2. El modelo de referencia CRISP-DM ......................................................................................25
4.2.1. Comprensión del Negocio................................................................................................27
4.2.2. Comprensión de Datos .....................................................................................................31
4.2.3. Preparación de Datos .......................................................................................................33
4.2.4. Modelado .........................................................................................................................37
4.2.5. Evaluación........................................................................................................................39
4.3. La guía de usuario de CRISP-DM ..........................................................................................43
4.3.1. Comprendiendo el negocio ..............................................................................................43
4.3.2. Comprensión de Datos .....................................................................................................51
4.3.3. Preparación de los datos...................................................................................................56
4.3.4. Modelado .........................................................................................................................60
4.3.5. Evaluación........................................................................................................................64
4.3.6. Desarrollo.........................................................................................................................67
4.4. Las salidas del CRISP-DM .....................................................................................................69
4.4.1. Comprensión del Negocio................................................................................................70
4.4.2. Comprensión de Datos .....................................................................................................71
4.4.3. Preparación de Datos .......................................................................................................72
4.4.4. Modelado .........................................................................................................................73
4.4.5. Evaluación........................................................................................................................74
4.4.6. Desarrollo.........................................................................................................................75
4.4.7. Resumen de dependencias ...............................................................................................75
4.5. Apéndice .................................................................................................................................77
4.5.1. Glosario/Terminología .....................................................................................................77
4.5.2. Tipos de problemas de minería de datos..........................................................................77
5. Descripción y desarrollo de la industria.........................................................................................85
5.1. La industria automotriz y el control de daños y/o averías ......................................................85
5.2. Circuitos logísticos..................................................................................................................86
5.3. Transportes y lugares de almacenamiento ..............................................................................87
6. Procesos a analizar, límites y alcance ............................................................................................89
6.1. Puntos de Control....................................................................................................................89
6.2. Estándares de inspección ........................................................................................................89
7. Información y datos .......................................................................................................................91
Página 7 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
7.1. Proceso de inspección y captura de datos ...............................................................................91
7.2. Sistema normalizado de codificación de daños y/o averías....................................................91
7.3. Proceso de educción de requerimientos del proyecto .............................................................91
8. Aplicación de la metodología propuesta........................................................................................95
8.1. Comprensión del Negocio.......................................................................................................95
8.2. Comprensión de Datos ..........................................................................................................104
8.3. Preparación de Datos ............................................................................................................112
8.4. Modelado ..............................................................................................................................115
8.4.1. Selección de las técnicas de modelado ..........................................................................115
8.4.2. Generación de la prueba de diseño ................................................................................115
8.4.3. Construcción de los modelos .........................................................................................116
8.4.4. Descripción de los modelos ...........................................................................................119
8.4.4.1. Modelo de Clasificación .........................................................................................119
8.4.4.2. Modelo de Clustering..............................................................................................144
8.4.4.3. Modelo de Predicción .............................................................................................167
8.4.5. Dificultades encontradas ................................................................................................190
8.5. Evaluación.............................................................................................................................190
8.5.1. Evaluación de los resultados en términos de minería de datos ......................................190
8.5.2. Evaluación de los resultados en términos de objetivos de negocio. ..............................218
8.5.2.1. Tipos de averías. .....................................................................................................219
8.5.2.2. Lugares....................................................................................................................220
8.5.2.3. Modelos...................................................................................................................220
8.5.2.4. Partes, Averías y Gravedad.....................................................................................221
8.5.2.5. Lugares, Partes y Tipos de Averías.........................................................................224
8.5.2.6. Modelos, Partes y Tipos de Averías........................................................................232
8.5.2.7. Imputación Tipo de Transporte...............................................................................238
8.6. Desarrollo..............................................................................................................................241
8.6.1. Plan de desarrollo...........................................................................................................241
8.6.2. Supervisión y mantenimiento del plan...........................................................................250
8.6.3. Producción de Informe definitivo ..................................................................................251
8.6.4. Revisión del proyecto.....................................................................................................252
9. Conclusiones ................................................................................................................................253
10. Líneas futuras de investigación..................................................................................................257
11. Bibliografías y Documentación .................................................................................................259
12. Anexos .......................................................................................................................................261
Anexo 1: Terminología de negocio..............................................................................................261
Anexo 2: Terminología de minería de datos................................................................................262
Anexo 3: Consultas estructuradas para base de datos..................................................................264
Anexo 4: Codificación .................................................................................................................273
Anexo 5: Presentación final. ........................................................................................................277
Página 8 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
1. Introducción
1.1. Minería de Datos (Data Mining)
El gran desarrollo tecnológico de los últimos años ha potenciado el almacenamiento de grandes
volúmenes de información. No solo desde el punto de vista del “computador personal” sino también
desde el punto de vista de la computación como un conjunto de dispositivos electrónicamente
interconectados capaces de soportar el trasporte de grandes cantidades de información en una
dirección determinada con el propósito de ser almacenada centraliza o descentralizadamente, o bien
desde el punto de vista de redes electrónicas donde desde cada nodo se permite la posibilidad de
cargar información en una o más bases de datos.
Al mayor poder de procesamiento y transporte de información se suman los avances tecnológicos
en materia de base de datos que soportan “grandes” volúmenes de información de diferentes
orígenes y fuentes pudiendo incluir texto, números, imágenes, video, etc.
Estos avances en materia de gran capacidad de almacenamiento de información han dado lugar a la
creación de nuevas tecnologías como la Minería de Datos.
Conceptualmente la Minería de Datos o Explotación de Datos, como también será llamada en el
presente trabajo, se puede definir como un conjunto de técnicas y herramientas aplicadas al proceso
no trivial de extraer y presentar conocimiento implícito, previamente desconocido, potencialmente
útil y humanamente comprensible, a partir de grandes conjuntos de datos con motivo de predecir de
forma automatizada tendencias y comportamientos y/o descubrir de forma automatizada modelos
previamente desconocidos [Piatetski-Shapiro, 1991].
Desde un punto de vista empresarial la minería de datos puede ser definida como un conjunto de
áreas que tiene como propósito la identificación de un conocimiento obtenido a partir de las bases
de datos que aporten un sesgo hacia la toma de decisiones [Molina, 2001].
Lo que realmente hace el data mining es reunir las ventajas de varias áreas como la Estadística, la
Inteligencia Artificial, la Computación Gráfica, el Datawarehouse y el Procesamiento Masivo,
principalmente usando como materia prima bases de datos.
Para tener una aproximación cercana a las diversas definiciones encontradas en diferentes artículos
de diferentes autores se puede concluir que la minería de datos es un proceso con el cual se pueden
descubrir y cuantificar relaciones predictivas en los datos, y del resultado de este proceso es posible
obtener conocimiento útil para el negocio.
Hoy en día realizando las consultas (simplemente navegando los datos) convencionales a grandes
bases de datos no es suficiente para resolver problemas de negocios, sino que se hace necesario
seguir una metodología ordenada para aplicar herramientas tecnológicas y técnicas disponibles en
informáticas para así obtener conocimiento y resultados que permitan a las compañías obtener un
beneficio. El entorno natural del Data Mining es el Datawarehouse.
La minería de datos trata de sacar información de detalle de un almacén de datos. No se conforma
solo con la visualización de datos, sino que es necesario obtener resultados en cuanto a la relación
que existe entre los mismos y como estos podrían repercutir en el negocio.
Página 9 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Para la explotación de datos aplicando minería de datos existen diferentes técnicas las cuales
pueden ser desarrolladas según diferentes metodologías. A continuación se describirán algunas
técnicas y metodologías de Data Mining.
1.2. Lineamientos del documento de tesis
El primer capítulo desarrolla una breve introducción a la minería de datos que es la base
operacional del presente proyecto de tesis.
El capítulo dos muestra una descripción de las diferentes técnicas de minería de datos que pueden
ser aplicadas en función de las necesidades del estudio en cuestión.
El tercer capítulo realiza una comparación entre las diferentes metodología de minería de datos
desarrolladas hasta el presente. Además muestra el avance tecnológico de cada técnica y muestra
como resultado una breve conclusión que motiva la aplicación de la metodología seleccionada para
este proyecto.
En el cuarto capítulo se desarrolla la metodología completa a utilizar en este proyecto y esta además
representa para esta tesis el estado de la tecnología. Se toma como marco de referencia la
metodología propuesta por la organización creadora de la misma y a la cual se hace referencia en
las respectivas citas.
Le quinto capítulo describe la situación actual de la industria automotriz en lo referente a daños y/o
averías. Además se muestran los posibles circuitos logísticos estándares en la industria y demás
detalles como los tipos de transporte o lugares de estacionamiento de las unidades automotrices.
El sexto capítulo hace referencia a los procesos a analizar, los límites del proyecto y los alcances del
mismo.
En el séptimo capítulo se realiza la descripción global del sistema de información del que se obtiene
toda la información para la explotación de datos.
En el capítulo ocho se realiza la aplicación de la metodología propuesta a la industria automotriz.
Paso a paso se hace el desarrollo completo de la metodología propuesta.
El capítulo nueve muestra las conclusiones a las que se arriba luego del desarrollo del proyecto de
tesis.
En el capítulo diez se presentan las posibles líneas de investigación que surgen de la realización de
este proyecto.
El capítulo once muestra la bibliografía a la cual se ha recurrido para el desarrollo del presente
proyecto.
Finalmente en el capítulo doce se muestran todos los anexos utilizados para la preparación, análisis
y evaluación de los resultados.
Página 10 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
2. Técnicas de Minería de Datos
Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico
y mediante los modelos extraídos. Utilizando técnicas de minería de datos se aborda la solución a
problemas de predicción, clasificación y segmentación.
1. Análisis estadístico
Debido al gran volumen de datos con el que se puede contar en la actualidad y al poder de proceso
en la tecnología desarrollada hasta aquí, se hace viable la exploración de la información utilizando
diferentes técnicas estadísticas.
El Análisis Estadístico se preocupa más por el poder de generalización de los resultados obtenidos
para inferir los resultados a situaciones más generales que la estudiada.
A continuación se presentan algunas técnicas:
•
•
•
•
•
•
•
•
1
ANOVA o análisis de la Varianza: Contrasta si existen diferencias significativas entre las
medidas de una o más variables continuas en grupos de población distintos.
Regresión: Define la relación entre una o más variables y un conjunto de variables
predictoras de las primeras.
Chi cuadrado: Contrasta la hipótesis de independencia entre variables.
Componentes principales: Permite reducir el número de variables observadas a un menor
número de variables artificiales, conservando la mayor parte de la información sobre la
varianza de las variables.
Análisis discriminante: Método de clasificación de individuos en grupos que previamente
se han establecido, y que permite encontrar la regla de clasificación de los elementos de
estos grupos, y por tanto identificar cuáles son las variables que mejor definan la pertenencia
al grupo.
Series temporales: Es el conocimiento de una variable a través del tiempo para que a partir
de ese conocimiento y bajo el supuesto de que no van a producirse cambios estructurales,
poder realizar predicciones. Suelen basarse en un estudio de la serie en ciclos, tendencias y
estacionalidades, que se diferencian por el ámbito de tiempo abarcado, para por composición
obtener la serie original. Se pueden aplicar enfoques híbridos con los métodos anteriores, en
los que la serie se puede explicar no sólo en función del tiempo sino como combinación de
otras variables de entornos más estables y, por lo tanto, más fácilmente predecibles.
Análisis cluster1: Permite clasificar una población en un número determinado de grupos, en
base a semejanzas y desemejanzas de perfiles existentes entre los diferentes componentes de
dicha población.
El método Chaid (Chi Squared Automatic Interaction Detector): Es un análisis que
genera un árbol de decisión para predecir el comportamiento de una variable, a partir de una
o más variables predictoras, de forma que los conjuntos de una misma rama y un mismo
nivel son disjuntos. Es útil en aquellas situaciones en las que el objetivo es dividir una
población en distintos segmentos basándose en algún criterio de decisión. El árbol de
decisión se construye partiendo el conjunto de datos en dos o más subconjuntos de
observaciones a partir de los valores que toman las variables predictoras. Cada uno de estos
subconjuntos vuelve después a ser particionado utilizando el mismo algoritmo. Este proceso
continúa hasta que no se encuentran diferencias significativas en la influencia de las
Análisis cluster usando mapas autoorganizados (técnica de sistemas inteligentes) será aplicado en esta tesis.
Página 11 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
variables de predicción de uno de estos grupos hacia el valor de la variable de respuesta. La
raíz del árbol es el conjunto de datos íntegro, los subconjuntos y los subsubconjuntos
conforman las ramas del árbol. Un conjunto en el que se hace una partición se llama nodo.
El número de subconjuntos en una partición puede ir de dos hasta el número de valores
distintos que puede tomar la variable usada para hacer la separación. La variable de
predicción usada para crear una partición es aquella más significativamente relacionada con
la variable de respuesta de acuerdo con test de independencia de la Chi cuadrado sobre una
tabla de contingencia.
2. Análisis a través de sistemas inteligentes
El objetivo de la aplicación de Sistemas Inteligentes en la minería de datos es extraer información
de manera no supervisada. Se preocupa por ofrecer soluciones algorítmicas con un costo
computacional aceptable.
A continuación se presentan algunas de estas técnicas:
•
•
•
•
•
Algoritmos genéticos: Son métodos numéricos de optimización, en los que aquella variable
o variables que se pretenden optimizar junto con las variables de estudio constituyen un
segmento de información. Aquellas configuraciones de las variables de análisis que
obtengan mejores valores para la variable de respuesta, corresponderán a segmentos con
mayor capacidad reproductiva. A través de la reproducción, los mejores segmentos perduran
y su proporción crece de generación en generación. Se puede además introducir elementos
aleatorios para la modificación de las variables (mutaciones). Al cabo de cierto número de
iteraciones, la población estará constituida por buenas soluciones al problema de
optimización.
Redes neuronales: Genéricamente son métodos de proceso numérico en paralelo, en el que
las variables interactúan mediante transformaciones lineales o no lineales, hasta obtener
salidas. Estas salidas se contrastan con los que tenían que haber salido, basándose en unos
datos de prueba, dando lugar a un proceso de retroalimentación mediante el cual la red se
reconfigura, hasta obtener un modelo adecuado.
Lógica difusa: Es una generalización del concepto de estadística. La estadística clásica se
basa en la teoría de probabilidades, a su vez ésta en la técnica conjuntista, en la que la
relación de pertenencia a un conjunto es dicotómica (el 2 es par o no lo es). Si se establece la
noción de conjunto borroso como aquel en el que la pertenencia tiene una cierta graduación
(¿un día a 20º C es caluroso?), dispondremos de una estadística más amplia y con resultados
más cercanos al modo de razonamiento humano.
Mapas autoorganizados: Los mapas autoorganizados o SOM (Self-Organizing Map),
también llamados redes de Kohonen son un tipo de red neuronal no supervisada,
competitiva, distribuida de forma regular en una rejilla de, normalmente, dos dimensiones,
cuyo fin es descubrir la estructura subyacente de los datos introducidos en ella. A lo largo
del entrenamiento de la red, los vectores de datos son introducidos en cada neurona y se
comparan con el vector de peso característico de cada neurona. La neurona que presenta
menor diferencia entre su vector de peso y el vector de datos es la neurona ganadora (o
BMU, Best-Matching Unit, Unidad con mejor ajuste) y ella y sus vecinas verán modificados
sus vectores de pesos.
Algoritmos de inducción: Encuadrado dentro de las técnicas de Aprendizaje Automático
(Machine Learning), estos algoritmos permiten construir automáticamente a partir de un
conjunto de datos de entrenamiento un árbol de clasificación. Para inferir el árbol, el
algoritmo realiza particiones binarias sucesivas en el espacio de las variables explicativas,
Página 12 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
de forma que en cada partición se escoge la variable que aporta más información en función
de una medida de entropía o cantidad de información. El árbol así construido consta del
mínimo número de atributos (variables) que se requieren para la clasificación eficiente de
los ejemplos dados, con lo que es claro el gran poder explicativo de esta técnica. También se
pueden elaborar, a partir del árbol, reglas de clasificación fácilmente interpretables, que
definen las características que más diferencian a las distintas clases establecidas
inicialmente. Este tipo de sistemas clasificadores presentan la ventaja, frente a las técnicas
estadísticas, de que tienen un carácter estrictamente no paramétrico. Además, aunque no
alcanzan el poder predictivo de las redes neuronales, sus resultados son mucho más
fácilmente interpretables que los modelos de “caja negra” suministrados por aquéllas.
3. Conclusiones
En general, cualquiera que sea el problema a resolver, no existe una única técnica para solucionarlo,
sino que puede ser abordado siguiendo aproximaciones distintas. El número de técnicas es muy
grande y es muy probable que siga creciendo.
La experiencia práctica muestra la aptitud de las técnicas de minería de datos para resolver
problemas empresariales. También es clara su aportación para resolver problemas científicos que
impliquen el tratamiento de grandes cantidades de datos.
La minería de datos es, en realidad, una prolongación de una práctica estadística de larga tradición,
la de Análisis de Datos. Existe, además, una aportación propia de técnicas específicas de
Inteligencia Artificial, en particular sobre la integración de los algoritmos, la automatización del
proceso y la optimización del coste.
A diferencia de la IA, que es una ciencia joven, en Estadística se viene aprendiendo de los datos
desde hace más de un siglo, la diferencia consiste en que ahora existe la potencia de cálculo
suficiente para tratar ficheros de datos de forma masiva y automática. Esta es una realidad que cada
vez será más habitual.
Por otro lado y en relación a la amplia diversidad de técnicas disponibles, conviene tener claro que
no existe la técnica más inteligente, sino formas inteligentes de utilizar una técnica y que cada uno
utiliza de forma inteligente aquello que conoce. También que para la mayoría de los problemas no
existen diferencias significativas en los resultados obtenidos.
Página 13 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 14 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
3. Metodologías de Minería de Datos
2
3.1. SEMMA
3
SAS Institute es el desarrollador de esta metodología, la define como el proceso de selección,
exploración y modelado de grandes cantidades de datos para descubrir patrones de negocio
desconocidos.
El nombre de esta terminología es el acrónimo correspondiente a las cinco fases básicas del proceso
(Figura 1).
Muestreo
(Sample)
Exploración
(Explore)
Manipulación
(Modify)
Modelado
(Model)
Valoración
(Assess)
Figura 1: Fases de la metodología SEMMA
El proceso se inicia con la extracción de la población muestral sobre la que se va a aplicar el
análisis. El objetivo de esta fase consiste en seleccionar una muestra representativa del problema en
estudio. La representatividad de la muestra es indispensable ya que de no cumplirse invalida todo el
modelo y los resultados dejan de ser admisibles. La forma más común de obtener una muestra es la
selección al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad
de ser elegido. Este método de muestreo se denomina muestreo aleatorio simple.
La metodología SEMMA establece que para cada muestra considerada para el análisis del proceso
se debe asociar el nivel de confianza de la muestra.
Una vez determinada una muestra o conjunto de muestras representativas de la población en
estudio, la metodología SEMMA indica que se debe proceder a una exploración de la información
disponible con el fin de simplificar en lo posible el problema para optimizar la eficiencia del
modelo. Para lograr este objetivo se propone la utilización de herramientas de visualización o de
técnicas estadísticas que ayuden a poner de manifiesto relaciones entre variables. De esta forma se
pretende determinar cuáles son las variables explicativas que van a servir como entradas al modelo.
La tercera fase de la metodología consiste en la manipulación de los datos, en base a la exploración
realizada, de forma que se definan y tengan el formato adecuado los datos que serán introducidos en
el modelo.
Una vez que se han definido las entradas del modelo con el formato adecuado para la aplicación de
la técnica de modelado, se procede al análisis y modelado de los datos. El objetivo de esta fase
consiste en establecer una relación entre las variables explicativas y las variables objeto del estudio,
que posibiliten inferir el valor de las mismas con un nivel de confianza determinado. Las técnicas
utilizadas para el modelado de los datos incluyen métodos estadísticos tradicionales (tales como
análisis discriminante, métodos de agrupamiento, y análisis de regresión), así como técnicas
basadas en datos tales como redes neuronales, técnicas adaptativas, lógica fuzzy (difusa), árboles de
decisión, reglas de asociación y computación evolutiva.
2
SEMMA: Simple, Explore, Modify, Model, Assess.
SAS Institute: Es una empresa con sede en Cary (Carolina del Norte, Estados Unidos). Es uno de los principales
fabricantes de software business intelligence.[
3
Página 15 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Finalmente, la última fase del proceso consiste en la valoración de los resultados mediante el
análisis de bondad del modelo o modelos contrastados con otros métodos estadísticos o con nuevas
poblaciones muestrales.
4
3.2. CRISP-DM
La metodología CRISP-DM (Chapman, 1999) consta de cuatro niveles de abstracción, organizados
de forma jerárquica en tareas que van desde el nivel más general hasta los casos más específicos.
A nivel más general, el proceso está organizado en seis fases (Figura 2), estando cada fase a su vez
estructurada en varias tareas generales de segundo nivel. Las tareas generales se proyectan a tareas
específicas, donde se describen las acciones que deben ser desarrolladas para situaciones
específicas. Así, si en el segundo nivel se tiene la tarea general “limpieza de datos”, en el tercer
nivel se dicen las tareas que tienen que desarrollarse para un caso específico, como por ejemplo,
“limpieza de datos numéricos”, o “limpieza de datos categóricos”. El cuarto nivel, recoge el
conjunto de acciones, decisiones y resultados sobre el proyecto de Data Mining específico.
La metodología CRISP-DM proporciona dos documentos distintos como herramienta de ayuda en
el desarrollo del proyecto de Data Mining: el del modelo de referencia y la guía del usuario.
El documento del modelo de referencia describe de forma general las fases, tareas generales y
salidas del proyecto de Data Mining. La guía del usuario proporciona información más detallada
sobre la aplicación práctica del modelo de referencia al proyecto de Data Mining específico,
proporcionando consejos y listas de comprobación sobre las tareas correspondientes a cada fase.
La metodología CRISP-DM estructura el ciclo de vida de un proyecto de Data Mining en seis fases,
que interactúan entre ellas de forma iterativa durante el desarrollo del proyecto (Figura 2).
Las flechas indican relaciones más habituales entre las fases, aunque se pueden establecer
relaciones entre cualquier fase. El círculo exterior simboliza la naturaleza cíclica del proceso de
modelado.
4
CRISP-DM: Cross Industry Standard Process for Data Mining.
Página 16 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Análisis del
Problema
Análisis de
los datos
Preparación
de los datos
Evaluación
Datos
Modelado
Explotación
Figura 2: Fases del proceso de modelado metodología CRISP-DM.
La primera fase análisis del problema, incluye la comprensión de los objetivos y requerimientos del
proyecto desde una perspectiva empresarial, con el fin de convertirlos en objetivos técnicos y en
una planificación.
La segunda fase de análisis de datos comprende la recolección inicial de datos, en orden a que sea
posible establecer un primer contacto con el problema, identificando la calidad de los datos y
estableciendo las relaciones más evidentes que permitan establecer las primeras hipótesis.
Una vez realizado el análisis de datos, la metodología establece que se proceda a la preparación de
los datos, de tal forma que puedan ser tratados por las técnicas de modelado. La preparación de
datos incluye las tareas generales de selección de datos a los que se van a aplicar la técnica de
modelado (variables y muestras), limpieza de los datos, generación de variables adicionales,
integración de diferentes orígenes de datos y cambios de formato.
La fase de preparación de los datos, se encuentra muy relacionada con la fase de modelado, puesto
que en función de la técnica de modelado que vaya a ser utilizada los datos necesitan ser procesados
en diferentes formas. Por lo tanto las fases de preparación y modelado interactúan de forma
sistemática.
Página 17 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
En la fase de modelado se seleccionan las técnicas de modelado más apropiadas para el proyecto de
Data Mining específico. Las técnicas a utilizar en esta fase se seleccionan en función de los
siguientes criterios:
•
•
•
•
•
Ser apropiada al problema
Disponer de datos adecuados
Cumplir los requerimientos del problema
Tiempo necesario para obtener un modelo
Conocimiento de la técnica
Antes de proceder al modelado de los datos se debe de establecer un diseño del método de
evaluación de los modelos, que permita establecer el grado de bondad de los modelos. Una vez
realizadas estas tareas genéricas se procede a la generación y evaluación del modelo. Los
parámetros utilizados en la generación del modelo dependen de las características de los datos.
En la fase de evaluación, se evalúa el modelo, no desde el punto de vista de los datos, sino del
cumplimiento de los criterios de éxito del problema. Se debe revisar el proceso teniendo en cuenta
los resultados obtenidos para poder repetir algún paso en el que a la vista del desarrollo posterior
del proceso se hayan podido cometer errores. Si el modelo generado es válido en función de los
criterios de éxito establecidos en la primera fase, se procede a la explotación del modelo.
Normalmente los proyectos de Data Mining no terminan en la implantación del modelo, sino que se
deben documentar y presentar los resultados de manera comprensible en orden a lograr un
incremento del conocimiento. Además en la fase de explotación se debe de asegurar el
mantenimiento de la aplicación y la posible difusión de los resultados [Fayyad, 1996].
3.3. Microsoft
En la Figura 3 se describe las relaciones entre cada paso en la metodología desarrollada por
Microsoft para la implementación de Data Mining (Figura 3).
Página 18 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Definir el
problema
Integración de
servicio
Preparar datos
Integración de
servicio
Implementar y
actualizar
modelos
Explorar datos
Vista de origen
de datos
Diseñador de
minería de datos
Validar
modelos
Generar
modelos
Figura 3: Fases del proceso de modelado metodología Microsoft.
El primer paso del proceso de minería de datos consiste en definir claramente el problema
empresarial.
Este paso incluye analizar los requisitos empresariales, definir el ámbito del problema, definir las
métricas por las que se evaluará el modelo y definir el objetivo final del proyecto de minería de
datos. Estas tareas se traducen en preguntas como las siguientes:
•
•
•
•
•
•
¿Qué se está buscando?
¿Qué atributo del conjunto de datos se desea intentar predecir?
¿Qué tipos de relaciones se intenta buscar?
¿Se desea realizar predicciones a partir del modelo de minería de datos o sólo buscar
asociaciones y patrones interesantes?
¿Cómo se distribuyen los datos?
¿Cómo se relacionan las columnas? o en caso de haber varias tablas, ¿cómo se relacionan las
tablas?
Para responder a estas preguntas, es probable que se deba dirigir un estudio de disponibilidad de
datos para investigar las necesidades de los usuarios de la empresa con respecto a los datos
disponibles. Si los datos no son compatibles con las necesidades de los usuarios, puede que se deba
volver a definir el proyecto.
El segundo paso del proceso de minería de datos consiste en consolidar y limpiar los datos
identificados en el paso “Definir el problema”.
Los datos pueden estar dispersos en la empresa y almacenados en distintos formatos; también
pueden contener incoherencias como entradas que faltan o contienen errores.
Página 19 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El tercer paso del proceso de minería de datos consiste en explorar los datos preparados.
Se debe comprender los datos para tomar las decisiones adecuadas al crear los modelos. Entre las
técnicas de exploración se incluyen calcular los valores mínimos y máximos, calcular la media y las
desviaciones estándar y examinar la distribución de los datos. Una vez explorados los datos, se
puede decidir si el conjunto de datos contiene datos con errores y, a continuación, crear una
estrategia para solucionar los problemas.
El cuarto paso del proceso de minería de datos consiste en generar los modelos de minería de datos.
Antes de generar un modelo, se deben separar aleatoriamente los datos preparados en conjuntos de
datos de entrenamiento y comprobación independientes. El conjunto de datos de entrenamiento se
utiliza para generar el modelo y el conjunto de datos de comprobación para comprobar la precisión
del modelo mediante la creación de consultas de predicción.
Una vez definida la estructura del modelo de minería de datos, se procesa rellenando la estructura
vacía con los patrones que describen el modelo. Esto se conoce como entrenar el modelo. Los
patrones se encuentran al pasar los datos originales por un algoritmo matemático.
El modelo de minería de datos se define mediante un objeto de estructura de minería de datos, un
objeto de modelo de minería de datos y un algoritmo de minería de datos.
El quinto paso del proceso de minería de datos consiste en explorar los modelos que se han
generado y comprobar su eficacia.
No se debe implementar un modelo en un entorno de producción sin comprobar primero si el
modelo funciona correctamente. Además, puede ser que se hayan creado varios modelos y se deba
decidir cuál funciona mejor. Si ninguno de los modelos que se han creado en el paso Generar
Modelos funciona correctamente, puede ser que se deba volver a un paso anterior del proceso y
volver a definir el problema o volver a investigar los datos del conjunto de datos original.
El último paso del proceso de minería de datos consiste en implementar los modelos que funcionan
mejor en un entorno de producción.
Una vez que los modelos de minería de datos se encuentran en el entorno de producción, se pueden
llevar acabo diferentes tareas, dependiendo de las necesidades.
Éstas son algunas de las tareas que se pueden realizar:
•
Utilizar los modelos para crear predicciones que se puedan utilizar para tomar decisiones
empresariales.
• Incrustar la funcionalidad de minería de datos directamente en una aplicación.
• Crear un paquete en el que se utilice un modelo de minería de datos para separar de forma
inteligente los datos entrantes en varias tablas.
• Crear un informe que permita a los usuarios realizar consultas directamente en un modelo de
minería de datos existente.
La actualización del modelo forma parte de la estrategia de implementación. A medida que la
organización recibe más datos, se deben volver a procesar los modelos para mejorar así su eficacia.
Página 20 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
3.4. Comparación de Metodologías
Las metodologías SEMMA, CRISP-DM y Microsoft esencialmente son muy parecidas. Las tres
están compuestas por etapas o fases que interactúan entre sí.
En referencia a la tecnología SEMMA está más ligada a los aspectos técnicos de la explotación de
datos. En cuanto a las otras dos, están más enfocadas en el negocio en sí; es decir en la aplicación
de la Minería de Datos a los negocios. Esta diferencia se ve específicamente en la primera etapa
donde SEMMA arranca directamente en el trabajo de datos mientras que CRISP-DM y Microsoft
empiezan por el estudio del negocio y sus objetivos, y luego recién se transforma en un problema
técnico.
Analizando la propuesta metodológica de Microsoft se puede ver que está íntimamente vinculada a
la aplicación de las herramientas de su propia compañía (Microsoft) especialmente en lo que
respecta a la integración de servicios, vista de origen de datos y diseñador de minería de datos. Lo
mismo ocurre con la metodología SEMMA la cual está ligada a herramientas SAS.
Para concluir se puede decir que uno de los motivos por los cuales fue escogida para el presente
proyecto la metodología CRISP-DM es que este sistema está diseñado como una metodología
independiente de la herramienta tecnológica a utilizar en la Explotación de Datos. Esto último la
hace más flexible. Otro punto importante es que es de libre acceso y cumple con la característica de
ser orientada al negocio. Para esta implementación su desarrollo será aplicado a los datos de la
Industria Automotriz.
Finalmente también es posible resaltar que la metodología CRISP-DM es más completa debido a
que tiene toda una fase dedicada al entendimiento del negocio.
La Tabla 1 muestra un cuadro comparativo entre las diferentes metodologías descriptas hasta aquí.
Metodologías
Estructura
Niveles
Fases
Herramientas
Procesos
Documentación
Objetivos
CRISP-DM
Fases y niveles
Parte de lo general a
lo específico
Análisis del problema
Análisis de datos
Preparación de Datos
Modelado
Evaluación
Explotación
Genéricas
Iterativo e interactivo
entre fases
SEMMA
Microsoft
Fases
No tiene
Fases
No tiene
Muestreo
Exploración
Manipulación
Modelado
Valoración
Definir el problema
Preparar los datos
Explorar los datos
Generar modelos
Explorar y validar los modelos
Implementar y actualizar los modelos
Microsoft
Iterativo e interactivo entre fases
SAS
Iterativo e interactivo entre
fases
Modelo de referencia No se especifica
No se especifica
Guía de usuario
Se centra en los Se
centra
en
las Se
centra
en
los
objetivos
características técnicas del empresariales del proyecto
empresariales
del desarrollo del proceso
proyecto
Tabla 1: Cuadro comparativo de metodologías
Página 21 de287
objetivos
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 22 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4. La metodología CRISP-DM
4.1. Introducción
4.1.1. La Metodología CRISP-DM
4.1.1.1. Interrupción jerárquica
La metodología de CRISP-DM está descrita en términos de un modelo de proceso jerárquico
consistente en un conjunto de tareas descritas en cuatro niveles de abstracción (de lo general a lo
específico): fase, tarea genérica, tarea especializada, e instancia de procesos. (Ver figura 4.)
Figura 4: Cuatro niveles de interrupción de la metodología CRISP-DM
En el nivel superior, el proceso de minería de datos es organizado en un número de fases; cada fase
consiste de varias tareas genéricas de segundo nivel. Este segundo nivel es llamado genérico porque
esta destinado a ser bastante general para cubrir todas las situaciones posibles de minería de datos.
Las tareas genéricas están destinadas a ser tan completas y estables como sea posible. Completo
significa que cubre tanto al proceso entero de minería de datos como todas las aplicaciones de
minería de datos posibles. Estable significa que el modelo debería ser válido para acontecimientos
normales y aún para desarrollos imprevistos como técnicas de modelado nuevo.
El tercer nivel, el nivel de tarea especializado, es el lugar para describir como las acciones en las
tareas genéricas deberían ser realizadas en ciertas situaciones específicas. Por ejemplo, en el
segundo nivel podría haber una tarea genérica llamada limpieza de datos. El tercer nivel describe
como esta tarea se distingue en situaciones diferentes, como la limpieza de valores numéricos
contra la limpieza de valores categóricos, o si el tipo de problema es de agrupamiento o de
modelado predictivo.
La descripción de fases y tareas como pasos discretos realizados en un orden específico representa
una secuencia idealizada de eventos.
En la práctica, muchas de las tareas pueden ser realizadas en un orden diferente, y esto a menudo es
necesario para volver a hacer tareas anteriores repetidamente y repetir ciertas acciones. Este modelo
Página 23 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
de proceso no intenta capturar todas estas posibles rutas del proceso de la minería de datos porque
esto requeriría un modelo de proceso demasiado complejo.
El cuarto nivel, la instancia de proceso, es un registro de las acciones, decisiones, y de los
resultados de una minería de datos real.
Una instancia de proceso esta organizado según las tareas definidas en los niveles más altos, pero
representa más bien lo que en realidad sucede en un caso particular que lo que sucede en general.
4.1.1.2. Modelo de referencia y guía de usuario
Horizontalmente, la metodología de CRISP-DM distingue entre el modelo de referencia y la guía de
usuario. El modelo de referencia presenta una descripción rápida de fases, las tareas, y sus salidas, y
describe que hacer en el proyecto de minería de datos. La guía de usuario da consejos más
detallados e insinuaciones para cada fase y cada tarea dentro de una fase, y representa como realizar
un proyecto de minería de datos.
4.1.2. Pasaje de modelos genéricos a modelos especializados
4.1.2.1. Contexto de la minería de datos
El contexto de minería de datos traza un mapa entre lo genérico y el nivel especializado en CRISPDM. Actualmente se distinguen cuatro dimensiones diferentes de contextos de minería de datos:
•
•
•
•
El dominio de aplicación es el área específica en la que el proyecto de minería de datos toma
lugar.
Los tipos de problemas de minería de datos describen la(s) clase(s) específica(s) de
objetivo(s) con el que el proyecto de minería de datos trata.
El aspecto técnico cubre cuestiones específicas en minería de datos que describe diferentes
(técnicas) dificultades que por lo general ocurren durante la minería de datos.
La herramienta y las especificaciones de dimensión técnica en la que las herramienta(s) de
minería de datos y/o técnicas son aplicadas durante el proyecto de minería de datos.
La Tabla 2 resume estas dimensiones de contextos de minería de datos y muestra ejemplos
específicos para cada dimensión.
Dimensión
Dominio
Aplicación
Modelar Respuesta
Realizar Predicción
Realizar Predicción
Ejemplos
Contexto Data Mining
Tipo
Aspecto
Problema
Técnico
Data Mining
Descripción y
Valores por
sumarización
omisión
Segmentación
Outliers
Descripción
Outliers
Concepto
Clasificación
Predicción
Análisis
Dependencia
Herramienta y
Técnica
Clementine
Mineset
Decision Tree
Decision Tree
Tabla 2: Dimensión de contextos y ejemplos de minería de datos
Página 24 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Un contexto específico de minería de datos es un valor concreto para una o más de estas
dimensiones. Por ejemplo, un proyecto de minería de datos tratando con un problema de
clasificación que se revuelve con la predicción constituye un contexto específico. Lo más específico
(los valores) para las dimensiones de contextos diferentes son fijadas (especificadas), lo mas
concreto es el contexto de minería de datos.
4.1.2.2. Pasaje con contextos
Se distinguen dos tipos diferentes de pasajes (plan) entre el nivel genérico y un especializado en el
CRISP-DM:
•
Pasaje para el presente: Si sólo se aplica el modelo de proceso genérico para realizar un
proyecto de minería simple e intentar pasar de tareas genéricas y sus descripciones al
proyecto específico como requerido, se habla sobre un pasaje solo para (probablemente) un
solo uso.
•
Pasaje para el futuro: Si sistemáticamente se especializa el modelo de proceso genérico
según un contexto predefinido (o se analiza sistemáticamente de modo similar y
consolidando las experiencias de un único proyecto hacia un modelo de proceso
especializado para el uso futuro en contextos comparables), se habla explícitamente de la
sobre escritura de un modelo de proceso especializado en términos de CRISP-DM.
Cualquiera de los tipos de trazados es apropiado según sus propios objetivos, depende de su
contexto de minería de datos específicos y las necesidades de su organización.
4.1.2.3. Pasaje
La estrategia básica para pasar un mapa del modelo de proceso genérico al nivel especializado es la
misma para ambos tipos de pasaje:
•
•
•
•
•
Analizar su contexto específico.
Quitar cualquier detalle no aplicable a su contexto.
Agregar cualquier detalle específico a su contexto.
Especializar (o instanciar) el contenido genérico según las características concretas de su
contexto.
Renombrar el contenido genérico posible para proporcionar significados más explícitos en
su contexto para la aclaración.
4.2. El modelo de referencia CRISP-DM
El modelo de proceso corriente para la minería de datos proporciona una descripción del ciclo de
vida del proyecto de minería de datos. Este contiene las fases de un proyecto, sus tareas respectivas,
y las relaciones entre estas tareas. En este nivel de descripción, no es posible identificar todas las
relaciones. Las relaciones podrían existir entre cualquier tarea de minería de datos según los
objetivos, el contexto, y -lo más importante- el interés del usuario sobre los datos.
El ciclo de vida del proyecto de minería de datos consiste en seis fases, se muestran en la Figura 2
(Fases del proceso de modelado metodología CRISP-DM). La secuencia de las fases no es rígida.
Página 25 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El movimiento hacia adelante y hacia atrás entre fases diferentes es siempre requerido. El resultado
de cada fase determina que la fase o la tarea particular de una fase tienen que ser realizados
después. Las flechas indican las más importantes y frecuentes dependencias entre fases.
El círculo externo en la Figura 2 simboliza la naturaleza cíclica de la minería de datos. La minería
de datos no se termina una vez que la solución es desplegada. Las informaciones ocultas (lecciones
ocultas) durante el proceso y la solución desplegada pueden provocar nuevas y a menudo más
preguntas enfocadas en el negocio. Los procesos de minería subsecuentes se beneficiarán de las
experiencias previas. A continuación se describe brevemente cada fase:
•
•
•
•
•
•
Comprensión del Negocio: Esta fase inicial se enfoca en la comprensión de los objetivos de
proyecto y exigencias desde una perspectiva de negocio, luego se convierte este
conocimiento de los datos en la definición de un problema de minería de datos y en un plan
preliminar diseñado para alcanzar los objetivos.
Comprensión de los datos: La fase de entendimiento de datos comienza con la colección
de datos inicial y continúa con las actividades que permiten familiarizarse con los datos,
identificar los problemas de calidad de datos, descubrir los primeros conocimientos en los
datos, y/o descubrir subconjuntos interesantes para formar hipótesis en cuanto a la
información oculta.
Preparación de Datos: La fase de Preparación de Datos cubre todas las actividades
necesarias para construir el conjunto de datos final (los datos que serán provistos por las
herramientas de modelado) de los datos en bruto iniciales. Las tareas de Preparación de
Datos probablemente van a ser realizadas muchas veces y no en cualquier orden prescripto.
Las tareas incluyen la selección de tablas, registros y atributos, así como la transformación y
la limpieza de datos para las herramientas que modelan.
Modelado: En esta fase, varias técnicas de modelado son seleccionadas y aplicadas, y sus
parámetros son calibrados a valores óptimos. Típicamente hay varias técnicas para el mismo
tipo de problema de minería de datos. Algunas técnicas tienen requerimientos específicos
sobre la forma de datos. Por lo tanto, volver a la fase de Preparación de Datos es a menudo
necesario.
Evaluación: En esta etapa en el proyecto, se ha construido un modelo (o modelos) que
parece tener una alta calidad de la perspectiva de análisis de datos. Antes de proceder al
despliegue final del modelo es importante evaluar a fondo el modelo y la revisión de los
pasos ejecutados para crearlo para comparar el modelo correctamente obtenido con los
objetivos de negocio. Un objetivo clave es determinar si hay alguna cuestión importante de
negocio que no ha sido suficientemente considerada. En el final de esta fase, una decisión en
el uso de los resultados de minería de datos debería ser tomada.
Desarrollo: La creación del modelo no es generalmente el final del proyecto. Incluso si el
objetivo del modelo es de aumentar el conocimiento de los datos, el conocimiento ganado
debería ser organizado y presentado en el modo en el que el cliente pueda usarlo. Ello a
menudo implica la aplicación de modelos "vivos" dentro de un proceso de toma de
decisiones de una organización, por ejemplo, en tiempo real la personalización de página
Web o la repetida obtención de bases de datos de mercadeo. Dependiendo de los
requerimientos, la fase de desarrollo puede ser tan simple como la generación de un informe
o tan compleja como la realización repetida de un proceso cruzado de minería de datos a
través de la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva el
paso de desarrollo. Sin embargo, incluso si el analista realizara el esfuerzo de despliegue,
esto es importante para el cliente para entender que acciones necesitan ser ejecutadas en
orden para hacer uso de los modelos creados en ese momento.
Página 26 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
La figura 5 presenta un contexto de fases acompañadas por tareas genéricas y las salidas. En las
secciones siguientes, se describen cada tarea genérica y sus salidas más detalladamente. La atención
es enfocada en descripciones de tarea y resúmenes de salidas.
Figura 5: Tareas genéricas y salidas del modelo de referencia CRISP-DM
4.2.1. Comprensión del Negocio
La primera etapa de la metodología apunta a la comprensión de los objetivos del proyecto desde el
punto de vista de los objetivos de negocio. En función del conocimiento obtenido del negocio se
plantea un problema de minería de datos. En esta etapa se desarrollan los pasos preliminares para
lograr los objetivos del negocio con herramientas de minería de datos.
Página 27 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Figura 6: Comprensión del Negocio
4.2.1.1. Determinación de objetivos de negocio
Tarea: Determinar los objetivos de negocio
El primer objetivo para un contexto es entender desde una perspectiva de negocio lo que el cliente
realmente quiere lograr. A menudo el cliente tiene muchos objetivos que compiten y restricciones
que deben ser correctamente equilibrados. El objetivo debe ser mostrar (destapar) factores
importantes, al principio esto puede influir en el resultado del proyecto.
Una consecuencia posible de la negligencia de este paso es gastar un gran esfuerzo produciendo
respuestas correctas a preguntas incorrectas o erradas.
Salida: Contexto
Se registra la información que se conoce sobre la situación de negocio de la organización en el
principio del proyecto.
Objetivos de negocio
Se describe el objetivo primario del cliente, desde una perspectiva de negocio. Además de los
objetivos del negocio primario allí hay típicamente otras preguntas de negocio relacionadas con lo
que al cliente le gustaría administrar. Por ejemplo, el objetivo primario del negocio podría ser
mantener a clientes corrientes por predicción cuando ellos son propensos a moverse a un
competidor. Los ejemplos de preguntas relacionadas de negocio son ¿Cómo el uso del canal
Página 28 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
primario (por ejemplo, ATM, visita al negocio, Internet) afecta si los clientes se quedan o se van? o
¿Bajar los honorarios de ATM considerablemente reducirá el número de los clientes más importante
que se irán?
Criterios de éxito de negocio
Se describen los criterios para un resultado acertado o útil al proyecto desde el punto de vista del
negocio. Esto podría ser bastante específico y capaz de ser medido objetivamente, por ejemplo, la
reducción de clientes se revuelve a un cierto nivel o valor, o esto podría ser general y subjetivo,
como “dar ideas útiles en las relaciones”. En este último caso, debería indicarse quien hace el juicio
subjetivo.
4.2.1.2. Evaluación de la situación
Tarea: Evaluar la situación
Esta tarea implica la investigación más detallada sobre todos los recursos, restricciones,
presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de
análisis de datos y el plan de proyecto. En la tarea anterior, su objetivo es ponerse rápidamente al
día con la situación. Aquí se quiere ampliar sobre los detalles.
Salida: Inventario de recursos
Se listan los recursos disponibles para el proyecto, incluyendo el personal (expertos de negocio,
expertos de datos, soportes técnicos, expertos en minería de datos), datos (extractos fijos,
aproximaciones a la vida real, almacenes de datos, o datos operacionales), recursos
computacionales (plataformas de hardware), y software (herramientas de minería de datos, otros
software relevantes).
Requerimientos, presunciones, y restricciones
Se listan todos los requerimientos del proyecto, incluyendo el programa de terminación, la
comprensibilidad y calidad de los resultados, y la seguridad, así como las cuestiones legales. Como
parte de esta salida se debe asegurar que se permita usar los datos.
Se listan las presunciones hechas por el proyecto. Estas pueden ser presunciones sobre los datos que
pueden ser verificados durante la minería de datos, pero también puede incluir presunciones no
comprobables sobre el negocio relacionado con el proyecto. Es en particular importante listar si esto
afectará la validez de los resultados.
Se listan las restricciones sobre el proyecto. Estas pueden ser restricciones sobre la disponibilidad
de recursos, pero puede también incluir coacciones tecnológicas como el tamaño de conjunto de
datos lo que es práctico para usar el modelado.
Riesgos y contingencias
Se listan los riesgos o los acontecimientos que podrían retrasar el proyecto o hacer que falle. Se
listan los planes de contingencia correspondientes, que acción será tomada si estos riesgos o
acontecimientos ocurren.
Página 29 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Terminología
Se compila un glosario de terminología relevante al proyecto. Esto puede incluir dos componentes:
(1) Un glosario de terminología relevante del negocio, que forma parte de la comprensión del
negocio disponible al proyecto. La construcción de este glosario es una útil “evocación al
conocimiento” y un ejercicio de educación.
(2) Un glosario de terminología de minería de datos, ilustrada con ejemplos relevantes al problema
del negocio en cuestión.
Costos y beneficios
Se construye un análisis de costo-beneficio para el proyecto, que compare los gastos del proyecto
con los beneficios potenciales al negocio si esto es exitoso. La comparación debería ser tan
específica como sea posible. Por ejemplo, usar medidas monetarias en una situación comercial.
4.2.1.3. Determinación de los objetivos de la minería de datos
Tarea: Determinar los objetivos de la minería de datos
Un objetivo de negocio declara objetivos en la terminología de negocio. Un objetivo de minería de
datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría
ser “Aumentar catálogos de ventas a clientes existentes.” Un objetivo de minería de datos podría ser
“Predecir cuantas baratijas un cliente comprará, obteniendo datos de sus compras de tres años
pasados, información demográfica (edad, sueldo, ciudad, etc.), y el precio del artículo.”
Salida: Objetivos de la minería de datos
Se describen las salidas intencionadas del proyecto que permiten el logro de los objetivos de
negocio.
Criterios de éxito de la minería de datos
Se definen los criterios de un resultado exitoso para el proyecto en términos técnicos por ejemplo,
un cierto nivel de predicción precisa o un perfil de inclinación a comprar con un determinado grado
de "elevación". Como con un criterio de éxito de negocio, puede ser necesario describir estos en
términos subjetivos, en este caso la persona o las personas que hacen el juicio subjetivo deberían ser
identificadas.
4.2.1.4. Producir el plan del proyecto
Tarea: Producir el plan del proyecto
Se describe el plan intencionado para alcanzar los objetivos de minería de datos y así alcanzar los
objetivos de negocio.
El plan debería especificar los pasos para ser realizados durante el resto del proyecto, incluyendo la
selección inicial de herramientas y técnicas.
Página 30 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Plan del Proyecto
Se listan las etapas a ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos,
entradas, salidas, y dependencias. Donde sea posible, se debe hacer explícita la iteración en gran
escala en el proceso de minería de datos. Por ejemplo, las repeticiones del modelado y las fases de
evaluación.
Como parte del plan de proyecto es también importante analizar dependencias entre la planificación
de tiempo y los riesgos.
Se marcan los resultados de estos análisis explícitamente en el plan de proyecto, idealmente con
acciones y recomendaciones si los riesgos se manifiestan.
El plan de proyecto contiene proyectos detallados para cada fase. Se decide en este punto que
estrategia de evaluación será usada en la fase de evaluación.
El plan de proyecto es un documento dinámico debido a que en el final de cada fase son necesarios
una revisión del progreso y logros y es recomendada una actualización correspondiente del plan de
proyecto. Los puntos de revisión específicas para estas actualizaciones son parte del plan del
proyecto.
Evaluación inicial de herramientas y técnicas
En el final de la primera fase, una evaluación inicial de herramientas y técnicas debería ser
realizada. Aquí, por ejemplo, se puede seleccionar una herramienta de minería de datos que soporte
varios métodos para las distintas etapas del proceso. Es importante evaluar herramientas y técnicas
tempranamente en el proceso desde la selección de herramientas y técnicas y esto puede influir en el
proyecto entero.
4.2.2. Comprensión de Datos
En esta fase se desarrolla el entendimiento de datos y todas aquellas actividades relacionadas con la
limpieza de datos, identificación de problemas vinculados con la toma de datos, procedimientos
para determinar la calidad de datos y todo lo tendiente a facilitar la familiarización con los datos. A
partir de esta etapa se determinan los primeros subconjuntos de datos que pueden contener la
información que se está buscando.
Página 31 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Figura 7: Comprensión de Datos
4.2.2.1. Recolección de datos iniciales
Tarea: Recolectar datos iniciales
Se adquieren en el proyecto los datos (o el acceso a los datos) listados en los recursos del proyecto.
Esta colección inicial incluye carga de datos, si es necesario para la comprensión de los datos. Por
ejemplo, si se usa un instrumento específico para la comprensión de los datos, esto perfectamente se
entiende para abrir sus datos en esta herramienta. Este esfuerzo posiblemente conduce a los pasos
iniciales de Preparación de Datos.
Si se adquieren datos de múltiples fuentes, la integración es una cuestión adicional, aquí o más tarde
en las fases de Preparación de Datos.
Salida: Informe de colección de datos inicial
Se lista el conjunto de dato(s) adquirido(s), juntos con sus posiciones, los métodos usados para
adquirirlos, y algunos de los problemas encontrados. Se registran los problemas encontrados y
algunas de las resoluciones alcanzadas. Esto ayuda a la réplica (observación) futura del proyecto o a
la ejecución de proyectos similares futuros.
Página 32 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.2.2.2. Describir los datos
Tarea: Describir los datos
Se examinan las propiedades "gruesas" o "superficiales" de los datos e informes adquiridos en los
resultados.
Salida: Informe de descripción de datos
Se describen los datos que han sido adquiridos, incluyendo su formato, la cantidad de datos (por
ejemplo, el número de registros y campos en cada tabla), los identificadores de los campos, y
cualquier otro rasgo superficial que ha sido descubierto. Se evalúa si los datos adquiridos satisfacen
las exigencias relevantes.
4.2.2.3. Explorar los datos
Tarea: Explorar los datos
Esta tarea dirige interrogantes de minería de datos usando preguntas, visualización, y técnicas de
reporte. Estos incluyen la distribución de atributos claves (por ejemplo, el atributo objetivo de una
tarea de predicción) relacionados entre pares o pequeños números de atributos, los resultados de
simples agregaciones, las propiedades de las subpoblaciones significativas, y análisis estadísticos
simples. Estos análisis directamente pueden dirigir los objetivos de minería de datos; ellos también
pueden contribuir o refinar la descripción de datos e informes de calidad, y alimentar en la
transformación y otros pasos de Preparación de Datos necesarios para análisis futuros.
Salida: Informe de exploración de datos
Se describen los resultados de esta tarea, incluyendo primeras conclusiones o hipótesis iniciales y su
impacto sobre el resto del proyecto. Si es apropiado, se pueden incluir gráficos y plots para indicar
las características de datos que sugieren más examen de subconjuntos de datos interesantes.
4.2.2.4. Verificar la calidad de los datos
Tarea: Verificar la calidad de los datos
Se examina la calidad de los datos, dirigiendo preguntas como: ¿Los datos están completos? ¿Esto
cubre todo los casos requeridos? ¿Son correctos, o estos contienen errores y, si hay errores, que tan
comunes son estos? ¿Hay valores omitidos en los datos? Si es así, ¿como se representan estos,
donde ocurre esto, y que tan comunes son estos?
Salida: Informe de calidad de datos
Se listan los resultados de la verificación de calidad de datos; si existen problemas de calidad, se
listan las posibles soluciones. Las soluciones a los problemas de calidad de datos generalmente
dependen tanto del conocimiento de los datos como del negocio.
4.2.3. Preparación de Datos
Página 33 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
En esta etapa se desarrollan las actividades para construir el conjunto de datos final. Aquí se
relaciona directamente el formato de los datos obtenidos con las herramientas de minería de datos a
utilizar. La tarea de Preparación de Datos probablemente será desarrollada en más de una fase en
paralelo a lo largo de todo el proyecto. Esta fase y sus tareas están vinculados con los aspectos
técnicos de sistemas como lo son las base de datos, tablas, registros, documentos electrónicos y
todos los programas / procesos para la transformación de los datos en información utilizable por los
modelos de minería de datos.
Figura 8: Preparación de Datos
Salida: Conjunto de datos
Este es el conjunto (o conjuntos) producido por la fase de Preparación de Datos, que es usada para
modelar o para el trabajo principal de análisis del proyecto.
Página 34 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Descripción del conjunto de datos
Se describe el conjunto de datos (o conjuntos) que es usado para el modelado y el trabajo principal
de análisis del proyecto.
4.2.3.1. Selección de datos
Tarea: Seleccionar datos
Se decide si los datos son usados para el análisis. Los criterios incluyen tanto la importancia a los
objetivos de la minería de datos, la calidad, y las restricciones técnicas como los límites sobre el
volumen de datos o los tipos de datos. La selección de datos puede cubrir tanto la selección de
atributos (columnas) como la selección de registros (filas) en una tabla.
Salida: Razonamiento para la inclusión/exclusión
Se listan los datos para ser incluidos o excluidos y los motivos para estas decisiones.
4.2.3.2. Limpieza de datos
Tarea: Limpiar datos
Se eleva la calidad de los datos al nivel requerido por las técnicas de análisis seleccionadas. Esto
puede implicar la selección de los subconjuntos de datos limpios, la inserción de datos por defecto
adecuados, o técnicas más ambiciosas tales como la estimación de datos faltantes mediante
modelado.
Salida: Informe de la limpieza de los datos
Se describe que decisiones y acciones fueron tomadas para dirigir los problemas de calidad de datos
informados durante la tarea de Verificación de Calidad de Datos de la fase de Comprensión de
Datos. Las transformaciones de los datos para una apropiada limpieza y el posible impacto en el
análisis de resultados deberían ser considerados.
4.2.3.3. Construir datos
Tarea: Construir datos
Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción
de atributos derivados o el ingreso de nuevos registros, o la transformación de valores para atributos
existentes.
Salidas: Atributos derivados
Los atributos derivados son los atributos nuevos que son construidos de uno o más atributos
existentes en el mismo registro. Ejemplo: área = longitud x anchura.
Página 35 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Registros generados
Se describe la creación de registros completamente nuevos. Ejemplo: Crear registros para los
clientes quienes no hicieron compras durante el año pasado. No habría ninguna razón de tener tales
registros en los datos brutos, pero para el objetivo del modelado esto podría tener sentido para
representar explícitamente el hecho que ciertos clientes no hayan hecho ninguna compra.
4.2.3.4. Integrar datos
Tarea: Integrar datos
Estos son los métodos por el cual la información es combinada desde múltiples tablas o registros
para crear nuevos registros o valores.
Salida: Combinación de datos
La combinación de tablas se refiere a la unión simultánea de dos o más tablas que tienen
información diferente sobre el mismo objeto. Ejemplo: una cadena de venta al público tiene una
tabla con la información sobre las características generales de cada tienda (por ejemplo, el espacio,
el tipo de comercio), otra tabla con datos resumidos de las ventas (por ejemplo, el beneficio, el
cambio porcentual en ventas desde el año anterior), y la otra con información sobre los datos
demográficos del área circundante. Cada una de estas tablas contiene un registro para cada tienda.
Estas tablas pueden ser combinadas simultáneamente en una nueva tabla con un registro para cada
tienda, combinando campos de las tablas fuentes.
Los datos combinados también cubren agregaciones. La agregación se refiere a operaciones en la
que nuevos valores de información resumida son calculados desde múltiples registros y/o tablas.
Por ejemplo, convirtiendo una tabla de compra de clientes donde hay un registro para cada compra
en una tabla nueva donde hay un registro para cada cliente, con campos tales como el número de
compras, el promedio de la cantidad de compra, el porcentaje de ordenes cobrados a tarjeta de
crédito, el porcentaje de artículos bajo promoción, etc.
4.2.3.5. Formatear datos
Tarea: Formatear datos
Se refiere a modificaciones principalmente sintácticas hechas a los datos que no cambian su
significado, pero podría ser requerido por la herramienta de modelado.
Salida: Datos reformateados
Algunas herramientas tienen requerimientos sobre el orden de los atributos, tales como el primer
campo que es un único identificador para cada registro o el último campo que es el campo resultado
que el modelo debe predecir.
Podría ser importante cambiar el orden de los registros en el conjunto de datos. Quizás la
herramienta de modelado requiere que los registros sean clasificados según el valor del atributo de
resultado.
Página 36 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Comúnmente, los registros del conjunto de datos son ordenados al principio de algún modo, pero el
algoritmo que modela necesita que ellos estén en un orden moderadamente arbitrario. Por ejemplo,
cuando se usan redes neuronales, esto es generalmente mejor para los registros para ser presentados
en un orden aleatorio, aunque algunas herramientas manejen esto automáticamente sin la
intervención explicita del usuario.
Además, hay cambios puramente sintácticos hechos para satisfacer las exigencias de la herramienta
de modelado específica. Ejemplos: el quitar las comas de adentro de campos de texto en ficheros de
datos delimitados por coma, cortar todos los valores a un máximo de 32 caracteres.
4.2.4. Modelado
En esta fase se eligen diferentes técnicas de modelado de datos y se estudian y ajustan parámetros
con los valores correctos para el proyecto. Existen en el universo tecnológico muchas técnicas para
la resolución del mismo problema de minería de datos. Es altamente probable que desde el
modelado sea necesario volver a la fase de preparación de datos puesto que todas las técnicas en
evaluación pueden tener requisitos de formato de datos diferentes. Durante esta etapa los datos son
procesados más de una vez posiblemente por cada herramienta.
Figura 9: Modelado
Página 37 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.2.4.1. Selección de la técnica de modelado
Tarea: Escoger la técnica de modelado
Como primer paso en modelado, se debe seleccionar la técnica de modelado real que va a ser
usado.
Aunque se haya podido seleccionar una herramienta durante la fase de Comprensión del Negocio,
esta tarea se refiere a la técnica de modelado específico, por ejemplo, un árbol de decisión
construido con C4.5, o la generación de redes neuronales Back-Propagación. Si múltiples técnicas
son aplicadas, se realiza esta tarea separadamente para cada técnica.
Salida: Técnicas de modelado
Se documenta la técnica de modelado real que se está por usar.
Presunciones del modelado
Muchas técnicas de modelado hacen presunciones específicas sobre los datos como por ejemplo que
todos los atributos tengan distribuciones uniformes, no encontrar valores no permitidos, el atributo
de clase debe ser simbólico, etc. Se debe registrar cualquiera de tales presunciones hechas.
4.2.4.2. Generación de la prueba de diseño
Tarea: Generar la prueba de diseño
Antes de construir un modelo, se debe generar un procedimiento o el mecanismo para probar la
calidad y validez del modelo. Por ejemplo, en tareas de minería de datos supervisados como la
clasificación, es común usar tasas de errores como medida de calidad para modelos de minería de
datos. Por lo tanto, típicamente se separa el conjunto de datos en una serie y en un conjunto de
prueba construimos el modelo sobre el conjunto de series, y se estima su calidad sobre el conjunto
de prueba separado.
Salida: Prueba de diseño
Se describe el plan intencionado para el entrenamiento, la prueba, y la evaluación de los modelos.
Un componente primario del plan determina como dividir un conjunto de datos disponible en datos
de entrenamiento, datos de prueba, y conjunto de datos de validación.
4.2.4.3. Construcción del modelo
Tarea: Construir el modelo
Se ejecuta la herramienta de modelado sobre el conjunto de datos preparados para crear uno o más
modelos.
Salidas: Parámetros de ajustes
Página 38 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Con cualquier herramienta de modelado, hay a menudo un gran número de parámetros que pueden
ser ajustados. Se listan los parámetros y sus valores escogidos, también con el razonamiento para
elegir los parámetros de ajustes.
Modelos
Estos son los modelos reales producidos por la herramienta de modelado, no un informe.
Descripciones del modelo
Se describen los modelos obtenidos. Se informa sobre la interpretación de los modelos y se
documenta cualquier dificultad encontrada con sus significados.
4.2.4.4. Evaluación del modelo
Tarea: Evaluar el modelo
Se interpretan los modelos según su conocimiento de dominio, los criterios de éxitos de minería de
datos, y el diseño de prueba deseado. Se juzga el éxito de la aplicación del modelado y se descubren
técnicas mas técnicamente; se necesita tomar contacto con analistas de negocio y expertos en el
dominio luego para hablar de los resultados de la minería de datos en el contexto de negocio. Se
nota que esta tarea sólo se considera para modelos, mientras que la fase de evaluación también toma
en cuenta todos los otros resultados que fueron producidos en el curso del proyecto.
Se intenta clasificar los modelos. Se evalúan los modelos según los criterios de evaluación. Tanto
como es posible, también se tiene en cuenta objetivos del negocio y criterios de éxito de negocio.
En los grandes proyectos de minería de datos, se aplica una sola técnica más de una vez, o se
generan resultados de minería de datos con varias técnicas diferentes. En esta tarea, se comparan
todos los resultados según los criterios de evaluación.
Salida: Evaluación de modelos
Se resumen los resultados de esta tarea, se listan las calidades de los modelos generados (por
ejemplo, en términos de exactitud), y se clasifican su calidad en relación con cada uno.
Parámetros de ajustes revisados
Según la evaluación del modelo, se revisan los parámetros de ajuste para la siguiente corrida en la
tarea de Construcción del Modelo. Se repite la construcción y evaluación del modelo hasta que se
encuentre el/los mejor/es modelo/s. Se documenta todo, tanto las revisiones como las evaluaciones.
4.2.5. Evaluación
Hasta esta fase se han obtenido algunos modelos de minería de datos con sus datos y parámetros
establecidos en forma óptima pero antes de pasar a la etapa final es necesario evaluar los resultados
obtenidos por la ejecución de los programas en función de los objetivos de negocio. Aquí se puede
presentar la necesidad de eliminar, modificar o considerar nuevas cuestiones relacionadas con el
negocio. Al final de la fase probablemente se tomarán algunas decisiones.
Página 39 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Figura 10: Evaluación
4.2.5.1. Evaluación de los resultados
Tarea: Evaluar los resultados
Los pasos de la evaluación anterior tratan con factores como la exactitud y la generalidad del
modelo. Este paso evalúa el grado al que el modelo responde (encuentra) los objetivos de negocio y
procura determinar si hay alguna decisión de negocio por el que este modelo es deficiente. Otra
opción de evaluación es probar el/los modelo/s sobre aplicaciones de prueba en la aplicación real, si
el tiempo y las restricciones de presupuesto lo permiten.
Además, la evaluación también verifica otros resultados generados por la minería de datos. Los
resultados de la minería de datos implican modelos que necesariamente son relacionados con los
objetivos originales de negocio y todas los otros descubrimientos que no son relacionados
necesariamente con los objetivos originales de negocio, pero también podría revelar desafíos
adicionales, información, o insinuaciones para futuras direcciones.
Salida: Evaluación de los resultados de la minería de datos en lo que concierne a criterios de
éxito de negocio
Se resumen los resultados de evaluación en términos de criterios de éxito de negocio, incluyendo
una declaración final en cuanto a si el proyecto ya encuentra los objetivos iniciales de negocio.
Modelos aprobados
Después de la evaluación de modelos en lo que concierne a criterios de éxito de negocio, los
modelos generados que encuentran los criterios seleccionados son los modelos aprobados.
Página 40 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.2.5.2. Proceso de revisión
Tarea: Revisar el proceso
En este punto, los modelos resultantes pasan a ser satisfactorios y a satisfacer las necesidades de
negocio. Ahora es apropiado hacer una revisión más cuidadosa de los compromisos de la minería de
datos para determinar si hay algún factor importante o tarea que de algún modo ha sido pasada por
alto. Esta revisión también cubre cuestiones de calidad como por ejemplo: ¿Se construyó
correctamente el modelo? ¿Se usan sólo los atributos que se permitieron usar y que están
disponibles para análisis futuros?
Salida: Revisión de proceso
Se resume la revisión de proceso y se destacan las actividades que han sido omitidas y/o aquellas
que deberían ser repetidas.
4.2.5.3. Determinación de los próximos pasos
Tarea: Determinar los próximos pasos
Según los resultados de la evaluación y la revisión de proceso, se decide como proceder. Se decide
si hay que terminar este proyecto y tomar medidas sobre el desarrollo si es apropiado, tanto iniciar
más iteraciones, o comenzar nuevos proyectos de minería de datos. Esta tarea incluye los análisis de
recursos restantes y del presupuesto, que puede influir en las decisiones.
Salida: Lista de posibles acciones
Se listan las acciones futuras potenciales, con los motivos a favor y en contra de cada opción.
Decisión
Se describe la decisión en cuanto a como proceder, junto con el razonamiento.
4.2.6. Desarrollo
El final del proyecto no termina con el modelado de datos y su ejecución y posterior evaluación de
los resultados puesto que el conocimiento obtenido hasta aquí debe ser presentado de forma clara y
precisa a todos los actores dentro de la organización. Se puede presentar un simple informe de
resultados, desarrollar una aplicación para la presentación de los resultados o bien instruir al usuario
de los modelos para que ellos mismos generen y ejecuten los modelos con nuevos datos. Es
importante al final de esta fase tener desarrollada toda la documentación del proyecto para dar
independencia al usuario final en la utilización y generación de nuevos procesos de explotación de
datos.
Página 41 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Figura 11: Desarrollo
4.2.6.1. Desarrollo del plan
Tarea: Desarrollar el plan
De acuerdo al desarrollo de los resultados de minería de datos en el negocio, esta tarea toma los
resultados de la evaluación y determina una estrategia para el desarrollo. Si un procedimiento
general ha sido identificado para crear el/los modelo/s relevante/s, este procedimiento es
documentado aquí para el desarrollo posterior.
Salida: Desarrollo del plan
Resumir la estrategia de desarrollo, incluyendo los pasos necesarios y como realizarlos.
4.2.6.2. Plan de supervisión y mantenimiento
Tarea: Planear la supervisión y el mantenimiento
La supervisión y el mantenimiento son cuestiones importantes si los resultados de minería de datos
son parte del negocio cotidiano y de su ambiente. La preparación cuidadosa de una estrategia de
mantenimiento ayuda a evitar largos periodos innecesarios de uso incorrecto de resultados de
minería de datos. Para supervisar el desarrollo de los resultados de la minería de datos, el proyecto
necesita un plan detallado de proceso de supervisión. Este plan tiene en cuenta el tipo específico de
desarrollo.
Página 42 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Supervisión y plan de mantenimiento
Se resume la estrategia de supervisión y mantenimiento incluyendo los pasos necesarios y como
realizarlos.
4.2.6.3. Informe definitivo de producto
Tarea: Producir el informe final
En el final del proyecto, se sobrescribe un informe final. Según el plan de desarrollo, este informe
puede ser sólo un resumen del proyecto y sus experiencias (si éstas aún no han sido documentadas
como una actividad en curso) o ésta puede ser una presentación final y comprensiva de los
resultados de minería de datos.
Salidas: Informe definitivo
Esto es el informe escrito final del compromiso de la minería de datos. Esto incluye todo el
desarrollo anterior, el resumen y la organización de los resultados.
Presentación final
También a menudo habrá una reunión en la conclusión del proyecto en el que los resultados son
presentados verbalmente al cliente.
4.2.6.4. Revisión del proyecto
Tarea: Revisar el proyecto
Se evalúa lo que fue correcto y lo que se equivocó, lo que fue bien hecho y lo que necesita ser
mejorado.
Salida: Documentación de la experiencia
Se resumen las experiencias importantes ganadas durante el proyecto. Por ejemplo, trampas,
accesos engañosos, o las insinuaciones para seleccionar las mejores técnicas de minería de datos en
situaciones similares podrían ser la parte de esta documentación. En proyectos ideales, la
documentación de la experiencia también cubre cualquier informe que ha sido escrito por miembros
individuales del proyecto durante las fases del proyecto y sus tareas.
4.3. La guía de usuario de CRISP-DM
4.3.1. Comprendiendo el negocio
4.3.1.1. Determinación de objetivos de negocio
Tarea: Determinar objetivos de negocio
El primer objetivo es comprender a fondo, desde una perspectiva de negocio, lo que el cliente
realmente quiere lograr. A menudo el cliente tiene muchos objetivos y restricciones que compiten
que deben ser correctamente equilibrados. El objetivo debe ser destapar factores importantes en el
Página 43 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
principio del proyecto esto puede influir en el resultado final. Una consecuencia probable de
descuidar este paso puede ser a expensas de un gran esfuerzo de producir las respuestas correctas a
las preguntas incorrectas.
Salida: Contexto
Se debe cotejar la información sobre la situación de negocio de la organización al principio del
proyecto. Estos detalles no sólo sirven para identificar más estrechamente los objetivos de negocio a
ser alcanzados, sino también sirven para identificar los recursos, tanto humanos como materiales,
que pueden ser usados durante el curso del proyecto.
Actividades: Organizar
•
•
•
•
•
Desarrollar organigramas que identifiquen divisiones, departamentos, y grupos de proyectos.
El organigrama debería también identificar los nombres de los gerentes y sus
responsabilidades.
Identificar a personas claves en el negocio y sus roles.
Identificar a un patrocinador interno (el patrocinador financiero y el experto primario del
dominio de usuario).
Indicar si hay un comité de dirección y lista de miembros.
Identificar las unidades de negocio que son afectadas por el proyecto de minería de datos
(por ejemplo, el Control de comercialización, Ventas, Finanzas).
Área del problema
•
•
•
•
•
•
•
Identificar el área del problema (por ejemplo, el control de comercialización, el cuidado de
cliente, el desarrollo comercial, etc.).
Describir el problema en términos generales.
Comprobar el estado actual del proyecto (por ejemplo, comprobar si ya esta claro que dentro
de la unidad de negocio un proyecto de minería de datos debe ser realizado, o si la minería
de datos necesita ser promovida como una tecnología clave en el negocio).
Clarificar los requisitos previos del proyecto (por ejemplo, ¿Cuál es la motivación del
proyecto? ¿La minería de datos ya está siendo usada en el negocio?).
Si es necesario, preparar presentaciones y demostraciones de minería de datos para el
negocio.
Identificar grupos de objetivos para el resultado de proyecto (por ejemplo, ¿Se espera
entregar un informe para la dirección superior o un sistema operacional para ser usado por
usuarios finales inexpertos?).
Identificar las necesidades de los usuarios y sus expectativas.
Solución actual
•
•
Describir cualquier solución usada actualmente para dirigir el problema.
Describir las ventajas y las desventajas de la solución corriente y el nivel al que esto es
aceptado por los usuarios.
Página 44 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Objetivos de negocio
Describir el objetivo primario del cliente, desde una perspectiva de negocio. Además del objetivo de
negocio primario, hay típicamente un gran número de preguntas relacionadas al negocio a las que al
cliente le gustaría dirigir. Por ejemplo, el objetivo primario de negocio podría ser mantener a
clientes actuales por predicción cuando ellos son propensos a moverse a un competidor, mientras un
objetivo secundario de negocio podría ser el de determinar si precios (comisiones) inferiores afectan
sólo un a segmento particular de clientes.
Actividades
•
•
•
•
De manera informal describir el problema a ser solucionado.
Especificar todas las preguntas de negocio tan precisas como sea posible.
Especificar cualquier otras exigencias de negocio (por ejemplo, el negocio no quiere perder
a ningún cliente).
Especificar las ventajas esperadas en términos de negocio.
Se debe tener cuidado
Se debe tener cuidado de establecer objetivos inalcanzables. Deben ser tan realistas como posibles y
hechos por ellos.
Salida: Criterios de éxito de negocio
Describir los criterios para un resultado exitoso o útil al proyecto desde el punto de vista del
negocio. Esto podría ser bastante específico y fácilmente medible, como una reducción de cliente a
un cierto grado, o general y subjetivo, como “dar ideas útiles en las relaciones”. En el caso último,
se debe estar seguro de indicar quien haría el juicio subjetivo.
Actividades
•
•
Especificar criterios de éxito de negocio (por ejemplo, Mejorar la tasa de respuesta en una
campaña de correo en el 10 por ciento y marcar la tasa en el 20 por ciento).
Identificar quien evalúa los criterios de éxito.
Se debe recordar
Cada uno de los criterios de éxito debería relacionarse con al menos uno de los objetivos
especificados de negocio.
Se recomienda
Antes del comienzo de la evaluación de situación, se podría analizar las experiencias anteriores del
problema. Internamente, usando CRISP-DM, o externamente, usando soluciones pre-empaquetadas.
Página 45 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.3.1.2. Evaluación de la situación
Tarea: Evaluar la situación
Esta tarea implica una investigación más detallada sobre todos los recursos, restricciones,
presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de
análisis de datos y en el desarrollo del plan de proyecto.
Salida: Inventario de recursos
Listar los recursos disponibles para el proyecto, incluyendo el personal (expertos de datos y de
negocios, soportes técnicos, expertos en minería de datos), datos (extracciones fijas, acceso a datos
existentes en almacenes de datos u operacionales), recursos computacionales (plataformas de
hardware), y software (instrumentos de minería de datos, otros software relevantes).
Actividades: Recursos de Hardware
•
•
•
•
Identificar el hardware básico.
Establecer la disponibilidad del hardware básico para el proyecto de minería de datos.
Comprobar si la planificación del mantenimiento de hardware se opone a la disponibilidad
del hardware para el proyecto de minería de datos.
Identificar el hardware disponible para ser usado por la herramienta de minería de datos (si
el instrumento es conocido en esta etapa).
Fuentes de datos y conocimientos
•
•
•
•
•
•
Identificar las fuentes de datos.
Identificar el tipo de fuentes de datos (fuentes en línea, expertos, documentación escrita,
etc.).
Identificar fuentes de conocimiento.
Identificar el tipo de fuentes de conocimientos (fuentes en línea, expertos, documentación
escrita, etc.).
Comprobar herramientas disponibles y técnicas.
Describir el conocimiento de generalidades relevantes (de manera informal o formal).
Fuentes de personal
•
•
•
•
Identificar al patrocinador del proyecto.
Identificar al administrador de sistema, el administrador de base de datos, y el personal de
soporte técnico para futuras preguntas.
Identificar al analista de mercado, los expertos en minería de datos, y estadísticos, y
comprobar su disponibilidad.
Comprobar la disponibilidad de expertos de dominio para fases posteriores
Se debe recordar
Se debe recordar que el proyecto puede necesitar personal técnico en cualquier momento en todas
partes del proyecto, por ejemplo durante la transformación de datos.
Página 46 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salidas: Requerimientos, presunciones, y restricciones
Listar todos los requerimientos del proyecto, incluyendo la planeación de la terminación, la
comprensibilidad, y la calidad y seguridad de los resultados, así como cuestiones legales. Como
parte de esta salida, se debe asegurar que se permiten usar los datos.
Listar las presunciones hechas por el proyecto. Estos pueden ser presunciones sobre los datos, que
pueden ser verificados durante la minería de datos, pero también puede incluir presunciones no
comprobables relacionadas con el proyecto. Esto es en particular importante de ponerlos en una
lista si ellos afectarán la validez de los resultados.
Listar las restricciones hechas en el proyecto. Estas restricciones podrían implicar la carencia de
recursos para terminar algunas tareas en el proyecto en el tiempo requerido, o pueden ser
restricciones legales o éticas sobre el uso de los datos o la solución necesaria para terminar la tarea
de minería de datos.
Actividades: Requerimientos
•
•
•
•
Especificar el perfil del grupo objetivo.
Capturar todos los requerimientos en la planificación.
Capturar los requerimientos de comprensibilidad, exactitud, desarrollar habilidades,
mantenimiento, y repetibilidad del proyecto de minería de datos y los modelos resultantes.
Capturar los requerimientos de seguridad, restricciones legales, de privacidad, información,
y planificación de proyecto.
Presunciones
•
•
•
•
•
Aclarar todas las presunciones (incluyendo las implícitas) y las hechas por ellos
explícitamente (por ejemplo, dirigir las cuestiones de negocio, a un número mínimo de
clientes con la edad por encima de 50 es necesaria).
Listar las presunciones sobre calidad de datos (por ejemplo, exactitud, disponibilidad)
Listar las presunciones sobre factores externos (por ejemplo, cuestiones económicas,
productos competitivos, avances técnicos).
Aclarar presunciones que conducen a cualquiera de las estimaciones (por ejemplo, el precio
de un instrumento específico es asumido para ser menor que $ 1.000).
Listar todas las presunciones en cuanto a si es necesario entender y describir o explicar el
modelo (por ejemplo, cómo el modelo y los resultados son presentados a la dirección /
patrocinador).
Restricciones
•
•
•
•
•
Comprobar restricciones generales (por ejemplo, cuestiones legales, presupuesto, escalas de
tiempo, y recursos).
Comprobar el correcto acceso a fuentes de datos (por ejemplo, restricciones de acceso, la
contraseña requerida).
Comprobar la accesibilidad de técnica de datos (los sistemas operativos, el sistema de
administración de datos, el formato de archivo y de base de datos).
Comprobar si el conocimiento relevante es accesible.
Comprobar restricciones de presupuesto (gastos fijos, gastos de implementación, etc.).
Página 47 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Se debe recordar
La lista de presunciones también incluye presunciones al principio del proyecto, esto es, lo que el
punto de inicio del proyecto ha sido.
Salidas: Riesgos y contingencias
Listar los riesgos, es decir los acontecimientos que podrían ocurrir, impactando en la planificación,
el costo, o el resultado. Listar los planes de contingencias respectivos: que acción será tomada para
evitar o reducir al mínimo el impacto o recuperarse de la ocurrencia de los riesgos previstos.
Actividades: Identificar riesgos
•
•
•
•
•
Identificar riesgos de negocio (por ejemplo, el competidor aparece primero con mejores
resultados).
Identificar riesgos de organización (por ejemplo, el departamento que solicita el proyecto no
tiene financiación para el proyecto).
Identificar riesgos financieros (por ejemplo, aumentar la financiación depende de los
resultados iniciales de minería de datos).
Identificar riesgos técnicos.
Identificar los riesgos que dependen de datos y de las fuentes de datos (por ejemplo, la mala
calidad y cobertura).
Desarrollo de planes de contingencia
•
•
Determinar condiciones en las que cada riesgo puede ocurrir.
Desarrollar planes de contingencia.
Salida: Terminología
Compilar un glosario de terminología relevante al proyecto. Esto debería incluir al menos dos
componentes:
(1) Un glosario de terminología relevante de negocio, que forma parte de la comprensión de
negocio disponible al proyecto.
(2) Un glosario de terminología de minería de datos, ilustrada con ejemplos relevantes al problema
de negocio en cuestión.
Actividades
•
•
•
Comprobar la disponibilidad previa de glosarios; sino se debe comenzar a bosquejar
glosarios.
Hablar a expertos de dominio para entender la terminología.
Familiarizarse con la terminología de negocio.
Salida: Costos y beneficios
Preparar un análisis de costo-beneficio para el proyecto, comparando los gastos del proyecto con el
beneficio potencial para el negocio si esto es exitoso.
Página 48 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Actividades
•
•
•
•
Estimar el costo para la colección de datos.
Estimar el costo de desarrollo y realización de una solución.
Identificar beneficios (por ejemplo, mejorar la satisfacción del cliente, ROI, y el aumento de
las ganancias).
Estimar gastos de operación.
Se recomienda
La comparación debería ser tan específica como sea posible, cómo esto permite un mejor caso de
negocio para ser realizado.
Se debe tener cuidado
Se deben identificar costos ocultos, como la extracción y preparación repetida de datos, cambios en
los procesos laborales, y tiempo requerido para el entrenamiento.
4.3.1.3. Determinar objetivos de minería de datos
Tarea: Determinar objetivos de minería de datos
Un objetivo de negocio declara objetivos en la terminología de negocio; un objetivo de minería de
datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría
ser, “Aumentar la venta por catalogo a clientes existentes”, mientras un objetivo de minería de datos
podría ser, “Predecir cuantas baratijas comprará un cliente, considerando sus compras durante los
tres años pasados, información demográfica relevante, y el precio del artículo.”
Salida: Objetivos de minería de datos
Describir las salidas planeadas del proyecto que permiten el logro de los objetivos de negocio.
Se debe tener en cuenta que estas son salidas normalmente técnicas.
Actividades
•
•
Traducir las preguntas de negocio a objetivos de minería de datos (por ejemplo, una
campaña de control de comercialización requiere la segmentación de clientes para decidir a
quien acercarse en esta campaña; el nivel/tamaño de los segmentos deberían ser
especificados).
Especificar datos, tipo de problema de minería de datos (por ejemplo, la clasificación, la
descripción, la predicción, y clustering).
Se recomienda
Puede ser sabio redefinir el problema. Por ejemplo, modelar la retención de producto más que la
retención del cliente cuando la retención del cliente entrega resultados muy tarde para afectar la
salida.
Página 49 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Criterios de éxitos de minería de datos
Definir los criterios para un resultado acertado para el proyecto en términos técnicos, por ejemplo
un cierto grado de exactitud predictiva o un perfil de propensión a comprar con un nivel dado
"elevación".
Cómo con los criterios de éxitos del negocio, puede ser necesario describir estos en términos
subjetivos, en el caso de que la persona o las personas que hacen el juicio subjetivo debieran ser
identificadas.
Actividades
•
•
•
Especificar los criterios para evaluar el modelo (por ejemplo, la exactitud del modelo, el
funcionamiento y la complejidad).
Definir el patrón de pruebas para los criterios de evaluación.
Especificar las reglas que dirigen criterios de evaluación subjetivos (por ejemplo, la
habilidad de explicar del modelo y de los datos y la comprensión de mercadeo
proporcionada por el modelo).
Se debe tener cuidado
Los datos que extraen criterios de éxito son diferentes a los criterios de éxito de negocio definidos
antes.
Se debe recordar
Se debe recordar que es sabio planear para el desarrollo desde el principio del proyecto.
4.3.1.4. Producción del plan del proyecto
Tarea: Producir el plan del proyecto
Describir el plan propuesto para alcanzar los objetivos de minería de datos y así alcanzar los
objetivos de negocio.
Salida: Plan del Proyecto
Listar las etapas para ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos,
entradas, salidas, y dependencias. En cualquier parte donde sea posible, se deben hacer explícitas
las iteraciones en gran escala en el proceso de minería de datos. Por ejemplo, las repeticiones del
modelado y fases de evaluación. Como parte del plan de proyecto, es también importante analizar
dependencias entre el planeamiento de los tiempos y los riesgos. Marcar los resultados de estos
análisis explícitamente en el plan de proyecto, idealmente con acciones y recomendaciones para
actuar si los riesgos son manifestados.
Aunque esta sea la única tarea en la que el plan de proyecto directamente es llamado, sin embargo
debería ser consultado continuamente y repasado en todas partes del proyecto. Debería ser
consultado el plan de proyecto como mínimo siempre que una tarea nueva sea comenzada o una
iteración futura de una tarea o una actividad este comenzando.
Página 50 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Actividades
•
•
•
•
•
•
•
Definir el plan de proceso inicial y hablar de la viabilidad con todo el personal incluido.
Combinar todos los objetivos identificados y técnicas seleccionadas en un procedimiento
coherente que solucione las cuestiones del negocio y encuentre los criterios de éxito de
negocio.
Estimar el esfuerzo y los recursos necesarios para alcanzar y desarrollar la solución. Es útil
considerar la experiencia de otras personas estimando escalas de tiempo para proyectos de
minería de datos. Por ejemplo, es a menudo presumido que el 50-70 por ciento del tiempo y
el esfuerzo en un proyecto de minería de datos es usado en la fase de Preparación de Datos,
mientras que solo un 20-30 por ciento es usado en la fase de Comprensión de Datos,
mientras que solo un 10-20 por ciento es gastado en cada uno de las fase de Modelado,
Evaluación, y Comprensión del Negocio y el 5-10 por ciento en la fase de Desarrollo.
Identificar pasos críticos.
Marcar los puntos de decisión.
Marcar los puntos de revisión.
Identificar las principales iteraciones.
Salida: Evaluación Inicial de herramientas y técnicas
Al final de la primera fase, el equipo de proyecto realiza una evaluación inicial de herramientas y
técnicas. Aquí, es importante seleccionar una herramienta de minería de datos que soporte varios
métodos para las diferentes etapas del proceso, ya que la selección de herramientas y técnicas puede
influir en el proyecto entero.
Actividades
•
•
•
•
Crear una lista de criterios de selección para herramientas y técnicas (o usar uno existente si
está disponible).
Escoger herramientas y técnicas posibles.
Evaluar la adecuación de técnicas.
Revisar y priorizar técnicas aplicables según la evaluación de soluciones alternativas
4.3.2. Comprensión de Datos
4.3.2.1. Recolección de datos iniciales
Tarea: Recoger datos iniciales
Obtener los datos (o el acceso a los datos) listados en los recursos de proyecto. Esta colección
inicial incluye carga de datos, si es necesario para la Comprensión de Datos. Por ejemplo, si se tiene
la intención de usar una herramienta específica para comprender los datos es lógico cargar los datos
en esta herramienta.
Salida: Informe de la recolección de datos inicial
Se debe describir toda la variedad de datos usados para el proyecto, e incluir cualquier
requerimiento de selección para datos más detallados. El informe de colección de datos también
debería definir si algunos atributos son relativamente más importantes que otros.
Página 51 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Se debe recordar que cualquier evaluación de calidad de datos debería ser hecha no solamente de las
fuentes de datos individuales, sino también de algunos datos que son resultado de fuentes de datos
que se combinan. Por inconsistencias entre las fuentes, los datos combinados pueden presentar los
problemas que no existen en las fuentes de datos individuales.
Actividades: Planificación de requerimientos de datos
Se debe planear que información es necesaria (por ejemplo, sólo para atributos determinados, o la
información adicional específica).
Comprobar si toda la información necesaria (para resolver los objetivos de la minería de datos) esta
en realidad disponible.
Criterios de selección
•
•
•
•
Se debe especificar los criterios de selección (por ejemplo, ¿Qué atributos son necesarios
para los objetivos específicos de minería de datos? ¿Que atributos han sido identificados
como no pertinentes? ¿Cuantos atributos se pueden manejar con las técnicas escogidas?).
Elegir tablas/archivos de interés.
Elegir datos dentro de una tabla/archivo.
Pensar cuanto tiempo de un historial habría que usar (por ejemplo, si 18 meses de datos
están disponibles, sólo 12 meses pueden ser necesarios para el ejercicio).
Se debe tener cuidado
Se debe estar consciente de que los datos recolectados de diferentes fuentes pueden dar lugar a
problemas de calidad cuando sean combinados (por ejemplo, los archivos de dirección combinados
con una base de datos de cliente pueden mostrar inconsistencias de formato, invalidez de datos,
etc.).
Inserción de datos
•
•
•
Si los datos contienen libre entradas de texto, ¿se tendrá que codificarlos para modelar o
necesitamos agruparlos en entradas específicas?
¿Se pueden encontrar atributos omitidos?
¿Se puede mejorar la extracción los datos?
Se recomienda
Se debe recordar que algún conocimiento sobre los datos puede estar disponible de fuentes no
electrónicas (por ejemplo, de gente, de texto impreso, etc.).
Puede ser necesario un preproceso de los datos (datos de serie tiempo, promedios ponderados, etc.).
4.3.2.2. Descripción de datos
Tarea: Describir datos
Examinar las propiedades "gruesas" de los datos obtenidos y el informe sobre los resultados.
Página 52 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Informe de descripción de datos
Se deben describir los datos que han sido obtenidos, incluyendo el formato de los datos, la cantidad
de los datos (por ejemplo, el número de registros y campos internos de cada tabla), las identidades
de los campos, y cualquier otro rasgo superficial que haya sido descubierto.
Actividades: Análisis volumétrico de datos
•
•
•
•
•
•
Identificar datos y métodos de captura.
Acceder a las fuentes de datos.
Usar análisis estadísticos si es apropiado.
Reportar las tablas y sus relaciones.
Comprobar el volumen de datos, el número de múltiplos, la complejidad.
Notar si los datos contienen entradas de texto libres.
Atributo, tipos y valores
•
•
•
•
•
•
•
•
•
•
•
Comprobar la accesibilidad y disponibilidad de atributos.
Comprobar los tipos de atributos (numérico, simbólico, la taxonomía, etc.).
Comprobar el rango de valores de los atributos.
Analizar los atributos correlativos (correlaciones de atributo).
Comprender el significado de cada atributo y clasificar (describir) el valor en términos de
negocio.
Para cada atributo se debe calcular la estadística básica (por ejemplo, calcular la
distribución, el promedio, el máximo, el mínimo, la desviación estándar, la varianza, la
moda, la inclinación, etc.).
Analizar la estadística básica y relacionar los resultados con su significado en términos de
negocio.
Decidir si el atributo es relevante para los objetivos específicos de la minería de datos.
Determinar si el significado del atributo es usado coherentemente (conscientemente).
Entrevistar a expertos de dominio para obtener su opinión sobre la importancia de los
atributos.
Decidir si es necesario equilibrar los datos (basado en las técnicas a ser usadas).
Claves
•
•
Se deben analizar relaciones claves.
Se debe comprobar la cantidad de coincidencias entre valores de atributos claves a través de
tablas.
Revisión de Objetivos/Presunciones
Se debe actualizar la lista de presunciones, si es necesario.
Página 53 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.3.2.3. Exploración de datos
Tarea: Explorar datos
Esta tarea aborda las preguntas de minería de datos que pueden ser dirigidas usando la
interrogación, la visualización, y técnicas de informe. Estos análisis pueden directamente dirigir los
objetivos de minería de datos. Sin embargo, ellos pueden también contribuir a refinar la descripción
de datos e informes de calidad, y alimentar internamente la transformación y otros pasos de
preparación de datos necesario antes de que pueda ocurrir un futuro análisis.
Salida: Informe de exploración de datos
Describir los resultados de esta tarea, incluyendo las primeras conclusiones o las hipótesis iniciales
y su impacto sobre el resto del proyecto. El informe también puede incluir gráficos y diseños (plots)
que indican las características de los datos o los puntos de interés de subconjuntos de datos dignos
de una futura investigación.
Actividades: Explorar Datos
•
•
Se debe analizar en detalles las propiedades de atributos interesantes (por ejemplo, la
estadística básica, las sub-poblaciones interesantes).
Identificar las características de las sub-poblaciones.
Formar suposiciones para análisis futuro
•
•
•
•
•
Considerar y evaluar la información y conclusiones en el informe de descripciones de datos.
Formar una hipótesis e identificar acciones.
Transformar la hipótesis en un objetivo de minería de datos, si es posible.
Aclarar objetivos de minería de datos o hacerlos más exactos. Una búsqueda "ciega" no es
necesariamente inútil, pero una búsqueda más dirigida hacia objetivos de negocio es preferible.
Realizar un análisis básico para verificar la hipótesis.
4.3.2.4. Verificación de la calidad de datos
Tarea: Verificar la calidad de datos
Se debe examinar la calidad de los datos, dirigiendo preguntas como: ¿Son los datos completos?
¿Estos cubren todos los casos requeridos? ¿Hay en ellos errores o ellos contienen errores? Si hay
errores, ¿como son ellos? ¿Hay valores omitidos en los datos? Si es así, ¿cómo son representados,
donde ocurren, y como son ellos?
Salida: Informe de calidad de datos
Listar los resultados de la verificación de calidad de datos; si hay problemas de calidad listar las
posibles soluciones.
Actividades
Identificar valores especiales y catalogar su significado.
Página 54 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Revisión de atributos claves
•
•
•
•
•
•
•
•
•
Se debe comprobar la cobertura (por ejemplo, si todos los valores posibles son
representados).
Comprobar las claves.
Verificar que los significados de los atributos y valores contenidos se satisfacen
simultáneamente.
Identificar atributos omitidos y campos en blanco.
Establecer el significado de datos que faltan o fallan.
Se deben comprobar los atributos con los valores diferentes que tienen significados similares
(por ejemplo, la grasa baja la dieta).
Comprobar la ortografía y el formato de valores (por ejemplo, mismo valor pero a veces
comienza con una letra minúscula y a veces con una letra mayúscula).
Comprobar las desviaciones, y decidir si una desviación es "ruido" o puede indicar un
fenómeno interesante.
Comprobar la plausibilidad de valores, (por ejemplo, todos los campos que tienen el mismo
o casi los mismos valores).
Se recomienda
Se debe repasar cualquiera de los atributos que dan respuestas que están en desacuerdo con el
sentido común (por ejemplo, adolescentes con altos niveles de ingreso).
Se pueden usar plots de visualización, histogramas, etc. para revelar inconsistencias en los datos.
Calidad de datos en archivos planos
•
•
Si los datos son almacenados en archivos planos, se debe comprobar que delimitador es
usado y si esto es usado coherentemente en todos los atributos.
Si los datos son almacenados en archivos planos, comprobar el número de campos en cada
registro para ver si ellos coinciden.
Ruido e inconsistencias entre fuentes
•
•
•
Comprobar consistencia y superabundancia entre fuentes diferentes.
Se debe planear para tratar el ruido.
Descubrir el tipo de ruido y que atributos son afectados.
Se recomienda
Se debe recordar que puede ser necesario excluir algunos datos ya que ellos no exponen
comportamiento positivo o negativo (por ejemplo, al comprobar en el comportamiento del préstamo
de clientes, excluye a todo los que nunca han tomado prestado, aquellos que no financian una
hipoteca de casa, aquellos cuya hipoteca se acerca a la madurez, etc.).
Revisar si las presunciones son válidas o no, considerando la información real o actual en los datos
y el conocimiento de negocio.
Página 55 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.3.3. Preparación de los datos
Salida: Conjunto de datos
Estos son los conjuntos de dato(s) producidos por la fase de Preparación de Datos, usada para
modelar o para el trabajo de análisis principal del proyecto.
Salida: Descripción del conjunto de datos
Esto es, la descripción del conjunto de datos(s) usado para el modelado o para el trabajo de análisis
principal del proyecto.
4.3.3.1. Datos seleccionados
Tarea: Seleccionar datos
Se debe decidir los datos a ser usados para el análisis. Los criterios incluyen la importancia a los
objetivos de minería de datos, la calidad, y las restricciones técnicas como los límites en el volumen
de datos o en los tipos de datos.
Salida: Razonamiento para inclusión/exclusión
Listar los datos a ser usados / excluidos y los motivos para estas decisiones.
Actividades
•
•
•
•
•
•
•
•
Recoger datos adicionales apropiados (de diferentes fuentes - internos así como externos).
Realizar las pruebas de importancia y correlación para decidir si los campos son incluidos.
Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de
calidad de los datos y en la exploración de datos (esto es, se puede desear incluir/excluir
otros juegos de datos).
Reconsiderar Criterios de Selección de Datos (ver la Tarea 2.1) en la luz de experiencia de
modelado (esto es, la evaluación del modelo puede mostrar que otros conjuntos de datos son
necesarios).
Seleccionar diferentes subconjuntos de datos (por ejemplo, atributos diferentes, sólo los
datos que encuentran ciertas condiciones).
Considerar el uso de técnicas de muestreo (por ejemplo, una solución rápida puede implicar
la prueba dura y el entrenamiento del conjunto de datos o la reducción del tamaño del
conjunto de datos de prueba, si la herramienta no puede manejar conjunto de datos llenos.
Esto puede también ser útil para tener muestras ponderadas para dar distinta importancia a
atributos diferentes o valores diferentes del mismo atributo).
Documentar el razonamiento para la inclusión/exclusión.
Comprobar técnicas disponibles para el muestreo de datos.
Se recomienda
Basado en Criterios de Selección de Datos se debe decidir si uno o más atributos son más
importantes que otros y el correspondiente peso de los atributos. Decidir basado en el contexto (esto
es, el uso, la herramienta, etc.), cómo manejarse con el peso.
Página 56 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.3.3.2. Limpieza de datos
Tarea: Limpiar datos
Se debe elevar la calidad de datos al nivel requerido por las técnicas de análisis seleccionadas. Esto
puede implicar la selección de subconjuntos limpios de los datos, la inserción de faltas apropiadas,
o técnicas más ambiciosas como la estimación de datos omitidos por modelado.
Salida: Informe de la limpieza de datos
Describir las decisiones y las acciones que fueron tomados para dirigir los problemas de calidad de
datos informados durante la Tarea de Verificación de Calidad de Datos. Si los datos están para ser
usados en el ejercicio de minería de datos, el informe debería dirigir cuestiones de calidad de datos
excepcionales y el efecto posible que esto podría tener sobre los resultados.
Actividades
•
•
•
•
Reconsiderar como tratar con cualquier tipo de ruido observado.
Corregir, remover, o ignorar el ruido.
Decidir como tratar con valores especiales y su significado. El área de valores especiales
puede dar lugar a muchos resultados extraños y con cuidado deberían ser examinados. Los
ejemplos de valores especiales podrían surgir por los resultados tomados de una revisión
donde algunas cuestiones no fueron preguntadas o no fueron contestadas. Esto podría
terminar en un valor de 99 para datos desconocidos. Por ejemplo, 99 para estado civil o
afiliación política. Los valores especiales también podrían surgir cuando los datos son
truncados por ejemplo 00 para gente de 100 años o para todos los coches con 100.000
kilómetros en el odómetro.
Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de
los datos limpios (esto es, se puede desear incluir/excluir otros conjuntos de datos).
Se recomienda
Recordar que algunos campos pueden ser irrelevantes a los objetivos de la minería de datos y, por lo
tanto, el ruido en aquellos campos no tiene ninguna importancia. Sin embargo, si el ruido es
ignorado por estos motivos, esto debería ser totalmente documentado como circunstancias que
pueden cambiarse más tarde.
4.3.3.3. Construcción de datos
Tarea: Construir datos
Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción
de atributos derivados, completar registros nuevos, o transformar valores para atributos existentes.
Actividades
•
•
Comprobar los mecanismos de construcción disponibles con la lista de herramientas
sugeridas para el proyecto.
Decidir si esto es lo mejor para realizar la construcción dentro de la herramienta o fuera de
ella (esto es, que es más eficiente, exacto, repetible).
Página 57 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de
construcción de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos).
Salida: Atributos derivados
Los atributos derivados son los atributos nuevos que son construidos de uno o más atributos
existentes en el mismo registro. Un ejemplo podría ser: área = longitud x anchura. ¿Por qué se
debería tener que construir atributos derivados durante el curso de una investigación de minería de
datos? No debería pensarse que sólo los datos de bases de datos u otras fuentes deberían ser usados
en la construcción de un modelo. Los atributos derivados podrían ser construidos porque:
•
•
•
El conocimiento del contexto convence que algún hecho es importante y debería ser
representado aunque no se tenga ningún atributo actualmente para representarlo.
El algoritmo de modelado en uso maneja sólo ciertos tipos de datos - por ejemplo se está
usando regresión lineal y se sospecha que hay ciertas no-linealidades que serán incluidas en
el modelo.
El resultado de la fase de modelado sugiere que ciertos hechos no sean cubiertos.
Actividades: Derivar atributos
•
•
•
•
Decidir si cualquier atributo puede ser normalizado (por ejemplo, usando un algoritmo de
agrupamiento (clustering) con el periodo y el ingreso, en ciertas divisas, el ingreso se
controlará).
Considerar agregar nueva información sobre la importancia relevante de los atributos para
agregar nuevos atributos (por ejemplo, atributos con peso, normalización ponderada).
¿Cómo se puede construir o imputar atributos faltantes? Decidir el tipo de construcción (por
ejemplo, la combinación, el promedio, la inducción).
Agregar atributos nuevos a los datos de acceso.
Se recomienda
Antes de agregar Atributos Derivados, se debe intentar determinar si y como ellos facilitan el
proceso de modelado o facilitan el algoritmo de modelado. Quizás “el ingreso por persona” es un
mejor o más fácil atributo para usar que “el ingreso por casa.” No se debe sacar atributos
simplemente para reducir el número de atributos de entrada.
Otro tipo de atributo derivado es la transformación de un atributo individual, por lo general
realizado para cubrir las necesidades de las herramientas de modelado.
Actividades Transformaciones de atributo individual
•
•
Especificar los pasos de transformaciones necesarias en los términos de facilitar la
transformación disponible (por ejemplo, cambiar un binning de un atributo numérico).
Realizar pasos de transformación.
Se recomienda
Las transformaciones pueden ser necesarias para cambiar rangos a campos simbólicos (por ejemplo,
años a rangos de edad) o campos simbólicos (“definitivamente sí”, “sí”, “no se sabe,” "no") a
valores numéricos. Las herramientas de modelado o los algoritmos a menudo los requieren.
Página 58 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Registros generados
Los registros generados son registros completamente nuevos, que agregan nuevo conocimiento o
representan nuevos datos que de otro modo no son representados (por ejemplo, habiendo
segmentado los datos, puede ser útil generar un registro para representar al miembro prototípico de
cada segmento para un tratamiento futuro).
Actividades
Comprobar por técnicas disponibles si es necesario (por ejemplo, mecanismos para construir
prototipos para cada segmento de datos segmentados).
4.3.3.4. Integración de datos
Tarea: Integrar datos
Estos son métodos para combinar la información de múltiples tablas u otras fuentes de información
para crear nuevos registros o valores.
Salida: Datos combinados
La combinación de tablas se refiere a la unión de dos o más tablas que tienen diferente información
sobre los mismos objetos. En esta etapa, también puede ser aconsejable generar registros nuevos.
También puede ser recomendado para generar valores agregados.
La agregación se refiere a operaciones donde los nuevos valores son calculados por información
resumida de múltiples registros y/o tablas.
Actividades
•
•
•
Comprobar si las aplicaciones de integración son capaces de integrar las fuentes de entrada
como se requiere.
Integrar fuentes y resultados almacenados.
Reconsiderar Criterios de Selección de Datos (ver la Tarea 2.1) en la luz de las experiencias
de integración de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos).
Se recomienda
Recordar que algún conocimiento puede estar contenido en un formato no-electrónico.
4.3.3.5. Formateo de datos
Tarea: Formatear datos
Transformar formateando se refiere principalmente a modificaciones sintácticas hechas a los datos
que no cambian su significado, pero podría ser requerido por la herramienta de modelado.
Página 59 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Datos reformateados
Algunas herramientas tienen requerimientos sobre el orden de los atributos, tal que el primer campo
sea un único identificador para cada registro o el campo último ser el juego de resultados que el
modelo debe predecir.
Actividades: Atributos reorganizados
Algunas herramientas tienen requerimientos sobre el orden de los atributos, tal que el primer campo
es un único identificador para cada registro o el campo último es el juego de resultados que el
modelo debe predecir.
Reordenando registros
Podría ser importante cambiar el orden de los registros en el conjunto de datos. Quizás el
instrumento de modelado requiere que los registros sean clasificados según el valor del atributo de
resultado.
Reformateado de valores internos
•
•
Estos son cambios puramente sintácticos hechos para satisfacer las exigencias de la herramienta
específica de modelado.
Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de
limpieza de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos).
4.3.4. Modelado
4.1. Seleccionar técnicas de modelado
Tarea: Seleccionar técnicas de modelado
Como primer paso en modelado, seleccionar la técnica de modelado inicial actual. Si hay múltiples
a ser aplicados, realizar separadamente esta tarea para cada técnica.
Se debe recordar que no todos los instrumentos y técnicas son aplicables a todas y cada tarea. Para
ciertos problemas, sólo algunas técnicas son apropiadas.
“Requerimientos políticos” y otras restricciones adicionales limitan las opciones disponibles para el
ingeniero de minería de datos. Puede ser que solo una herramienta o técnica estén disponibles para
solucionar el problema a mano y que el instrumento no pueda ser absolutamente lo mejor, desde un
punto de vista técnico.
Página 60 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Figura 11: Diversidad de Técnicas
Salida: Técnicas de modelado
Registrar las técnicas de modelado real que se usan.
Actividades
Decidir las técnicas apropiada para el ejercicio teniendo en cuenta la herramienta seleccionada.
Salida: Presunciones de modelado
Muchas técnicas de modelado realizan presunciones específicas sobre los datos.
Actividades
•
•
•
Definir cualquier presunción construida por la técnica sobre los datos (por ejemplo, la
calidad, el formato, la distribución).
Comparar estas presunciones con aquellas del Informe de Descripción de Datos.
Se debe asegurar que estas presunciones sostienen y permiten volver a la fase de
Preparación de Datos, si es necesario.
Página 61 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.3.4.2. Generar el diseño de prueba
Tarea: Generar el diseño de prueba
Antes de construir un modelo, es necesario definir un procedimiento para probar la calidad del
modelo y la validez. Por ejemplo, en tareas de minería de datos supervisadas como la clasificación,
es común usar tasas de error como medidas de calidad para modelos de minería de datos. Por lo
tanto, el diseño de prueba especifica que el conjunto de datos debería ser separado en el
entrenamiento y en el conjunto de prueba. El modelo esta construido sobre el conjunto de
entrenamiento y su calidad estimada sobre el conjunto de prueba.
Salida: Diseño de Prueba
Describir el plan deliberado para el entrenamiento, las pruebas, y la evaluación de los modelos. Un
componente primario del plan es para decidir como dividir el conjunto de datos disponible sobre
datos que se entrenan, datos de prueba, y conjunto de pruebas de validación.
Actividades
•
•
•
Comprobar que existen diseños de prueba separadamente para cada objetivo de minería de
datos.
Decidir los pasos necesarios (el número de iteraciones, el número de desviaciones o curvas,
etc.).
Preparar los datos requeridos para la prueba
4.3.4.3. Construcción del modelo
Tarea: Construir el modelo
Se corre la herramienta de modelado sobre el conjunto de datos listo para crear uno o más modelos.
Salida: Parámetros de ajuste
Con cualquier herramienta de modelado hay a menudo un gran número de parámetros que pueden
ser ajustados. Se debe listar los parámetros y sus valores seleccionados, con la explicación (el
razonamiento) para la elección.
Actividades
•
•
Determinar los parámetros iniciales.
Documentar las razones para elegir aquellos valores.
Salida: Modelos
Controlar la herramienta de modelado en el conjunto de datos listos para crear uno o más modelos.
Actividades
•
Ejecutar la técnica seleccionada sobre el conjunto de datos de entrada para producir el
modelo.
Página 62 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Post-procesar los resultados de minería de datos (por ejemplo, editar reglas, mostrar
árboles).
Salida: Descripción del modelo
Describir el resultado del modelado y evaluar su exactitud esperada, la robustez, y defectos
posibles.
Informar sobre la interpretación de los modelos y encontrar cualquier dificultad.
Actividades
•
•
•
•
•
•
•
Describir cualquier característica del modelo actual que puede ser útil para el futuro.
Ajustar parámetro de entorno (de registro) usado para producir el modelo.
Dar una descripción detallada del modelo y cualquier rasgo especial.
Para modelos basados por regla, listar las reglas producidas, más cualquier evaluación de
cada regla o la exactitud y alcance total del modelo.
Para modelos no transparentes, listar cualquier información técnica sobre el modelo (como
la topología de las redes neuronales) y cualquier descripción de comportamiento producido
por el proceso de modelado (como la exactitud o la sensibilidad).
Describir el comportamiento del modelo y la interpretación.
Expresar conclusiones respecto a los patrones en los datos (si hay alguno); a veces el
modelo revela hechos importantes sobre los datos sin un proceso de evaluación separado
(por ejemplo, que la salida o la conclusión son duplicadas en una de las entradas).
4.3.4.4. Evaluación del modelo
Tarea: Evaluar el modelo
El modelo ahora debería ser evaluado para asegurar que se encontró criterio de éxito de la minería
de datos y aprobar los criterios de prueba deseados. Esto es una evaluación puramente técnica
basada en el resultado de las tareas de modelado.
Salida: Evaluación del modelo
Resumir los resultados de esta tarea, listar las calidades de los modelos generados (por ejemplo, en
términos de exactitud), y el nivel de su calidad en relación a otro.
Actividades
•
•
•
•
•
•
•
•
Evaluar los resultados en lo que concierne a criterios de evaluación.
Probar los resultados según una estrategia de prueba (por ejemplo: Corrida y Prueba,
Validación cruzada, bootstrapping, etc.).
Comparar los resultados de la evaluación y la interpretación.
Crear la clasificación de resultados en lo que concierne a criterios de éxito y evaluación.
Seleccionar los mejores modelos.
Interpretar los resultados en términos de negocio (tanto como sea posible en esta etapa).
Conseguir comentarios de los modelos por expertos en datos o en el dominio.
Chequear la credibilidad del modelo.
Página 63 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
•
•
•
Comprobar los efectos sobre los objetivos de minería de datos.
Comprobar los modelos contra una base de conocimiento determinada para ver si la
información descubierta es nueva y útil.
Comprobar la fiabilidad de los resultados.
Analizar el potencial para el desarrollo de cada resultado
Si hay una descripción verbal del modelo generado (por ejemplo, en forma de reglas),
evaluar las reglas: ¿Ellas son lógicas, o ellas son factibles, hay demasiadas reglas o hay
demasiado poco, ellos violan el sentido común?
Evaluar resultados.
Conseguir ideas específicas de cada técnica de modelado y ciertos parámetros de ajustes que
conduzcan a resultados buenos/malos.
Se recomienda
“Tablas de Elevación” y “Tablas de Beneficio” pueden ser construidas para determinar bien lo que
el modelo predice.
Salida: Revisión de parámetros de ajuste
Según la evaluación del modelo, se debe revisar parámetros de ajuste para la siguiente corrida en la
tarea de Construcción del Modelo. Iterar (repetir) la construcción del modelo y evaluar hasta que se
encuentre el mejor modelo.
Actividades
Ajustar parámetros para producir mejores modelos.
4.3.5. Evaluación
Los pasos de evaluación previa tratan con factores como la exactitud y la generalidad del modelo.
Este paso evalúa el grado en el que el modelo encuentra los objetivos de negocio, y procura
determinar si hay alguna razón de negocio por la qué este modelo sea deficiente. Se comparan
resultados con los criterios de evaluación definidos en el principio del proyecto.
Un modo bueno para definir las salidas totales de un proyecto de minería de datos es usar la
ecuación:
RESULTADOS = MODELOS + CONCLUSIONES
En esta ecuación, definimos que la salida total del proyecto de minería de datos no son solamente
los modelos (aunque ellos sean, desde luego, importantes) sino también las conclusiones, las que
definimos como algo (aparte del modelo) que es importante en:
•
•
•
la búsqueda de los objetivos de negocio o importancia para arribar a nuevas preguntas,
las líneas de aproximación, o
los efectos negativos (por ejemplo, los problemas de calidad de datos descubierto por el uso
de la minería de datos).
Página 64 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Se debe tener en cuenta que aunque el modelo esté directamente conectado a las preguntas de
negocio, las conclusiones no necesariamente están relacionadas con cualquiera de las preguntas u
objetivos, mientras ellos son importantes para el promotor del proyecto.
4.3.5.1. Evaluación de los resultados
Tarea: Evaluar los resultados
Esta etapa evalúa el grado al que el modelo encuentra los objetivos de negocio, y procura
determinar si hay alguna razón de negocio por el cual este modelo es deficiente. Otra opción es
probar el (los) modelo(s) sobre la aplicación de prueba en el sistema verdadero, si las restricciones
de tiempo y de presupuesto así lo permiten.
Además, la evaluación también evalúa otros resultados generados por la minería de datos. Los
resultados de minería de datos cubren los modelos que están relacionados con los objetivos
originales de negocio y todas las demás conclusiones. Unos son relacionados con los objetivos de
negocios originales mientras que otros podrían revelar desafíos adicionales, información, o ideas
para futuras administraciones (direcciones).
Salida: Evaluación de los resultados de minería de datos en lo que respecta a criterios de éxito
de negocio
Resumir resultados de evaluación en términos de criterios de éxito de negocio, incluyendo una
declaración final relacionada a si el proyecto encuentra los objetivos iniciales de negocio.
Actividades
•
•
•
•
•
•
•
•
•
•
Comprender los resultados de la minería de datos.
Interpretar los resultados en términos de la aplicación (del uso).
Comprobar efectos sobre los objetivos de minería de datos.
Comprobar los resultados de minería de datos contra la base de un conocimiento
determinado para ver si la información descubierta es nueva y útil.
Evaluar y estimar los resultados en lo que respecta a criterios de éxito de negocio (esto es, si
el proyecto ha alcanzado los Objetivos de Negocio originales).
Comparar los resultados de la evaluación y la interpretación.
Clasificar los resultados en lo que respecta a criterios de éxito de negocio.
Comprobar el efecto de los resultados sobre el objetivo (fin) de la aplicación inicial.
Determinar si hay nuevos objetivos de negocio para ser dirigidos más tarde en el proyecto, o
en nuevos proyectos.
Expresar recomendaciones para proyectos futuros de minería de datos
Salida: Modelos aprobados
Después de evaluar los modelos con respecto a los criterios de éxito de negocio, se debe seleccionar
y probar los modelos generados que encontraron los criterios seleccionados.
Página 65 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.3.5.2. Proceso de revisión
Tarea: Revisar el proceso
En este punto, el modelo resultante parece ser satisfactorio y parece satisfacer necesidades de
negocio. Es ahora apropiado hacer una revisión más cuidadosa de las promesas de minería de datos
para determinar si hay algún factor importante o tarea que de algún modo ha sido pasada por alto.
En esta etapa del ejercicio de minería de datos, el Proceso de Revisión toma la forma de una
Revisión de Garantía de Calidad.
Salida: Revisión de procesos
Resumir el proceso de revisión y poner en una lista las actividades que han sido omitidas y/o
deberían ser repetidas.
Actividades
•
•
•
•
•
•
Proporcionar una descripción del proceso de minería de datos usado.
Analizar el proceso de minería de datos. Para cada etapa del proceso: ¿Esto fue necesario?
¿Esto fue ejecutado de forma óptima? ¿En que modo podría ser mejorado?
Identificar fracasos.
Identificar pasos desviados (de engaños).
Identificar acciones alternativas posibles y/o caminos inesperados en el proceso.
Revisar resultados de minería de datos en lo que concierne a criterios de éxito de negocio.
4.3.5.3. Determinación de los próximos pasos
Tarea: Determinar los próximos pasos
Basado en los resultados de evaluación y la revisión de proceso, se debe decidir como proceder.
Las decisiones a ser tomadas incluyen si hay que terminar este proyecto y seguir adelante al
desarrollo para iniciar futuras iteraciones, o establecer nuevos proyectos de minería de datos.
Salida: Lista de acciones posibles
Listar acciones futuras posibles con los motivos para y contra de cada opción.
Actividades
•
•
•
•
•
Analizar el potencial para el desarrollo de cada resultado.
Estimar el potencial para la mejora de proceso actual.
Comprobar los recursos restantes para determinar si ellos permiten iteraciones de proceso
adicionales (o si recursos adicionales pueden estar siendo disponibles).
Recomendar continuar con las alternativas.
Refinar el plan de proceso.
Salida: Decisión
Describir las decisiones hechas, con el razonamiento para ello.
Página 66 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Actividades
•
•
•
Clasificar las acciones posibles.
Seleccionar una de las acciones posibles.
Documentar las razones para la elección.
4.3.6. Desarrollo
4.3.6.1. Plan de desarrollo
Tarea: Desarrollo del Plan
Esta tarea comienza con la evaluación de los resultados y concluye con una estrategia para el
desarrollo de los resultados de la minería de datos en el negocio.
Salida: Plan de Desarrollo
Resumir la estrategia de desarrollo, incluyendo los pasos necesarios y como realizarlos.
Actividades
•
•
•
•
•
•
•
•
•
Resumir resultados desarrollados.
Construir y evaluar los planes alternativos para el desarrollo.
Decidir para cada resultado conocimiento o información distintos.
Determinar como el conocimiento o la información serán propagados (generados) a
usuarios.
Decidir como será supervisado el uso del resultado y medir sus beneficios (donde
aplicable).
Decidir por cada resultado de modelo desarrollado o de software.
Establecer como el modelo o el resultado de software serán desplegados dentro de
sistemas de la organización.
Determinar como su empleo será supervisado y como se miden sus beneficios (donde
aplicable).
Identificar posibles problemas durante el desarrollo (peligros a ser evitados).
los
sea
los
sea
4.3.6.2. Supervisión y mantenimiento del plan
Tarea: Supervisar y mantener el plan
La supervisión y el mantenimiento son cuestiones importantes si los resultados de la minería de
datos se hacen parte del negocio cotidiano y de su ambiente. Una preparación cuidadosa de una
estrategia de mantenimiento ayuda a evitar innecesariamente largos períodos de uso incorrecto de
los resultados de minería de datos. Para supervisar el desarrollo de los resultados de minería de
datos, el proyecto necesita un plan detallado para supervisar y mantener. Este plan tiene en cuenta el
tipo específico de desarrollo.
Página 67 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Salida: Plan de supervisión y mantenimiento
Resumir la estrategia de supervisión y mantenimiento, la inclusión de pasos necesarios y como
realizarlos.
Actividades
•
•
•
•
•
Comprobar aspectos dinámicos (esto es, ¿qué cosas podrían cambiar en el entorno?).
Decidir como será supervisada la precisión.
Determinar cuando el resultado de minería de datos o el modelo no deberían ser usados más.
Identificar criterios (la validez, el límite de la exactitud, nuevos datos, cambios en el
dominio de aplicación, etc.), y que debería pasar si el modelo o el resultado no pueden ser
usados más. Actualización del modelo, establecimiento de nuevos proyectos de minería de
datos, etc.
¿Cambiarán con el tiempo los objetivos de negocio del empleo del modelo? Documentar
totalmente el problema inicial que el modelo intentaba solucionar.
Desarrollar el plan de mantenimiento y la supervisión.
4.3.6.3. Producción de Informe definitivo
Tarea: Producir Informe definitivo
En el final del proyecto, el equipo de proyecto sobrescribe un informe definitivo. Según el plan de
desarrollo, este informe puede ser sólo un resumen del proyecto y su experiencia, o una
presentación final de los resultados de minería de datos.
Salida: Informe definitivo
En el final del proyecto, habrá al menos un informe definitivo en el que todos los hilos son
encontrados. Así como la identificación de los resultados obtenidos, el informe también debería
describir el proceso, mostrar los costos que se han encontrados, definir cualquier desviación del
plan original, describir proyectos de implementación, y hacer cualquier recomendación para el
futuro trabajo. El contenido real detallado del informe depende en gran medida de la audiencia
planeada.
Actividades
•
•
•
•
•
•
Identificar cuales informes son necesarios (presentación de diapositiva, conclusiones de
administración, detalles encontrados, explicación de los modelos, etc.).
Analizar que tan bien se han encontrado los objetivos de minería de datos iniciales.
Identificar grupos de objetivos para el informe.
Describir en forma general las estructuras y el contenido de informe(s).
Seleccionar conclusiones para ser incluidas en los informes.
Escribir un informe.
Salida: Presentación final
Así como un informe definitivo, puede ser necesario hacer una presentación final para concluir el
proyecto (por ejemplo, al patrocinador de dirección). La presentación normalmente contiene un
Página 68 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
subconjunto del contenido de la información en el informe definitivo, estructurado de un modo
diferente.
Actividades
•
•
Decidir el grupo objetivo para la presentación final y determinar si ellos ya habrán recibido
el informe definitivo.
Seleccionar cuales de los artículos del informe definitivo deberían ser incluidos en la
presentación final.
4.3.6.4. Revisión del proyecto
Tarea: Revisar el proyecto
Evaluar que fue lo correcto y que fue lo errado, cual fue el éxito obtenido, y que necesidades serán
mejoradas.
Salida: Documentación de experiencia
Resumir la gran experiencia ganada durante el proyecto. Por ejemplo, trampas, accesos a
información incorrecta (misleading approaches), o los puntos para seleccionar las mejores técnicas
de minería de datos en situaciones similares podrían ser la parte de esta documentación. En
proyectos ideales, la documentación de experiencia también cubre cualquier informe que ha sido
escrito por miembros individuales del proyecto durante el proyecto.
Actividades
•
•
•
•
•
•
Entrevistar a toda la gente significativa involucrada en el proyecto y preguntarles sobre su
experiencia durante el proyecto.
Si los usuarios finales trabajan en el negocio con los resultados de minería de datos,
entrevistarlos: ¿Están satisfechos? ¿Cómo podría haber sido mejor realizado? ¿Necesitan de
apoyo adicional?
Resumir la realimentación y escribir la documentación de experiencia.
Analizar el proceso (las cosas que se trabajaron bien, los errores producidos, las lecciones
aprendidas, etc.).
Documentar el proceso de minería de datos específico (¿Cómo pueden los resultados y la
experiencia de aplicación del modelo ser realimentado en el proceso?)
Generalizar desde los detalles para producir la experiencia útil para proyectos futuros.
4.4. Las salidas del CRISP-DM
Esta sección contiene las breves descripciones de los objetivos y el contenido de los informes más
importantes. Aquí, se enfoca en los informes que son significativos para comunicar los resultados
de una fase a la gente no involucrada en esta fase (y posiblemente no involucrada en este proyecto).
Estos no son necesariamente idénticos a las salidas como lo descrito en el modelo de referencia y la
guía de usuario. El objetivo de estas salidas es mas para documentar resultados mientras se está
realizando el proyecto.
Página 69 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.4.1. Comprensión del Negocio
Los resultados de la fase de Comprensión de Negocio pueden ser resumidos en un informe. Se
sugiere las secciones siguientes:
Contexto
La sección Contexto proporciona una descripción básica del contexto de proyecto. Se deben listar
cuales áreas están trabajando en el proyecto, que problemas han sido identificados, y por qué la
minería de datos parece proporcionar una solución.
Objetivos de negocio y criterios de éxito
La sección de Objetivos de negocio describe los objetivos del proyecto en términos de negocio.
Para cada objetivo, Los Criterios de Éxito de Negocio, esto es, describir las medidas para
determinar si realmente el proyecto ha logrado sus objetivos.
Esta sección también debería listar los objetivos que fueron considerados, pero rechazados. El
razonamiento de la selección de objetivos debería ser dado.
Inventario de recursos
La sección de Inventario de Recursos apunta a identificar el personal, fuentes de datos, instalaciones
técnicas, y otros recursos que pueden ser útiles en la realización del proyecto.
Requerimientos, presunciones, y restricciones
Esta sección lista los requerimientos generales para la ejecución del proyecto: tipo de resultados de
proyecto, presunciones hechas sobre la naturaleza del problema y de los datos que están siendo
usados, y restricciones impuestas al proyecto.
Riesgos y contingencias
Esta sección identifica los problemas que pueden ocurrir en el proyecto, describe las consecuencias,
y declara que acciones pueden ser tomadas para reducir al mínimo tales riesgos.
Terminología
La sección de Terminología permite a la gente desconocida con los problemas que están siendo
dirigidos por el proyecto hacerse más familiar con ellos.
Costos y beneficios
Esta sección describe los costos del proyecto y predice los beneficios del negocio si el proyecto es
exitoso (por ejemplo, la vuelta en la Inversión). Otros beneficios menos tangibles (por ejemplo, la
satisfacción del cliente) también deberían ser destacadas.
Objetivos de minería de datos y criterios de éxito
Página 70 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
La sección de Objetivos de Minería de datos declara los resultados del proyecto que permiten el
logro de los objetivos de negocio. También como el listado de los accesos probables de minería de
datos, los criterios de éxito para los resultados en términos de minería de datos también deberían ser
puestos en una lista.
Plan de proyecto
Esta sección pone en una lista las etapas para ser ejecutadas en el proyecto, juntos con su duración,
recursos requeridos, entradas, salidas, y dependencias. Donde sea posible, esto debería hacer
explícitamente las iteraciones en gran escala en el proceso por ejemplo de minería de datos (por
ejemplo, las repeticiones del modelado y fases de evaluación).
Evaluación inicial de herramientas y técnicas
Esta sección da una vista inicial de que herramientas y técnicas probablemente van a ser usadas y
como. Esto describe los requerimientos para las herramientas y técnicas, ponen en una lista
herramientas disponibles y técnicas, y los compara con los requerimientos.
4.4.2. Comprensión de Datos
Los resultados de la fase Comprensión de Datos por lo general son documentados en varios
informes. Idealmente, estos informes serían los escritos mientras se estaban realizando las
respectivas tareas. Los informes describen el conjunto de datos que es explorado durante la
Comprensión de Datos.
Para el informe definitivo, un sumario de las partes más relevantes es suficiente.
Informe de colección de datos iniciales
Este informe describe como las diferentes fuentes de datos identificadas en el inventario fueron
capturadas y extraídos.
Temas a ser cubiertos:
•
•
•
•
Contexto de datos.
Lista de fuentes de datos con amplia área de cobertura de datos requeridos por cada uno.
Para cada fuente de datos, método de adquisición o extracción.
Problemas encontrados en adquisición de datos o extracción.
Informe de descripción de datos
Cada conjunto de datos adquirido es descrito en este informe.
Temas a ser cubiertos:
•
•
•
Cada fuente de datos descrita detalladamente.
Lista de tablas (puede ser sólo uno) u otros objetos de base de datos.
Descripción de cada campo, incluyendo unidades, códigos usados, etc.
Página 71 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Informe de exploración de datos
Este informe describe la exploración de datos y sus resultados.
Temas a ser cubiertos:
Contexto, incluyendo los amplios objetivos de exploración de datos. Para cada área de exploración
emprendida:
•
•
•
•
•
•
•
Las regularidades esperadas o patrones.
Método de detección.
Regularidades o patrones encontrados, esperados e inesperados.
Cualquier otra sorpresa.
Conclusiones para transformación de datos, limpieza de datos, y cualquier otro proceso
previo.
Conclusiones relacionadas con datos que extraen objetivos u objetivos de negocio.
Sumario de conclusiones.
Informe de calidad de datos
Este informe describe lo completo y la exactitud de los datos.
Temas a ser cubiertos:
Contexto, incluyendo amplias expectativas sobre calidad de datos. Para cada conjunto de datos:
•
•
•
Acercar temas para evaluar la calidad de datos.
Los resultados de evaluación de calidad de datos.
Sumario de conclusiones de calidad de datos.
4.4.3. Preparación de Datos
Los informes en la fase de Preparación de Datos se enfocan en los pasos de pre-proceso que
producen los datos para ser minados.
Informe de descripción de conjunto de datos
Este informe proporciona una descripción del conjunto de datos (después del pre-proceso) y el
proceso por el que fue producido.
Temas a ser cubiertos:
Contexto, incluyendo objetivos amplios y plan para el pre-proceso.
Razonamiento para inclusión/exclusión de conjunto de datos. Para cada conjunto de datos incluir:
•
•
La descripción del pre-proceso, incluyendo las acciones que fueron necesarias para dirigir
cualquier cuestión de calidad de datos.
Descripción detallada del conjunto de datos resultante, tabla por tabla y campo por campo.
Página 72 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
Razonamiento para inclusión/exclusión de atributos.
Descubrimientos de hechos durante el pre-proceso, y cualquier implicación para futuros
trabajos.
Sumario y conclusiones.
4.4.4. Modelado
Las salidas producidas durante la fase Modelado pueden ser combinadas en un informe. Se sugieren
las secciones siguientes.
Modelado de presunciones
Esta sección define cualquier presunción explícita hecha sobre los datos y cualquier presunción que
está implícita en la técnica de modelado a ser usado.
Diseño de prueba
Esta sección describe como los modelos son construidos, probados, y evaluados.
Temas a ser cubiertos:
Contexto de fondo para la ocupación del modelo y su relación a los objetivos de minería de datos.
Para cada tarea de modelado:
•
•
•
•
•
•
Ampliación de la descripción del tipo de modelo y los datos que se entrenan para ser usado.
La explicación de como el modelo será probado o evaluado.
Descripción de cualquier dato requerido para las pruebas.
Plan para producción de los datos de prueba si hay.
Descripción de cualquier examen planeado de modelos por expertos en dominio o de datos.
Sumario de plan de prueba.
Descripción del modelo
Este informe describe los modelos entregados y las descripciones del proceso por el que ellos
fueron producidos.
Temas a ser cubiertos:
Descripción de modelos producidos. Para cada modelo:
•
•
•
•
Tipo de modelo y la relación a los objetivos de minería de datos.
Los parámetros de ajustes usados para producir el modelo.
Descripción detallada del modelo y cualquier rasgo especial. Por ejemplo: para modelos
basados por regla, listar las reglas producidas más cualquier evaluación de precisión por
regla o el modelo completo y el alcance; para modelos no transparentes, listar cualquier
información técnica sobre el modelo (como la topología de red de los nervios) y algunas
descripciones de comportamiento producidas por el proceso de modelado (como la precisión
o la sensibilidad).
Descripción del comportamiento del modelo e interpretación.
Página 73 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
Conclusiones en cuanto a los patrones en los datos (si hay). A veces el modelo revelará
hechos importantes sobre los datos sin un proceso de evaluación separado (por ejemplo, que
la salida o la conclusión están duplicadas en una de las entradas).
Sumario de conclusiones.
Evaluación del modelo
Esta sección describe los resultados de prueba de los modelos según el diseño de prueba.
Temas a ser cubiertos:
Descripción de los procesos de evaluación y los resultados, incluyendo cualquier desviación del
plan de prueba. Para cada modelo:
•
•
•
•
•
Evaluación detallada, incluyendo medidas como precisión e interpretación del
comportamiento.
Cualquier comentario sobre los modelos por expertos en el dominio o de datos.
Evaluación resumida de modelos.
Ideas en por qué una cierta técnica de modelado y ciertos ajustes de parámetro conducen a
resultados buenos/malos.
Evaluación sumaria del conjunto de modelos completos.
4.4.5. Evaluación
Evaluación de los resultados de minería de datos en lo que respecta a criterios de éxito de
negocio
Este informe compara los objetivos de minería de datos con los objetivos de negocio y los criterios
de éxito de negocio.
Temas a ser cubiertos:
Revisión de objetivos de negocio y criterios de éxito de negocio (qué podría haberse cambiado
durante y/o como consecuencia de la minería de datos). Para cada criterio de éxito de negocio:
•
•
•
•
•
•
Comparación detallada entre criterio de éxito y resultados de minería de datos.
Conclusiones sobre aceptabilidad (achievability) de criterios de éxitos y conveniencia del
proceso de minería de datos.
Revisión del éxito de proyecto:
¿El proyecto ha alcanzado los objetivos originales de negocio?
¿Objetivos nuevos de negocio deben ser dirigidos después en el proyecto o en nuevos
proyectos?
Conclusiones para futuros proyectos de minería de datos.
Revisión de proceso
Esta sección evalúa la eficacia del proyecto e identifica cualquier factor que podría haber sido
pasado por alto y que debería ser tenido en cuenta si el proyecto es repetido.
Página 74 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Lista de posibles acciones
Esta sección hace recomendaciones en cuanto a los siguientes pasos en el proyecto.
4.4.6. Desarrollo
Plan de desarrollo
Este informe especifica el desarrollo de los resultados de minería de datos.
Temas a ser cubiertos:
•
•
Resumen de los resultados desarrollados (derivado de los informes de Próximos Pasos).
Descripción de plan de desarrollo.
Supervisión y plan de mantenimiento
La supervisión y el plan de mantenimiento especifican como los resultados desarrollados deben ser
mantenidos.
Temas a ser cubiertos:
Descripción de los resultados de desarrollo y la indicación de que los resultados pueden requerir la
actualización (y el por qué). Para cada resultado desarrollado:
•
•
•
Descripción de como la actualización será provocada (por una normal actualización, por un
acontecimiento de activación, por la ejecución de una supervisión).
Descripción de cómo la actualización será realizada.
Resumen de los procesos de actualización de los resultados.
Informe definitivo
El informe definitivo es usado para resumir el proyecto y sus resultados.
Contenido:
•
•
•
•
•
•
•
•
Resumen de la Comprensión del Negocio: contexto, objetivos, y criterios de éxito.
Sumario de proceso de minería de datos.
Resumen de los resultados de minería de datos.
Sumario de la evaluación de resultados.
Resumen del desarrollo y de los planes de mantenimiento.
Análisis Costo/Beneficio.
Conclusiones para el negocio.
Conclusiones para futura minería de datos.
4.4.7. Resumen de dependencias
Página 75 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
La siguiente tabla (Tabla 3) resume las entradas principales para los operadores. Esto no significa
que solo las listas de entradas puestas deberían ser consideradas, por ejemplo, los objetivos de
negocio deberían ser distribuidos a todo los operadores.
Sin embargo, el operador debería dirigir cuestiones específicas elevadas por sus entradas.
Frase
Entregable
Entender el
negocio
Background
Referido a
Relacionado a
Objetivo de negocio
Backgorund
Terminología
Creterio de éxito de negocio
Objetivo de negocio
Inventario de recursos
Requerimientos, asunciones y
restricciones
Objetivo de negocio
Riesgos y contingencias
Objetivo de negocio - Criterio de éxito de negocio
Terminología
Backgorund
Objetivo de
negocio
Costos y beneficios
Objetivo de negocio
Plan de proyecto
Metas de minería de datos
Objetivo de negocio - Requerimientos, asunciones y
restricciones
Criterio de éxito de minería de datos
Criterio de éxito de negocio - Requerimientos, asumciones y
restricciones - Metas de minería de datos
Plan de proyecto
Objetivo de negocio - Inventario de recursos - Requerimientos,
asunciones y restricciones - Riesgos y contingencias
Objetivo de negocio - Inventario de recursos - Objetivos de
minería de datos
Costos y
beneficios
Reporte de descripción de datos
Objetivo de negocio - Reporte de colección inicial de datos
Reporte de calidad
de datos
Reporte de exploración de datos
Objetivo de negocio - Reporte de colección inicial de datos
Reporte de
descripción de
datos
Reporte de calidad de datos
Objetivo de negocio - Reporte de colección inicial de datos
Preparar datos
Set de datos y descripción de set de
datos
Modelar
Diseño de test
Objetivo de negocio - Objetivo de minería de datos - Reporte de
descripción de datos - Reporte de calidad de datos - Reporte de
exploración de datos
Objetivo de minería de datos - Criterio de éxito de minería de
datos
Comprender
datos
Evaluación
Desarrollo
Reporte de colección inicial de datos
Modelos
Objetivo de minería de datos
Setear parámetros
Setear parámetros
Objetivo de minería de datos
Modelos
Descripción de modelo
Modelos - Setear parámetros - Diseño de test
Evaluación de modelo
Criterio de éxito de negocio - Diseño de test - Modelos
Evaluar resultado de minería de datos
- Criterio de éxito de negocio
Criterio de éxito de negocio - Terminología
Revisión de proceso
Objetivo de negocio - Evaluación de resultado de minería de
datos - Criterio de éxito de negocio
Pasos a seguir
Plan de proyecto - Evaluación de resultado de minería de datos Criterio de éxito de negocio
Desarrollo de plan
Objetivo de negocio - Requerimientos, asunciones y
restricciones
Plan de
mantenimiento
Plan de mantenimiento
Objetivo de negocio - Requerimientos, asunciones y
restricciones
Desarrollo de plan
Reporte final y presentación
Objetivo de negocio - Terminología - Evaluación de resultado de
minería de datos - Criterio de éxito de negocio
Plan de proyecto - Revisión de proceso
Documentación de experiencia
Tabla 3: Entradas principales de los operadores
Página 76 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4.5. Apéndice
4.5.1. Glosario/Terminología
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Actividad: Es parte de una tarea en la Guía de Usuario; describe las acciones para realizar
una tarea.
Metodología de CRISP-DM: El término general para todos los conceptos desarrollados y
definidos en el CRISP-DM.
Contexto de minería de datos: Un conjunto de restricciones y presunciones, tales como el
tipo de problema, las técnicas o herramientas, el dominio de aplicación.
Tipos de problemas de minería de datos: Una clase de típicos problemas de minería de
datos, tales como la descripción de datos y el resumen, la segmentación, las descripciones de
conceptos, la clasificación, la predicción, el análisis de dependencia.
Genérico: Una tarea que mantiene un cruce con todos los proyectos de minería de datos
posibles.
Modelo: La capacidad de aplicar algoritmos a un conjunto de datos para predecir atributos
objetivos; ejecutable.
Salida: El resultado tangible de la ejecución de una tarea.
Fase: Un término para la parte de alto nivel del modelo de proceso CRISP-DM; consiste en
tareas relacionadas.
Caso del proceso: Un proyecto específico descrito en términos del modelo de proceso
Modelo de proceso: Define la estructura de proyectos de minería de datos y proporciona la
guía para su ejecución; consiste en el modelo de referencia y en la guía de usuario.
Modelo de referencia: Descomposición de proyectos de minería de datos en fases, tareas, y
salidas.
Especializado: Una tarea que hace presunciones específicas en contextos específicos de
minería de datos.
Tarea: Una serie de actividades para producir una o más salidas; parte de una fase
Guía de usuario: Asesoramiento específico sobre como realizar proyectos de minería de
datos.
4.5.2. Tipos de problemas de minería de datos
Por lo general, los proyectos de minería de datos implican una combinación de diferentes tipos de
problema, que juntos solucionan el problema de negocio.
4.5.2.1. Descripción de datos y resumen
La descripción y el resumen de datos apuntan a la descripción concisa de las características de los
datos, típicamente en forma elemental y agregada. Esto da al usuario una descripción de la
estructura de los datos. A veces, una descripción y resumen de los datos solo puede ser un objetivo
de un proyecto de minería de datos. Por ejemplo, un minorista podría estar interesado en el volumen
de ventas de todas las salidas separado por categorías. Los cambios y diferencias de un período
anterior podrían ser resumidos y destacados. Esta clase de problema estaría en lo mas bajo de la
escala de problemas de minería de datos.
En casi todos los proyectos de minería de datos, sin embargo, la descripción y resumen de los datos
son un objetivo subordinado en el proceso, típicamente en sus tempranas etapas. En el principio de
un proceso de minería de datos, el usuario a menudo no conoce, ni el objetivo preciso del análisis,
Página 77 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
ni la naturaleza exacta de los datos. La exploración inicial del análisis de datos puede ayudar a los
usuarios a entender la naturaleza de los datos y formar hipótesis potenciales de la información
oculta. La estadística descriptiva simple y las técnicas de visualización proporcionan las primeras
ideas sobre los datos. Por ejemplo, la distribución de clientes por edad y regiones geográficas
sugiere que partes de un grupo de clientes necesita para ser dirigida para futuras estrategias de
comercialización (marketing).
La descripción y el resumen de datos típicamente ocurren en combinación con otros tipos de
problemas de minería de datos. Por ejemplo, la descripción de datos puede conducir a la postulación
(presunción) de segmentos interesantes en los datos. Una vez que los segmentos son identificados y
definidos, una descripción y un resumen de estos segmentos son útiles. Es aconsejable llevar a cabo
una descripción y resumen de datos antes de que cualquier otro tipo de problema de minería de dato
sea especificado (dirigido). En este documento, esto se refleja en el hecho que la descripción y
resumen de datos es una tarea en la fase de Comprensión de Datos.
El resumen también juega un papel importante en la presentación de los resultados finales. Los
resultados de otros tipos de problemas de minería de datos (por ejemplo, las descripciones de
conceptos o los modelos de predicción) también pueden ser considerados resumen de datos, pero
sobre un nivel conceptual más alto.
Muchos sistemas de informe, paquetes estadísticos, OLAP, y sistemas EIS pueden cubrir la
descripción y resumen de datos, pero hacerlo usualmente no proporciona algunos métodos para
realizar modelado más avanzado. Si la descripción y resumen de datos son considerados un tipo de
problema independiente y ningún modelado futuro es requerido, entonces estas herramientas
pueden ser apropiadas para realizar los compromisos de minería de datos.
4.5.2.2. Segmentación
La segmentación apunta a la separación de los datos en subgrupos o clase significativos e
interesantes. Todos los miembros de un subgrupo comparten características comunes. Por ejemplo,
en el análisis de cesta de compras, uno podría definir los segmentos de cestas según los artículos
que ellos contienen.
La segmentación puede ser realizada a mano o semi-automáticamente. El analista puede suponer
ciertos subgrupos como relevantes para la pregunta de negocio, basada sobre un conocimiento
previo o sobre el resultado de la descripción y el resumen de datos. En adición, hay también
técnicas automáticas de agrupamiento (clustering) que pueden descubrir las estructuras antes
insospechadas y ocultas en datos que permite la segmentación.
La segmentación a veces puede ser un objetivo de minería de datos. Entonces la detección de
segmentos sería el objetivo principal de un proyecto de minería de datos. Por ejemplo, todas las
direcciones en áreas de código postal con la edad mas alta que el promedio y un ingreso podrían ser
seleccionadas para enviar publicidad para seguro de clínica de ancianos.
Muy a menudo, sin embargo, la segmentación es un paso hacia la solución de otros tipos de
problema. Entonces, el objetivo es de guardar (mantener) el tamaño de los datos manejables o
encontrar los subconjuntos de datos homogéneos que son más fáciles para analizar. Típicamente en
grandes conjuntos de datos variados afectan el alcance de cada uno y obscurece los patrones
interesantes. Entonces, la segmentación apropiada hace la tarea más fácil. Por ejemplo, analizar las
dependencias entre artículos en millones de cestas de compras es muy difícil. Esto es mucho más
Página 78 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
fácil (y más significativo, generalmente) para identificar dependencias en los segmentos
interesantes de cestas de compras -por ejemplo, cestas de alto valor, cestas que contienen bienes de
confort, o cestas de un día o de un periodo particular.
Nota: En la literatura, hay algo de ambigüedad en el significado de ciertos términos. A veces llaman
a la segmentación agrupamiento (clustering) o clasificación (classification). El último término es
confuso porque algunas personas lo usan para referirse a la creación de clases, mientras que otros
piensan en la creación de modelos para predecir las clases conocidas para casos antes no vistos. En
este documento, restringimos el término de clasificación al último significado (ver más abajo) y
usar el término segmentación con el antiguo significado, aunque las técnicas de clasificación
puedan ser usadas para obtener descripciones de los segmentos descubiertos.
Técnicas apropiadas:
•
•
•
Técnicas de agrupamiento (clustering)
Redes Neuronales
Visualización
Ejemplo:
Una empresa de venta de autos con regularidad recoge información sobre sus clientes acerca de sus
características socioeconómicas como el ingreso, la edad, el sexo, la profesión, etc. Usando análisis
de agrupamiento, la empresa puede dividir a sus clientes en subgrupos más comprensibles y
analizar la estructura de cada subgrupo. Estrategias de control de comercialización (marketing)
específicas son desarrolladas para cada grupo separado.
4.5.2.3. Descripciones de conceptos
La descripción de concepto apunta a una descripción comprensible de conceptos o clases. El
objetivo no es para completar el desarrollo de modelos con predicción de exactitud alta, sino para
ganar ideas. Por ejemplo, una empresa puede estar interesada en el estudio sobre sus clientes más
leales y desleales. De una descripción de concepto de estos conceptos (clientes leales y desleales) la
compañía infiere que podría estar hecho para encontrar clientes leales o transformar clientes
desleales a clientes leales.
Una descripción de concepto tiene una conexión cercana tanto a la segmentación como a la
clasificación. La segmentación puede conducir a una enumeración de objetos que pertenecen a un
concepto o clase sin proporcionar cualquier descripción comprensible. Típicamente la segmentación
es llevada a cabo antes de que la descripción de concepto sea realizada. Algunas técnicas -técnicas
de agrupamiento conceptuales, por ejemplo-ejecutan la segmentación y descripción de concepto al
mismo tiempo.
Las descripciones de concepto también pueden ser usadas para objetivos de clasificación. Por otra
parte, algunas técnicas de clasificación producen modelos de clasificación comprensibles, que
pueden entonces ser consideradas descripciones de concepto. La distinción importante es que la
clasificación apunta a ser completa en algún sentido. El modelo de clasificación tiene que aplicarse
a todos los casos en la población seleccionada.
Página 79 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
De otra manera, las descripciones de concepto no tienen que ser completas. Es suficiente si ellos
describen las partes importantes de los conceptos o clases. En el ejemplo mencionado, puede ser
suficiente conseguir las descripciones de conceptos de aquellos clientes que son claramente leales.
Técnicas apropiadas:
•
•
Métodos de inducción de reglas
Agrupamiento conceptual
Ejemplo:
Usando datos sobre los compradores de coches nuevos y una técnica de inducción de regla, una
empresa de coche podría generar las reglas que describen sus clientes leales y desleales. Debajo
están los ejemplos de las reglas generadas:
•
•
•
•
Si SEXO = macho y EDAD > 51 entonces CLIENTE = leal
Si SEXO = hembra y EDAD > 21 entonces CLIENTE = leal
Si PROFESIÓN = gerente y EDAD < 51 entonces CLIENTE = desleal
Si ESTADO CIVIL = soltero y EDAD < 51 entonces CLIENTE = desleal
4.5.2.4. Clasificación
La clasificación asume que hay un conjunto de objetos caracterizados por algún atributo o rasgo que
pertenece a diferentes clases. La etiqueta de clase es un valor (simbólico) discreto y es conocido
para cada objeto. El objetivo es para construir los modelos de clasificación (a veces llamados
clasificadores), que asigna la etiqueta de clase correcta a objetos antes no vistos y sin etiquetas.
Los modelos de clasificación sobre todo son usados para el modelado predictivo.
Las etiquetas de clase pueden ser presentadas en el avance -definida por el usuario, por ejemplo, o
derivadas de la segmentación. La clasificación es uno de los tipos de problemas más importantes de
minería de datos que ocurren en una amplia gama de aplicaciones. Muchos problemas de minería de
datos pueden ser transformados a problemas de clasificación. Por ejemplo, intentando guardar
créditos para evaluar el riesgo de acreditar a un cliente nuevo. Esto puede ser transformado a un
problema de clasificación para crear dos clases, clientes buenos y clientes malos. Un modelo de
clasificación puede ser generado de los datos de cliente existentes de acuerdo a su comportamiento
crediticio. Este modelo de clasificación puede entonces ser usado para asignar a clientes nuevos a
una de las dos clases y aceptarlo o rechazarlo.
La clasificación tiene conexiones a casi todos los otros tipos de problemas. Los problemas de
predicción pueden ser transformados a los problemas de clasificación por discretización de etiquetas
de clase continuas, porque las técnicas de discretización permiten transformar rangos continuos en
intervalos discretos. Estos intervalos discretos, más que los valores numéricos exactos, son usados
como etiquetas de clase, y de ahí conducen a un problema de clasificación.
Algunas técnicas de clasificación producen una clase comprensible o descripciones de concepto.
Hay también una conexión al análisis de dependencia porque los modelos de clasificación
típicamente usan (explotan) y aclaran las dependencias entre atributos.
Página 80 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
La segmentación puede también proporcionar las etiquetas de clase o restringir el conjunto de datos
para que buenos modelos de clasificación puedan ser construidos. Es útil analizar desviaciones
antes de que un modelo de clasificación sea construido. Las desviaciones y contingencias (cosas
fuera de lugar-outliers) pueden obscurecer el patrón que podría permitir un buen modelo de
clasificación. De otro modo, un modelo de clasificación también puede ser usado para identificar
desviaciones y otros problemas con los datos.
Técnicas apropiadas:
•
•
•
•
•
•
•
Análisis de discriminante
Métodos de inducción de regla
Aprendizaje por árboles de Decisión
Redes neuronales
La K más cercana
Razonamiento basado en caso
Algoritmos genéticos
Ejemplo:
Los bancos generalmente tienen información sobre el comportamiento de pago de sus aspirantes de
crédito.
Combinando esta información financiera con otra información sobre los clientes, como el sexo, la
edad, el ingreso, etc., es posible desarrollar un sistema para clasificar a clientes nuevos como
clientes buenos o malos (esto es, el riesgo de crédito en la aceptación de un cliente es alto o bajo).
4.5.2.5. Predicción
Otro tipo de problema importante que ocurre en una amplia gama de usos es la predicción. La
predicción es muy similar a la clasificación.
La única diferencia es que en la predicción el atributo objetivo (la clase) no es un atributo
cualitativo discreto, sino es uno continuo.
El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no
vistos. En la literatura, este tipo de problema es a veces llamado regresión. Si la predicción trata con
datos de serie tiempo, entonces a menudo lo llaman pronosticación.
Técnicas apropiadas:
•
•
•
•
•
•
Análisis de regresión
Árboles de regresión
Redes neuronales
La K más cercana
Métodos de la Caja-Jenkins
Algoritmos genéticos
Ejemplo:
Página 81 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El rédito anual de una empresa internacional esta correlacionado con otros atributos como la
promoción, la tasa de cambio, la tasa de inflación, etc. Teniendo estos valores (o estimaciones
confiables), la empresa puede predecir su rédito esperado durante el próximo año.
4.5.2.6. Análisis de dependencia
El análisis de dependencia consiste en encontrar un modelo que describe dependencias
significativas (o asociaciones) entre artículos de datos o acontecimientos. Las dependencias pueden
ser usadas para predecir el valor de unos datos de artículo dada la información sobre otros artículos
de datos. Aunque las dependencias pueden ser usadas para el modelado predictivo, aquellos son
mas usados por su comprensión. Las dependencias pueden ser estrictas o probabilísticas.
Las asociaciones son un caso especial de dependencias, que recientemente se han hecho muy
populares. Las asociaciones describen las afinidades de artículos de datos (esto es, artículos de datos
o los acontecimientos que con frecuencia ocurren juntos). Un típico escenario de aplicación para
asociaciones es el análisis de cestas que hacen compras. Allí, una regla como “en el 30 por ciento de
todas las compras, la cerveza y cacahuetes han sido comprados juntos” es un ejemplo típico para
una asociación.
Los algoritmos para detectar asociaciones son muy rápidos y producen muchas asociaciones.
Seleccionar el más interesante es un desafío.
El análisis de dependencia tiene conexiones cercanas a la predicción y a la clasificación, ya que las
dependencias implícitamente son usadas para la formulación de modelos predictivos. Hay también
una conexión a descripciones de concepto, que a menudo destacan dependencias.
En aplicaciones, el análisis de dependencia a menudo co-ocurre con la segmentación. En grandes
conjunto de datos, las dependencias son raras veces significativas porque muchas influencias cubren
el uno al otro. En tales casos, se aconseja realizar un análisis de dependencia sobre más segmentos
homogéneos de datos.
El modelo secuencial es una clase especial de dependencia en las que el orden de acontecimientos
es considerado. En un análisis de cesta de compras, las asociaciones describen dependencias entre
artículos en un tiempo dado. El patrón secuencial describe el modelo que hace compras de un
cliente particular o un grupo de clientes en el tiempo.
Técnicas Apropiadas:
•
•
•
•
•
•
Análisis de correlación
Análisis de regresión
Reglas de asociación
Redes bayesianas
Programación de lógica inductiva
Técnicas de visualización
Ejemplo 1:
Usando el análisis de regresión, un analista de negocio ha encontrado que hay dependencias
significativas entre las ventas totales de un producto y tanto en su precio como en la cantidad de
Página 82 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
gastos de publicidad. Este conocimiento permite al negocio alcanzar el nivel deseado de las ventas
por cambio del precio del producto y/o el gasto de publicidad.
Ejemplo 2:
Aplicando algoritmos de regla de asociación a datos sobre accesorios de coche, una empresa de
coches ha encontrado que en el 95 por ciento de casos, si un CD player es ordenado, una
transmisión automática es ordenada también.
Basado en esta dependencia, la empresa de coche decide ofrecer estos accesorios como un paquete,
que conduce a la reducción del costo.
Página 83 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 84 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
5. Descripción y desarrollo de la industria.
5.1. La industria automotriz y el control de daños y/o averías
El nuevo orden internacional que comenzó a gestarse en la década del 70 y que luego fue
impulsado por la terminación de la guerra fría y la oleada de internacionalización de las economías
ha dado lugar a un nuevo paradigma en la división de trabajo. La especialización del trabajo no se
realiza solo a nivel empresa o región sino a nivel mundial y puede involucrar tanto a regiones como
a países e inclusive a continentes.
Con el desarrollo de las tecnologías de las comunicaciones y los transportes desde hace dos décadas
se asiste a un nuevo sistema de producción en la industria automotriz que se sostiene en base a la
distribución de la producción de las diferentes marcas y modelos en masa al rededor del mundo.
Todas las compañías automotrices hoy en día no producen todos sus modelos en una sola región o
país sino que las mismas realizan acuerdos multinacionales para producir determinados modelos en
determinados lugares para luego intercambiarlos entre los diferentes puntos de producción. De esta
manera para asistir a cada mercado en cada región se realizan los convenios internacionales de
intercambio de unidades necesarios para satisfacer las demandas.
Este movimiento de intercambio de unidades entre las diferentes regiones del mundo ha llevado a
esta industria a desarrollar un estricto control en el seguimiento e identificación del estado de las
mismas a lo largo de su recorrido. Como consecuencia inmediata de este traslado de los productos
surge que los costos por movimiento, reparación y puesta a punto de los automóviles es mayor a los
costos de producción. Esto es, el costo por unidad producida es inferior al costo de la misma desde
que sale de planta hasta que llega al cliente final.
Las unidades pueden ser movilizados por diferentes tipos de transportes: aéreos, marítimos o
terrestres (camiones o tren). El traslado de los autos puede ser con almacenamiento en contenedores
o trincados independientemente uno de otro. También son estoqueados/almacenados en diferentes
playas o patios con el objeto de ser reparados o simplemente por cuestiones comerciales previas a la
distribución.
Las cantidades transportadas en masa varían desde unos pocos (7, 11 o 13 unidades por transportes
terrestre, por ejemplo bateas) a cientos (por ejemplo por tren) o inclusive a miles de unidades (por
ejemplo buques equipados según normas internacionales para transportar desde cientos a miles de
unidades).
Para el control y la verificación del estado de cada unidad las diferentes empresas (marcas) han
creado sus propios estándares de inspección o peritaje o verificación. Cada unidad es inspeccionada
según los estándares impuesto por cada compañía en cada uno de los lugares por donde pasan o
bien donde se estacionan.
El camino que recorre cada unidad desde que sale de planta hasta que llega a un cliente final es lo
que se denomina en la industria como “circuito logístico” o “cadena logística”. En cada circuito
intervienen una o varias empresas denominadas operadoras logísticas. Cada operador logístico
puede contratar (tercerizar) a otras empresas para el transporte de las unidades de punto a punto.
Además también es frecuente la tercerización en el desarrollo de las inspecciones o peritajes que es
realizado normalmente en los lugares donde se produce el intercambio de responsabilidad de una
Página 85 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
empresa a otra. Así es que como ejemplos estándares de lugares o puntos de inspección se pueden
nombrar:
•
•
•
•
•
•
•
controles a la bajada o subida de buque;
controles dentro de los buques;
controles a la entrada o salida de un puerto;
controles dentro de los puertos (estiba);
controles a la salida de una planta de producción;
controles a la entrada o salida de un patio / playa (stock) comercial o por reparación;
controles a la subida o bajada de bateas (camiones).
5.2. Circuitos logísticos
Los elementos que lo componen son los diferentes medios de transporte (podrían ser llamados
enlaces) y los puntos (podrían ser denominados nodos) por donde transitan o se estacionan los
autos. Tanto los transportes como los lugares por donde pasan pueden ser lugares de distintas
compañías, transportes de distintas compañías e inclusive el traspaso de un trasporte a un lugar o a
otro trasporte puede ser realizado por otra empresa.
La verificación o control de una unidad en sus diferentes puntos se desarrolla en función de los
estándares de cada empresa. Las empresas pueden ser certificadas según normas internacionales o
no, esto todavía en esta industria es irrelevante para algunas compañías.
Ejemplo 1: Exportación Argentina
Figura 1: Circuito exportación
Ejemplo 2: Importación Argentina
Figura 2: Circuito importación
Página 86 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
5.3. Transportes y lugares de almacenamiento
Como se ha mencionado anteriormente cada transporte puede tener diferentes capacidades.
Normalmente el transporte terrestre se realiza a través de camiones o bateas. Pero también existe la
posibilidad de ser realizado a través de trenes para lo cual con frecuencia se utilizan contenedores
para resguardar la estructura del auto.
Los transportes marítimos son todavía el medio de transporte más rentable para este negocio. Todo
buque o barcaza está equipada con la tecnología y herramientas necesarias para transportar algunos
miles de autos (hasta 4.000 unidades). Para el transporte de las unidades en el interior de un barco
se realiza lo que en el medio se denomina trincado que consiste en amarrar desde diferentes puntos
del auto (ruedas o parte de la estructura del auto) al piso del buque. De esta forma se evita el
movimiento de los productos cuando el transporte es movilizado a través de un océano o río.
El trasporte por vía aérea es el menos frecuente por razones de costo. Pero al igual que con el
transporte marítimo las unidades pueden ir trincadas o bien también se suele utilizar contenedores.
Página 87 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 88 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
6. Procesos a analizar, límites y alcance
6.1. Puntos de Control
•
Puntos de control y transporte
Para el desarrollo del presente proyecto se definirán y tomarán muestras de puntos y transportes
estándares en la industria; esto es, se trabajará con muestras tomadas de inspecciones realizadas
frecuentemente por cualquier marca.
A continuación se describen los puntos de control que intervienen en este proyecto.
•
Despacho de planta de producción
Inspecciones realizadas sobre todas las unidades que salen de planta de producción y se dirigen
por transporte terrestre (camiones) a patios o puertos. La imputabilidad de las observaciones
notadas corresponde a planta de producción (normalmente denominada origen o averías de
calidad).
•
Ingreso a puerto
Procedente de diferentes lugares y trasladadas a través de camiones. La responsabilidad es
imputada a transporte terrestre.
•
Subida a buque
Luego de estadio en playa de puerto toda unidad es embarcada. Las inspecciones son realizadas
previas a la entrada a rampa. La imputabilidad corresponde a patio de puerto.
•
Descarga de buque
Unidades inspeccionadas a la descarga de un barco. Los daños y/o averías son imputados a las
empresas de transporte marítimo.
•
Salida de puerto
Luego de una determinada cantidad de tiempo las unidades son despachadas de puerto con
destinos diferentes. Las unidades son cargadas a camiones.
6.2. Estándares de inspección
Las observaciones realizadas son parametrizadas según los estándares impuestos por las compañías
que intervienen como operadoras logísticas.
Los daños y/o averías constan de tres partes claramente diferenciables: parte (área), avería (tipo de
daño) y gravedad (severidad):
•
Parte: o denominada frecuentemente área, es un código alfanumérico de dos dígitos que
identifica una de las partes del auto.
Página 89 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
Avería: está compuesto por un código alfanumérico de dos dígitos y es utilizado para definir
el tipo de daño.
Gravedad: o severidad compuesto por un código alfanumérico definido para especificar la
gravedad del daño o avería descubierto.
Un campo de observación es también considerado como parte de la codificación estándar. Sirve
para realizar cualquier aclaración sobre un daño que no se ha podido parametrizar directamente
debido a la falta de los códigos que lo pueden definir.
Algunos estándares incluyen un cuarto código compuesto por tres o cuatro dígitos alfanuméricos
definidos para realizar una observación referente a la avería y que sirve para especificar que la
avería fue descubierta en un lugar dos o tres puntos antes de la inspección en ese CP (check point).
Página 90 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
7. Información y datos
7.1. Proceso de inspección y captura de datos
El proceso de inspección se realiza solo sobre las partes visibles de la unidad. El presente proyecto
no incluye todas las fallas o desperfectos mecánicos del auto.
Cada perito o inspector aplica la norma estándar para observar y recorrer el vehículo en búsqueda
de daños y/o averías. Las inspecciones sobre cada unidad pueden ser realizadas por uno o más
peritos. La cantidad de inspectores depende de los acuerdos realizados entre las empresas y de las
verificaciones posteriores o anteriores que se realizan a cada unidad.
Los automóviles transitan por las diferentes cadenas logísticas con la documentación
correspondiente. Esta documentación incluye lo que se denomina VIN (Vehicle Identification
Number) que es un código alfanumérico de 17 o 18 dígitos.
El VIN tiene una estructura estándar en la industria y a partir de este se pueden conocer datos del
vehículo como el origen, la marca, el modelo, el color, etc. Este número alfanumérico viene
impreso en la documentación en código de barras.
La gran mayoría de las marcas trabaja con el código de barras denominado 128. Pero también se
usan otras normas como la 3 de 9 o 3 de 6. Siempre el auto tiene impreso el VIN en código de
barras de 17 o 18 dígitos.
Del procedimiento de inspección realizado surge un código de avería si es observada en la unidad.
La misma, según un proceso estándar, hoy en día, es cargada manualmente por cada perito. Luego
esta información es almacenada en una base de datos la cual es alimentada diariamente por todas las
inspecciones realizadas.
En algunos procesos de carga masiva de datos se utilizan colectores electrónicos de datos y en otros
simplemente se transforma o procesa la información suministrada por la compañía interesada en
verificar las unidades (entrega lo que se denomina parking list de vehículos). Los procesos de carga
masiva se realizan en proceso batch o por radio frecuencia. Este último va almacenando on line en
la base de datos unidad por unidad inspeccionada.
7.2. Sistema normalizado de codificación de daños y/o averías
Los datos cargados (los cuales son utilizados en este proyecto) son: VIN, parte, avería, gravedad,
observación y código de clave (o código que especifica el origen real de la avería).
7.3. Proceso de educción de requerimientos del proyecto
Comprensión del dominio
El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. Más
detalles sobre la determinación de los objetivos se encontrarán en el módulo de “Comprensión del
Negocio” de la metodología CRISP-DM detallada más adelante.
Los actores involucrados para la obtención de los datos necesarios para el desarrollo del presente
trabajo son:
Página 91 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
Especialistas en consultoría marítima y peritajes navales
Especialistas en inspección de unidades automotrices
Especialistas en desarrollo de tecnología para la captura de datos y desarrollo de base de
datos para el almacenamiento de los mismos.
En referencia a los límites del proyecto se puede hacer referencia al hecho de explotar la
información almacenada en las base de datos desde el período 2002 a 2008. Se cuenta con dos
cadenas logísticas de exportación, dos cadenas logísticas de importación y puntos de control de
carga y descarga de autos en puertos de Argentina y Brasil.
Identificación de necesidades
El objetivo del requisito es la búsqueda e identificación de los diferentes tipos de averías y/o daños
en las unidades. Esta necesidad surge de las compañías que intervienen en el proceso como
consecuencia del movimiento fluido de unidades de lugar en lugar. Es necesario también por
cuestiones operacionales debido a que en toda la cadena de suministro es necesario poder establecer
los recursos consumidos para el movimiento de las unidades.
Con la posibilidad de asignar recursos es posible establecer los costos que demandará el sistema
logístico. Con el establecimiento de los patrones buscado es posible para cada parte interesada
poder presupuestar en función de las cantidades movilizadas los costos por reparación de los daños.
El equipamiento de los sistemas de transporte es otro ítem a cubrir como consecuencia del
descubrimiento de patrones de producción de daños y averías. Todo proveedor de servicio de
transporte debe cumplir con determinadas condiciones para asegurar la conducción segura de las
unidades.
El origen de la información para este proyecto se encuentra en bases de datos normalizadas. Las
mismas son alimentadas diariamente por personal capacitado y experto en la identificación de
daños. Se cuenta con equipamiento electrónico para la captura automática de datos por lo que la
posibilidad de errores en la información es mínima.
Del mismo modo la consistencia de la información es controlada diariamente tanto por el personal
responsable directamente de la misma como de los clientes que acceden para verificar el estado de
las unidades movilizadas a los largo de los circuitos y/o en los diferentes puntos de control.
Para la realización de la búsqueda de la información se cuenta con información detallada de:
•
•
•
•
•
•
•
Cantidad de unidades transportadas
Lugares por donde pasan las unidades
Trasportes, tipos y compañías
Partes averiadas
Tipos de averías
Severidad de averías
Responsables de averías
Página 92 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Identificación de riesgos y contingencias
Al momento de desarrollar el presente proyecto no se detectan riesgos para su desarrollo y por lo
tanto no es necesario definir planes de contingencia. Se cuenta con la información electrónicamente
tomada y con el personal capacitado para el análisis de la información.
El hecho de no ver en este momento del proyecto riesgos potenciales no significa que no existan
puesto que al tratarse específicamente de una minería de datos (definida como el intento por
descubrir información oculta en los datos) es probable que los resultados obtenidos coincidan con
trabajos relacionados por empresas privadas con el objetivo de reducir o presupuestar costos. En
función de esto último se puede describir como plan de contingencia ante este probable riesgo el
desarrollo de un informe parametrizado con datos precisos y/o la valorización de los patrones de
daños y/o averías detectadas.
Evaluación de herramientas de explotación de información
Por cuestiones de índole práctico y a los efectos de llevar acabo el presente trabajo de tesis de
maestría se utilizan herramientas de explotación de datos suministradas por los Directores de Tesis,
las mismas son:
•
•
•
Software para Construcción de Árboles de Decisión utilizando un Modelo de Clasificación.
Software para Agrupamiento usando Mapas Autoorganizados.
Software para Construcción de Modelos de Predicción.
Página 93 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 94 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8. Aplicación de la metodología propuesta.
8.1. Comprensión del Negocio
8.1.1. Objetivos del negocio
El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. De
esto último también se puede inferir que es de utilidad para la toma de decisiones el poder
determinar o definir los lugares donde se producen los daños y las imputaciones de las mismas.
Descubrir donde se producen los siniestro conduce a la definición de políticas para la prevención de
las fallas en el sistema. De esto último surgen las medidas correctivas a llevar a cabo.
Los objetivos pueden ser resumidos en:
•
•
•
•
•
•
•
•
•
Identificar daños y/o averías.
Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de
transporte.
Imputar incidentes según el tipo de transporte.
Determinar tipos de averías y/o daños.
Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento.
Especificar gravedad de daños y/o averías.
Especificar lugares donde se producen daños y/o averías tratando de definir patrones de
comportamiento.
Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así
también, partes, tipos de averías, gravedades, lugares donde se producen.
Descubrir información “oculta” en función de los modelos generados a partir de los datos
disponibles.
Contexto actual
En referencia a la situación global del negocio se puede decir que toda la información necesaria
para la explotación de datos se encuentra disponible electrónicamente pero en forma dispersa. Esto
es, cada organización que interviene en cada circuito logístico tiene su propia sistema de análisis de
daños y/o averías e inclusive los estándares con los cuales se parametriza la información es distinta
una de otra.
No hay en el medio un estudio en profundidad sobre el comportamiento de los estados por los que
atraviesa una unidad automotriz en referencia al estudio de daños, averías, responsables e
imputaciones.
Departamentos involucrados en cada compañía
Los departamentos involucrados en el desarrollo en el control y seguimiento de unidades
automotrices de los cuales surge la información y hacia los cuales está destinado el resultado del
proyecto son:
•
•
Departamento de calidad
Departamento de ventas
Página 95 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
Departamento de operaciones
Departamento de sistemas
Departamento de logística y distribución
Área del problema
La producción de daños y averías es prácticamente inevitable debido al movimiento de las unidades
y al traspaso de empresa a empresa y de medio a medio de trasporte. Del mismo modo es vital para
la industria la especificación y determinación clara de las responsabilidades por cada siniestro. De
lo afinado que se encuentre el sistema depende el abastecimiento de unidades a los mercados
objetivos.
La minería de datos debe ser promovida en esta actividad debido a que no existen registros
documentados de comportamientos estándares en la producción de siniestros. Todo lo relacionado
con cantidades tanto de producción, como exportación o importación están claramente detalladas
tanto para las compañías que intervienen en la industria como en los organismos gubernamentales y
no gubernamentales.
Todo análisis de siniestros y especificación de tiempos de abastecimiento y reparación de unidades
se realiza individualmente y en forma reactiva.
Solución actual
Actualmente se recurre a las consultas manuales (por ejemplo SQL) para obtener los datos
necesarios para tener conocimiento de la situación de las unidades. En el caso de que haya
discrepancias en cuanto a las responsabilidades o imputabilidad de daños y/o averías se realiza un
cruce de información entre las compañías que intervienen la operatoria logística.
Objetivo primario de negocio
El objetivo primario de negocio para el presente proyecto es la posibilidad de detectar el
comportamiento de los daños y/o averías que se producen en las unidades automotrices 0 kilómetro
a lo largo de su circuito logístico.
Actividades
Cumplir con los objetivos propuestos por la aplicación de la metodología de explotación de datos
dará respuesta a las siguientes preguntas:
•
•
•
•
•
•
•
•
•
¿Cuáles son las partes de los vehículos con mayor y menor incidencia de daños?
¿Cuáles son los tipos de daños de mayor y menor frecuencia?
¿Qué gravedad tienen frecuentemente las averías producidas?
¿Cuáles son la mayor y menor cantidad de partes faltantes?
¿Cuáles son los lugares donde se producen la mayor y menor cantidad de daños?
¿Cuáles son los trasportes que provocan la mayor y menor cantidad de daños?
¿Qué marcas y modelos son dañados con mayor y menor frecuencia?
¿Cuáles son las mayores y menores combinaciones de partes y averías producidas?
¿Cuáles son los mayores y menores combinaciones de partes y faltantes producidos?
Página 96 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
•
¿Cuáles son las mayores y menores combinaciones de partes, averías y gravedades
producidas?
¿Cuáles son los periodos de mayor flujo de exportación e importación de unidades vía
marítima?
¿Cuáles son los porcentajes de siniestralidad producidas por cantidad de unidades
movilizadas?
¿Cuáles son los porcentajes de más de una averías en las unidades automotrices?
¿Cuáles son los porcentajes de unidades dañadas por cantidad de unidades inspeccionadas?
Criterios de éxito
Desde el punto de vista del negocio se establece como criterio de éxito el poder:
•
•
•
•
•
•
•
Especificar daños y/o averías; cantidades, tipos y severidad.
Establecer responsabilidades específicas.
Especificar tipos de transportes que producen las averías y tipos de avería.
Establecer claramente averías y tipos de averías.
Definir comportamientos de averías y daños.
Especificar lugares de producción de daños.
Definir estadísticamente tipos de transportes, partes, tipos de averías, gravedades e
imputabilidad de daños y/o averías.
El criterio de éxito del proyecto estará definido por personal experto en el desarrollo de las
actividades de inspección, captura de datos, análisis de información y tecnología con experiencia
comprobable en el negocio.
Expertos en el proceso operativo y tecnológico llevarán adelante todo el proceso de establecimiento
de criterio de éxito del proyecto.
8.1.2. Evaluación de la situación
Situación
Se cuenta con información detallada de las operaciones vinculadas a las inspecciones de unidades
automotrices desde 2002 a la fecha. Todas las bases de información se encuentran normalizadas y
con la documentación vinculada a las mismas.
Actualmente las bases de datos se encuentran en línea y funcionando bajo un desarrollo Web. Está
están siendo utilizadas y alimentadas diariamente.
Recursos de software
Se cuenta con los siguientes sistemas:
•
•
•
•
Servidor de base de datos.
Software para la Construcción de un Árbol de Decisión utilizando un Modelo de
Clasificación.
Software para Agrupamiento usando Mapas Autoorganizados.
Software para la Construcción de un Modelo de Predicción.
Página 97 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Recursos de hardware
Están a disposición los siguientes sistemas de hardware:
•
•
•
•
Equipamiento para la producción y almacenamiento de la base de datos, y el entrenamiento
de los modelos:
1. CPU Microprocesador Intel ® Core ™ 2, 1.7 GHz, 512 MB RAM, 60 GB HD.
2. CPU Microprocesador Intel ® Pentium ® 4, 1.7 GHz, 640 MB RAM, 80 GB HD.
3. Monitor 17’’.
4. Monitores 17’’.
5. Impresora Láser.
Servidor de base de datos local instalado para el resguardo de las base de información en
línea.
1. Servidor Microprocesador Intel ® Pentium ®, 3 GHz, 1 GB RAM, 160 GB HD.
2. Servidor Microprocesador Intel ® Pentium ®, Dual, 1.8 GHz, 1.5 GB RAM, 320GB
HD.
3. Monitor 15’’.
Acceso irrestricto a las base de datos en línea y publicadas por Web.
Sistema de banda ancha 3 MB conectado directamente a los servicios publicados en
producción.
Además se cuenta con personal experimentado en inspecciones a los cuales se puede acceder para
realizar las consultas necesarias para aclarar cualquier inquietud.
Fuentes de datos y conocimiento
Se cuenta con la siguiente información:
•
•
•
•
•
Base de datos con información vinculada a los movimientos de importación y exportación
de vehículos (dos marcas del mercado argentino con destino y origen Brasil y Francia, año
2002 a 2008).
Base de datos con información vinculada a los movimientos de exportación de vehículos
(dos marcas del mercado brasileño con destino Argentina, año 2002 a 2008).
Base de datos con información de empresa de transporte marítimo referida a los
movimientos de unidades de importación y exportación de autos (varias marcas del mercado
argentino con destino y origen de diferentes países, año 2006 a 2008).
Base de datos con unidades de importación y exportación de empresa de transporte marítimo
(varias marcas del mercado brasileño con destino y origen de diferentes países, año 2004 a
2008).
Base de datos con información de movimientos de autos de una empresa de transporte
terrestre (una marca del mercado argentino año 2004).
Fuentes de personal
Se cuenta con personal experto en inspecciones y con acceso a los mismos si restricciones de
tiempo.
Hay contacto directo y permanente con los administradores de sistemas, de personal y de soporte
técnico.
Página 98 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El proyecto cuenta con el apoyo técnico operativo y tecnológico en todo momento. Se tiene acceso
inclusive a lugares donde se genera la información y se realiza su almacenamiento.
Requerimientos, presunciones, y restricciones
Los datos pueden ser usados transformando toda información relacionada directamente con:
• Marcas de vehículos.
• Modelos de vehículos.
• Nombres de buques y compañías marítimas.
• Números de batea y nombre de compañías de transporte terrestre.
• Nombres de todas las empresas vinculadas a las operaciones en cualquier punto de control.
Para el uso de la información se procederá a desarrollar un sistema de codificación alfanumérica
para evitar inconvenientes legales.
La validez de los resultados obtenidos puede ser verificada directamente consultando sobre las
bases de datos.
Terminología
Ver Anexo 1: Glosario de terminología relevante de negocio.
Ver Anexo 2: Glosario de terminología de minería de datos.
8.1.3. Objetivos de minería de datos
Los objetivos en términos de minería de datos son:
•
•
•
•
•
•
•
•
•
•
•
•
•
Determinar el comportamiento de partes de vehículos con mayor y menor incidencia de
daños.
Determinar el comportamiento de tipos de daños de mayor y menor frecuencia.
Determinar el comportamiento de gravedades que tienen frecuentemente las averías
producidas.
Especificar el comportamiento de partes faltantes con mayor y menor incidencia.
Determinar lugares donde se producen la mayor y menor cantidad de daños.
Especificar el comportamiento que provoca la mayor y menor cantidad de daños según los
tipos de transporte.
Definir el comportamiento de marcas y modelos dañados con mayor y menor frecuencia.
Definir el comportamiento de las mayores y menores combinaciones de partes y averías
producidas.
Definir el comportamiento de las mayores y menores combinaciones de partes y faltantes
producidos.
Determinar el comportamiento de las mayores y menores combinaciones de partes, averías y
gravedades producidas.
Determinar el comportamiento de los flujos de exportación e importación de unidades vía
marítima.
Determinar el comportamiento de siniestralidad producidas por cantidad de unidades
movilizadas.
Determinar el comportamiento de más de una avería en las unidades automotrices.
Página 99 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Definir el comportamiento de unidades dañadas por cantidad de unidades inspeccionadas.
Actividades
Clasificación: Por año 2003, 2004, 2005, 2006, 2007, 2008.
•
•
•
•
•
•
•
•
•
•
•
Mes de operación
Mes de producción
Puntos de control
Empresa de transporte marítimo
Empresa de almacenamiento
Empresa de producción de autos
Número de batea
Modelo de vehículos
Parte de vehículos
Tipo de averías
Gravedad
Agrupamiento: Por año 2003, 2004, 2005, 2006, 2007, 2008.
•
•
•
•
•
•
•
•
•
•
•
Mes de operación
Mes de producción
Puntos de control
Empresa de transporte marítimo
Empresa de almacenamiento
Empresa de producción de autos
Número de batea
Modelo de vehículos
Parte de vehículos
Tipo de averías
Gravedad
Predicción: Por año 2003, 2004, 2005, 2006, 2007, 2008.
•
•
•
•
•
•
•
•
•
•
•
Mes de operación
Mes de producción
Puntos de control
Empresa de transporte marítimo
Empresa de almacenamiento
Empresa de producción de autos
Número de batea
Modelo de vehículos
Parte de vehículos
Tipo de averías
Gravedad
Página 100 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Criterios de éxitos de la minería de datos
Los resultados serán evaluados y controlados contra consultas SQL directas sobre la base de datos.
En función de las muestras de consultas manuales a cada base de datos se establecerán los criterios
de éxitos de cada resultado.
Para cada resultado se especificará un patrón manual de consulta.
8.1.4. Producción del plan del proyecto
Plan de proyecto
Se tomarán muestras de las bases de datos en producción según los puntos descritos en los ítems del
presente proyecto vistos anteriormente.
A cada una de las muestras tomadas se analizará el contenido y se realizarán trabajos de
normalización de información y adaptación para su mejor interpretación.
En forma paralela se irá describiendo en detalle en diccionario de terminología de negocio (Anexo
1) todo el vocabulario usado en la industria.
•
Etapa 1: Análisis de la estructura de datos e información de las bases de datos en
producción. Tiempo estimado 3 semanas.
•
Etapa 2: Ejecución de consultas para la captura de muestras representativas para lograr los
objetivos del proyecto. Tiempo estimado 1 semana.
•
Etapa 3: Conversión y normalización de datos según estructura requerida por los sistemas
donde los datos será procesados. Tiempo estimado 3 semanas.
•
Etapa 4: Ejecución de los procesos de explotación de datos sobre toda la información
obtenida y parametrizada. Tiempo estimado 1 semana.
•
Etapa 5: Análisis de los resultados obtenidos en función de los procesos ejecutados en el
punto anterior. Tiempo estimado 2 semanas.
•
Etapa 6: Según los resultados obtenidos se procederá a ejecutar nuevamente los procesos de
explotación de datos. Tiempo estimado 1 semana.
•
Etapa 7: Desarrollo de reportes en función de los resultados obtenidos y considerando los
objetivos de negocios del presente proyecto. Tiempo estimado 1 semana.
•
Etapa 8: Análisis y desarrollo de las conclusiones obtenidas según los resultados de cada
proceso. Tiempo estimado 2 semanas.
•
Etapa 9: Desarrollo de presentación de los resultados obtenidos a los participantes del
proyecto. Tiempo estimado 1 semana.
Página 101 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Nota: Durante cada una de las etapas del proyecto se irá desarrollando en paralelo el diccionario de
terminología de negocio (Anexo 1) y de minería de datos (Anexo 2).
Evaluación inicial de herramientas y técnicas
Construcción de árboles basado en modelo de clasificación.
Los Árboles de clasificación, o también llamados modelos basados en árboles, se fundamentan en el
principio de “divide y vencerás”, construyendo un árbol que en cada nodo establece unas
condiciones sobre un atributo, dividiendo así el conjunto de casos en subconjuntos que cumplen
cada condición. Los subconjuntos se vuelven a dividir añadiendo nuevos niveles al árbol hasta
detenerse mediante algún criterio.
Agrupamiento usando mapas autoorganizados
Técnicas que agrupan los datos en función de una distancia sin utilizar ningún tipo de información
externa para organizar los grupos.
Clustering no supervisado. Conjunto de técnicas que agrupan los datos en función de una distancia
sin utilizar ningún tipo de información externa para organizar los grupos. Dependiendo de la forma
en la que los datos son agrupados, podemos distinguir dos tipos de clustering:
•
Jerárquico: El clustering jerárquico aglomeratico es un método determinista basado en una
matriz de distancias. Establece pequeños grupos de genes/condiciones que tienen un patrón
de expresión común y posteriormente construye un dendograma (representación grafica de
un grupo de relaciones basadas en la cercanía o similitud entre los datos) de forma
secuencial. El árbol o dendograma, establece una relación ordenada de los grupos
previamente definidos y la longitud de sus ramas es una representación de la distancia entre
los distintos nodos del mismo. En el desarrollo del clustering jerárquico se han utilizado
diferentes algoritmos (UPGMA, Ward, etc.) aunque todos siguen la misma estrategia en
general: separan cada gen en un nodo diferente, calculan la distancia entre los dos genes más
próximos y los juntan en un cluster. Entonces se vuelve a calcular la matriz de distancias
sustituyendo los dos patrones que se han unido por el promedio de ambos. En cada paso, los
algoritmos son capaces de juntar los genes no solo de dos en dos sino muchos más a la vez.
Muchos de ellos simplemente se diferencian en la forma en la que calculan la distancia del
nuevo cluster formado al resto de los elementos de la matriz, y en este sentido, la
aproximación del “Average linkage” (algoritmo que opera agrupando iterativamente los
genes o clusters que presentan la distancia media mas pequeña en cada paso sucesivo del
calculo de la matriz de distancias) es la mas utilizada.
•
Por otro lado existe el clustering jerárquico divisivo que es similar al anterior pero agrupa
los genes de forma inversa. Mientras que el clustering aglomerativo separa inicialmente
todos los genes y posteriormente los va agrupando para construir clusters más grandes, el
clustering divisivo agrupa inicialmente todos los genes en un único cluster y sucesivamente
los va separando hasta que cada uno se encuentre aislado como una entidad. Es decir, el
método divisivo va identificando aquellos genes con un patrón más diferente para separarlos
en el espacio lo más posible. Este es el caso de SOTA (Self-Organizing Tree Algorithm). A
pesar de que no esta exento de problemas, el clustering es una herramienta poderosa para la
reducción de los datos obtenido de microarrays y para el estudio de posibles hipótesis que
Página 102 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
relacionan los clusters de genes obtenidos con el fenotipo. Sin embargo, este tipo de
relaciones deben ser formalmente validadas por otros experimentos adicionales.
•
No jerárquico: En este caso los algoritmos comienzan a calcular la matriz de distancias a
partir de un numero predefinido de clusters y van recolocando de forma iterativa los genes
en los diferentes grupos hasta minimizar la dispersión interna de cada cluster. Los dos
algoritmos más representativos de este tipo de clustering son:
1. K-Medias: es un algoritmo que comienza con una muestra de “k” genes elegidos al azar
de la matriz original de datos. Cada uno de ellos se utiliza como el centroide inicial de
los “k” clusters que se van a formar. La matriz de distancias se calcula desde dicho
centroide hasta cada uno de los genes de la matriz de datos y cada uno de ellos será
asignado de esta forma al centroide más cercano. Entonces la matriz de distancias se
recalcula reemplazando cada centroide por la media de los genes asignados a él y el
algoritmo repite entonces el proceso anterior. El mapa de clusters que ofrece este
algoritmo carece de topología.
2. SOM: los mapas auto-organizados (Self-Organising Maps) son redes neuronales. El
algoritmo permite, de forma iterativa, que los patrones mas parecidos se vayan juntando
entre si y alejándose de aquellos otros que son mas diferentes. Este tipo de algoritmos
son más fiables y robustos puesto que se basan en redes neuronales que por definición
son capaces de trabajar con grandes cantidades de datos con ruido. Sin embargo, no
carece de ciertos inconvenientes. SOM es una herramienta particularmente útil en el
tratamiento de datos procedentes de series temporales.
El gran problema que presentan estos métodos no jerárquicos es que al no generar un
dendograma no permiten hacerse una idea de la representación espacial de los genes, la cual
suele ofrecer un conocimiento intuitivo de cómo analizar los datos de microarrays.
Clustering supervisado: se basa en la idea de que para la clasificación de la mayoría de muestras
biológicas ya existe información preliminar que puede utilizarse para agrupación de nuevos datos
en clusters. Los métodos supervisados aprenden de esta información previa, generalmente ofrecida
por un conjunto de datos de “entrenamiento”, la forma en que deben clasificar los nuevos datos
(genes o condiciones) que se les presentan.
SVM (Supported Vector Machines): es una técnica lineal que utiliza hiperplanos para separar los
datos en el espacio como puntos negativos o positivos. Los datos de estudio son clasificados
respecto de otro conjunto de datos previamente conocido.
Preceptrones: están basados en redes neuronales. Tienen algunas ventajas sobre las SVM como por
ejemplo la capacidad de clasificar muchas muestras al mismo tiempo y discriminar entre varias
clases diferentes.
Construcción de un modelo de predicción
Otro tipo de problema importante que ocurre en una amplia gama de usos es la predicción. La
predicción es muy similar a la clasificación.
La única diferencia es que en la predicción el atributo objetivo (la clase) no es un atributo
cualitativo discreto, sino es uno continuo.
Página 103 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no
vistos. En la literatura, este tipo de problema es a veces llamado regresión. Si la predicción trata con
datos de serie tiempo, entonces a menudo lo llaman pronosticación.
8.2. Comprensión de Datos
8.2.1. Recolección de datos iniciales
8.2.1.1. Informe de la recolección de datos inicial
•
Identificación de autos
Cada unidad automotriz se identifica con un número el cual se específica en cada uno de los
registros que componen el presente trabajo. Toda unidad está relacionada con una avería la
cual es producida en un determinado lugar, por una determinada empresa responsable.
•
Modelos
Los datos relacionados con el nombre real del modelo son reemplazados por códigos
numéricos los cuales son extraídos directamente de cada consulta a la base de datos.
•
Lugares
Los diferentes tipos de lugares están codificados. Los lugares están relacionados con los
sitios donde las unidades son estacionadas transitoriamente.
•
Tipos de transporte
Los transportes también están codificados por un número y los mismos son de diferente tipo.
Esta información es referida a los transportes y tipos de transporte que trasladan los
vehículos de un sitio a otro.
•
Empresas
Cada empresa responsable por un siniestro es extraída con un código numérico. Todo sitio o
transporte están vinculados a una empresa.
•
Partes
Cada parte de una unidad automotriz es identificada con un número que usualmente está
compuesto por dos dígitos alfanuméricos. Cada número representa una parte de un auto.
•
Averías
Cada tipo de avería de cada siniestro está representado por un número. Normalmente es un
código compuesto por dos dígitos alfanuméricos.
•
Gravedades
Los diferentes niveles de avería son también extraídos con un número. Representan la
severidad que tiene una avería en una determinada parte del auto.
•
Observación
También referida a cada avería y tiene como objetivo el describir un daño que no puede ser
codificado en función del estándar de inspección especificado. Es un campo alfanumérico de
N cantidad de caracteres.
Página 104 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Fechas
Las fechas son extraídas en formato numérico con el formato aaaammdd: 4 caracteres
numéricos correspondientes al año, 2 al mes y 2 al día.
Requerimientos de información
La información necesaria para el logro de los objetivos del proyecto son los descritos en el ítem
anterior y lo mismos se encuentran disponibles en las bases de datos.
Criterio de selección de los datos
Los atributos específicos necesarios para la minería de datos son:
•
•
•
•
•
•
•
•
Identificador de autos
Fecha de operación en la que se detecta el daño
Modelo de cada unidad
Lugar
Parte del auto donde se produce la avería
Tipo de avería producida en cada unidad
Severidad o gravedad de avería producida
Observaciones por cada unidad
Tablas seleccionadas para la extracción de datos:
•
•
•
•
•
•
•
•
•
•
•
•
•
Autos
Operaciones
Daños
Autos – Operaciones
Modelos
Marcas
Lugares
Empresas
Partes
Averías
Gravedades
Compañías
Buques
Los datos se extraerán según la fecha de operación en la que se ha detectado cada avería. Los
periodos establecidos para realizar las particiones de datos extraídos es anual des el año 2003 hasta
el año 2008.
Todos los datos son extraídos de un sistema estándar como lo es el SQL Server. La estructura de
cada base de datos esta normalizada.
Inserción y transformación de datos
Los datos que contienen solo descripciones compuestas por caracteres alfanuméricos son los
relacionados con las observaciones.
Página 105 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
En cuanto a la transformación de datos se encuentra la necesidad de codificar los datos de modelos
debido a que los mismos se encuentran (en dos de las marcas incluidas en el presente proyecto) en
formato de caracteres. Para cada una de las consultas realizadas en la generación del código
seleccionador se procede a la transformación automática de los modelos en códigos numéricos.
8.2.2. Descripción de datos
En lineamientos generales todos los datos extraídos están codificados numéricamente por lo tanto la
necesidad de manipulación de los mismos es mínima a la hora de llevarlos a los modelos a utilizar
en el proyecto.
Los tipos de datos extraídos son:
•
•
•
•
•
•
•
•
Identificador de autos: numérico
Fecha de operación en la que se detecta el daño: numérico
Modelo de cada unidad: numérico
Lugar: numérico
Parte del auto donde se produce la avería: numérico
Tipo de avería producida en cada unidad: numérico
Severidad o gravedad de avería producida: numérico
Observaciones por cada unidad: alfanumérico
Análisis volumétrico de datos
Datos y métodos de captura
Los datos son extraídos realizando consultas con tecnología SQL. Luego la información
estructurada es almacenada en planillas de cálculo y posteriormente se cargan en los modelos para
ser analizados.
Si es necesario algún tipo de transformación para cada grupo de datos capturado el proceso para
transformar los mismos se realiza con sentencias SQL.
La disponibilidad de datos es 100 % accesible.
Fuentes de datos
Como lo mencionado en párrafos anteriores la fuente de datos se obtiene por en línea desde los
sistemas en producción las cuales son alimentadas diariamente.
Tablas y relaciones
Autos – Operaciones: Estas tablas se relacionan para identificar las operaciones que son realizadas
diariamente y la cantidad de unidades que contienen las mismas.
Daños – Autos – Operaciones: Esta relación permite al sistema relacionar las averías tomadas a
cada auto y para una operación especifica.
Daños – Partes: Relacionadas para obtener los códigos y la descripción con la que se identifica cada
parte en un daño determinado.
Página 106 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Daños – Averías: Estas tablas están relacionadas para obtener los códigos y descripción de los
diferentes tipos de averías contenidos en un daño.
Daños – Gravedades: Relacionadas para detallar los códigos y la descripción de cada nivel de
gravedad para un daño específico.
Operaciones – Buques: Desde allí se obtienen los datos vinculados a los buques que forman parte de
una operación determinada si la misma es realizada en puerto tanto a la bajada como a la subida de
los autos a cada navío.
Operaciones – Compañías: Relacionadas para obtener información vinculada a las empresas
responsables por los daños u observaciones realizadas para cada unidad automotriz.
Operaciones – Puntos de control: Toda operación está vinculada a un lugar específico en la cadena.
Esta relación permite al sistema obtener información detallada de lugar donde se realizó la
inspección del auto.
Operaciones – Imputaciones: Estas tablas están relacionadas para poder saber cuales es el tipo de
transporte o bien el tipo de lugar donde se produce una determinada avería.
8.2.3. Exploración de datos
•
Árboles de Decisión con Modelo de Clasificación.
El algoritmo de construcción de árboles de decisión trabaja sobre la cantidad de registros
tomadas sin especificación de cantidad máxima y el objetivo inicial es el descubrimiento de
patrones para el comportamiento de las averías en lugares, tipos de transporte, modelos y
marcas. El procesamiento de datos se realiza según los periodos definidos.
•
Agrupamiento con Mapas Autoorganizados.
El agrupamiento de información se realiza con 5000 registros como máximo y se toman
matrices de 3 x 3, 4 x 4, y 10 x 10. Del mismo modo que en el algoritmo anterior el proceso de
la información se realiza en función de los periodos establecidos. Los agrupamientos se realizan
sobre modelos, lugares, partes, averías y severidades.
•
Modelos de Predicción.
La construcción de los modelos de predicción se desarrolla sobre 2000 registros como cantidad
máxima. Se procesan corridas para el análisis de datos de partes, averías, lugares, modelos,
severidades y marcas. Con esta información se puede obtener el comportamiento de las averías
en relación a determinadas partes, lugares, y tipos de transporte. En este caso también los
registros son procesados según los periodos establecidos.
Informe de exploración de datos
Se realiza la exploración de datos sobre información extraída desde el año 2003 al 2008. Los
primeros resultados van a mostrar información estadística y principalmente sirve para determinar la
consistencia y completitud de datos.
Página 107 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
También en esta etapa se va ha poder ver la necesidad de extraer de la base de datos atributos que
posiblemente fueron omitidos y los cuales a partir de esta primera exploración se pueden
vislumbrar.
De la exploración inicial de toda la información disponible para el presente estudio se define la
división de los periodos de procesamiento de datos de la siguiente forma:
•
Muestra 1: Año 2003, 16 modelos.
•
Muestra 2: Primer semestre año 2004, 11 modelos.
•
Muestra 3: Segundo semestre año 2004, 13 modelos.
•
Muestra 4: Primer semestre año 2005, 19 modelos.
•
Muestra 5: Segundo semestre año 2005, 18 modelos.
•
Muestra 6: Primer semestre año 2006, 18 modelos.
•
Muestra 7: Segundo semestre año 2006, 22 modelos.
•
Muestra 8: Primer semestre año 2007, 20 modelos.
•
Muestra 9: Segundo semestre año 2007, 22 modelos.
•
Muestra 10: Primer semestre año 2008, 22 modelos.
Para cada uno de los periodos establecidos el estudio comprende los siguientes lugares:
•
•
Importación: salida de planta de origen, subida a buque puerto de origen, bajada de buque
puerto de destino, salida de puerto de destino.
Exportación: salida de planta, ingreso a puerto, subida a buque.
En referencia a las empresas y tipos de transporte por cada lugar se encuentran:
•
•
•
Transporte terrestre: 4 empresas.
Transporte marítimo: 92 buques correspondientes a 21 compañías.
Puertos: 3 empresas.
Para concluir con el presente informe de exploración de datos se detallan las diferentes cantidades
de datos a analizar y los gráficos donde corresponden.
•
•
•
•
Cantidad total de registros explotar: 50246
Cantidad total de modelos que intervienen: 22
Cantidad de partes de autos: 99
Cantidad de tipos de averías: 11
Página 108 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
En los gráfico siguientes se muestran resultados de la exploración de datos inicial sobre al totalidad
de la información con la que se desarrolla el presente proyecto. Los gráficos muestran la
información den dibujo de barras y de tortas para una mejor interpretación de los resultados.
El Gráfico 1 muestra las cantidades de unidades producidas en función de los lugares donde se
producen y del recorrido que realizan.
25000
22075
20000
15000
10000
5070
5000
2390
1544
0
Retiro Fábrica de
Subida Buque
Bajada de Buque
Origen
Puerto de Origen
Retiro de Puerto
Gráfico 1: Cantidad de averías por lugar (Importación de vehículos)
En el Gráfico 2 se muestran las mismas cantidades del gráfico 1 en dibujo de tortas. Allí también se
puede observar el porcentaje de averías en función de los lugares en un circuito común de
importación de vehículos.
Retiro de Puerto; 1544; 5%
Retiro Fábrica de Origen;
2390; 8%
Bajada de Buque; 5070;
16%
Subida Buque Puerto de
Origen; 22075; 71%
Gráfico 2: Cantidad de averías por lugar, cantidades y porcentajes (Importación de vehículos)
El Gráfico 3 permite ver las cantidades por lugares de detección de averías en un circuito estándar
de exportación de autos.
Página 109 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
12000
10137
10000
8000
6647
6000
4000
2383
2000
0
T ransferencia ubicación y
línea de carga
Ingreso a Puerto
Subida a Buque
Gráfico 3: Cantidad de averías por lugar (Exportación de vehículos)
El Gráfico 4 detalla las cantidades de averías en función de los lugares y permite ver los porcentajes
y cantidades en un circuito estándar de exportación.
Subida a Buque; 2383; 12%
T ransferencia ubicación y
línea de carga; 10137; 53%
Ingreso a Puerto; 6647; 35%
Gráfico 4: Cantidad de averías por lugar, cantidades y porcentajes (Exportación de vehículos)
El Gráfico 5 muestra los 10 modelos de vehículos con mayor cantidad de dañados.
16000
14060
14000
11890
12000
9129
10000
8000
6000
4814
3734
4000
2612
1577
2000
798
17
20
9
5
7
13
8
18
6
434
5 253
0
1
2
3
4
5
6
7
8
9
10
Gráfico 5: Los 10 modelos con mayor cantidad de averías
El Gráfico 6 permite ver los 10 modelos con mayor cantidad de averías especificando cantidades y
porcentajes del total tomado como referencia.
Página 110 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
9; 6; 6%
10; 5; 5%
1; 17; 16%
8; 18; 17%
2; 20; 18%
7; 8; 7%
3; 9; 8%
6; 13; 12%
4; 5; 5%
5; 7; 6%
Gráfico 6: Los 10 modelos con mayor cantidad de averías, porcentajes y cantidades
El Gráfico 7 muestra las 10 partes de vehículos dañadas más frecuentemente. Solo se toman estás
10 áreas para tener referencia y como consecuencia de la primera exploración de datos.
5000
4500
4403
4401
4286
3926
4000
3568
3500
3029
3000
2500
1975
2000
1906
1744
1296
1500
1000
500
0
Puerta d elantera
Parag o lp e
Puerta d elant era
Derecha
tras ero / Sp o iler
izq uierd a
t ras ero
Puerta tras era
izq uierd a
Parag o lp e
d elantero /
Pro tecto r
d elantero
Puerta tras era
Derecha
M anual
Ot ro s
Sp o iler
d elantero
Llant a d elant era
izq uierd a
Gráfico 7: Las 10 partes con mayor incidencia de averías
Concluyendo con la exploración de datos se muestra a continuación el Gráfico 8 con las 10 averías
producidas en los vehículos con mayor frecuencia.
Página 111 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
25000
20061
20000
17824
15000
10000
5219
5082
5000
819
577
Arra nc a do R o to F is ura do
M a nc ha do
283
223
79
70
9
De s ga
rra do C o rta do
Que m a do
0
R a ya do R o za do
Abo lla do
P intura
s a lta da
F a lta nte
R e ve nta do Exc e s o
P ro ye c c ió n
Es ta lla do
kilo m e tra je
Gráfico 8: Las 10 partes con mayor incidencia de averías
8.2.4. Verificación de la calidad de datos
En función de la exploración inicial de datos se concluye que estos son completos. Los datos cubren
los casos requeridos para la obtención de los resultados necesarios para el logro de los objetivos del
presente proyecto.
Los datos provienen del mismo sistema de base datos el cual no contiene errores, con excepción de
los errores gramaticales en los campos que permiten el ingreso de texto, pero esos campos no son
requeridos para el presente proyecto.
En referencia a los valores omitidos hasta este punto ellos no fueron encontrados. Del mismo modo
hasta este ítemes del proyecto no se presentó la necesidad de excluir datos.
8.3. Preparación de Datos
8.3.1. Datos seleccionados
Los datos seleccionados para el análisis son los siguientes:
•
•
•
•
•
•
•
•
Número de chasis: tipo entero.
Modelo: tipo entero.
Fecha: tipo entero, formado año (4 dígitos), mes (2 dígitos) y día (2 dígitos).
Lugar: tipo entero.
Parte: tipo entero.
Tipo Avería: tipo entero.
Gravedad: tipo entero.
Observación: tipo carácter.
El volumen de datos a explotar varía en función del software a utilizar, esto es:
Página 112 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Modelo de Clasificación: El software no tiene límite especificado por lo que los datos a
extraer para el análisis depende exclusivamente del contenido en la base de datos en la
división de períodos establecidos.
•
Modelo de Clustering: El límite del software es 5000 registros. Si el grupo de datos tomados
en cada periodo supera la restricción establecida por el software se procede a tomar el grupo
de valor fecha más bajo. Esto es, se toma la primera parte de los registros del periodo.
•
Modelo de Predicción: El límite del software es de 2000 registros. En el caso de superar las
cantidades de datos restringidas por el software se toma como criterio de selección el mismo
que para el punto anterior a los efectos de normalizar las consultas (SQL) de extracción de
datos.
En referencia a importancia de datos se puede dividir en tres niveles:
•
•
•
Primaria: Los datos de Modelo, Lugar, Parte, Avería. Estos son los datos en función de los
cuales se realizar las explotaciones.
Secundaria: Los atributos referidos a Fecha y Gravedad. En cuanto a las fechas solo son
utilizadas a los efectos de la toma de datos y para establecer un criterio de normalización de
las consultas para la extracción de los datos. En cuanto a los datos de gravedad los mismos
no tienen variación significativa. Inclusive la variación más alta, que son cuatro, solo la
presentan en los dos o tres primeros periodos de selección puesto que luego se achican solo
a dos tipos.
Terciaria: El atributo Observación entra en esta clasificación puesto que el mismo no
interviene en la evaluación directa de los modelos.
8.3.2. Limpieza de datos
La base de datos con la se cuenta para el presente trabajo contiene información relacionada con
operaciones de 4 marcas de automóviles. Pero solo 2 de las marcas contienen información relevante
y representativa por su cantidad y diversidad de movimientos. Por este motivo se procedió a
eliminar del presente proyecto las otras dos marcas como así también los puntos por donde pasan
los cuales no agregan valor al proyecto.
Los datos de las marcas que quedan fuera del proyecto pueden ser objeto de un estudio posterior
para continuar con esta línea de investigación en la industria automotriz. Los datos de las marcas
que quedan excluías del proyecto no tienen importancia relevante para los períodos de distribución
de las extracciones realizadas pero si pueden ser relevantes si los períodos establecidos son más
prolongados (por ejemplo cada dos años).
También por motivos de normalización para el ingreso de información a los modelos de software
con los que se cuenta se ha realizado por SQL la codificación de los modelos puesto que los mismos
están disponibles en la base de datos en formato de caracteres alfanuméricos.
El campo Gravedad puede ser irrelevante en alguno de los períodos iniciales del presente estudio
debido a la cantidad de variaciones. Inicialmente son 1, 2, 3 y 4 y al final se reduce solo a dos 1 y 2.
Página 113 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8.3.3. Construcción de datos
Como se ha mencionado en el ítem anterior se ha realizado la transformación del atributo Modelo a
formato numérico debido a que los mismos se encontraban en formato alfanumérico.
Lo recomendable para el proceso de transformación es la programación de una consulta SQL con
las sentencias correspondientes para la transformación de los datos.
Todos los datos extraídos previos a la incorporación de los mismos en el software de análisis de
datos pasan a un archivo de planilla de cálculo.
La explotación de los datos se realizará sobre información codificada en formato numérico y luego
de realizar el estudio del significado de los resultados se procede a la captura del significado en la
base de datos.
Las marcas y modelos excluidos según lo dicho previamente también son filtrados en las consultas
estructuradas. Los números de VIN que contiene cada unidad permiten realizar el filtro
apropiadamente puesto que es único y universal para cada uno. La estructura del número de
identificación del auto permite saber dentro de si mismo a que marca y modelo pertenece, por lo
tanto en cada consulta SQL se incorpora la sentencia correspondiente para efectivizar el filtro.
8.3.4. Integración de datos
Los datos son extraídos y combinados a partir de tres tablas relacionadas por sus respectivas claves.
Los atributos finales se obtienen de las siguientes tablas:
•
•
•
Chasis
Número de identificación de un auto
Modelo del vehiculo
Operaciones
Fecha en que se realiza la operación donde interviene el vehículo que sufre la avería.
Daños
Código de parte averiada
Código de avería
Código de gravedad
Observación
Las consultas SQL son capaces de integrar toda la información requerida para el presente proyecto.
Todas las líneas de código para la generación de los archivos en función de los períodos
establecidos quedan almacenadas en archivos con formato de query. Las consultas programadas se
encuentran almacenadas en el Anexo 3.
8.3.5. Formateo de datos
Las herramientas exigen que los datos a explotar sean numéricos.
En cuanto al orden en el que debe ir cada columna los programas no requieren una posición
específica pero a los efectos de normalizar el presente proceso de trabajo se define el siguiente
orden:
Página 114 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
a.
b.
c.
d.
e.
f.
g.
h.
Chasis
Modelo
Fecha
Lugar
Parte
Avería
Gravedad
Observación
8.4. Modelado
8.4.1. Selección de las técnicas de modelado
•
Árboles de Clasificación
•
Agrupamiento con Mapas Autoorganizados
•
Modelo de Predicción
La documentación necesaria para la utilización de las herramientas de software que se utilizan en
este proyecto de tesis se encuentra disponible en la misma aplicación. La información brindada por
cada herramienta es técnicamente precisa y detallada lo cual permite su aplicabilidad sin mayores
inconvenientes.
Las aplicaciones han sido desarrolladas con tecnologías de planilla de cálculos programadas con
uno de los lenguajes de programación estándares en informática.
8.4.2. Generación de la prueba de diseño
El conjunto de datos de entrenamiento es almacenado en archivos con formato de hoja de cálculo y
se dividen en función de los períodos establecidos previamente para el presente proyecto. Se
capturan y almacenan todos los datos según cada período preestablecido. Las cantidades de datos de
entrenamiento para los respectivos modelos también es variable en función del software a usar, lo
cual se especificó previamente en párrafos anteriores.
Las pruebas se han realizado con muestras reducidas de los datos a ser explotados con el formato
que se utilizará en los modelos reales.
En referencia a la validación de la calidad de datos cada aplicación solicita como parámetros
iniciales previos a cada proceso la especificación de los mismos. Cada validación especificada
queda almacenada en la aplicación ejecutada.
Durante las pruebas de diseño de los modelos se desestimaron los campos de identificación de
chasis, fecha de producción de la avería y observación. La decisión fue tomada en función de lo que
se conoce hasta este momento de desarrollo del proyecto y no se descarta la posibilidad de recurrir a
esta información como consecuencia de un estudio o análisis futuro.
De las pruebas también podemos concluir que en función de los resultados que se puedan llegar a
obtener del presente estudio, se podría hacer necesario o bien podría ser caso de futuras líneas de
Página 115 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
investigación el desarrollo de la detección de patrones específicamente en uno de los más
importantes medios de transporte de autos como lo son los buques.
8.4.3. Construcción de los modelos
A continuación se describe la parametrización y ejecución de los modelos en función de las tres
herramientas utilizadas por el proyecto.
8.4.3.1. Modelo de Clasificación
Construcción de un Modelo de Clasificación para el analizar el comportamiento de los Tipos de
Averías.
Variables de entrada:
• Código de Parte: Continuous Predictor.
• Código de Gravedad: Continuous Predictor.
Variables de salida:
• Código de Avería: Categorical Predictor.
Construcción de un Modelo de Clasificación para el análisis del comportamiento donde (CP) se
producen las averías en un automóvil.
Variables de entrada:
• Código de Parte: Continuous Predictor.
• Código de Avería: Continuous Predictor.
• Código de Gravedad: Continuous Predictor.
Variables de salida:
• Código de lugar (punto de control): Categorical Predictor.
Construcción de un Modelo de Clasificación para analizar las averías producidas en modelos.
Variables de entrada:
• Código de Parte: Continuous Predictor.
• Código de Avería: Continuous Predictor.
• Código de Gravedad: Continuous Predictor.
Variables de salida:
• Código de modelo de auto: Categorical Predictor.
El procesamiento de datos de estos modelos permite determinar los niveles de siniestralidad por
lugar y modelos de unidades automotrices. Otra información que se obtiene a partir de estos
modelos es la imputación de los incidentes y la determinación de los tipos de transportes que los
provocan.
8.4.3.2. Modelo de Clustering
Construcción de un Modelo de Clustering para establecer el agrupamiento de daños.
Página 116 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Variables de entrada:
• Código de Parte.
• Código de Avería.
• Código de Gravedad.
Variables de salida:
• Formación de grupos.
Construcción de un Modelo de Clustering para el agrupamiento de datos en relación a daños y los
lugares donde se producen sin considerar la gravedad del daño.
Variables de entrada:
• Código de CP.
• Código de Parte.
• Código de Avería.
Variables de salida:
• Formación de grupos.
Construcción de un Modelo de Clustering para el agrupamiento de datos de averías en lugares
considerando la severidad de los daños.
Variables de entrada:
• Código de CP.
• Código de Parte.
• Código de Avería.
• Código de Gravedad.
Variables de salida:
• Formación de grupos.
Construcción de un Modelo de Clustering para el agrupamiento de datos de averías producidas en
modelos sin considerar la gravedad de los daños.
Variables de entrada:
• Código de Modelo.
• Código de Parte.
• Código de Avería.
Variables de salida:
• Formación de grupos.
Construcción de un Modelo de Clustering para el agrupamiento de datos de averías producidas en
modelos especificando la severidad de los daños.
Variables de entrada:
• Código de Modelos.
• Código de Parte.
• Código de Avería.
Página 117 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Código de Gravedad.
Variables de salida:
• Formación de grupos.
La ejecución de estos agrupamientos identifica los daños producidos relacionados con los lugares y
modelos de unidades. También permite ver la relación entre las partes averiadas, los tipos de averías
producidos y la severidad de los mismos.
Del análisis de la relación entre los daños y los lugares se puede establecer el comportamiento de
los daños en función del tipo de transporte.
8.4.3.3. Modelo de Predicción
Construcción de un Modelo de Predicción para determinar el comportamiento de las partes en
función del tipo de avería y gravedad de la misma.
Variables de entrada:
• Código de Avería: Continuous.
• Código de Gravedad: Continuous.
Variables de salida:
• Código de Parte: Output.
Construcción de un Modelo de Predicción para determinar el comportamiento de los tipos de avería
en función de las partes donde se producen y la gravedad de la misma.
Variables de entrada:
• Código de Parte: Continuous.
• Código de Gravedad: Continuous.
Variables de salida:
• Código de Avería: Output.
Construcción de un Modelo de Predicción para establecer el comportamiento de las averías en
función del lugar donde se producen.
Variables de entrada:
• Código de Parte: Continuous.
• Código de Avería: Continuous.
• Código de Gravedad: Continuous.
Variables de salida:
• Código de CP: Output.
Construcción de un Modelo de Predicción para establecer el comportamiento de las averías en
función de los modelos de vehículo.
Variables de entrada:
Página 118 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
Código de Parte: Continuous.
Código de Avería: Continuous.
Código de Gravedad: Continuous.
Variables de salida:
• Código de Modelo: Output.
Con el procesamiento del Modelo de Predicción es posible encontrar los daños, lugares, tipos de
transportes, y modelos donde se producen las averías.
Los modelos trabajan sobre los códigos numéricos de las variables introducidas. La traducción de
los códigos empleados en el procesamiento de datos se encuentra disponible en el Anexo 4.
En el Anexo 4 se encuentra el detalle descriptivo de los modelos, lugares, tipos de transporte,
código de área de un auto, tipo de avería de un auto y gravedad de una avería en un automóvil.
8.4.4. Descripción de los modelos
8.4.4.1. Modelo de Clasificación
Se trabaja sobre tres categorías: Averías, Lugares y Modelos.
El modelo de minería de datos permite visualizar la ocurrencia de los tipos de averías producidos
sobre todas las partes y especificando las gravedades. Se observan las cantidades y porcentajes de
ocurrencia a lo largo de cada periodo.
El análisis de la clase lugares permite visualizar el comportamiento de las averías en los diferentes
lugares por donde transitan las unidades automotrices. También permite ver cantidades y
porcentajes mostrando una clara relación entre los diferentes lugares donde se producen.
Por último se analiza la ocurrencia de las averías por modelos de autos. Al final también es posible
encontrar información sobre cantidades y porcentajes por cada período.
Para los tres tipos de análisis mencionados se crean los árboles de decisión con sus respectivas
reglas.
Finalmente este modelo muestra un detalle de los resultados obtenidos como la cantidad de hojas de
los árboles generados, la cantidad de nodos, el tiempo de proceso de la herramienta, etc.
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer
período.
•
Averías (Período 1 – Año 2003)
Avería
Arrancado - Roto – Fisurado
Desgarrado – Cortado
Reventado – Estallado
Pintura saltada
Abollado
Página 119 de287
Cantidad
136
23
12
935
5338
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Faltante
Proyección
Rayado – Rozado
Manchado
Exceso kilometraje
494
9
2023
84
223
Tabla 4: Cantidad de daños y sus códigos correspondientes
Exceso kilometraje
2%
Manchado
1%
Rayado - Rozado
22%
Arrancado - Roto Fisurado
Desgarrado - Cortado
1%
0%
Reventado - Estallado
0%
Pintura saltada
10%
Proyección
0%
Faltante
5%
Abollado
59%
Gráfico 9: Porcentajes de ocurrencia de averías
•
Lugares (Período 1 – Año 2003)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
87
6925
942
352
424
443
104
Tabla 5: Cantidad de averías por lugar
Página 120 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Subida a Buque
1%
Retiro Fábrica de
Origen
1%
Transferencia
Ingreso a Puerto
ubicación y línea de
5%
carga
5%
Retiro de Puerto
4%
Bajada de Buque
10%
Subida Buque Puerto
de Origen
74%
Gráfico 10: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 1 – Año 2003)
Modelo
Modelo 1
Modelo 2
Modelo 3
Modelo 4
Modelo 5
Modelo 9
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Modelo 15
Modelo 16
Modelo 17
Modelo 18
Modelo 19
Modelo 20
Cantidad
33
33
194
8
595
4143
33
13
436
67
12
13
2662
467
22
546
Tabla 6: Cantidad de averías por modelo
Página 121 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 19
0%
Modelo 20
6%
Modelo 1
0%
Modelo 2
Modelo 3
0%
2%
Modelo 4
0%
Modelo 18
5%
Modelo 5
6%
Modelo 17
29%
Modelo 9
46%
Modelo 16
0%
Modelo 15
0%
Modelo 14
1%
Modelo 13
5%
Modelo 11
0%
Modelo 12
0%
Gráfico 11: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo
período.
•
Averías (Período 2 – Semestre 1 Año 2004)
Avería
Quemado
Arrancado - Roto – Fisurado
Desgarrado – Cortado
Reventado – Estallado
Pintura saltada
Abollado
Faltante
Proyección
Rayado – Rozado
Manchado
Cantidad
2
31
6
14
790
2855
184
2
1628
155
Tabla 7: Cantidad de daños y sus códigos correspondientes
Página 122 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Quemado
0%
Manchado
3%
Arrancado - Roto Fisurado
Reventado - Estallado
1%
0%
Desgarrado - Cortado
0%
Pintura saltada
14%
Rayado - Rozado
29%
Proyección
0%
Faltante
3%
Abollado
50%
Gráfico 12: Porcentajes de ocurrencia de averías
•
Lugares (Período 2 – Semestre 1 Año 2004)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
87
6925
942
352
424
443
104
Tabla 8: Cantidad de averías por lugar
Página 123 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Transferencia
Ingreso a Puerto
ubicación y línea de
6%
carga
1%
Retiro de Puerto
2%
Subida a Buque
1%
Retiro Fábrica de
Origen
1%
Bajada de Buque
6%
Subida Buque Puerto
de Origen
83%
Gráfico 13: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 2 – Semestre 1 Año 2004)
Modelo 1
Modelo 2
Modelo 3
Modelo 5
Modelo 9
Modelo 11
Modelo 13
Modelo 14
Modelo 16
Modelo 17
Modelo 18
Modelo 20
15
9
52
244
1785
5
562
10
22
2616
28
319
Tabla 9: Cantidad de averías por modelo
Página 124 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 20
6%
Modelo 1
0%
Modelo 2
0%
Modelo 18
0%
Modelo 3
1%
Modelo 5
4%
Modelo 9
32%
Modelo 17
47%
Modelo 11
0%
Modelo 13
10%
Modelo 16
0%
Modelo 14
0%
Gráfico 14: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer
período.
•
Averías (Período 3 – Semestre 2 Año 2004)
Avería
Quemado
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Rayado - Rozado
Manchado
Cantidad
4
46
8
13
812
2375
274
1794
29
Tabla 10: Cantidad de daños y sus códigos correspondientes
Página 125 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Quemado
0%
Manchado
1%
Arrancado - Roto Fisurado
Reventado - Estallado
1%
0%
Desgarrado - Cortado
0%
Pintura saltada
15%
Rayado - Rozado
34%
Abollado
44%
Faltante
5%
Gráfico 15: Porcentajes de ocurrencia de averías
•
Lugares (Período 3 – Semestre 2 Año 2004)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
33
4008
505
71
20
491
228
Tabla 11: Cantidad de averías por lugar
Subida a Buque
4%
Transferencia
ubicación y línea de
carga
0%
Ingreso a Puerto
9%
Retiro Fábrica de
Origen
1%
Retiro de Puerto
1%
Bajada de Buque
9%
Subida Buque Puerto
de Origen
76%
Página 126 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Gráfico 16: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 3 – Semestre 2 Año 2004)
Modelo
Modelo 1
Modelo 2
Modelo 3
Modelo 5
Modelo 6
Modelo 8
Modelo 9
Modelo 11
Modelo 13
Modelo 14
Modelo 16
Modelo 17
Modelo 18
Modelo 20
Cantidad
30
8
6
252
14
2
833
8
457
4
29
3041
40
632
Tabla 12: Cantidad de averías por modelo
Modelo 1
1%
Modelo 3
0%
Modelo 2
0%
Modelo 5
5%
Modelo 8
0%
Modelo 6
0%
Modelo 9
15%
Modelo 20
12%
Modelo 11
0%
Modelo 18
1%
Modelo 13
9%
Modelo 14
0%
Modelo 16
1%
Modelo 17
56%
Gráfico 17: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto
período.
•
Averías (Período 4 – Semestre 1 Año 2005)
Avería
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Abollado
Página 127 de287
Cantidad
66
2
25
598
1099
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Faltante
Rayado - Rozado
Manchado
264
1792
61
Tabla 13: Cantidad de daños y sus códigos correspondientes
Arrancado - Roto Fisurado
2%
Manchado
2%
Desgarrado - Cortado
0%
Reventado - Estallado
1%
Pintura saltada
15%
Rayado - Rozado
45%
Abollado
28%
Faltante
7%
Gráfico 18: Torta especificando porcentajes de ocurrencia de averías
•
Lugares (Período 4 – Semestre 1 Año 2005)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
603
1849
570
137
39
510
201
Tabla 14: Cantidad de averías por lugar
Página 128 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Subida a Buque
5%
Ingreso a Puerto
13%
Retiro Fábrica de
Origen
15%
Transferencia
ubicación y línea de
carga
1%
Retiro de Puerto
4%
Subida Buque Puerto
de Origen
47%
Bajada de Buque
15%
Gráfico 19: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 4 – Semestre 1 Año 2005)
Modelo
Modelo 1
Modelo 2
Modelo 5
Modelo 6
Modelo 8
Modelo 9
Modelo 13
Modelo 16
Modelo 17
Modelo 18
Modelo 20
Cantidad
20
3
200
72
465
433
35
18
2002
86
574
Tabla 15: Cantidad de averías por modelo
Página 129 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 1
1%
Modelo 20
15%
Modelo 2
0%
Modelo 5
5%
Modelo 6
2%
Modelo 18
2%
Modelo 8
12%
Modelo 9
11%
Modelo 13
1%
Modelo 16
0%
Modelo 17
51%
Gráfico 20: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto
período.
•
Averías (Período 5 – Semestre 2 Año 2005)
Avería
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Proyección
Rayado - Rozado
Manchado
Cantidad
67
6
28
490
1126
240
6
1887
21
Tabla 16: Cantidad de daños y sus códigos correspondientes
Arrancado - Roto Fisurado
2%
Desgarrado - Cortado
0%
Reventado - Estallado
1%
Manchado
1%
Pintura saltada
13%
Abollado
29%
Rayado - Rozado
48%
Proyección
0%
Faltante
6%
Gráfico 21: Porcentajes de ocurrencia de averías
Página 130 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Lugares (Período 5 – Semestre 2 Año 2005)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
909
1208
758
248
94
550
104
Tabla 17: Cantidad de averías por lugar
Subida a Buque
3%
Ingreso a Puerto
14%
Retiro Fábrica de
Origen
23%
Transferencia
ubicación y línea de
carga
2%
Retiro de Puerto
6%
Subida Buque Puerto
de Origen
32%
Bajada de Buque
20%
Gráfico 22: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 5 – Semestre 2 Año 2005)
Modelo
Modelo 1
Modelo 2
Modelo 5
Modelo 6
Modelo 8
Modelo 9
Modelo 13
Modelo 16
Modelo 17
Modelo 18
Modelo 19
Modelo 20
Cantidad
48
8
398
85
608
469
70
4
1795
39
80
266
Tabla 18: Cantidad de averías por modelo
Página 131 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 19
2%
Modelo 20
7%
Modelo 1
1%
Modelo 2
0%
Modelo 5
10%
Modelo 6
2%
Modelo 18
1%
Modelo 8
16%
Modelo 17
47%
Modelo 9
12%
Modelo 16
0%
Modelo 13
Gráfico 23: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto
período.
•
Averías (Período 6 – Semestre 1 Año 2006)
Avería
Arrancado - Roto - Fisurado
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Rayado - Rozado
Manchado
Cantidad
34
17
271
1681
247
1499
4
Tabla 19: Cantidad de daños y sus códigos correspondientes
Manchado
0%
Arrancado - Roto Fisurado
1%
Reventado - Estallado
0%
Pintura saltada
7%
Rayado - Rozado
40%
Faltante
7%
Abollado
45%
Gráfico 24: Porcentajes de ocurrencia de averías
Página 132 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Lugares (Período 6 – Semestre 1 Año 2006)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
631
1585
580
187
136
497
138
Tabla 20: Cantidad de averías por lugar
Subida a Buque
4%
Ingreso a Puerto
13%
Retiro Fábrica de
Origen
17%
Transferencia
ubicación y línea de
carga
4%
Retiro de Puerto
5%
Subida Buque Puerto
de Origen
42%
Bajada de Buque
15%
Gráfico 25: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 6 – Semestre 1 Año 2006)
Modelo
Modelo 1
Modelo 2
Modelo 5
Modelo 6
Modelo 8
Modelo 9
Modelo 11
Modelo 13
Modelo 16
Modelo 17
Modelo 18
Modelo 19
Modelo 20
Cantidad
4
4
533
69
285
789
2
125
8
1482
10
2
441
Tabla 21: Cantidad de averías por modelo
Página 133 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 19
0%
Modelo 20
12%
Modelo 1
0%
Modelo 2
0%
Modelo 5
14%
Modelo 6
2%
Modelo 18
0%
Modelo 8
8%
Modelo 17
40%
Modelo 9
21%
Modelo 16
0%
Modelo 13
3%
Modelo 11
0%
Gráfico 26: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo
período.
•
Averías (Período 7 – Semestre 2 Año 2006)
Avería
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Proyección
Rayado - Rozado
Manchado
Cantidad
80
5
18
140
781
353
2
1208
11
Tabla 22: Cantidad de daños y sus códigos correspondientes
Página 134 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Arrancado - Roto Fisurado
3%
Manchado
0%
Reventado - Estallado
1%
Desgarrado - Cortado
0%
Pintura saltada
5%
Abollado
30%
Rayado - Rozado
47%
Faltante
14%
Proyección
0%
Gráfico 27: Porcentajes de ocurrencia de averías
•
Lugares (Período 7 – Semestre 2 Año 2006)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
39
144
547
119
415
1069
265
Tabla 23: Cantidad de averías por lugar
Retiro Fábrica de
Origen
Subida a Buque
2%
10%
Subida Buque Puerto
de Origen
6%
Bajada de Buque
21%
Retiro de Puerto
5%
Ingreso a Puerto
40%
Transferencia
ubicación y línea de
carga
16%
Gráfico 28: Porcentajes de ocurrencia de avería en diferentes lugares
Página 135 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Modelos (Período 7 – Semestre 2 Año 2006)
Modelo
Modelo 1
Modelo 2
Modelo 5
Modelo 6
Modelo 7
Modelo 8
Modelo 9
Modelo 10
Modelo 11
Modelo 13
Modelo 15
Modelo 16
Modelo 17
Modelo 18
Modelo 20
Cantidad
21
12
565
76
2
28
170
4
2
106
32
3
260
29
1288
Tabla 24: Cantidad de averías por modelo
Modelo 1
1%
Modelo 2
0%
Modelo 5
22%
Modelo 6
3%
Modelo 7
0%
Modelo 8
1%
Modelo 9
7%
Modelo 10
0%
Modelo 11
0%
Modelo 20
50%
Modelo 13
4%
Modelo 18
1%
Modelo 17
10%
Modelo 16
0%
Modelo 15
1%
Gráfico 29: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo
período.
•
Averías (Período 8 – Semestre 1 Año 2007)
Avería
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Página 136 de287
Cantidad
62
4
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Proyección
Rayado - Rozado
Manchado
21
237
761
605
40
1278
11
Tabla 25: Cantidad de daños y sus códigos correspondientes
Arrancado - Roto Fisurado
2%
Manchado
Reventado - Estallado
1%
0%
Desgarrado - Cortado
0%
Pintura saltada
8%
Abollado
25%
Rayado - Rozado
43%
Proyección
1%
Faltante
20%
Gráfico 30: Porcentajes de ocurrencia de averías
•
Lugares (Período 8 – Semestre 1 Año 2007)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
20
517
219
156
1437
575
95
Tabla 26: Cantidad de averías por lugar
Página 137 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Retiro Fábrica de
Origen
1%
Subida a Buque
3%
Ingreso a Puerto
19%
Subida Buque Puerto
de Origen
17%
Bajada de Buque
7%
Retiro de Puerto
5%
Transferencia
ubicación y línea de
carga
48%
Gráfico 31: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 8 – Semestre 1 Año 2007)
Modelo
Modelo 1
Modelo 5
Modelo 6
Modelo 7
Modelo 8
Modelo 9
Modelo 13
Modelo 15
Modelo 16
Modelo 17
Modelo 18
Modelo 20
Cantidad
5
712
43
94
88
209
270
11
22
125
37
1403
Tabla 27: Cantidad de averías por modelo
Página 138 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 5
24%
Modelo 1
0%
Modelo 6
1%
Modelo 7
3%
Modelo 20
47%
Modelo 8
3%
Modelo 9
7%
Modelo 13
9%
Modelo 18
1%
Modelo 17
4%
Modelo 15
0%
Modelo 16
1%
Gráfico 32: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno
período.
•
Averías (Período 9 – Semestre 2 Año 2007)
Avería
Quemado
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Proyección
Rayado - Rozado
Manchado
Cantidad
2
146
10
59
609
1016
641
2
4689
14
Tabla 28: Cantidad de daños y sus códigos correspondientes
Página 139 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Quemado
0%
Arrancado - Roto Fisurado
2%
Desgarrado - Cortado
0%
Reventado - Estallado
1%
Manchado
0%
Pintura saltada
8%
Abollado
14%
Faltante
9%
Proyección
0%
Rayado - Rozado
66%
Gráfico 33: Porcentajes de ocurrencia de averías
•
Lugares (Período 9 – Semestre 2 Año 2007)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
18
635
282
60
4503
1167
523
Tabla 29: Cantidad de averías por lugar
Subida a Buque
7%
Retiro Fábrica de
Origen
0%
Ingreso a Puerto
16%
Subida Buque Puerto
de Origen
9%
Bajada de Buque
4%
Retiro de Puerto
1%
Transferencia
ubicación y línea de
carga
63%
Gráfico 34: Porcentajes de ocurrencia de avería en diferentes lugares
Página 140 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Modelos (Período 9 – Semestre 2 Año 2007)
Modelo
Modelo 2
Modelo 5
Modelo 6
Modelo 7
Modelo 8
Modelo 9
Modelo 13
Modelo 15
Modelo 16
Modelo 17
Modelo 18
Modelo 20
Cantidad
1
839
18
1747
75
156
358
100
9
30
36
3819
Tabla 30: Cantidad de averías por modelo
Modelo 5
12%
Modelo 2
0%
Modelo 6
0%
Modelo 7
24%
Modelo 20
54%
Modelo 8
1%
Modelo 18
1%
Modelo 17
0%
Modelo 9
2%
Modelo 13
5%
Modelo 15
1%
Modelo 16
0%
Gráfico 35: Porcentajes de ocurrencia de avería en modelos
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo
período.
•
Averías (Período 10 – Semestre 1 Año 2008)
Avería
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Abollado
Faltante
Proyección
Página 141 de287
Cantidad
144
5
76
334
751
1771
16
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Rayado - Rozado
Manchado
2223
187
Tabla 31: Cantidad de daños y sus códigos correspondientes
Arrancado - Roto - Desgarrado - Cortado
0%
Fisurado
3%
Reventado - Estallado
1%
Manchado
3%
Pintura saltada
6%
Abollado
14%
Faltante
32%
Rayado - Rozado
41%
Proyección
0%
Gráfico 36: Porcentajes de ocurrencia de averías
•
Lugares (Período 10 – Semestre 1 Año 2008)
Lugar
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Bajada de Buque
Retiro de Puerto
Transferencia ubicación y línea de carga
Ingreso a Puerto
Subida a Buque
Cantidad
12
454
318
124
3008
958
633
Tabla 32: Cantidad de averías por lugar
Página 142 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Retiro Fábrica de
Origen
Subida a Buque
0%
11%
Subida Buque Puerto
de Origen
8%
Bajada de Buque
6%
Ingreso a Puerto
17%
Retiro de Puerto
2%
Transferencia
ubicación y línea de
carga
56%
Gráfico 37: Porcentajes de ocurrencia de avería en diferentes lugares
•
Modelos (Período 10 – Semestre 1 Año 2008)
Modelo
Modelo 2
Modelo 5
Modelo 6
Modelo 7
Modelo 8
Modelo 9
Modelo 13
Modelo 15
Modelo 16
Modelo 17
Modelo 18
Modelo 20
Cantidad
46
433
57
1883
26
142
190
74
26
38
21
2571
Tabla 33: Cantidad de averías por modelo
Página 143 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 2
1%
Modelo 5
8%
Modelo 6
1%
Modelo 7
34%
Modelo 20
48%
Modelo 8
0%
Modelo 18
0%
Modelo 17
1%
Modelo 16
0%
Modelo 13
3%
Modelo 15
1%
Modelo 9
3%
Gráfico 38: Porcentajes de ocurrencia de avería en modelos
8.4.4.2. Modelo de Clustering
El análisis es realizado agrupando: Parte – Avería – Gravedad, Lugar – Parte – Avería, Lugar –
Parte – Avería – Gravedad, Modelo – Parte – Avería, Modelo – Parte – Avería – Gravedad.
El agrupamiento de partes, averías y gravedades permite visualizar el comportamiento de los
siniestros ocurridos separando los daños en función del formato establecido por el estándar
utilizado. El análisis es realizado por cada período en el presente proyecto.
Para el segundo caso se toman el agrupamiento considerando el lugar donde se produce una avería,
el tipo de avería y la parte del automóvil que es afectado. Al igual que para el anterior agrupamiento
este análisis se realiza para cada uno de los periodos. En el siguiente proceso al agrupamiento se
suma la gravedad del siniestro.
Luego, el análisis posterior de los datos tiene en cuenta el agrupamiento de la información
considerando el modelo averiado y la parte del auto y tipo de avería producido. Finalmente al
agrupamiento anterior y al igual que en el caso de los lugares el agrupamiento de los modelos
incluye la gravedad de cada siniestro.
Cada uno de los procesos realizados muestra al final el resultado estadístico logrado. Allí se
especifican cantidades por grupos, cantidad de grupos formados, porcentajes, etc. El proceso de
agrupamiento es realizado con matrices cuadradas de 10 x 10 en todos los casos.
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer
período.
•
Parte – Avería – Gravedad (Período 1 – Año 2003)
Overall
Parte
Tapa acceso gancho
remolque
Avería
Faltante
Gravedad
Mediano
Página 144 de287
Cantidad Fila Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 1 Puerta delantera
derecha
Cluster 2 Escape
Arrancado - Roto Fisurado
Abollado
Intolerable
99
1
1
Grave
779
1
2
Cluster 3 Alfombra
suplementarias
Cluster 4 Parabrisa
Rayado - Rozado
Grave
455
1
3
Proyección
Mediano
362
1
4
Cluster 5 Luz trasera izquierda Faltante
Mediano
626
1
5
Cluster 6 Puerta delantera
derecha
Cluster 7 Cubierta delantera
izquierda
Cluster 8 Panel lateral
izquierdo
Cluster 9 Panel lateral derecho
Faltante
Leve
1130
1
6
Rayado - Rozado
Mediano
138
1
7
Abollado
Leve
1057
1
9
Abollado
Mediano
354
1
10
Tabla 7: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 1 – Año 2003)
Overall
Lugar
Retiro de Puerto
Cluster 4
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
Cluster 5
Ingreso a Puerto
Cluster 6
Ingreso a Puerto
Cluster 7
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
Cluster 1
Cluster 2
Cluster 3
Cluster 8
Parte
Tapa acceso gancho
remolque
Manijas externas de
puertas delanteras
Avería
Faltante
Rayado –
Rozado
1
1
1
Panel trasero bajo
baúl
Rayado –
Rozado
12
1
2
Capot
Rayado –
Rozado
11
1
3
Paragolpe delantero
/ Superior
Techo corredizo
Rayado –
Rozado
Faltante
38
1
4
55
1
5
Cubierta delantera
derecha
Luz de neblina
trasera
Abollado
111
1
6
Exceso
kilometraje
299
1
7
Luz trasera
izquierda
Luz de neblina
trasera
Abollado
63
1
8
Abollado
76
1
9
4334
1
10
Transferencia
ubicación y línea de
carga
Cluster 10 Subida Buque Puerto Bolsa de
de Origen
herramientas
Cluster 9
Cantidad Fila
Faltante
Columna
Tabla 8: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 1 – Año 2003)
Lugar
Parte
Avería
Gravedad Cantidad Fila Columna
Página 145 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Retiro de
Puerto
Tapa acceso gancho
remolque
Faltante
Mediano
Cluster 1 Bajada de
Buque
Tapizado interno
puerta delantera
izquierda
Cristales de parante
delantero
Rayado Rozado
Mediano
Abollado
Cluster 3 Subida
Buque Puerto
de Origen
Cluster 4 Ingreso a
Puerto
Sistema de
navegación
Cluster 5 Subida
Buque Puerto
de Origen
Cluster 6 Transferencia
ubicación y
línea de carga
Cluster 7 Subida
Buque Puerto
de Origen
Cluster 8 Subida
Buque Puerto
de Origen
Cluster 9 Subida
Buque Puerto
de Origen
Overall
Cluster 2 Retiro de
Puerto
596
1
1
Grave
1007
1
2
Proyección
Grave
15
1
3
Moldura protectora
lateral derecha
Rayado Rozado
Leve
488
1
4
Cable de carga
Faltante
Mediano
582
1
5
Insignia
Faltante
Leve
99
1
6
Llave
Abollado
Leve
2120
1
7
Guardabarro
delantero izquierdo
Rayado Rozado
Leve
14
1
8
Guardabarro
delantero izquierdo
Rayado Rozado
Mediano
79
1
9
Tabla 9: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 1 – Año 2003)
Overall
Modelo
Modelo 12
Parte
Tapa acceso gancho remolque
Avería
Faltante
Cantidad
Cluster 1
Modelo 4
Faltante
636
1
1
Cluster 2
Modelo 10
Moldura protectora lateral
derecha
Manual
Abollado
1267
1
2
Cluster 3
Modelo 18
Cubierta delantera derecha
879
1
3
Cluster 4
Modelo 10
121
1
4
Cluster 5
Modelo 10
Giro Delantero (derecho /
izquierdo)
Panel lateral izquierdo
Rayado –
Rozado
Rayado –
Rozado
Abollado
1113
1
5
Cluster 6
Modelo 9
Cerraduras de puertas
295
1
6
Cluster 7
Modelo 17
Cubierta delantera izquierda
689
1
8
Rayado –
Rozado
Abollado
Fila
Columna
Tabla 10: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 1 – Año 2003)
Overall
Modelo
Modelo 12
Parte
Tapa acceso gancho
remolque
Avería
Faltante
Página 146 de287
Gravedad Cantidad Fila Columna
Mediano
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 1
Modelo 5
Cluster 2
Modelo 15
Cluster 3
Modelo 18
Cluster 4
Giro Delantero
(derecho / izquierdo)
Puerta trasera derecha
Faltante
Intolerable
389
1
1
Faltante
Grave
792
1
2
Faltante
Mediano
110
1
3
Modelo 16
Paragolpe trasero /
Spoiler trasero
Bolsa de herramientas
Abollado Mediano
231
1
4
Cluster 5
Modelo 17
Panel lateral derecho
290
1
5
Cluster 6
Modelo 9
168
1
6
Cluster 7
Modelo 15
8
1
7
Cluster 8
Modelo 11
Manijas externas de
puertas traseras
Apoya cabezas
delantero / izquierdo /
derecho
Luz de neblina trasera
Rayado - Mediano
Rozado
Rayado - Mediano
Rozado
Faltante Mediano
2945
1
8
Cluster 9
Modelo 13
2
1
9
Cluster 10
Modelo 14
65
1
10
Faro delantero
izquierdo / derecho
Retrovisor externo
derecho
Faltante
Leve
Abollado Mediano
Pintura
saltada
Mediano
Tabla 11: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo
período.
•
Parte – Avería – Gravedad (Período 2 – Semestre 1 Año 2004)
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
Cluster 8
Parte
Tapa acceso
gancho remolque
Cristales de
parante delantero
Guardabarro
trasero derecho
Cerraduras de
puertas
Otros
Cable de carga
Antena
Bolsa de
herramientas
Tapa de Baúl o
Puerta Trasera
Avería
Faltante
Gravedad
Mediano
Cantidad
Fila
Columna
Faltante
Intolerable
317
1
1
Faltante
Grave
756
1
2
Rayado - Rozado
Mediano
374
1
3
Abollado
Rayado - Rozado
Rayado - Rozado
Abollado
Leve
Leve
Mediano
Mediano
1864
223
520
932
1
1
1
1
4
5
7
9
Abollado
Mediano
14
1
10
Tabla 12: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 2 – Semestre 1 Año 2004)
Overall
Lugar
Retiro de Puerto
Parte
Tapa acceso
gancho remolque
Página 147 de287
Avería
Faltante
Cantidad Fila Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Llanta trasera
izquierda
Faltante
9
1
1
Puerta delantera
izquierda
Rayado Rozado
31
1
2
Techo corredizo
Rayado Rozado
17
1
3
Cluster 4
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
Techo corredizo
97
1
4
Cluster 5
Ingreso a Puerto
62
1
5
Cluster 6
Ingreso a Puerto
23
1
6
Cluster 7
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
Puerta trasera
derecha
Tapa posterior de
techo
Otros
Rayado Rozado
Rayado Rozado
Pintura
saltada
Abollado
167
1
7
Abollado
14
1
8
4580
1
10
Cluster 1
Cluster 2
Cluster 3
Cluster 8
Cluster 9
Subida Buque
Puerto de Origen
Llanta delantera
derecha
Bolsa de
herramientas
Faltante
Tabla 13: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 2 – Semestre 1 Año 2004)
Overall
Lugar
Retiro de Puerto
Cluster 1
Bajada de Buque
Cluster 2
Retiro de Puerto
Cluster 3
Bajada de Buque
Cluster 4
Ingreso a Puerto
Cluster 5
Bajada de Buque
Cluster 6
Transferencia
ubicación y línea
de carga
Bajada de Buque Llanta
delantera
derecha
Retiro de Puerto Techo
(inclusive
convertible)
Cluster 7
Cluster 8
Parte
Tapa acceso
gancho
remolque
Cristales de
parante
delantero
Guardabarro
trasero
derecho
Panel lateral
izquierdo
Tapa
posterior de
techo
Llanta
delantera
derecha
Parrilla
delantera
Avería
Faltante
Gravedad Cantidad Fila Columna
Mediano
Faltante
Intolerable
259
1
1
Faltante
Grave
627
1
2
Faltante
Leve
1961
1
3
Pintura
saltada
Mediano
82
1
4
Abollado
Leve
1642
1
5
Abollado
Leve
15
1
6
Faltante
Grave
405
1
7
9
1
10
Proyección Mediano
Tabla 14: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
Página 148 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Modelo – Parte – Avería (Período 2 – Semestre 1 Año 2004)
Overall
Modelo
Modelo 14
Parte
Tapa acceso gancho
remolque
Aerosol antipinchazos
Avería
Faltante
Cluster 1
Modelo 17
Cluster 2
Modelo 10
Cluster 3
Cantidad
Fila
Columna
Proyección
1010
1
1
Abollado
1695
1
2
Modelo 17
Guardabarro delantero
izquierdo
Puerta delantera derecha
Abollado
614
1
3
Cluster 4
Modelo 8
Panel lateral izquierdo
243
1
4
Cluster 5
Modelo 13
Manual
12
1
5
Cluster 6
Modelo 6
192
1
6
Cluster 7
Modelo 7
1
7
Modelo 17
382
1
8
Cluster 9
Modelo 12
8
1
9
Cluster 10
Modelo 17
Rayado Rozado
Rayado Rozado
Pintura
saltada
Faltante
131
Cluster 8
Limpiador y lavador de
parabrisas
Zócalo interno puerta
delantera izquierda
Cubierta delantera
izquierda
Paragolpe trasero / Spoiler
trasero
Alfombra baúl / caja de
carga
Rayado Rozado
Rayado Rozado
Abollado
713
1
10
Tabla 15: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 2 - Semestre 1 Año 2004)
Overall
Modelo
Modelo 14
Parte
Tapa acceso
gancho remolque
Guardabarro
trasero derecho
Cristales de
parante delantero
Barras de techo
Avería
Faltante
Gravedad Cantidad Fila Columna
Mediano
Cluster 1
Modelo 16
Faltante
Grave
800
1
1
Cluster 2
Modelo 8
Faltante
Grave
273
1
2
Cluster 3
Modelo 10
111
1
3
Cluster 4
Modelo 12
Rayado Rozado
Faltante
Mediano
7
1
4
2341
1
5
Faltante
Mediano
350
1
6
Pintura
saltada
Faltante
Mediano
11
1
7
Modelo 17
Alfombra
suplementarias
Puerta delantera
izquierda
Giro Delantero
(derecho /
izquierdo)
Cubierta delantera
derecha
Aleron
Cluster 5
Modelo 13
Cluster 6
Modelo 8
Cluster 7
Modelo 9
Cluster 8
Mediano
1085
1
8
Cluster 9
Modelo 17
Otros
Rayado Rozado
Mediano
22
1
10
Proyección Mediano
Leve
Tabla 16: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer
período.
Página 149 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004)
Overall
Cluster 1
Cluster 2
Cluster 3
Parte
Tapa acceso gancho
remolque
Paragolpe delantero /
Superior
Paragolpe delantero /
Protector delantero
Capot
Avería
Faltante
Gravedad Cantidad Fila Columna
Leve
Rayado - Rozado
Mediano
4
1
1
Rayado - Rozado
Mediano
4
1
3
Rayado - Rozado
Grave
23
1
4
Rayado - Rozado
Grave
58
1
5
Cluster 5
Paragolpe trasero / Zona
contacto
Aleron
Proyección
Grave
78
1
6
Cluster 6
Luz de neblina trasera
Abollado
Grave
401
1
7
Cluster 7
Tapa acceso gancho
remolque
Faltante
-
4432
1
10
Cluster 4
Tabla 17: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 3 – Semestre 2 Año 2004)
Overall
Lugar
Retiro de Puerto
Parte
Avería
Tapa acceso gancho Faltante
remolque
Cantidad Fila Columna
Cluster 1
Ingreso a Puerto
Barras de techo
Pintura
saltada
46
1
1
Cluster 2
Ingreso a Puerto
Guardabarro trasero Pintura
derecho
saltada
40
1
2
Cluster 3
Ingreso a Puerto
Luz de neblina
trasera
Abollado
147
1
3
Cluster 4
Ingreso a Puerto
Bolsa de
herramientas
Faltante
6
1
4
Cluster 5
Ingreso a Puerto
Luz de patente
trasera
Rayado Rozado
72
1
5
Cluster 6
Ingreso a Puerto
Tapa acceso gancho Faltante
remolque
10
1
6
Cluster 7
Subida a Buque
Retrovisor externo
izquierdo
Rayado Rozado
36
1
7
Cluster 8
Ingreso a Puerto
Paragolpe trasero /
Zona contacto
Rayado Rozado
299
1
8
Cluster 9
Transferencia ubicación
y línea de carga
Taza
Proyección
13
1
9
Cluster 10
Transferencia ubicación
y línea de carga
Bolsa de
herramientas
Faltante
4331
1
10
Tabla 18: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004)
Página 150 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Overall
Lugar
Retiro de Puerto
Parte
Tapa acceso
gancho
remolque
Spoiler
delantero
Avería
Faltante
Gravedad Cantidad Fila Columna
Leve
Cluster 1
Subida a Buque
Rayado Rozado
Mediano
Cluster 2
Ingreso a Puerto
Parante
delantero
Rayado Rozado
Cluster 3
3
1
1
Grave
15
1
3
Ingreso a Puerto
Alfombra
Proyección Grave
suplementarias
48
1
4
Cluster 4
Ingreso a Puerto
Luz de neblina Faltante
trasera
Grave
54
1
5
Cluster 5
Subida Buque
Giro Delantero
Puerto de Origen (derecho /
izquierdo)
Ingreso a Puerto Retrovisor
externo
derecho
Moldura
Transferencia
ubicación y línea protctora
lateral
de carga
izquierda
Subida Buque
Otros
Puerto de Origen
Grave
448
1
6
548
1
8
Cluster 6
Cluster 7
Cluster 8
Faltante
Proyección -
Pintura
saltada
-
1
1
9
Faltante
-
3883
1
10
Tabla 19: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 3 – Semestre 2 Año 2004)
Overall
Modelo
Modelo 15
Cluster 1
Modelo 17
Cluster 2
Modelo 17
Cluster 3
Modelo 9
Cluster 4
Modelo 13
Cluster 5
Modelo 17
Cluster 6
Modelo 17
Cluster 7
Modelo 18
Cluster 8
Modelo 17
Parte
Tapa acceso gancho
remolque
Llave de rueda
Avería
Faltante
Cantidad
Faltante
Cubierta delantera
Faltante
izquierda
Giro Delantero
Abollado
(derecho / izquierdo)
Puerta trasera izquierda Abollado
Guardabarro trasero
derecho
Luz de neblina trasera
Abollado
Desgarrado Cortado
Limpiador y lavador de Proyección
parabrisas
Tapa posterior de techo Faltante
Fila
Columna
556
1
1
1084
1
2
1409
1
3
89
1
4
849
1
6
15
1
7
712
1
8
286
1
9
Tabla 20: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004)
Overall
Modelo
Modelo 15
Parte
Avería
Tapa acceso
Faltante
gancho remolque
Página 151 de287
Gravedad
Leve
Cantidad
Fila
Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 1
Modelo 5
Capot
Cluster 2
Modelo 4
Cluster 3
Modelo 7
Retrovisor
externo derecho
Insignia
Cluster 4
Modelo 15
Plip
Cluster 5
Modelo 10
Cluster 6
Modelo 17
Cluster 7
Modelo 17
Faro de stop
luneta
Puerta trasera
izquierda
Manual
Cluster 8
Modelo 15
Rayado Rozado
Faltante
Grave
11
1
1
Grave
63
1
2
Rayado Rozado
Rayado Rozado
Abollado
Grave
23
1
3
Grave
12
1
4
Grave
128
1
5
Faltante
Grave
72
1
6
Faltante
Grave
259
1
7
4432
1
10
Tapa acceso
Faltante
gancho remolque
-
Tabla 21: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto
período.
•
Parte – Avería – Gravedad (Período 4 – Semestre 2 Año 2005)
Parte
Guardabarro trasero
derecho
Spoiler delantero
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Manchado
Observada
1
1
1
Manchado
Observada
4
1
2
Manchado
Observada
2
1
3
Cluster 4
Paragolpe delantero /
Protector delantero
Paragolpe delantero /
Superior
Capot
Rayado - Rozado
Observada
77
1
4
Cluster 5
Panel trasero bajo baúl
Rayado - Rozado
Observada
134
1
5
Cluster 6
Aleron
Proyección
Observada
172
1
6
Cluster 7
Panel trasero bajo baúl
Pintura saltada
Observada
16
1
7
Cluster 8
Llanta delantera izquierda
Abollado
Observada
703
1
8
Cluster 9
Zócalo izquierdo
Manchado
Observada
31
1
9
Faltante
-
2779
1
10
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 10 Zócalo derecho
Tabla 22: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 4 – Semestre 1 Año 2005)
Cluster 3
Lugar
Retiro de
Puerto
Ingreso a
Puerto
Ingreso a
Puerto
Subida a Buque
Cluster 4
Ingreso a
Overall
Cluster 1
Cluster 2
Parte
Avería
Guardabarro trasero derecho Faltante
Paragolpe trasesro / Zona
contacto
Paragolpe trasero / Spoiler
trasero
Paragolpe delantero /
Protector delantero
Capot
Página 152 de287
Rayado Rozado
Rayado Rozado
Rayado Rozado
Rayado -
Cantidad Fila
Columna
3
1
1
6
1
4
9
1
5
72
1
6
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 5
Cluster 6
Cluster 7
Cluster 8
Puerto
Subida Buque
Puerto de
Origen
Retiro de
Puerto
Retiro de
Puerto
Retiro de
Puerto
Tapa posterior de techo
Rozado
Rayado Rozado
131
1
7
Taza
Faltante
226
1
8
Llanta delantera izquierda
Faltante
311
1
9
Puerta trasera derecha
Faltante
3161
1
10
Tabla 23: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 4 – Semestre 1 Año 2005)
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
Cluster 8
Cluster 9
Lugar
Retiro de
Puerto
Subida a
Buque
Subida a
Buque
Ingreso a
Puerto
Ingreso a
Puerto
Ingreso a
Puerto
Ingreso a
Puerto
Bajada de
Buque
Subida
Buque Puerto
de Origen
Subida
Buque Puerto
de Origen
Parte
Guardabarro
trasero derecho
Zócalo interno
puerta delantera
izquierda
Paragolpe trasero
/ Spoiler trasero
Capot
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Rayado Rozado
Observada
3
1
1
Rayado Rozado
Rayado Rozado
Faltante
Observada
10
1
3
Observada
64
1
4
Observada
43
1
5
Luz de neblina
Proyección
trasera
Cubierta delantera Faltante
derecha
Zócalo derecho
Faltante
Observada
165
1
6
-
436
1
7
-
2342
1
8
Escape
Faltante
Observada
855
1
9
Luneta trasera /
Cristal puerta
trasera
Arrancado Roto Fisurado
-
1
1
10
Parabrisa
Tabla 24: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 4 – Semestre 1 Año 2005)
Overall
Modelo
Modelo 15
Parte
Guardabarro trasero
derecho
Parante delantero
Avería
Faltante
Cluster 1
Modelo 9
Cluster 2
Modelo 6
Modelo 18
Limpiador de Faros
(derecho / izquierdo)
Llanta delantera
izquierda
Panel trasero bajo baúl
Cluster 3
Modelo 8
Cluster 4
Cluster 5
Modelo 15
Capot
Reventado Estallado
Rayado - Rozado
Cantidad
Fila
Columna
42
1
1
Proyección
380
1
2
Abollado
812
1
3
1250
1
4
13
1
5
Rayado - Rozado
Página 153 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 6
Modelo 17
Cluster 7
Modelo 18
Cluster 8
Modelo 17
Cluster 9
Modelo 17
Cluster 10 Modelo 17
Paragolpe trasero /
Spoiler trasero
Escape
Arrancado - Roto Fisurado
Proyección
4
1
6
583
1
7
Guardabarro delantero
izquierdo
Separador interno de
carga
Llanta delantera
derecha
Pintura saltada
533
1
8
Proyección
237
1
9
65
1
10
Pintura saltada
Tabla 25: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 4 – Semestre 1 Año 2005)
Cluster 5 Modelo 9
Parte
Avería
Guardabarro trasero Faltante
derecho
Batería
Rayado Rozado
Luz de patente
Proyección
trasera
Tapa acceso gancho Abollado
remolque
Alfombra
Faltante
suplementarias
Zócalo derecho
Manchado
Cluster 6 Modelo 12
Parante delantero
Faltante
Observada
Cluster 7 Modelo 15
Zócalo derecho
Faltante
-
Overall
Modelo
Modelo 15
Cluster 1 Modelo 16
Cluster 2 Modelo 18
Cluster 3 Modelo 8
Cluster 4 Modelo 18
Gravedad Cantidad Fila Columna
Observada
22
1
1
Observada
146
1
2
Observada
382
1
3
Observada
518
1
4
Observada
67
1
6
5
1
8
2779
1
10
Tabla 26: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto
período.
•
Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005)
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Cluster 1
Parte
Guardabarro delantero
derecho
Capot
Abollado
Observada
14
1
1
Cluster 2
Barras de techo
Pintura saltada
Observada
38
1
3
Cluster 3
Barras de techo
Rayado - Rozado
Observada
108
1
4
Cluster 4
Retrovisor externo
izquierdo
Tapa tanque
combustible
Bolsa de herramientas
Pintura saltada
Observada
146
1
6
Rayado - Rozado
Observada
30
1
7
Rayado - Rozado
Observada
81
1
8
Guardabarro delantero
derecho
Faltante
-
3464
1
10
Overall
Cluster 5
Cluster 6
Cluster 7
Página 154 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Tabla 27: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 5 – Semestre 2 Año 2005)
Lugar
Overall Retiro de Puerto
Parte
Guardabarro delantero
derecho
Cluster Subida Buque Puerto Paragolpe delantero /
de Origen
Superior
1
Cluster Subida Buque Puerto Paragolpe delantero /
de Origen
Protector delantero
2
Paragolpe delantero /
Cluster Bajada de Buque
Protector delantero
3
Paragolpe delantero /
Cluster Bajada de Buque
Superior
4
Paragolpe trasero / Spoiler
Cluster Retiro Fábrica de
Origen
trasero
5
Antena
Cluster Bajada de Buque
6
Cristales de parante
Cluster Retiro de Puerto
delantero
7
Avería
Faltante
Cantidad Fila Columna
Rayado Rozado
Rayado Rozado
Rayado Rozado
Rayado Rozado
Rayado Rozado
Proyección
Faltante
13
1
1
29
1
5
63
1
6
44
1
7
993
1
8
177
1
9
2562
1
10
Tabla 28: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005)
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
Cluster 8
Lugar
Retiro de
Puerto
Ingreso a
Puerto
Ingreso a
Puerto
Ingreso a
Puerto
Subida a
Buque
Ingreso a
Puerto
Subida Buque
Puerto de
Origen
Bajada de
Buque
Ingreso a
Puerto
Parte
Guardabarro
delantero derecho
Techo (inclusive
convertible)
Otros
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Pintura
saltada
Abollado
-
67
1
1
-
177
1
2
Techo (inclusive
convertible)
Bolsa de
herramientas
Llanta delantera
izquierda
Guardabarro
delantero derecho
Rayado Rozado
Proyección -
142
1
3
12
1
4
Proyección -
111
1
5
Faltante
-
2955
1
6
Zócalo derecho
Faltante
Observada
168
1
7
Llanta delantera
derecha
Proyección Observada
249
1
8
Tabla 29: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 5 – Semestre 2 Año 2005)
Overall
Modelo
Modelo 13
Cluster 1
Modelo 18
Parte
Guardabarro delantero
derecho
Guardabarros y parante
Avería
Faltante
Cantidad
Rayado –
269
Página 155 de287
Fila
Columna
1
1
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 2
Cluster 3
Modelo 17
Modelo 7
Cluster 4
Modelo 17
Cluster 5
Modelo 13
Cluster 6
Modelo 6
Cluster 7
Modelo 9
trasero izquierdo
Faro de stop luneta
Tapa acceso gancho
remolque
Tapa de Baúl o Puerta
Trasera
Techo (inclusive
convertible)
Paragolpe trasero / Zona
contacto
Paragolpe delantero /
Superior
Rozado
Abollado
Abollado
669
1290
1
1
2
3
Rayado Rozado
Abollado
1307
1
5
24
1
6
Rayado Rozado
Rayado Rozado
263
1
8
59
1
10
Tabla 30: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005)
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Rayado Rozado
Rayado Rozado
Abollado
Observada
7
1
1
Observada
53
1
2
Cluster 3
Modelo
Parte
Modelo 13 Guardabarro delantero
derecho
Modelo 20 Paragolpe delantero /
Protector delantero
Modelo 19 Tapizado interno puerta
delantera izquierda
Modelo 18 Llave
Observada
123
1
3
Cluster 4
Modelo 9
Parrilla delantera
Proyección Observada
6
1
4
Cluster 5
Modelo 6
Taza
Proyección Observada
Cluster 6
Modelo 13 Techo (inclusive
convertible)
Modelo 8 Guardabarro delantero
izquierdo
Modelo 13 Guardabarro delantero
derecho
Overall
Cluster 1
Cluster 2
Cluster 7
Cluster 8
167
1
5
Abollado
Observada
11
1
7
Abollado
Observada
50
1
8
Faltante
-
3464
1
10
Tabla 31: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto
período.
•
Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006)
Cluster 3
Retiro de Puerto
Transferencia ubicación y
línea de carga
Transferencia ubicación y
línea de carga
Ingreso a Puerto
Cluster 4
Ingreso a Puerto
Cluster 5
Cluster 6
Ingreso a Puerto
Transferencia ubicación y
línea de carga
Subida Buque Puerto de
Origen
Overall
Cluster 1
Cluster 2
Cluster 7
Zócalo derecho
Spoiler delantero
Faltante
Rayado Rozado
Paragolpe delantero /
Rayado Protector delantero
Rozado
Paragolpe delantero /
Rayado Protector delantero
Rozado
Zócalo interno puerta
Rayado delantera izquierda
Rozado
Tapa acceso gancho remolque Faltante
Llave
Abollado
Guardabarro trasero derecho
Página 156 de287
Faltante
42
1
2
27
1
5
74
1
6
114
1
7
470
53
1
1
8
9
2983
1
10
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Tabla 32: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 6 – Semestre 1 Año 2006)
Lugar
Retiro de Puerto
Parte
Zócalo derecho
Avería
Faltante
Cantidad Fila Columna
Spoiler delantero
Rayado Rozado
42
1
2
Paragolpe delantero /
Protector delantero
Rayado Rozado
27
1
5
Cluster 3
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
1
6
Ingreso a Puerto
114
1
7
Cluster 5
Ingreso a Puerto
Rayado Rozado
Rayado Rozado
Faltante
74
Cluster 4
470
1
8
Cluster 6
Paragolpe delantero /
Protector delantero
Zócalo interno puerta
delantera izquierda
Tapa acceso gancho
remolque
Llave
Transferencia
ubicación y línea de
carga
Subida Buque Puerto Guardabarro trasero
de Origen
derecho
Abollado
53
1
9
Faltante
2983
1
10
Overall
Cluster 1
Cluster 2
Cluster 7
Tabla 33: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006)
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
Cluster 8
Lugar
Parte
Retiro de Puerto Zócalo derecho
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Bajada de
Spoiler delantero
Buque
Retiro de Puerto Paragolpe delantero
/ Protector delantero
Bajada de
Spoiler delantero
Buque
Ingreso a Puerto Tapa posterior de
techo
Bajada de
Moldura protectora
Buque
lateral derecha
Transferencia
Puerta trasera
ubicación y
izquierda
línea de carga
Bajada de
Tapa acceso gancho
Buque
remolque
Bajada de
Zócalo derecho
Buque
Rayado Rozado
Rayado Rozado
Rayado Rozado
Rayado Rozado
Faltante
Observada
7
1
1
Observada
1
1
4
Observada
9
1
5
Observada
35
1
6
Observada
103
1
7
Abollado Observada
33
1
8
Abollado Observada
274
1
9
3301
1
10
Faltante
-
Tabla 34: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 6 – Semestre 1 Año 2006)
Modelo
Parte
Avería
Página 157 de287
Cantidad
Fila
Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Overall
Cluster 1
Modelo 13
Modelo 20
Cluster 2
Modelo 17
Zócalo derecho
Paragolpe delantero /
Protector delantero
Panel trasero bajo baúl
Cluster 3
Cluster 4
Modelo 7
Modelo 17
Escape
Otros
Cluster 5
Modelo 18
Cluster 6
Modelo 16
Cluster 7
Modelo 13
Giro Delantero (derecho /
izquierdo)
Guardabarros y parante
trasero izquierdo
Barras de techo
Faltante
Rayado Rozado
Rayado Rozado
Faltante
Rayado Rozado
Abollado
124
1
1
901
1
2
1695
110
1
1
3
6
577
1
7
Abollado
318
1
8
Abollado
38
1
9
Tabla 35: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006)
Overall
Modelo
Modelo 13
Parte
Zócalo derecho
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Cluster 1
Modelo 20
Cluster 2
Modelo 20
Paragolpe delantero /
Superior
Spoiler delantero
Cluster 3
Modelo 19
Rayado Observada
Rozado
Rayado Observada
Rozado
Proyección Observada
Cluster 4
Modelo 19
Cluster 5
Modelo 7
Bolsa de herramientas Faltante
Observada
260
1
5
Cluster 6
Modelo 11
Observada
5
1
6
Cluster 7
Modelo 16
Manijas externas de
puertas delanteras
Parrilla delantera
Observada
74
1
8
Cluster 8
Modelo 13
Zócalo derecho
3301
1
10
Paragolpe trasero /
Spoiler trasero
Bolsa de herramientas Proyección Observada
Pintura
saltada
Pintura
saltada
Faltante
-
1
1
1
20
1
2
45
1
3
57
1
4
Tabla 36: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo
período.
•
Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006)
Parte
Avería
Guardabarro delantero Faltante
derecho
Cluster 1 Llanta trasera derecha Pintura saltada
Gravedad Cantidad
Observada
1
1
1
Cluster 2 Cubierta trasera
derecha
Cluster 3 Bajo chasis delantero
Reventado - Estallado
Observada
1
1
2
Observada
2
1
3
Observada
15
1
4
Cluster 5 Luz de neblina trasera
Arrancado - Roto Fisurado
Arrancado - Roto Fisurado
Abollado
Observada
94
1
5
Cluster 6 Faro de stop luneta
Rayado - Rozado
Observada
94
1
6
Overall
Cluster 4 Bolsa de herramientas
Página 158 de287
Fila
Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Proyección
Cluster 7 Tapa posterior de
techo
Abollado
Cluster 8 Alfombra
suplementarias
Cluster 9 Guardabarro delantero Faltante
derecho
Observada
128
1
7
Observada
22
1
8
2271
1
10
-
Tabla 37: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 7 – Semestre 2 Año 2006)
Cluster 1
Lugar
Transferencia
ubicación y línea de
carga
Retiro de Puerto
Cluster 2
Bajada de Buque
Cluster 3
Bajada de Buque
Cluster 4
Ingreso a Puerto
Cluster 5
Bajada de Buque
Cluster 6
Cluster 7
Overall
Parte
Guardabarro delantero
derecho
Avería
Faltante
Paragolpe delantero /
Protector delantero
Paragolpe delantero /
Protector delantero
Manijas externas de
puertas traseras
Parabrisa
Rayado Rozado
Rayado Rozado
Proyección
Cantidad Fila Columna
11
1
1
41
1
2
326
1
3
Proyección
865
1
4
Abollado
473
1
5
Ingreso a Puerto
Guardabarro delantero
izquierdo
Faro de stop luneta
Abollado
483
1
7
Ingreso a Puerto
Llave
Rayado Rozado
429
1
8
Tabla 38: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006)
Overall
Cluster 1
Cluster 2
Lugar
Transferencia
ubicación y
línea de carga
Bajada de
Buque
Bajada de
Buque
Cluster 3
Retiro de
Puerto
Cluster 4
Bajada de
Buque
Bajada de
Buque
Bajada de
Buque
Ingreso a
Puerto
Cluster 5
Cluster 6
Cluster 7
Parte
Avería
Guardabarro
Faltante
delantero derecho
Gravedad Cantidad Fila Columna
-
Spoiler delantero
Rayado Rozado
Rayado Rozado
Observada
1
1
1
Observada
3
1
3
Rayado Rozado
Observada
1
1
4
Rayado Observada
Rozado
Proyección Observada
14
1
5
21
1
6
Abollado
Observada
67
1
7
Observada
250
1
8
Paragolpe
delantero /
Protector
delantero
Paragolpe
delantero /
Protector
delantero
Panel trasero bajo
baúl
Alfombra
suplementarias
Parrilla delantera
Guardabarro
Faltante
delantero derecho
Página 159 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 8
Transferencia
ubicación y
línea de carga
Guardabarro
Faltante
delantero derecho
-
2271
1
10
Tabla 39: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 7 – Semestre 2 Año 2006)
Overall
Modelo
Modelo 15
Parte
Guardabarro
delantero derecho
Parrilla delantera
Avería
Faltante
Cluster 1
Modelo 20
Cluster 2
Modelo 19
Cluster 3
Modelo 6
Cluster 4
Modelo 11
Retrovisor externo
izquierdo
Puerta delantera
derecha
Barras de techo
Proyección
Cluster 5
Modelo 20
Barras de techo
Proyección
Cluster 6
Modelo 13
Cluster 7
Modelo 18
Cluster 8
Modelo 13
Tapa acceso gancho
remolque
Retrovisor externo
derecho
Llanta delantera
derecha
Rayado Rozado
Reventado Estallado
Abollado
Cantidad
Fila
Columna
Rayado Rozado
Abollado
252
1
1
553
1
2
Faltante
868
1
3
91
1
4
714
1
5
4
1
6
114
1
7
32
1
10
Tabla 40: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006)
Overall
Modelo
Modelo 15
Avería
Faltante
Modelo 5
Parte
Guardabarro
delantero derecho
Otros
Cluster 1
Cluster 2
Modelo 5
Zócalo izquierdo
Cluster 3
Modelo 7
Zócalo izquierdo
Rayado Rozado
Abollado
Cluster 4
Modelo 6
Cluster 5
Modelo 8
Cluster 6
Modelo 19
Cluster 7
Modelo 13
Cluster 8
Modelo 15
Manijas externas de
puertas traseras
Retrovisor externo
derecho
Retrovisor externo
derecho
Giro Delantero
(derecho / izquierdo)
Guardabarro
delantero derecho
Gravedad Cantidad Fila Columna
-
Manchado Observada
2
1
1
Observada
22
1
3
Observada
42
1
4
Proyección Observada
42
1
5
Pintura
saltada
Faltante
Observada
20
1
6
Observada
224
1
7
Abollado
Observada
5
1
8
Faltante
-
2271
1
10
Tabla 41: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo
período.
•
Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007)
Página 160 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Overall
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Cluster
7
Parte
Zócalo derecho
Spoiler delantero
Avería
Faltante
Rayado Rozado
Rayado Rozado
Rayado Rozado
Abollado
Paragolpe delantero / Protector
delantero
Paragolpe trasero / Spoiler
trasero
Tapa posterior de techo
Manual
Luz de neblina trasera
Pintura
saltada
Faltante
Zócalo derecho
Faltante
Gravedad Cantidad
Observada
2
Observada
64
Observada
68
Observada
76
Observada
5
Observada
437
2377
Fila
Columna
1
1
1
4
1
5
1
6
1
7
1
8
1
10
Tabla 42: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 8 – Semestre 1 Año 2007)
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Lugar
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
Transferencia
ubicación y línea de
carga
Bajada de Buque
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Parte
Zócalo derecho
Avería
Faltante
Cantidad Fila Columna
Puerta trasera
izquierda
Guardabarro trasero
derecho
Proyección
599
1
1
Pintura
saltada
288
1
2
Moldura protectora
lateral derecha
Techo (inclusive
convertible)
Faltante
910
1
3
Rayado Rozado
510
1
4
Manual
Faltante
722
1
5
Tabla 43: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007)
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Lugar
Transferencia
ubicación y
línea de carga
Ingreso a
Puerto
Transferencia
ubicación y
línea de carga
Ingreso a
Puerto
Transferencia
Parte
Zócalo derecho
Avería
Faltante
Paragolpe delantero / Pintura
Protector delantero
saltada
Faldillas para barro Pintura
saltada
Gravedad Cantidad Fila Columna
-
Observada
2
1
1
Observada
6
1
3
Zócalo izquierdo
Abollado Observada
57
1
4
Puerta trasera
Rayado - Observada
68
1
5
Página 161 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 5
Cluster 6
Cluster 7
Cluster 8
ubicación y
línea de carga
Transferencia
ubicación y
línea de carga
Bajada de
Buque
Subida Buque
Puerto de
Origen
Transferencia
ubicación y
línea de carga
izquierda
Rozado
Tapizado interno
puerta delantera
izquierda
Capot
Rayado - Observada
Rozado
160
1
6
Rayado - Observada
Rozado
Panel lateral derecho Abollado Observada
10
1
7
349
1
8
2377
1
10
Zócalo derecho
Faltante
-
Tabla 44: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 8 – Semestre 1 Año 2007)
Overall
Cluster 1
Modelo
Modelo 14
Modelo 5
Parte
Zócalo derecho
Capot
Cluster 2
Modelo 5
Cluster 3
Cluster 4
Modelo 7
Modelo 13
Cluster 5
Cluster 6
Modelo 19
Modelo 13
Cluster 7
Modelo 13
Cluster 8
Modelo 20
Manijas externas de
puertas traseras
Parrilla delantera
Retrovisor externo
izquierdo
Zócalo izquierdo
Guardabarro delantero
izquierdo
Tapa de Baúl o Puerta
Trasera
Limpiador y lavador de
parabrisas
Techo corredizo
Puerta delantera derecha
Cluster 9 Modelo 14
Cluster 10 Modelo 13
Avería
Faltante
Rayado Rozado
Proyección
Cantidad
Fila
Columna
105
1
1
316
1
2
Faltante
Rayado Rozado
Abollado
Abollado
730
1
1
1
3
4
455
206
1
1
5
6
Abollado
15
1
7
1110
1
8
90
1
1
1
9
10
Proyección
Faltante
Rayado Rozado
Tabla 45: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007)
Overall
Modelo
Modelo 14
Cluster 1 Modelo 20
Cluster 2 Modelo 20
Cluster 3 Modelo 20
Cluster 4 Modelo 17
Cluster 5 Modelo 20
Cluster 6 Modelo 11
Parte
Zócalo derecho
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Paragolpe delantero /
Superior
Paragolpe delantero /
Protector delantero
Tapa de Baúl o Puerta
Trasera
Manijas externas de
puertas traseras
Cubierta delantera
izquierda
Panel lateral derecho
Rayado Rozado
Rayado Rozado
Rayado Rozado
Proyección
Observada
1
1
1
Observada
20
1
2
Observada
45
1
3
Observada
57
1
4
Observada
260
1
5
Observada
5
1
6
Rayado Rozado
Faltante
Página 162 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 7 Modelo 14
Zócalo derecho
Faltante
-
74
1
8
Tabla 46: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno
período.
•
Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)
Parte
Avería
Proyección
Gravedad Cantidad
-
Cluster 1 Conjunto carrocería
Manchado
Observada
Cluster 2 Llanta trasera izquierda
Observada
Cluster 4 Guardabarros y parante trasero
izquierdo
Cluster 5 Panel lateral derecho
Rayado Rozado
Rayado Rozado
Rayado Rozado
Faltante
Observada
Cluster 6 Techo corredizo
Proyección
Observada
Cluster 7 Limpiador y lavador de
parabrisas
Proyección
-
Overall
Taza
Cluster 3 Cubierta trasera derecha
Fila
Columna
2
1
1
67
1
5
76
1
6
176
1
7
438
1
8
275
1
9
3966
1
10
Observada
Observada
Tabla 47: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 9 – Semestre 2 Año 2007)
Cluster 1
Lugar
Parte
Transferencia
Taza
ubicación y línea de
carga
Retiro de Puerto
Capot
Cluster 2
Bajada de Buque
Spoiler delantero
Cluster 3
Bajada de Buque
Capot
Cluster 4
Bajada de Buque
Cluster 5
Cluster 6
Bajada de Buque
Bajada de Buque
Cluster 7
Zócalo interno puerta
delantera izquierda
Barras de techo
Tapa acceso gancho
remolque
Llanta trasera izquierda Abollado
Transferencia
ubicación y línea de
carga
Ingreso a Puerto
Manijas externas de
puertas delanteras
Transferencia
Faro de stop luneta
ubicación y línea de
carga
Overall
Cluster 8
Cluster 9
Avería
Cantidad Fila Columna
Proyección
Rayado Rozado
Rayado Rozado
Rayado Rozado
Rayado Rozado
Abollado
Abollado
1
1
1
3
1
3
27
1
4
30
1
5
147
520
1
1
6
7
21
1
8
Proyección
3082
1
9
Rayado Rozado
1169
1
10
Tabla 48: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)
Página 163 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Overall
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
Cluster 8
Cluster 9
Lugar
Transferencia
ubicación y
línea de carga
Bajada de
Buque
Transferencia
ubicación y
línea de carga
Ingreso a
Puerto
Transferencia
ubicación y
línea de carga
Ingreso a
Puerto
Transferencia
ubicación y
línea de carga
Subida Buque
Puerto de
Origen
Subida Buque
Puerto de
Origen
Transferencia
ubicación y
línea de carga
Parte
Avería
Gravedad Cantidad Fila Columna
Proyección -
Taza
Zócalo izquierdo
Observada
11
1
1
Observada
72
1
2
Tapizado interno
puerta delantera
izquierda
Tapa tanque
combustible
Proyección Observada
239
1
3
Rayado Rozado
Observada
233
1
4
Escape
Rayado Rozado
Rayado Rozado
Observada
51
1
5
Observada
100
1
6
Abollado
Observada
62
1
7
Limpiador y lavador Abollado
de parabrisas
Observada
266
1
8
3966
1
10
Llanta trasera
izquierda
Zócalo derecho
Puerta delantera
izquierda
Rayado Rozado
Rayado Rozado
Limpiador y lavador Proyección de parabrisas
Tabla 49: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 9 – Semestre 2 Año 2007)
Modelo
Modelo
14
Cluster 1 Modelo 7
Overall
Cluster 2 Modelo 6
Cluster 3 Modelo 7
Cluster 4 Modelo
14
Cluster 5 Modelo
20
Cluster 6 Modelo 9
Cluster 7 Modelo
13
Cluster 8 Modelo
13
Cluster 8 Modelo
13
Parte
Avería
Proyección
Taza
Cable de carga
Tapizado interno puerta
delantera izquierda
Guardabarro trasero derecho
Luz de neblina trasera
Rayado Rozado
Rayado Rozado
Pintura
saltada
Abollado
Cantidad
Fila
Columna
356
1
1
782
1
2
704
1
3
112
1
4
Limpiador y lavador de
parabrisas
Techo corredizo
Faro de stop luneta
Proyección
2716
1
5
Proyección
Faltante
15
27
1
1
6
7
Guardabarro trasero derecho
Abollado
144
1
10
Techo (inclusive convertible)
Abollado
144
1
10
Tabla 50: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
Página 164 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Modelo – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)
Overall
Cluster 1
Modelo
Modelo 14
Modelo 20
Cluster 2
Modelo 20
Cluster 3
Modelo 8
Cluster 4
Modelo 16
Cluster 5
Modelo 15
Cluster 6
Modelo 7
Cluster 7
Modelo 20
Parte
Taza
Llanta trasera
izquierda
Alfombra baúl /
caja de carga
Alfombra
suplementarias
Llanta delantera
derecha
Techo (inclusive
convertible)
Llanta delantera
derecha
Transponder
Avería
Proyección
Rayado Rozado
Rayado Rozado
Proyección
Faltante
Proyección
Faltante
Proyección
Gravedad Cantidad Fila Columna
Observada
65
1
1
Observada
165
1
3
Observada
450
1
4
Observada
354
1
5
22
1
7
1598
1
8
2346
1
9
Tabla 51: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo
período.
•
Parte – Avería – Gravedad (Período 10 – Semestre 1 Año 2008)
Overall
Parte
Zócalo derecho
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Cluster 1
Spoiler delantero
Rayado - Rozado
Observada
5
1
1
Cluster 2
Paragolpe delantero /
Protector delantero
Paragolpe delantero /
Superior
Paragolpe trasero /
Spoiler trasero
Moldura protctora lateral
izquierda
Retrovisor externo
derecho
Rayado - Rozado
Observada
75
1
5
Rayado - Rozado
Observada
15
1
6
Proyección
Observada
145
1
7
Rayado - Rozado
Observada
828
1
8
Faltante
-
3932
1
10
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Tabla 52: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad
•
Lugar – Parte – Avería (Período 10 – Semestre 1 Año 2008)
Overall
Cluster 1
Cluster 2
Lugar
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Parte
Zócalo derecho
Avería
Faltante
Paragolpe delantero /
Protector delantero
Rayado Rozado
176
1
1
Tapa posterior de techo
Rayado Rozado
717
1
2
Página 165 de287
Cantidad Fila Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 3
Bajada de Buque
Panel lateral derecho
Faltante
834
1
3
Cluster 4
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Transferencia
ubicación y línea de
carga
Manijas externas de
puertas traseras
Reventado Estallado
204
1
4
3031
1
5
38
1
6
Cluster 5
Cluster 6
Giro Delantero (derecho Faltante
/ izquierdo)
Llanta trasera izquierda
Rayado Rozado
Tabla 53: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería
•
Lugar – Parte – Avería – Gravedad (Período 10 – Semestre 1 Año 2008)
Lugar
Overall Transferencia
ubicación y línea
de carga
Cluster Transferencia
ubicación y línea
1
de carga
Cluster Subida a Buque
2
Cluster Subida a Buque
3
Cluster Ingreso a Puerto
4
Cluster Ingreso a Puerto
5
Cluster Bajada de Buque
6
Cluster Transferencia
ubicación y línea
7
de carga
Cluster Ingreso a Puerto
8
Cluster Transferencia
ubicación y línea
9
de carga
Parte
Zócalo derecho
Avería
Faltante
Gravedad Cantidad Fila Columna
-
Paragolpe
delantero /
Protector delantero
Paragolpe
delantero /
Protector delantero
Bolsa de
herramientas
Arrancado Roto Fisurado
Arrancado Roto Fisurado
Arrancado Roto Fisurado
Pintura
saltada
Observada
1
1
1
Observada
3
1
3
Observada
12
1
4
Observada
44
1
5
Rayado Rozado
Abollado
Observada
255
1
6
Observada
116
1
7
Rayado Rozado
Observada
402
1
8
Manchado
Observada
235
1
9
3932
1
10
Giro Delantero
(derecho /
izquierdo)
Paragolpe trasero /
Spoiler trasero
Moldura
protectora lateral
derecha
Llanta delantera
izquierda
Encendedor
Retrovisor externo Faltante
derecho
-
Tabla 54: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad
•
Modelo – Parte – Avería (Período 10 – Semestre 1 Año 2008)
Modelo
Parte
Overall Modelo 13 Zócalo derecho
Cluster 1 Modelo 20 Paragolpe delantero /
Protector delantero
Cluster 2 Modelo 20 Manijas externas de
puertas delanteras
Cluster 3 Modelo 15 Cable de carga
Avería
Faltante
Rayado Rozado
Proyección
181
1
1
290
1
2
Proyección
5
1
3
Página 166 de287
Cantidad
Fila
Columna
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Cluster 4 Modelo 13 Techo corredizo
Cluster 5 Modelo 8 Capot
Cluster 6 Modelo 10 Cristales de parante
delantero
Cluster 7 Modelo 19 Puerta trasera derecha
Cluster 8 Modelo 13 Faro de stop luneta
Cluster 9 Modelo 7
Panel lateral derecho
Pintura saltada
Faltante
Reventado Estallado
Faltante
Rayado Rozado
Proyección
186
35
60
1
1
1
4
5
6
2040
4
1
1
7
9
2199
1
10
Tabla 55: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería
•
Modelo – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)
Overall
Cluster 1
Modelo
Modelo 13
Modelo 20
Cluster 2
Cluster 3
Modelo 20
Modelo 20
Cluster 4
Modelo 6
Cluster 5
Cluster 6
Modelo 7
Modelo 7
Cluster 7
Modelo 16
Cluster 8
Modelo 14
Parte
Zócalo derecho
Llanta trasera
izquierda
Conjunto carrocería
Guardabarro
delantero izquierdo
Luz de patente trasera
Conjunto carrocería
Giro Delantero
(derecho / izquierdo)
Limpiador y lavador
de parabrisas
Retrovisor externo
derecho
Avería
Faltante
Rayado Rozado
Manchado
Rayado Rozado
Rayado Rozado
Manchado
Rayado Rozado
Faltante
Gravedad Cantidad Fila Columna
Observada
11
1
1
Faltante
-
Observada
Observada
18
102
1
1
2
3
Observada
12
1
4
Observada
Observada
163
560
1
1
5
6
Observada
202
1
7
3932
1
10
Tabla 56: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad
8.4.4.3. Modelo de Predicción
Al igual que con el análisis del modelo anterior este se realiza sobre diferentes variables de ingreso:
Parte – Avería – Gravedad con predicción de la Parte, Parte – Avería – Gravedad con predicción de
la Avería, Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar, y
finalmente Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo.
El primer análisis permite ver o predecir la ocurrencia que una avería sea producida en una
determinada parte.
Del análisis del segundo grupo se obtiene información sobre la ocurrencia de una determinada
avería teniendo en cuenta la parte de un auto y la gravedad del daño.
El siguiente proceso permite ver la ocurrencia de una avería en un determinado lugar.
Para finalizar esta etapa se toma como referencia de predicción el modelo de auto que es averiado.
La herramienta nos permite ver por cada análisis y procesamiento de datos la respectiva curva de
entrenamiento para cada modelo y la correspondiente curva de validación de datos de cada modelo.
Página 167 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 1 – Año 2003)
Variable Tipo de Avería
Parte predictiva: Puerta delantera Derecha
Tipo de Avería: Exceso kilometraje
Gravedad: Mediano
Partes predictivas:
Puerta delantera Derecha
Puerta trasera Derecha
Panel lateral derecho
Moldura protector lateral derecha
Giro Delantero (D/I)
Cristales de parante delantero.
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Otros
Variable Gravedad
Parte predictiva: Tapa acceso gancho remolque
Tipo Avería: Faltante
Gravedad: Leve
Partes predictivas:
Moldura protector lateral derecha
Giro Delantero (D/I)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
•
Parte – Avería – Gravedad con predicción de la Avería (Período 1 – Año 2003)
Variable Parte
Avería predictiva: Faltante
Parte: Rueda de Auxilio
Gravedad: Mediano
Averías predictivas:
Abollado
Faltante
Proyección
Variable Gravedad
Avería predictiva: Techo corredizo
Parte: Exceso kilometraje
Gravedad: Leve
Averías predictivas:
Abollado
Faltante
Página 168 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 1 – Año 2003)
Variable Parte
Lugar predictivo: Retiro de Puerto
Parte: Rueda de Auxilio
Tipo de avería: Faltante
Gravedad: Mediano
Variable Tipo de Avería
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Tapa acceso gancho remolque
Tipo Avería: Exceso kilometraje
Gravedad: Mediano
Variable Gravedad
Lugar predictivo: Retiro de Puerto
Parte: Tapa acceso gancho remolque
Tipo Avería: Faltante
Gravedad: Leve
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 1 – Año 2003)
Variable Parte
Modelo predictivo: Modelo 9
Parte: Rueda de Auxilio
Tipo de avería: Faltante
Gravedad: Mediano
Modelos predictivos:
Modelo 8
Modelo 9
Modelo 10
Modelo 11
Modelo 12
Variable Avería
Modelo predictivo: Modelo 11
Parte: Tapa acceso gancho remolque
Tipo de avería: Exceso kilometraje
Gravedad: Mediano
Modelos predictivos:
Modelo 8
Modelo 9
Modelo 10
Modelo 11
Modelo 12
Variable Gravedad
Modelo predictivo: Modelo 10
Página 169 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Parte: Tapa acceso gancho remolque
Tipo de avería: Faltante
Gravedad: Leve
Modelos predictivos:
Modelo 9
Modelo 10
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 2 – Semestre 1 Año
2004)
Variable Tipo de Avería
Parte predictiva: Escape
Tipo de Avería: Abollado
Gravedad: Mediano
Partes predictivas:
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Otros
Llave
Parrilla delantera
Luz de neblina trasera
Faro de stop luneta
Retrovisor externo izquierdo
Guardabarro delantero izquierdo
Variable Gravedad
Parte predictiva: Llave
Tipo Avería: Abollado
Gravedad: Mediano
Partes predictivas:
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Otros
Llave
•
Parte – Avería – Gravedad con predicción de la Avería (Período 1 – Semestre 1 Año
2004)
Variable Parte
Avería predictiva: Abollado
Parte: Llave
Gravedad: Mediano
Página 170 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Averías predictivas:
Abollado
Variable Gravedad
Avería predictiva: Abollado
Parte: Llave
Gravedad: Mediano
Averías predictivas:
Abollado
Faltante
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 2 – Semestre 1 Año 2004)
Variable Parte
Lugar predictivo: Bajada de Buque
Parte: Llave
Tipo de avería: Abollado
Gravedad: Mediano
Variable Tipo de Avería
Lugar predictivo: Retiro de Puerto
Parte: Llave
Tipo Avería: Abollado
Gravedad: Mediano
Variable Gravedad
Lugar predictivo: Bajada de buque
Parte: Llave
Tipo Avería: Abollado
Gravedad: Mediano
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 2 – Semestre 1 Año 2004)
Variable Parte
Modelo predictivo: Modelo 11
Parte: Llave
Tipo de avería: Abollado
Gravedad: Mediano
Modelos predictivos:
Modelo 11
Variable Avería
Modelo predictivo: Modelo 11
Parte: Llave
Tipo de avería: Abollado
Gravedad: Mediano
Modelos predictivos:
Modelo 11
Página 171 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Variable Gravedad
Modelo predictivo: Modelo 11
Parte: Llave
Tipo de avería: Abollado
Gravedad: Mediano
Modelos predictivos:
Modelo 11
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 3 – Semestre 2 Año
2004)
Variable Tipo de Avería
Parte predictiva: Llanta delantera derecha
Tipo de Avería: Faltante
Gravedad: Observada
Partes predictivas:
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Variable Gravedad
Parte predictiva: Puerta trasera derecha
Tipo Avería: Faltante
Gravedad: Observada
Partes predictivas:
Puerta delantera derecha
•
Parte – Avería – Gravedad con predicción de la Avería (Período 3 – Semestre 2 Año
2004)
Variable Parte
Avería predictiva: Abollado
Parte: Giro Delantero (D/I)
Gravedad: Observada
Averías predictivas:
Abollado
Página 172 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Faltante
Variable Gravedad
Avería predictiva: Abollado
Parte: Giro Delantero (D/I)
Gravedad: Observada
Averías predictivas:
Abollado
Faltante
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 3 – Semestre 2 Año 2004)
Variable Parte
Lugar predictivo: Bajada de Buque
Parte: Giro Delantero (D/I)
Tipo de avería: Faltante
Gravedad: Observada
Variable Tipo de Avería
Lugar predictivo: Retiro de Puerto
Parte: Giro Delantero (D/I)
Tipo Avería: Faltante
Gravedad: Observada
Variable Gravedad
Lugar predictivo: Retiro de Puerto
Parte: Giro Delantero (D/I)
Tipo Avería: Faltante
Gravedad: Observada
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 3 – Semestre 2 Año 2004)
Variable Parte
Modelo predictivo: Modelo 14
Parte: Giro Delantero (D/I)
Tipo de avería: Abollado
Gravedad: Observada
Modelos predictivos:
Modelo 14
Variable Avería
Modelo predictivo: Modelo 16
Parte: Giro Delantero (D/I)
Tipo de avería: Abollado
Gravedad: Observada
Modelos predictivos:
Modelo 12
Modelo 13
Página 173 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 14
Modelo 15
Variable Gravedad
Modelo predictivo: Modelo 14
Parte: Giro Delantero (D/I)
Tipo de avería: Abollado
Gravedad: Observada
Modelos predictivos:
Modelo 13
Modelo 14
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 4 – Semestre 1 Año
2005)
Variable Tipo de Avería
Parte predictiva: Alerón
Tipo de Avería: Faltante
Gravedad: Partes predictivas:
Limpiador y lavador de vidrios traseros
Alerón
Taza
Alfombra suplementarias
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Variable Gravedad
Parte predictiva: Cubierta delantera derecha
Tipo Avería: Faltante
Gravedad: Partes predictivas:
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Página 174 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
•
Parte – Avería – Gravedad con predicción de la Avería (Período 4 – Semestre 1 Año
2005)
Variable Parte
Avería predictiva: Abollado
Parte: Panel lateral derecho
Gravedad: Averías predictivas:
Abollado
Faltante
Proyección
•
Variable Gravedad
Avería predictiva: Faltante
Parte: Panel lateral derecho
Gravedad: Averías predictivas:
Abollado
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 4 – Semestre 1 Año 2005)
Variable Parte
Lugar predictivo: Retiro de Puerto
Parte: Panel lateral derecho
Tipo de avería: Faltante
Gravedad: Variable Tipo de Avería
Lugar predictivo: Retiro de Puerto
Parte: Panel lateral derecho
Tipo Avería: Faltante
Gravedad: Variable Gravedad
Lugar predictivo: Retiro de Puerto
Parte: Panel lateral derecho
Tipo Avería: Faltante
Gravedad: -
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 4 – Semestre 1 Año 2005)
Variable Parte
Página 175 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo predictivo: Modelo 15
Parte: Panel lateral derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 14
Modelo 15
Variable Avería
Modelo predictivo: Modelo 17
Parte: Panel lateral derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 13
Modelo 14
Modelo 15
Modelo 16
Variable Gravedad
Modelo predictivo: Modelo 15
Parte: Panel lateral derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 10
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Modelo 15
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 5 – Semestre 2 Año
2005)
Variable Tipo de Avería
Parte predictiva: Aerosol antipinchazos
Tipo de Avería: Faltante
Gravedad: Partes predictivas:
Aerosol antipinchazos
Transponder
Antena
Faldillas para barro
Limpiador de Faros (derecho / izquierdo)
Limpiador y lavador de parabrisas
Limpiador y lavador de vidrios traseros
Página 176 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Alerón
Taza
Alfombra suplementarias
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Otros
Llave
Parrilla delantera
Luz de neblina trasera
Faro de stop luneta
Variable Gravedad
Parte predictiva: Guardabarro trasero derecho
Tipo Avería: Faltante
Gravedad: Partes predictivas:
Zócalo derecho
Guardabarro trasero derecho
•
Parte – Avería – Gravedad con predicción de la Avería (Período 5 – Semestre 2 Año
2005)
Variable Parte
Avería predictiva: Abollado
Parte: Zócalo derecho
Gravedad: Averías predictivas:
Abollado
Faltante
Proyección
Variable Gravedad
Avería predictiva: Proyección
Parte: Zócalo derecho
Gravedad: Averías predictivas:
Página 177 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Faltante
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 5 – Semestre 2 Año 2005)
Variable Parte
Lugar predictivo: Retiro de Puerto
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Variable Tipo de Avería
Lugar predictivo: Retiro de Puerto
Parte: Zócalo derecho
Tipo Avería: Faltante
Gravedad: Variable Gravedad
Lugar predictivo: Ingreso a Puerto
Parte: Zócalo derecho
Tipo Avería: Faltante
Gravedad: -
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 5 – Semestre 2 Año 2005)
Variable Parte
Modelo predictivo: Modelo 14
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 13
Variable Avería
Modelo predictivo: Modelo 16
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 10
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Modelo 15
Variable Gravedad
Modelo predictivo: Modelo 13
Parte: Zócalo derecho
Página 178 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 12
Modelo 13
Modelo 14
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 6 – Semestre 1 Año
2006)
Variable Tipo de Avería
Parte predictiva: Panel trasero bajo baúl
Tipo de Avería: Faltante
Gravedad: Partes predictivas:
Panel trasero bajo baúl
Paragolpe trasero / Zona contacto
Tapizado interno puerta delantera izquierda
Zócalo interno puerta delantera izquierda
Manijas externas de puertas delanteras
Manijas externas de puertas traseras
Aerosol antipinchazos
Transponder
Antena
Faldillas para barro
Limpiador de Faros (derecho / izquierdo)
Limpiador y lavador de parabrisas
Limpiador y lavador de vidrios traseros
Alerón
Taza
Alfombra suplementarias
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Página 179 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Otros
Llave
Parrilla delantera
Luz de neblina trasera
Variable Gravedad
Parte predictiva: Puerta delantera derecha
Tipo Avería: Faltante
Gravedad: Partes predictivas:
Guardabarro trasero derecho
Puerta delantera derecha
•
Parte – Avería – Gravedad con predicción de la Avería (Período 6 – Semestre 1 Año
2006)
Variable Parte
Avería predictiva: Abollado
Parte: Cubierta delantera derecha
Gravedad: Averías predictivas:
Abollado
Faltante
Proyección
Variable Gravedad
Avería predictiva: Faltante
Parte: Cubierta delantera derecha
Gravedad: Averías predictivas:
Abollado
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 6 – Semestre 1 Año 2006)
Variable Parte
Lugar predictivo: Retiro de Puerto
Parte: Cubierta delantera derecha
Tipo de avería: Faltante
Gravedad: Variable Tipo de Avería
Lugar predictivo: Retiro de Puerto
Parte: Cubierta delantera derecha
Tipo Avería: Faltante
Gravedad: Variable Gravedad
Lugar predictivo: Retiro de Puerto
Parte: Cubierta delantera derecha
Página 180 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Tipo Avería: Faltante
Gravedad: •
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 6 – Semestre 1 Año 2006)
Variable Parte
Modelo predictivo: Modelo 11
Parte: Cubierta delantera derecha
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 10
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Variable Avería
Modelo predictivo: Modelo 14
Parte: Cubierta delantera derecha
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 10
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Variable Gravedad
Modelo predictivo: Modelo 12
Parte: Cubierta delantera derecha
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 10
Modelo 11
Modelo 12
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 7 – Semestre 2 Año
2006)
Variable Tipo de Avería
Parte predictiva: Manijas externas de puertas traseras
Tipo de Avería: Faltante
Gravedad: Página 181 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Partes predictivas:
Manijas externas de puertas traseras
Aerosol antipinchazos
Transponder
Antena
Faldillas para barro
Limpiador de Faros (derecho / izquierdo)
Limpiador y lavador de parabrisas
Limpiador y lavador de vidrios traseros
Alerón
Taza
Alfombra suplementarias
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Otros
Variable Gravedad
Parte predictiva: Cubierta delantera derecha
Tipo Avería: Faltante
Gravedad: Partes predictivas:
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
•
Parte – Avería – Gravedad con predicción de la Avería (Período 7 – Semestre 2 Año
2006)
Variable Parte
Avería predictiva: Faltante
Parte: Guardabarro delantero derecho
Gravedad: Averías predictivas:
Abollado
Faltante
Página 182 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Variable Gravedad
Avería predictiva: Faltante
Parte: Guardabarro delantero derecho
Gravedad: Averías predictivas:
Abollado
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 7 – Semestre 2 Año 2006)
Variable Parte
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Guardabarro delantero derecho
Tipo de avería: Faltante
Gravedad: Variable Tipo de Avería
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Guardabarro delantero derecho
Tipo Avería: Faltante
Gravedad: Variable Gravedad
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Guardabarro delantero derecho
Tipo Avería: Faltante
Gravedad: -
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 7 – Semestre 2 Año 2006)
Variable Parte
Modelo predictivo: Modelo 15
Parte: Guardabarro delantero derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 14
Modelo 15
Modelo 16
Variable Avería
Modelo predictivo: Modelo 16
Parte: Guardabarro delantero derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 15
Variable Gravedad
Página 183 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo predictivo: Modelo 15
Parte: Guardabarro delantero derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 15
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 8 – Semestre 1 Año
2007)
Variable Tipo de Avería
Parte predictiva: Manual
Tipo de Avería: Faltante
Gravedad: Partes predictivas:
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Variable Gravedad
Parte predictiva: Guardabarro delantero derecho
Tipo Avería: Faltante
Gravedad: Partes predictivas:
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
•
Parte – Avería – Gravedad con predicción de la Avería (Período 8 – Semestre 1 Año
2007)
Variable Parte
Avería predictiva: Faltante
Parte: Zócalo derecho
Gravedad: Averías predictivas:
Faltante
Variable Gravedad
Avería predictiva: Faltante
Parte: Zócalo derecho
Página 184 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Gravedad: Averías predictivas:
Faltante
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 8 – Semestre 1 Año 2007)
Variable Parte
Lugar predictivo: Retiro de Puerto
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Variable Tipo de Avería
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Zócalo derecho
Tipo Avería: Faltante
Gravedad: Variable Gravedad
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Zócalo derecho
Tipo Avería: Faltante
Gravedad: -
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 8 – Semestre 1 Año 2007)
Variable Parte
Modelo predictivo: Modelo 13
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 13
Modelo 14
Modelo 15
Variable Avería
Modelo predictivo: Modelo 16
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Modelo 15
Modelo 16
Página 185 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Variable Gravedad
Modelo predictivo: Modelo 15
Parte: Zócalo derecho
Tipo de avería: Faltante
Gravedad: Modelos predictivos:
Modelo 13
Modelo 14
Modelo 15
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 9 – Semestre 2 Año
2007)
Variable Tipo de Avería
Parte predictiva: Cubierta delantera derecha
Tipo de Avería: Proyección
Gravedad: Partes predictivas:
Guardabarro delantero derecho
Llanta delantera derecha
Variable Gravedad
Parte predictiva: Cubierta delantera derechacho
Tipo Avería: Proyección
Gravedad: Partes predictivas:
Guardabarro delantero derecho
Llanta delantera derecha
•
Parte – Avería – Gravedad con predicción de la Avería (Período 9 – Semestre 2 Año
2007)
Variable Parte
Avería predictiva: Faltante
Parte: Cubierta delantera derecha
Gravedad: Averías predictivas:
Faltante
Variable Gravedad
Avería predictiva: Faltante
Parte: Cubierta delantera derecha
Gravedad: Averías predictivas:
Faltante
Página 186 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 9 – Semestre 2 Año 2007)
Variable Parte
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Cubierta delantera derecha
Tipo de avería: Proyección
Gravedad: Variable Tipo de Avería
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Cubierta delantera derecha
Tipo Avería: Proyección
Gravedad: Variable Gravedad
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Cubierta delantera derecha
Tipo Avería: Proyección
Gravedad: -
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 9 – Semestre 2 Año 2007)
Variable Parte
Modelo predictivo: Modelo 12
Parte: Cubierta delantera derecha
Tipo de avería: Proyección
Gravedad: Modelos predictivos:
Modelo 12
Variable Avería
Modelo predictivo: Modelo 13
Parte: Cubierta delantera derecha
Tipo de avería: Proyección
Gravedad: Modelos predictivos:
Modelo 10
Modelo 11
Modelo 12
Modelo 13
Variable Gravedad
Modelo predictivo: Modelo 13
Parte: Cubierta delantera derecha
Tipo de avería: Proyección
Gravedad: Modelos predictivos:
Modelo 13
Página 187 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo
período.
•
Parte – Avería – Gravedad con predicción de la Parte (Período 10 – Semestre 1 Año
2008)
Variable Tipo de Avería
Parte predictiva: Manual
Tipo de Avería: Proyección
Gravedad: Partes predictivas:
Taza
Alfombra suplementarias
Manual
Variable Gravedad
Parte predictiva: Taza
Tipo Avería: Proyección
Gravedad: Partes predictivas:
Taza
Alfombra suplementarias
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
•
Parte – Avería – Gravedad con predicción de la Avería (Período 10 – Semestre 1 Año
2008)
Variable Parte
Avería predictiva: Faltante
Parte: Puerta delantera derecha
Gravedad: Averías predictivas:
Faltante
Abollado
Variable Gravedad
Avería predictiva: Faltante
Parte: Puerta delantera derecha
Gravedad: Averías predictivas:
Faltante
Abollado
Página 188 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar
(Período 10 – Semestre 1 Año 2008)
Variable Parte
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Puerta delantera derecha
Tipo de avería: Proyección
Gravedad: Variable Tipo de Avería
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Puerta delantera derecha
Tipo Avería: Proyección
Gravedad: Variable Gravedad
Lugar predictivo: Transferencia ubicación y línea de carga
Parte: Puerta delantera derecha
Tipo Avería: Proyección
Gravedad: -
•
Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el
Modelo (Período 10 – Semestre 1 Año 2008)
Variable Parte
Modelo predictivo: Modelo 10
Parte: Puerta delantera derecha
Tipo de avería: Proyección
Gravedad: Modelos predictivos:
Modelo 9
Modelo 10
Variable Avería
Modelo predictivo: Modelo 10
Parte: Puerta delantera derecha
Tipo de avería: Proyección
Gravedad: Modelos predictivos:
Modelo 9
Modelo 10
Variable Gravedad
Modelo predictivo: Modelo 10
Parte: Puerta delantera derecha
Tipo de avería: Proyección
Gravedad: Modelos predictivos:
Modelo 9
Modelo 10
Página 189 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8.4.5. Dificultades encontradas
La única dificultad encontrada en el procesamiento de los modelos desarrollados fue que en cuatro
de los diez períodos ejecutados se encontraron cuatro eventos que se producían una sola vez en el
período respectivo. Por lo tanto en la ejecución del Modelo de Clasificación al contener una sola
clasificación para poder correr la aplicación esos registros debían ser eliminados.
8.5. Evaluación
Los modelos generados y los resultados obtenidos para cada período han sido satisfactorios. Los
modelos de Predicción y Clasificación han tenido un tiempo promedio de proceso de algunos
minutos (entre 5 y 10 minutos). En cuanto al modelo de Agrupamiento el tiempo insumido fue de 7
u 8 horas en promedio.
Los resultados obtenidos de los diferentes modelos tienen relación entre si y en un primer análisis
aproximado se puede deducir que los mismos has sido los esperados especialmente en lo que
respecta a cantidades y promedios.
La ejecución de los modelos ha generado los datos esperados en función de los objetivos de negocio
establecidos previamente para el presente proyecto. Si bien en este primer análisis se puede decir
que se han cubierto todas las alternativas para lograr los objetivos de negocio y de minería de datos
no se descarta la posibilidad de arribar a nuevas preguntas de negocio o nuevas aproximaciones de
resultados. Podemos concluir que los modelos están conectados directamente a los objetivos de
negocio y de minería de datos.
8.5.1. Evaluación de los resultados en términos de minería de datos
A continuación se desarrolla un resumen de los resultados obtenidos para cada período y para cada
modelo de minería de datos.
8.5.1.1. Período 1: Año 2003.
Clasificación
Averías:
59 % de averías “Abollado”.
22 % de averías “Rayado – Rozado”.
10 % de averías “Pintura saltada”.
Lugares:
74 % de averías en “Subida a Buque Puerto de Origen”. Imputación transporte terrestre.
10 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
5 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
5 % de averías en “Transferencia Ubicación y Línea de Carga”. Imputación planta de
producción.
Modelos:
46 % de averías en Modelo 9.
29 % de averías en Modelo 17.
6 % de averías en Modelo 5.
Página 190 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
6 % de averías en Modelo 20.
5 % de averías en Modelo 18.
5 % de averías en Modelo 13.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Area - Avería – Gravedad:
Puerta delantera derecha, Arrancado - Roto – Fisurado, Intolerable: 99 - 2 %
Escape, Abollado, Grave: 779 - 16 %.
Alfombra suplementarias, Rayado – Rozado, Grave: 455 - 9 %
Parabrisa, Proyección, Mediano: 362 – 7 %.
Luz trasera izquierda, Faltante, Mediano: 626 – 13 %.
Puerta delantera derecha, Faltante, Leve: 1130 – 23 %.
Cubierta delantera izquierda, Rayado – Rozado, Mediano: 138 – 3 %.
Panel lateral izquierdo, Abollado, Leve: 1057 - 21 %.
Panel lateral derecho, Abollado, Mediano: 354 – 7 %.
General:
Tapa acceso gancho remolque, Faltante, Mediano.
Lugar - Parte – Avería:
Ingreso a Puerto, Paragolpe delantero / Superior, Rayado – Rozado: 38 – 1 %.
Ingreso a Puerto, Techo corredizo, Faltante: 55 – 1 %.
Ingreso a Puerto, Cubierta delantera derecha, Abollado: 111 – 2 %.
Transferencia ubicación y línea de carga, Luz de neblina trasera, Exceso kilometraje: 299 –
6 %.
Ingreso a Puerto, Luz trasera izquierda, Abollado: 63 – 1 %.
Transferencia ubicación y línea de carga, Luz de neblina trasera, Abollado: 76 – 2 %.
Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante: 4334 – 87 %.
General:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante.
Lugar - Parte - Avería – Gravedad:
Bajada de Buque, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Mediano:
596 – 12 %.
Retiro de Puerto, Cristales de parante delantero, Abollado, Grave: 1007 – 20 %.
Ingreso a Puerto, Moldura protectora lateral derecha, Rayado – Rozado, Leve: 488 – 10
%.
Subida Buque Puerto de Origen, Cable de carga, Faltante, Mediano: 582 – 12 %.
Transferencia ubicación y línea de carga, Insignia, Faltante, Leve: 99 – 2 %.
Subida Buque Puerto de Origen, Llave, Abollado, Leve: 2120 – 42 %.
Subida Buque Puerto de Origen, Guardabarro delantero izquierdo, Rayado –
Rozado,
Mediano: 79 – 2 %.
General:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Mediano.
Página 191 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo - Area – Avería:
Modelo 4, Moldura protectora lateral derecha, Faltante: 636 – 13 %.
Modelo 10, Manual, Abollado: 1267 – 25 %.
Modelo 18, Cubierta delantera derecha, Rayado – Rozado: 879 – 18 %.
Modelo 10, Giro Delantero (derecho / izquierdo), Rayado – Rozado: 121 – 2 %.
Modelo 10, Panel lateral izquierdo, Abollado: 1113 – 22 %.
Modelo 9, Cerraduras de puertas, Rayado – Rozado: 295 – 6 %.
Modelo 17, Cubierta delantera izquierda, Abollado: 689 – 14 %.
General:
Modelo 12, Tapa acceso gancho remolque, Faltante.
Modelo - Area - Avería – Gravedad:
Modelo 5, Giro Delantero (derecho / izquierdo), Faltante, Intolerable: 389 – 8 %.
Modelo 15, Puerta trasera derecha, Faltante, Grave: 792 – 16 %.
Modelo 18, Paragolpe trasero / Spoiler trasero, Faltante, Mediano: 110 – 2 %.
Modelo 16, Bolsa de herramientas, Abollado, Mediano: 231 – 5 %.
Modelo 17, Panel lateral derecho, Rayado – Rozado, Mediano: 290 – 6 %.
Modelo 9, Manijas externas de puertas traseras, Rayado – Rozado, Mediano: 168 - 3 %.
Modelo 11, Luz de neblina trasera, Faltante, Leve: 2945 – 59 %.
Modelo 14, Retrovisor externo derecho, Pintura saltada, Mediano: 65 – 1 %.
General:
Modelo 12, Tapa acceso gancho remolque, Faltante, Mediano.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Puerta delantera derecha
Avería: Exceso kilometraje
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Parte: Tapa acceso gancho remolque
Avería: Faltante
Gravedad: Leve
Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Faltante
Parte: Rueda de auxilio
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Tapa acceso gancho remolque
Gravedad: Leve
Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Rueda de auxilio
Avería: Faltante
Página 192 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Gravedad: Mediano
Con variación de Avería los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Tapa acceso gancho remolque
Avería: Exceso kilometraje
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Tapa acceso gancho remolque
Avería: Faltante
Gravedad: Leve
Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 9
Parte: Rueda de auxilio
Avería: Faltante
Gravedad: Mediano
Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 11
Parte: Tapa acceso gancho remolque
Avería: Exceso kilometraje
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 10
Parte: Tapa acceso gancho remolque
Avería: Faltante
Gravedad: Leve
8.5.1.2. Período 2: Año 2004 semestre 1.
Clasificación
Averías:
50 % de averías “Abollado”.
29 % de averías “Rayado – Rozado”.
14 % de averías “Pintura saltada”.
3 % de averías “Faltante”
3 % de averías “Manchado”.
Lugares:
83 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
6 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
6 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
2 % de averías en “Retiro de Puerto”. Imputación puerto.
Modelos:
47 % de averías en Modelo 17.
32 % de averías en Modelo 9.
10 % de averías en Modelo 13.
6 % de averías en Modelo 20.
Página 193 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
4 % de averías en Modelo 18.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Cristales de parante delantero, Faltante, Intolerable: 317 – 6 %.
Guardabarro trasero derecho, Faltante, Grave: 756 – 15 %.
Cerraduras de puertas, Rayado – Rozado, Mediano: 374 – 7 %.
Otros, Abollado, Leve: 1864 – 37 %.
Cable de carga, Rayado – Rozado, Leve: 223 – 4 %.
Antena, Rayado – Rozado, Mediano: 520 – 10 %.
Bolsa de herramientas, Abollado, Mediano: 932 – 19 %.
General:
Tapa acceso gancho remolque, Faltante, Mediano.
Lugar - Parte – Avería:
Transferencia ubicación y línea de carga, Puerta delantera izquierda, Rayado – Rozado: 31
– 1 %.
Ingreso a Puerto, Techo corredizo, Rayado – Rozado: 97 - 2 %.
Ingreso a Puerto, Puerta trasera derecha, Rayado – Rozado: 62 – 1 %.
Transferencia ubicación y línea de carga, Otros, Abollado: 167 – 3 %.
Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante: 4580 – 92 %.
General:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante.
Lugar - Parte - Avería – Gravedad:
Bajada de Buque, Cristales de parante delantero, Faltante, Intolerable: 259 – 5
Retiro de Puerto, Guardabarro trasero derecho, Faltante, Grave: 627 – 13 %.
Bajada de Buque, Panel lateral izquierdo, Faltante, Leve: 1961 – 39 %.
Ingreso a Puerto, Tapa posterior de techo, Pintura saltada, Mediano: 82 – 2 %.
Bajada de Buque, Llanta delantera derecha, Abollado, Leve: 1642 – 33 %
Bajada de Buque, Llanta delantera derecha, Faltante, Grave: 405 – 8 %.
%.
General:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Mediano.
Modelo - Parte – Avería:
Modelo 17, Aerosol antipinchazos, Proyección: 1010 – 20 %.
Modelo 10, Guardabarro delantero izquierdo, Abollado: 1695 – 34 %.
Modelo 17, Puerta delantera derecha, Abollado: 614 – 12 %.
Modelo 8, Panel lateral izquierdo, Rayado – Rozado: 243 – 5 %.
Modelo 6, Limpiador y lavador de parabrisas, Abollado: 192 – 4 %.
Modelo 7, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 131 – 3 %.
Modelo 17, Cubierta delantera izquierda, Rayado – Rozado: 382 – 8 %.
Modelo 17, Alfombra baúl / caja de carga, Faltante: 713 – 14 %.
Página 194 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
General:
Modelo 14, Tapa acceso gancho remolque, Faltante.
Modelo - Parte - Avería – Gravedad:
Modelo 16, Guardabarro trasero derecho, Faltante, Grave: 800 – 16 %.
Modelo 8, Cristales de parante delantero, Faltante, Grave: 273 – 5 %.
Modelo 10, Barras de techo, Proyección, Mediano: 111 – 2 %.
Modelo 13, Puerta delantera izquierda, Faltante, Leve: 2341 – 47 %.
Modelo 8, Giro Delantero (derecho / izquierdo), Faltante, Mediano: 350 – 7 %.
Modelo 17, Aleron, Faltante, Mediano: 1085 – 22 %.
General:
Modelo 14, Tapa acceso gancho remolque, Faltante, Mediano.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Escape
Avería: Abollado
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Parte: Llave
Avería: Abollado
Gravedad: Mediano
Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Abollado
Parte: Llave
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Avería: Abollado
Parte: Llave
Gravedad: Mediano
Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Baja de Buque
Parte: Llave
Avería: Abollado
Gravedad: Mediano
Con variación de Avería los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Llave
Avería: Abollado
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Lugar: Bajada de Buque
Parte: Llave
Avería: Abollado
Gravedad: Mediano
Página 195 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 11
Parte: Llave
Avería: Abollado
Gravedad: Mediano
Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 11
Parte: Llave
Avería: Abollado
Gravedad: Mediano
Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 11
Parte: Llave
Avería: Abollado
Gravedad: Mediano
8.5.1.3. Período 3: Año 2004 semestre 2.
Clasificación
Averías:
44 % de averías “Abollado”.
34 % de averías “Rayado – Rozado”.
15 % de averías “Pintura saltada”.
5 % de averías “Faltante”
Lugares:
76 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
9 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
9 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
4 % de averías en “Subida a Buque”. Imputación puerto.
Modelos:
56 % de averías en Modelo 17.
15 % de averías en Modelo 9.
12 % de averías en Modelo 20.
9 % de averías en Modelo 13.
5 % de averías en Modelo 5.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Paragolpe trasero / Zona contacto, Rayado – Rozado, Grave: 58 – 1 %.
Alerón, Proyección, Grave: 78 – 2 %.
Luz de neblina trasera, Abollado, Grave: 401 – 8 %.
Tapa acceso gancho remolque, Faltante: 4432 – 89 %.
Página 196 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
General:
Tapa acceso gancho remolque, Faltante, Leve.
Lugar - Parte – Avería:
Ingreso a Puerto, Barras de techo, Pintura saltada: 46 – 1 %.
Ingreso a Puerto, Guardabarro trasero derecho, Pintura saltada: 40 – 1 %.
Ingreso a Puerto, Luz de neblina trasera, Abollado: 147 – 3 %.
Ingreso a Puerto, Luz de patente trasera, Rayado – Rozado: 72 – 1 %.
Transferencia ubicación y línea de carga, Retrovisor externo izquierdo, Rayado – Rozado:
36 – 1 %.
Ingreso a Puerto, Paragolpe trasero / Zona contacto, Rayado – Rozado: 299 – 6 %.
Transferencia ubicación y línea de carga, Bolsa de herramientas, Faltante: 4331- 87 %.
General:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante.
Lugar - Parte - Avería – Gravedad:
Ingreso a Puerto, Alfombra suplementarias, Proyección, Grave: 48 – 1 %.
Ingreso a Puerto, Luz de neblina trasera, Faltante, Grave: 54 – 1 %.
Subida Buque Puerto de Origen, Giro Delantero (derecho / izquierdo), Faltante, Grave: 448
– 9 %.
Ingreso a Puerto, Retrovisor externo derecho, Proyección: 548 – 11 %.
Subida Buque Puerto de Origen, Otros, Faltante: 3883 – 78 %.
General:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Leve.
Modelo - Área – Avería:
Modelo 17, Llave de rueda, Faltante: 556 – 11 %.
Modelo 17, Cubierta delantera izquierda, Faltante: 1084 – 22 %.
Modelo 9, Giro Delantero (derecho / izquierdo), Abollado: 1409 – 28 %.
Modelo 13, Puerta trasera izquierda, Abollado: 89 – 2 %.
Modelo 17, Guardabarro trasero derecho, Abollado: 849 – 17 %.
Modelo 18, Limpiador y lavador de parabrisas, Proyección: 712 – 14 %.
Modelo 17, Tapa posterior de techo, Faltante: 286 – 6 %.
General:
Modelo 15, Tapa acceso gancho remolque, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo - Área - Avería – Gravedad:
Modelo 4, Retrovisor externo derecho, Faltante, Grave: 63 – 1 %.
Modelo 10, Faro de stop luneta, Abollado, Grave: 128 – 3 %.
Modelo 17, Puerta trasera izquierda, Faltante, Grave: 72 – 1 %.
Modelo 17, Manual, Faltante, Grave: 259 – 5 %.
Modelo 15, Tapa acceso gancho remolque, Faltante: 4432 – 89 %.
General:
Modelo 15, Tapa acceso gancho remolque, Faltante, Leve.
Página 197 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Llanta delantera derecha
Avería: Faltante
Gravedad: Observada
Con variación de Gravedad los valores predictivos resultan:
Parte: Puerta trasera derecha
Avería: Faltante
Gravedad: Observada
Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Abollado
Parte: Giro Delantero (derecho / izquierdo)
Gravedad: Observada
Con variación de Gravedad los valores predictivos resultan:
Avería: Abollado
Parte: Giro Delantero (derecho / izquierdo)
Gravedad: Observada
Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Baja de Buque
Parte: Giro Delantero (derecho / izquierdo)
Avería: Faltante
Gravedad: Observada
Con variación de Avería los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Giro Delantero (derecho / izquierdo)
Avería: Faltante
Gravedad: Observada
Con variación de Gravedad los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Giro Delantero (derecho / izquierdo)
Avería: Faltante
Gravedad: Observada
Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 14
Parte: Giro Delantero (derecho / izquierdo)
Avería: Abollado
Gravedad: Observada
Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 16
Parte: Giro Delantero (derecho / izquierdo)
Avería: Faltante
Gravedad: Observada
Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 14
Parte: Giro Delantero (derecho / izquierdo)
Página 198 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Avería: Faltante
Gravedad: Observada
8.5.1.4. Período 4: Año 2005 semestre 1.
Clasificación
Averías:
45 % de averías “Rayado – Rozado”.
28 % de averías “Abollado”.
15 % de averías “Pintura saltada”.
7 % de averías “Faltante”
Lugares:
47 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
15 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción.
15 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
Modelos:
51 % de averías en Modelo 17.
15 % de averías en Modelo 20.
12 % de averías en Modelo 8.
11 % de averías en Modelo 9.
5 % de averías en Modelo 5.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Capot, Rayado – Rozado, Observada: 77 – 2 %.
Panel trasero bajo baúl, Rayado – Rozado, Observada: 134 – 3%.
Alerón, Proyección, Observada: 172 – 4 %.
Llanta delantera izquierda, Abollado, Observada: 703 – 18 %.
Zócalo izquierdo, Manchado, Observada: 31 – 1 %.
Zócalo derecho, Faltante: 2779 – 71 %.
General:
Guardabarro trasero derecho, Faltante.
Lugar - Parte – Avería:
Ingreso a Puerto, Capot, Rayado – Rozado: 72 – 2 %.
Subida Buque Puerto de Origen, Tapa posterior de techo, Rayado – Rozado: 131 – 3 %.
Retiro de Puerto, Taza, Faltante: 226 – 6 %.
Retiro de Puerto, Llanta delantera izquierda, Faltante: 311 – 8 %.
Retiro de Puerto, Puerta trasera derecha, Faltante: 3161 – 81 %.
General:
Retiro de Puerto, Guardabarro trasero derecho, Faltante.
Página 199 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Lugar - Parte - Avería – Gravedad:
Bajada de Buque, Capot, Rayado – Rozado, Observada: 64 – 2 %.
Ingreso a Puerto, Parabrisa, Faltante, Observada: 43 – 1 %.
Bajada de Buque, Luz de neblina trasera, Proyección, Observada: 165 – 4 %.
Transferencia ubicación y línea de carga, Cubierta delantera derecha, Faltante: 436 – 11 %.
Bajada de Buque, Zócalo derecho, Faltante: 2342, - 60 %.
Bajada de Buque, Escape, Faltante, Observada: 855 – 22 %.
General:
Retiro de Puerto, Guardabarro trasero derecho, Faltante.
Modelo - Área – Avería:
Modelo 9, Parante delantero, Rayado – Rozado: 42 – 1 %.
Modelo 6, Limpiador de Faros (derecho / izquierdo), Proyección: 380 – 10 %.
Modelo 8, Llanta delantera izquierda, Abollado: 812 – 21 %.
Modelo 18, Panel trasero bajo baúl, Rayado – Rozado: 1250 – 32 %.
Modelo 18, Escape, Proyección, 583 – 15 %.
Modelo 17, Guardabarro delantero izquierdo, Pintura saltada: 533 – 14 %.
Modelo 17, Separador interno de carga, Proyección: 237 – 6 %.
Modelo 17, Llanta delantera derecha, Pintura saltada: 65 – 2 %.
General:
Modelo 15, Guardabarro trasero derecho, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo 16, Batería, Rayado – Rozado, Observada: 22 – 1 %.
Modelo 18, Luz de patente trasera, Proyección, Observada: 146 – 4 %.
Modelo 8, Tapa acceso gancho remolque, Abollado, Observada: 382 – 10 %.
Modelo 18, Alfombra suplementarias, Faltante, Observada: 518 – 13 %.
Modelo 9, Zócalo derecho, Manchado, Observada: 67 – 2 %.
Modelo 15, Zócalo derecho, Faltante: 2779 – 71 %.
General:
Modelo 15, Guardabarro trasero derecho, Faltante.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Alerón
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Abollado
Parte: Panel lateral derecho
Página 200 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Panel lateral derecho
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Giro Panel lateral derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Panel lateral derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Panel lateral derecho
Avería: Faltante
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 15
Parte: Panel lateral derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 17
Parte: Panel lateral derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 15
Parte: Panel lateral derecho
Avería: Faltante
Gravedad: 8.5.1.5. Período 5: Año 2005 semestre 2.
Clasificación
Averías:
48 % de averías “Rayado – Rozado”.
29 % de averías “Abollado”.
13 % de averías “Pintura saltada”.
6 % de averías “Faltante”
Lugares:
32 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
Página 201 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
23 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción.
20 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
14 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
6 % de averías en “Retiro de Puerto”. Imputación puerto.
Modelos:
47 % de averías en Modelo 17.
16 % de averías en Modelo 8.
12 % de averías en Modelo 9.
10 % de averías en Modelo 5.
7 % de averías en Modelo 20.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Barras de techo, Pintura saltada, Observada: 38 – 1 %.
Barras de techo, Rayado – Rozado, Observada: 108 – 3 %.
Retrovisor externo izquierdo, Pintura saltada, Observada: 146 – 4 %.
Tapa tanque combustible, Rayado – Rozado, Observada: 30 – 1 %.
Bolsa de herramientas, Rayado – Rozado, Observada: 81 – 2 %.
Guardabarro delantero derecho, Faltante: 3464 – 89 %.
General:
Guardabarro delantero derecho, Faltante.
Lugar - Parte – Avería:
Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero
Rayado –
Rozado: 29 – 1 %.
Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado - Rozado 63 – 2 %.
Bajada de Buque, Paragolpe delantero / Superior, Rayado – Rozado: 44 – 1 %.
Retiro Fábrica de Origen, Paragolpe trasero / Spoiler trasero, Rayado – Rozado: 993 – 26
%.
Bajada de Buque, Antena, Proyección: 177 – 5 %.
Retiro de Puerto, Cristales de parante delantero, Faltante: 2562 – 66 %.
General:
Retiro de Puerto, Guardabarro delantero derecho, Faltante.
Lugar - Parte - Avería – Gravedad:
Ingreso a Puerto, Techo (inclusive convertible), Pintura saltada: 67 – 2 %.
Ingreso a Puerto, Otros, Abollado: 177 – 5 %.
Ingreso a Puerto, Techo (inclusive convertible), Rayado – Rozado: 142 – 4 %.
Ingreso a Puerto, Llanta delantera izquierda, Proyección: 111 – 3 %.
Subida Buque Puerto de Origen, Guardabarro delantero derecho, Faltante: 2955 - 76 %.
Bajada de Buque, Zócalo derecho, Faltante, Observada: 168 – 4 %.
Ingreso a Puerto, Llanta delantera derecha, Proyección, Observada: 249 – 6 %.
General:
Página 202 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Retiro de Puerto, Guardabarro delantero derecho, Faltante.
Modelo - Área – Avería:
Modelo 18, Guardabarros y parante trasero izquierdo, Rayado – Rozado: 269 – 7 %.
Modelo 17, Faro de stop luneta, Abollado: 669 – 17 %.
Modelo 7, Tapa acceso gancho remolque, Abollado: 1290 – 33 %.
Modelo 17, Tapa de Baúl o Puerta Trasera, Rayado – Rozado: 1307 – 34 %.
Modelo 13, Techo (inclusive convertible), Abollado: 24 – 1 %.
Modelo 6, Paragolpe trasero / Zona contacto, Rayado – Rozado: 263 – 7 %.
Modelo 9, Paragolpe delantero / Superior, Rayado – Rozado: 59 – 2 %.
General:
Modelo 13, Guardabarro delantero derecho, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo 19, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada: 53 –
1 %.
Modelo 18, Llave, Abollado, Observada: 123 – 3 %.
Modelo 6, Taza, Proyección, Observada: 167 – 4 %.
Modelo 8, Guardabarro delantero izquierdo, Abollado, Observada: 50 – 1 %.
Modelo 13, Guardabarro delantero derecho, Faltante: 3464 – 89 %.
General:
Modelo 13, Guardabarro delantero derecho, Faltante.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Aerosol antipinchazos
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Guardabarro trasero derecho
Avería: Faltante
Gravedad: Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Abollado
Parte: Zócalo derecho
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Proyección
Parte: Zócalo derecho
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Zócalo derecho
Avería: Faltante
Página 203 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Ingreso a Puerto
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 14
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 16
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 13
Parte: Zócalo derecho
Avería: Faltante
Gravedad: 8.5.1.6. Período 6: Año 2006 semestre 1.
Clasificación
Averías:
45 % de averías “Abollado”.
40 % de averías “Rayado – Rozado”.
7 % de averías “Pintura saltada”.
7 % de averías “Faltante”
Lugares:
42 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
17 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción.
15 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
5 % de averías en “Retiro de Puerto”. Imputación puerto.
Modelos:
40 % de averías en Modelo 17.
21 % de averías en Modelo 9.
14 % de averías en Modelo 5.
12 % de averías en Modelo 20.
Página 204 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8 % de averías en Modelo 8.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Capot, Rayado – Rozado, Observada: 24 – 1 %.
Panel trasero bajo baúl, Rayado – Rozado, Observada: 37 – 1 %.
Manijas externas de puertas delanteras, Faltante, Observada: 40 – 1 %.
Luz de neblina trasera, Abollado, Observada: 340 – 9 %.
Zócalo derecho, Faltante: 3301 – 88 %.
General:
Zócalo derecho, Faltante.
Lugar - Parte – Avería:
Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado: 42 – 1 %.
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado
– Rozado: 27 – 1 %.
Ingreso a Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado: 74 – 2 %.
Ingreso a Puerto, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 114 – 3 %.
Ingreso a Puerto, Tapa acceso gancho remolque, Faltante: 470 – 12 %.
Transferencia ubicación y línea de carga, Llave, Abollado: 53 – 1 %.
Subida Buque Puerto de Origen, Guardabarro trasero derecho, Faltante: 2983- 79 %.
General:
Retiro de Puerto, Zócalo derecho, Faltante.
Lugar - Parte - Avería – Gravedad:
Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada: 7 – 1 %.
Retiro de Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 1
– 4 %.
Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada: 9 – 5 %.
Ingreso a Puerto, Tapa posterior de techo, Rayado – Rozado, Observada: 35 – 6 %.
Bajada de Buque, Moldura protectora lateral derecha, Faltante, Observada: 103 – 7 %.
Transferencia ubicación y línea de carga, Puerta trasera izquierda, Abollado, Observada: 33
– 8 %.
Bajada de Buque, Tapa acceso gancho remolque, Abollado, Observada: 274 – 9 %.
Bajada de Buque, Zócalo derecho, Faltante: 3301 – 10 %.
General:
Retiro de Puerto, Zócalo derecho, Faltante.
Modelo - Área – Avería:
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado: 124 – 3 %.
Modelo 17, Panel trasero bajo baúl, Rayado – Rozado: 901 – 24 %.
Modelo 7, Escape, Faltante: 1695 – 45 %.
Modelo 17, Otros, Rayado – Rozado: 110 – 3 %.
Modelo 18, Giro Delantero (derecho / izquierdo), Abollado: 577 – 15 %.
Página 205 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 16, Guardabarros y parante trasero izquierdo, Abollado: 318 – 8 %.
Modelo 13, Barras de techo, Abollado: 38 – 1 %.
General:
Modelo 13, Zócalo derecho, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo 20, Spoiler delantero, Rayado – Rozado, Observada: 20 – 1 %.
Modelo 19, Paragolpe trasero / Spoiler trasero, Proyección, Observada: 45 – 1 %.
Modelo 19, Bolsa de herramientas, Proyección, Observada: 57 – 2 %.
Modelo 7, Bolsa de herramientas, Faltante, Observada: 260 – 7 %.
Modelo 16, Parrilla delantera, Pintura saltada, Observada: 74 – 2 %.
Modelo 13, Zócalo derecho, Faltante: 3301 – 88 %.
General:
Modelo 13, Zócalo derecho, Faltante.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Panel trasero bajo baúl
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Puerta delantera derecha
Avería: Faltante
Gravedad: Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Abollado
Parte: Cubierta delantera derecha
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Cubierta delantera derecha
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Retiro de Puerto
Página 206 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 11
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 14
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 12
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: 8.5.1.7. Período 7: Año 2006 semestre 2.
Clasificación
Averías:
47 % de averías “Rayado – Rozado”.
30 % de averías “Abollado”.
14 % de averías “Faltante”.
5 % de averías “Pintura saltada”
Lugares:
40 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
21% de averías en “Bajada de Buque”. Imputación transporte marítimo.
16 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
10 % de averías en “Subida a Buque”. Imputación puerto.
6 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
Modelos:
50 % de averías en Modelo 20.
22 % de averías en Modelo 5.
10 % de averías en Modelo 10.
7 % de averías en Modelo 9.
4 % de averías en Modelo 13.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Página 207 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Bolsa de herramientas, Arrancado - Roto – Fisurado, Observada: 15 – 1 %.
Luz de neblina trasera, Abollado, Observada: 94 – 4 %.
Faro de stop luneta, Rayado – Rozado, Observada: 94 – 4 %.
Tapa posterior de techo, Proyección, Observada: 128 – 5 %.
Alfombra suplementarias, Abollado, Observada: 22 - 1 %.
Guardabarro delantero derecho, Faltante: 2271 – 86 %.
General:
Guardabarro delantero derecho, Faltante.
Lugar - Parte – Avería:
Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado: 41 – 2 %.
Bajada de Buque, Manijas externas de puertas traseras, Proyección: 326 – 12 %.
Ingreso a Puerto, Parabrisa, Proyección: 865 – 33 %.
Bajada de Buque, Guardabarro delantero izquierdo, Abollado: 473 – 18 %.
Ingreso a Puerto, Faro de stop luneta, Abollado: 483 – 18 %.
Ingreso a Puerto, Llave, Rayado – Rozado: 429 – 16 %.
General:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.
Lugar - Parte - Avería – Gravedad:
Bajada de Buque, Panel trasero bajo baúl, Rayado – Rozado, Observada: 14 – 1 %.
Bajada de Buque, Alfombra suplementarias, Proyección, Observada: 21 – 1 %.
Bajada de Buque, Parrilla delantera, Abollado, Observada: 67 – 3 %.
Ingreso a Puerto, Guardabarro delantero derecho, Faltante, Observada: 250 – 10 %.
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante: 2271 –
86 %.
General:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.
Modelo - Área – Avería:
Modelo 20, Parrilla delantera, Rayado – Rozado: 252 – 10 %.
Modelo 19, Retrovisor externo izquierdo, Abollado: 553 – 21 %.
Modelo 6, Puerta delantera derecha, Faltante: 868 – 33 %.
Modelo 11, Barras de techo, Proyección: 91 – 3 %.
Modelo 20, Barras de techo, Proyección: 714 – 27 %.
Modelo 18, Retrovisor externo derecho, Reventado – Estallado: 114 – 4 %.
Modelo 13, Llanta delantera derecha, Abollado: 32 – 1 %.
General:
Modelo 15, Guardabarro delantero derecho, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo 5, Zócalo izquierdo, Rayado – Rozado, Observada: 22 – 1 %.
Modelo 7, Zócalo izquierdo, Abollado, Observada: 42 – 2 %.
Modelo 6, Manijas externas de puertas traseras, Proyección, Observada: 42 – 2 %.
Modelo 8, Retrovisor externo derecho, Pintura saltada, Observada: 20 – 1 %.
Modelo 19, Retrovisor externo derecho, Faltante, Observada: 224 – 9 %.
Página 208 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 15, Guardabarro delantero derecho, Faltante: 2271 – 86 %.
General:
Modelo 15, Guardabarro delantero derecho, Faltante.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Manijas externas de puertas traseras
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Cubierta delantera derecha
Avería: Faltante
Gravedad: Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Faltante
Parte: Guardabarro delantero derecho
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Guardabarro delantero derecho
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Guardabarro delantero derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Guardabarro delantero derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Guardabarro delantero derecho
Avería: Faltante
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 15
Parte: Guardabarro delantero derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 16
Parte: Guardabarro delantero derecho
Página 209 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 15
Parte: Guardabarro delantero derecho
Avería: Faltante
Gravedad: 8.5.1.8. Período 8: Año 2007 semestre 1.
Clasificación
Averías:
43 % de averías “Rayado – Rozado”.
25 % de averías “Abollado”.
20 % de averías “Faltante”.
8 % de averías “Pintura saltada”
Lugares:
48 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
19 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
17 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
7 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
5 % de averías en “Retiro de Puerto”. Imputación puerto.
Modelos:
47 % de averías en Modelo 20.
24 % de averías en Modelo 5.
9 % de averías en Modelo 13.
7 % de averías en Modelo 9.
4 % de averías en Modelo 17.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 64 – 2 %.
Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada: 68 – 2 %.
Tapa posterior de techo, Abollado, Observada: 76 – 3 %.
Luz de neblina trasera, Faltante, Observada: 437 – 14 %.
Zócalo derecho, Faltante: 2377 – 78 %.
General:
Zócalo derecho, Faltante.
Lugar - Parte – Avería:
Ingreso a Puerto, Puerta trasera izquierda, Proyección: 599 – 20 %.
Página 210 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Transferencia ubicación y línea de carga, Guardabarro trasero derecho, Pintura saltada: 288
– 10 %.
Bajada de Buque, Moldura protectora lateral derecha, Faltante: 910 – 30 %.
Transferencia ubicación y línea de carga, Techo (inclusive convertible), Rayado – Rozado:
510 – 17 %.
Transferencia ubicación y línea de carga, Manual, Faltante: 722 – 24 %.
General:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.
Lugar - Parte - Avería – Gravedad:
Ingreso a Puerto, Zócalo izquierdo, Abollado, Observada: 57 – 2 %.
Transferencia ubicación y línea de carga, Puerta trasera izquierda, Rayado – Rozado,
Observada: 68 – 2 %.
Transferencia ubicación y línea de carga, Tapizado interno puerta delantera izquierda,
Rayado – Rozado, Observada: 160 – 5 %.
Subida Buque Puerto de Origen, Panel lateral derecho, Abollado, Observada: 349 – 12 %.
Transferencia ubicación y línea de carga, Zócalo derecho, Faltante: 2377 - 78 %.
General:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.
Modelo - Área – Avería:
Modelo 5, Capot, Rayado – Rozado: 105 – 3 %.
Modelo 5, Manijas externas de puertas traseras, Proyección: 316 – 10 %.
Modelo 7, Parrilla delantera, Faltante: 730 – 24 %.
Modelo 19, Zócalo izquierdo, Abollado: 455 – 15 %.
Modelo 13, Guardabarro delantero izquierdo, Abollado: 206 – 7 %.
Modelo 20, Limpiador y lavador de parabrisas, Proyección: 1110 – 37 %.
Modelo 14, Techo corredizo, Faltante: 90 – 3 %.
General:
Modelo 14, Zócalo derecho, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 20 – 4
%.
Modelo 20, Tapa de Baúl o Puerta Trasera, Rayado – Rozado, Observada: 45 – 10 %.
Modelo 17, Manijas externas de puertas traseras, Proyección, Observada: 57 – 12 %.
Modelo 20, Cubierta delantera izquierda, Rayado – Rozado, Observada: 260 – 56 %.
Modelo 11, Panel lateral derecho, Faltante, Observada: 5 – 1 %.
Modelo 14, Zócalo derecho, Faltante: 74 – 16 %.
General:
Modelo 14, Zócalo derecho, Faltante.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Página 211 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Parte: Manual
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Guardabarro delantero derecho
Avería: Faltante
Gravedad: Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Faltante
Parte: Zócalo derecho
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Zócalo derecho
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Retiro de Puerto
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 13
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 16
Parte: Zócalo derecho
Avería: Faltante
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 15
Parte: Zócalo derecho
Avería: Faltante
Gravedad: -
Página 212 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8.5.1.9. Período 9: Año 2007 semestre 2.
Clasificación
Averías:
66 % de averías “Rayado – Rozado”.
14 % de averías “Abollado”.
9 % de averías “Faltante”.
8 % de averías “Pintura saltada”
Lugares:
63 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
16 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
7 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
4 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
Modelos:
54 % de averías en Modelo 20.
24 % de averías en Modelo 7.
12 % de averías en Modelo 5.
5 % de averías en Modelo 13.
2 % de averías en Modelo 9.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Llanta trasera izquierda, Rayado – Rozado, Observada: 67 – 1 %.
Cubierta trasera derecha, Rayado – Rozado, Observada: 76 – 2 %.
Guardabarros y parante trasero izquierdo, Rayado – Rozado, Observada: 176 – 4
Panel lateral derecho, Faltante, Observada: 438 – 9 %.
Techo corredizo, Proyección, Observada: 275 – 6 %.
Limpiador y lavador de parabrisas, Proyección: 3966 – 79 %.
%.
General:
Taza, Proyección.
Lugar - Parte – Avería:
Bajada de Buque, Capot, Rayado – Rozado: 27 – 1 %.
Bajada de Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 30 – 1 %.
Bajada de Buque, Barras de techo, Abollado: 147 – 3 %.
Bajada de Buque, Tapa acceso gancho remolque, Abollado: 520 – 10 %.
Ingreso a Puerto, Manijas externas de puertas delanteras, Proyección: 3082 – 62 %.
Transferencia ubicación y línea de carga, Faro de stop luneta, Rayado – Rozado: 1169- 23
%.
General:
Transferencia ubicación y línea de carga, Taza, Proyección.
Página 213 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Lugar - Parte - Avería – Gravedad:
Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado,
Observada: 72 – 1 %.
Ingreso a Puerto, Tapizado interno puerta delantera izquierda, Proyección, Observada: 239 –
5 %.
Transferencia ubicación y línea de carga, Tapa tanque combustible, Rayado – Rozado,
Observada: 233 – 5 %.
Ingreso a Puerto, Escape, Rayado – Rozado, Observada: 51 – 1 %.
Transferencia ubicación y línea de carga, Zócalo derecho, Rayado – Rozado, Observada:
100 – 2 %.
Subida Buque Puerto de Origen, Puerta delantera izquierda, Abollado, Observada: 62 – 1 %.
Subida Buque Puerto de Origen, Limpiador y lavador de parabrisas, Abollado, Observada:
266 – 5 %.
Transferencia ubicación y línea de carga, Limpiador y lavador de parabrisas, Proyección:
3966 – 79 %.
General:
Transferencia ubicación y línea de carga, Taza, Proyección.
Modelo - Área – Avería:
Modelo 7, Cable de carga, Rayado – Rozado: 356 – 7 %.
Modelo 6, Tapizado interno puerta delantera izquierda, Rayado – Rozado: 782 – 16 %
Modelo 7, Guardabarro trasero derecho, Pintura saltada: 704 – 14 %.
Modelo 14, Luz de neblina trasera, Abollado: 112 – 2 %.
Modelo 20, Limpiador y lavador de parabrisas, Proyección: 2716 – 54 %.
Modelo 13, Faro de stop luneta, Faltante: 27 – 1 %.
Modelo 13, Guardabarro trasero derecho, Abollado: 144 – 3 %.
Modelo 13, Techo (inclusive convertible), Abollado: 144 – 3 %.
General:
Modelo 14, Taza, Proyección.
Modelo - Área - Avería – Gravedad:
Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada: 65 – 1 %.
Modelo 20, Alfombra baúl / caja de carga, Rayado – Rozado, Observada: 165 - 3 %.
Modelo 8, Alfombra suplementarias, Proyección, Observada: 450 – 9 %.
Modelo 16, Llanta delantera derecha, Faltante, Observada: 354 – 7 %.
Modelo 7, Llanta delantera derecha, Faltante: 1598 – 32 %.
Modelo 20, Transponder, Proyección: 2346 – 47 %.
General:
Modelo 14, Taza, Proyección.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Cubierta delantera derecha
Avería: Proyección
Página 214 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Faltante
Parte: Cubierta delantera derecha
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Cubierta delantera derecha
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 12
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 13
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 13
Parte: Cubierta delantera derecha
Avería: Proyección
Gravedad: -
Página 215 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8.5.1.10. Período 10: Año 2008 semestre 1.
Clasificación
Averías:
41 % de averías “Rayado – Rozado”.
32 % de averías “Faltante”.
14 % de averías “Abollado”.
6 % de averías “Pintura saltada”
Lugares:
56 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
17 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
11 % de averías en “Subida a Buque”. Imputación puerto.
8 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.
6 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
Modelos:
48 % de averías en Modelo 20.
34 % de averías en Modelo 7.
8 % de averías en Modelo 5.
3 % de averías en Modelo 13.
3 % de averías en Modelo 9.
Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados.
Clustering
Área - Avería – Gravedad:
Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 75 – 2 %.
Paragolpe trasero / Spoiler trasero, Proyección, Observada: 145 – 3 %.
Moldura protctora lateral izquierda, Rayado – Rozado, Observada: 828 - 17 %.
Retrovisor externo derecho, Faltante: 3932 - 79 %.
General:
Zócalo derecho, Faltante.
Lugar - Parte – Avería:
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado
– Rozado: 176 – 4 %.
Transferencia ubicación y línea de carga, Tapa posterior de techo, Rayado – Rozado: 717 –
14 %.
Bajada de Buque, Panel lateral derecho, Faltante: 834 – 17 %.
Transferencia ubicación y línea de carga, Manijas externas de puertas traseras, Reventado –
Estallado: 204 – 4 %.
Transferencia ubicación y línea de carga, Giro Delantero (derecho / izquierdo), Faltante:
3031 – 61 %.
Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado: 38 – 1
%.
Página 216 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
General:
Transferencia ubicación y línea de carga, Zócalo derecho, Faltante.
Lugar - Parte - Avería – Gravedad:
Ingreso a Puerto, Giro Delantero (derecho / izquierdo), Pintura saltada, Observada: 44 – 1
%.
Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada: 255 – 5
%.
Bajada de Buque, Moldura protectora lateral derecha, Abollado, Observada: 116 – 2 %.
Transferencia ubicación y línea de carga, Llanta delantera izquierda, Rayado – Rozado,
Observada: 402 – 8 %.
Ingreso a Puerto, Encendedor, Manchado, Observada: 235 – 5 %.
Transferencia ubicación y línea de carga, Retrovisor externo derecho, Faltante: 3932 – 79 %.
General:
Transferencia ubicación y línea de carga, Zócalo derecho, Faltante.
Modelo - Área – Avería:
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado: 181 - 4 %.
Modelo 20, Manijas externas de puertas delanteras, Proyección: 290 - 6 %.
Modelo 13, Techo corredizo Pintura saltada, 186 - 4 %.
Modelo 8, Capot, Faltante: 35 - 1 %.
Modelo 10, Cristales de parante delantero, Reventado – Estallado: 60 - 1 %.
Modelo 19, Puerta trasera derecha, Faltante: 2040 - 41 %.
Modelo 7, Panel lateral derecho, Proyección: 2199 - 44 %.
General:
Modelo 13, Zócalo derecho, Faltante.
Modelo - Área - Avería – Gravedad:
Modelo 20, Guardabarro delantero izquierdo, Rayado – Rozado, Observada: 102 - 2 %.
Modelo 7, Conjunto carrocería, Manchado, Observada: 163 - 3 %.
Modelo 7, Giro Delantero (derecho / izquierdo), Rayado – Rozado, Observada: 560 - 11 %.
Modelo 16, Limpiador y lavador de parabrisas, Faltante, Observada: 202 - 4 %.
Modelo 14, Retrovisor externo derecho, Faltante: 3932 - 79 %.
General:
Modelo 13, Zócalo derecho, Faltante.
Predicción
Parte:
Con variación de Avería los valores predictivos resultan:
Parte: Manual
Avería: Proyección
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Parte: Taza
Avería: Proyección
Gravedad: Página 217 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Avería:
Con variación de Parte los valores predictivos resultan:
Avería: Faltante
Parte: Puerta delantera derecha
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Avería: Faltante
Parte: Puerta delantera derecha
Gravedad: Lugar:
Con variación de Parte los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Puerta delantera derecha
Avería: Proyección
Gravedad: Con variación de Avería los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Puerta delantera derecha
Avería: Proyección
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Lugar: Transferencia ubicación y línea de carga
Parte: Puerta delantera derecha
Avería: Proyección
Gravedad: Modelos:
Con variación de Parte los valores predictivos resultan:
Modelo: Modelo 10
Parte: Puerta delantera derecha
Avería: Proyección
Gravedad: Con variación de Avería los valores predictivos resultan:
Modelo: Modelo 10
Parte: Puerta delantera derecha
Avería: Proyección
Gravedad: Con variación de Gravedad los valores predictivos resultan:
Modelo: Modelo 10
Parte: Puerta delantera derecha
Avería: Proyección
Gravedad: 8.5.2. Evaluación de los resultados en términos de objetivos de negocio.
En este ítems se van a describir los resultados obtenidos de la explotación de datos en función de los
objetivos de negocio propuesto para el presente estudio.
Cada período analizado contiene como resultado información detallada sobre daños, tipo de daños,
lugares, transportes y modelos de autos, los cuales se encuentran relacionados entre si y permiten
ver un comportamiento que se va a tratar de describir claramente.
Página 218 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Existen objetivos de negocios específicamente vinculados con resultados estadísticos como
cantidades, cantidades totales, porcentajes, máximos, mínimos, etc. los cuales fueron explicitados
en los puntos desarrollados por el proyecto en la parte de exploración de datos, evaluación de
resultados y resumen de los resultados obtenidos. Ahora se va a tratar de describir los
comportamientos y conductas de los datos explotados para de esta forma concluir con la evaluación
final de la minería de datos desarrollada.
8.5.2.1. Tipos de averías.
Los Tipos de Averías predominantes a lo largo de los períodos analizados son abollados, rayados o
rozados, pinturas saltadas y faltantes. Entre estos 4 Tipos de Averías se encuentra más del 90 % de
los siniestros en cada período.
El período 1 y 2 se caracteriza en primer lugar por el Tipo de Avería abollado con 59 y 50 %
respectivamente, luego el rayado o rozado con 22 y 29 % respectivamente y luego el pintura
saltada con el 10 % y 14 % respectivamente. En el segundo período aparece la avería faltante con el
3 % de ocurrencia. Y finalmente en el período 2 aparece por única vez a un nivel aceptable de
ocurrencia para ser mencionado el Tipo de Avería manchado con un 3 %.
Luego analizando el período 3 se puede ver que los niveles de ocurrencia de las averías cambia
teniendo en primer lugar los abollados con 44 %, luego el 34 % para rayados o rozados, en tercer
lugar el 15 % de averías son pintura saltada y finalmente el 5 % de tipo de averías son faltantes.
El cuarto y quinto período contienen exactamente los mismos tipos de averías con un leve cambio
en la distribución de los porcentajes de ocurrencia. Esto es, en primer lugar el Tipo de Avería
rayado o rozado con 45 y 48 % para cada período respectivamente, luego aparecen los abollados
con 28 y 29 % respectivamente, en tercer lugar se encuentra el Tipo de Avería pintura saltada con el
15 y 13 % respectivamente, y para terminar, en ambos períodos aparece la ocurrencia de los
faltantes con el 7 y el 6 % respectivamente.
El período 6 presenta en la ocurrencia de los Tipos de Averías la misma distribución en cuanto a
porcentajes del período 3. O sea que en primer lugar se ve un 45 % de averías abollado, luego un 40
% de Tipos de Averías rayado o rozado, en tercer lugar pintura saltada con un 7 % y finalmente otro
7 % para los faltantes.
Los períodos 7, 8 y 9 presentan la ocurrencia exactamente de los mismos tipos de averías. Los
porcentajes se distribuyen de la siguiente forma: en primer lugar rayado o rozado con el 47, 43 y 66
% respectivamente, luego en segundo lugar los abollados con el 30, 25 y 14 % respectivamente, en
tercer lugar aparecen los faltantes con el 14, 20 y 9 % respectivamente, y finalmente se observan los
tipos de averías de pintura saltada con el 5 % para el período 7 y el 8 % para los períodos 8 y 9.
Para concluir con el análisis de los resultados de los Tipos de Averías ocurridos de éste punto se
puede ver que en el período 10 con un particular cambio en la posición de los porcentajes de
ocurrencia en el segundo lugar aparecen los faltantes con un 32 %. En primer lugar tenemos el
rayado – rozado con el 41 %. Y en el tercer y cuarto lugar se encuentran los abollados y pintura
saltada con el 14 y 6 % respectivamente.
Página 219 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8.5.2.2. Lugares.
Para los 6 primeros períodos del presente estudio los lugares predominantes donde ocurrieron las
averías son a la Subida de Buque en Puerto de Origen con el 74, 83, 76, 47, 32 y 42
respectivamente. Los motivos por los cuales se produjo el cambio son fundamentalmente por la
decisión política de la empresa vinculada a la implementación de mayores controles debido al alto
porcentaje de siniestralidad. Ese motivo no es incumbencia del presente estudio por lo cual solo es
mencionado sin realizar el estudio y/o análisis del cambio ejecutado por la compañía.
Los tres primeros períodos se caracterizan en segundo lugar por la ocurrencia de las averías en las
operaciones de Bajada de Buque con el 10, el 6 y el 9 % respectivamente. Los siguientes tres
períodos el segundo lugar de ocurrencia es Retiro Fábrica de Origen 15, 23 y 17 % respectivamente.
Para el tercer lugar en la ocurrencia de averías se haya el mismo comportamiento que para el
segundo lugar para los 6 primeros períodos. Esto es, los tres primeros períodos tienen como tercer
lugar de ocurrencia de averías el Ingreso a Puerto con el 5, el 6 y el 9 % respectivamente. Luego en
los siguientes tres períodos cambia por Bajada de Buque con 15, 20 y 15 % respectivamente.
Para concluir con el análisis de los 6 primeros períodos se ve que en el cuarto lugar para el período
1, 2 y 3 se encuentran los lugares de Transferencia Ubicación y Línea de Carga (5 %), Retiro de
Puerto (2 %) y Subida a Buque (4 %). Luego para los períodos 4, 5 y 6 se encuentra en cuarto lugar
la ocurrencia de averías en Ingreso a Puerto con el 13, 14 y 13 % de ocurrencia respectivamente.
Para los períodos 7, 8, 9 y 10 se produce un cambio en los porcentajes de ocurrencia de mayor a
menor nivel de averías. En el período 7 el mayor nivel de ocurrencia se ve en el Ingreso a Puerto
con el 40 %. Luego se reduce a un 21 % en la Bajada de Buque. En tercer lugar en el período 7 se
encuentra la Transferencia Ubicación y Línea de Carga y finalmente con un porcentaje mínimo del
10 % y 6 % se encuentran la Subida a Buque y Subida a Buque Puerto de Origen respectivamente.
Básicamente estos dos últimos lugares son similares operativamente pero se diferencian
específicamente por el lugar físico. Esta similitud será evaluada en los puntos siguientes donde se
analiza la imputabilidad de las averías en función de los tipos de transportes.
El período 8 y 9 coinciden en cuatro lugares con el mismo nivel de ocurrencia en porcentajes. En
primer término el lugar Transferencia Ubicación y Línea de Carga con el 48 y el 63 %
respectivamente. Luego en el segundo puesto el lugar Ingreso a Puerto con el 19 y 16 %
respectivamente. En tercer lugar las ocurrencias se producen en la Bajada de Buque con el 7 % en
ambos períodos. Para concluir el análisis de estos dos períodos se ve que en el período hay un
pequeño porcentaje (5 %) correspondiente al lugar Retiro de Puerto.
Para terminar con el análisis de los lugares donde se producen las averías se ve que en el período 10
el 56 % de ocurrencia de averías se produce en el lugar Transferencia Ubicación y Línea de Carga,
luego el segundo lugar donde se producen las averías con mayor frecuencia en es Ingreso a Puerto
con el 17 %. En tercer lugar se observa que la Subida a Buque tiene el 11 % de ocurrencia de
averías. Finalmente los lugares Subida a Buque Puerto de Origen y Bajada de Buque son los de
menor ocurrencia con el 8 y el 6 % respectivamente.
8.5.2.3. Modelos.
Como particular comportamiento se puede ver que en 9 de los 10 períodos analizados un 50 % ± 6
% de los datos explotados giran en torno a un solo modelo.
Página 220 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El primer período tiene al Modelo 9 (46 %) como de mayor ocurrencia de averías, seguido por el
Modelo 17 con el 29 %. En tercer lugar se encuentra el Modelo 5 y 20 con el 6 %, y finalmente con
el 5 % se ve la ocurrencia de averías sobre el Modelo 18 y 13.
Los períodos 2 y 3 tienen en primera instancia con mayor nivel de ocurrencia de averías al Modelo
17 (47 y 56 % respectivamente) y luego al Modelo 9 (32 y 15 % respectivamente). Luego en el
período 2 sigue el Modelo 13 con el 10 %, en cuarto lugar el Modelo 20 con el 6 % y finalmente el
Modelo 18 con el 4 %. Para el período 3 se ve que en el tercer lugar se encuentra el Modelo 20 con
el 12 %, luego el Modelo 13 con el 9 % y finalmente el Modelo 5 con el 5 % de ocurrencia de
averías.
En los períodos 4, 5 y 6 el Modelo con mayor cantidad de ocurrencia de averías es el 17 (51, 47 y
40 % respectivamente). Luego en el período 4 se ve el Modelo 20 con el 15 %, en tercer lugar el
Modelo 8 con el 12 % y en cuarto y quinto lugar los Modelos 9 y 5 con el 11 y el 5 %
respectivamente. El período 5 tiene en segundo lugar de ocurrencia de averías al Modelo 8 con el 16
%, luego el Modelo 9 con el 12 %, y finalmente el Modelo 5 y 20 con el 10 y el 5 %
respectivamente. El período 6 tiene en segundo lugar al Modelo 9 con el 21 %, luego en tercer lugar
el Modelo 5 con el 14 %, en cuarto lugar el Modelo 20 con el 12 % y finalmente el Modelo 8 con el
8 %.
Los períodos 7 y 8 se caracterizan por la mayor ocurrencia de averías en los Modelos 20 (50 y 47 %
respectivamente) y 5 (22 y 24 % respectivamente) en primer y segundo lugar respectivamente. En
el período 7 se ve en tercer lugar al Modelo 10 con el 10 % de ocurrencia de averías y luego los
Modelos 9 y 13 con el 7 y 4 % respectivamente. En el período 8 se encuentra en el tercer lugar de
ocurrencia de averías el Modelo 13 con el 9 % y luego los Modelos 9 y 17 con el 7 y el 4 %
respectivamente.
Finalmente analizados los datos del período 9 y 10 considerando la ocurrencia de averías en los
Modelos se puede ver que tienen la misma ubicación en porcentajes de ocurrencia. El Modelo 20 es
el de mayor ocurrencia con el 54 % para el período 9 y el 48 % para el período 10. En segundo
lugar en ambos períodos se encuentra el Modelo 7 con el 24 y el 34 % respectivamente para cada
período. Luego en tercer lugar se encuentra el Modelo número 5 con el 12 y el 8 % respectivamente
para cada período. El Modelo 13 ocupa el cuarto lugar de ocurrencia de averías con el 5 y 3 %
respectivamente. Para terminar se menciona con el menor porcentaje de ocurrencia el Modelo 9 con
el 2 y el 3 % de nivel de ocurrencia para los períodos 9 y 10 respectivamente.
8.5.2.4. Partes, Averías y Gravedad.
La estructura de las averías estudiadas en el presente proyecto es Parte + Avería + Gravedad. En
este punto se evalúan los resultados de la explotación de datos combinando los tres parámetros en
cada uno de los períodos.
Para el primer período se puede ver que la media general es:
Tapa acceso gancho remolque, Faltante, Mediano.
Es un tipo de daño válido y está relacionada con el robo de esa parte.
Los centroides que pueden representar un tipo de ocurrencia de avería mínimo son:
Luz trasera izquierda, Faltante, Mediano (13 %).
Cubierta delantera izquierda, Rayado – Rozado, Mediano (3 %).
En ambos casos su ocurrencia es poco probable y los porcentajes arrojados por la explotación de
datos no tienen relación con la realidad.
Página 221 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Finalmente para el primer período se observan los centroides compuesto por:
Panel lateral izquierdo, Abollado, Leve (21 %)
Panel lateral derecho, Abollado, Mediano (7 %)
Se puede concluir para este período que hay un comportamiento particular debido a que la media
global de daño no se corresponde con ninguno de los centroides formados. Posiblemente el
resultado se debe al hecho que el número que caracteriza al Tipo de Avería Faltante (7) se encuentra
entre los dos Tipos de Avería de mayor ocurrencia en el período (Abollado 6 y Rozado – Rayado
9).
El período dos está caracterizado por la media global igual al periodo anterior:
Tapa acceso gancho remolque, Faltante, Mediano.
Al igual que en el periodo anterior se puede ver que la media global no tiene relación con los datos
generados por los centroides que participan con resultado válido.
El centroide compuesto por:
Cristales de parante delantero, Faltante, Intolerable (6 %).
Tiene poco grado de ocurrencia en la realidad, pero puede llegar a tener aparición entre los
siniestros.
En cuanto al centroide real representativo de este periodo se encuentra:
Otros, Abollado, Leve (37 %).
Este tipo de daños está vinculado directamente a la posibilidad de encontrar abolladuras en
diferentes partes de las unidades.
Como conclusión de este periodo también se puede decir que el hecho de no haber relación entre la
media global y los resultados posibles obtenidos se debe a una cuestión específicamente
matemática.
Siguiendo con los centroides del periodos 3 se puede ver que la media global continúa siendo:
Tapa acceso gancho remolque, Faltante, Leve.
Pero la característica distintiva de la media para este período es que su gravedad es leve y no
mediana como en los dos períodos anteriores.
Este periodo se caracteriza por estos dos tipos de daños:
Paragolpe trasero / Zona contacto, Rayado – Rozado, Grave (1 %).
Tapa acceso gancho remolque, Faltante (89 %).
Aquí si se puede ver la relación directa entre la avería con nivel porcentual más alto ocurrido en el
período y la media global. Sin embargo no hay correspondencia entre el tipo de avería con mayor
cantidad de ocurrencia y el tipo de avería que compone el daño que caracteriza al centroide de
mayor porcentaje.
El periodo cuatro contiene como media global:
Guardabarro trasero derecho, Faltante.
Al evaluar la ocurrencia de este evento en la base de datos se puede ver que no tiene posibilidad real
de combinación. Posiblemente su aparición en la media es solo a los efectos de cálculos
matemáticos.
Analizando el centroide:
Zócalo izquierdo, Manchado, Observada (1 %).
Se puede concluir que el porcentaje de ocurrencia en la realidad es mínimo como está representado
por el porcentaje de la explotación de los datos.
En cuanto a los centroides que caracterizan a este periodo:
Capot, Rayado – Rozado, Observada (2 %).
Panel trasero bajo baúl, Rayado – Rozado, Observada (3%).
Llanta delantera izquierda, Abollado, Observada (18 %).
Página 222 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Se puede ver que las mismas son solo averías del tipo leve debido a que las mismas solo aparecen
como observaciones.
En el quinto periodo el daño con media global es:
Guardabarro delantero derecho, Faltante.
Este daño coincide con el daño de centroide de mayor ocurrencia de este periodo pero el mismo no
aparece en la base de datos estudiada. Al igual que en los casos anteriores posiblemente su
aparición solo se debe a cuestiones de cálculo matemático. Y para reforzar la conclusión también se
debe mencionar que la mayor cantidad de tipos de avería para este periodo no es el Faltante sino el
Abollado.
En cuanto a los centroides que aparecen con posibilidad de ocurrencia baja en la realidad se
encuentra:
Barras de techo, Rayado – Rozado, Observada (3 %).
El 3 % indica cantidad de ocurrencia numerosa en relación a la cantidad verificada sobre la base de
datos.
Los centroides que caracterizan este periodo son:
Retrovisor externo izquierdo, Pintura saltada, Observada (4 %).
Tapa tanque combustible, Rayado – Rozado, Observada (– 1 %).
Si bien no representan un porcentaje importante de ocurrencia son los únicos cuyo resultado en la
verificación de datos tienen ocurrencia válida.
Como en el periodo 5, en el periodo 6 la media global de daño ocurrido no encuentra validez
cruzando los datos de la base de datos explotada:
Zócalo derecho, Faltante.
Este daño no tiene posibilidad de ocurrencia real.
En cuanto a los centroides que caracterizan al periodo:
Capot, Rayado – Rozado, Observada (1 %).
Panel trasero bajo baúl, Rayado – Rozado, Observada (1 %).
Estos dos centroides representan un porcentaje mínimo de ocurrencia en función de la cantidad de
datos introducidos en el modelo.
En el periodo 7 tampoco se encuentra correspondencia entre la media global y los datos explotados:
Guardabarro delantero derecho, Faltante.
En cuanto al centroide que caracteriza este periodo se ve:
Bolsa de herramientas, Arrancado - Roto – Fisurado, Observada (1 %).
El porcentaje de ocurrencia es mínimo.
El periodo 8 tiene como media global:
Zócalo derecho, Faltante.
Y al igual que en el periodo anterior este centroide no represente ocurrencia real en la base datos.
En cuanto a los centroides representativo de este periodo:
Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (2 %).
Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada (2 %).
Luz de neblina trasera, Faltante, Observada (14 %).
El periodo 9 tiene como media global:
Taza, Proyección.
El centroide más importante no representa una avería real.
El cluster representativo de este periodo es:
Guardabarros y parante trasero izquierdo, Rayado – Rozado, Observada (4 %).
Página 223 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Llanta trasera izquierda, Rayado – Rozado, Observada (1 %).
Este representa un porcentaje mínimo de ocurrencia en la base de datos explotada.
La media global que representa este periodo es:
Zócalo derecho, Faltante.
Tampoco es una combinación de daño válida y además no se corresponde con el tipo de avería más
producido en este periodo.
Los centroides que representan este periodo son más representativos y arrojan mayor probabilidad
de ocurrencia que en los periodos anteriores:
Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (2 %).
Moldura protectora lateral izquierda, Rayado – Rozado, Observada (17 %).
Retrovisor externo derecho, Faltante (79 %).
Para finalizar con el desarrollo de este punto del Clustering de daños considerando Parte + Tipo de
Avería + Gravedad es difícil tomar como valores válidos factibles de dar algún tipo de información
en relación al comportamiento de las averías debido específicamente a que la combinación de los
parámetros que definen un daño es excluyente. Es decir que hay combinaciones de códigos de
partes, averías y gravedades que en la realidad no se van a producir e inclusive en la práctica
algunas veces son poco frecuentes y no justifican su estudio.
El desarrollo del Clustering evaluando cada uno de los grupos separando por cada una de sus partes
si resulta de validez para el modelo y si arroja resultados factibles de ser estudiados para determinar
un comportamiento de los siniestros.
En los puntos que continúan en el presente trabajo se seguirá evaluando la información suministrada
por el agrupamiento de datos considerando los daños imputables a un modelo o a un determinado
lugar, por lo tanto es viable la posibilidad que el agrupamiento de datos arroje resultados que
permitan representar fehacientemente el comportamiento de los daños en las unidades automotrices.
8.5.2.5. Lugares, Partes y Tipos de Averías.
Analizando el resultado del primer periodo podemos ver que la media global contemplando la
gravedad de una avería y sin contemplarla arrojan como daño:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante.
La gravedad de la media global es: Mediano.
En cuanto a los resultados sin contemplar la gravedad de la avería podemos ver:
Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante (87 %).
Luego se puede visualizar el siguiente resultado:
Transferencia ubicación y línea de carga, Luz de neblina trasera, Exceso kilometraje (6
%).
Transferencia ubicación y línea de carga, Luz de neblina trasera, Abollado (2 %).
Si bien tanto el lugar como la parte averiada suman un 8 % de ocurrencia, los porcentajes se dividen
entre el 6 % y 2 % para diferentes tipos de averías.
Finalmente se puede ver que los daños:
Ingreso a Puerto, Cubierta delantera derecha, Abollado (2 %).
Ingreso a Puerto, Paragolpe delantero / Superior, Rayado – Rozado (1 %).
Ingreso a Puerto, Techo corredizo, Faltante (1 %).
Ingreso a Puerto, Luz trasera izquierda, Abollado (1 %).
El 5 % del total de averías ocurren en el ingreso a puerto, pero las partes se distribuyen en tres
grupos 3 % de abolladuras, 1 % de rayados o rozados y 1 % de faltantes.
Página 224 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Si los datos procesados contemplan la gravedad de una avería los resultados cambian. Los daños
que encabezan el mayor porcentaje de ocurrencias son:
Subida Buque Puerto de Origen, Llave, Abollado, Leve (42 %).
Retiro de Puerto, Cristales de parante delantero, Abollado, Grave (20 %).
Subida Buque Puerto de Origen, Cable de carga, Faltante, Mediano (12 %).
Subida Buque Puerto de Origen, Guardabarro delantero izquierdo, Rayado – Rozado,
Mediano (2 %).
Analizando estos datos se puede ver que las averías ocurren en un 56 % en la subida a buque. Pero
los tipos de averías se dividen solo en tres, por un lado el 62 % de abolladuras, el 12 % son faltantes
y por otro solo el 2 % corresponde a rayados o rozados. Y en cuanto a las partes no sucede lo
mismo puesto que se dividen en 4 partes, el 42 % corresponden a llaves, el 20 % a los cristales de
parante delantero, el 12 % se refiere a los cables de carga o bien en un 2 % a guardabarros delantero
izquierdo. Finalmente se ve que los las gravedades varían en leves 42 %, graves 20 % y medianos
en un 2 %.
Luego se ve la siguiente distribución de ocurrencia de averías donde es considerada la gravedad:
Bajada de Buque, Tapizado interno puerta delantera izquierda, Rayado – Rozado,
Mediano (12 %).
Ingreso a Puerto, Moldura protectora lateral derecha, Rayado – Rozado, Leve (10 %).
Transferencia ubicación y línea de carga, Insignia, Faltante, Leve (2 %).
Solo se puede hacer la observación referida a que solo participa de esta distribución dos tipos de
averías por un lado el 22 % de rayados o rozados leves y por otro el 2 % de faltantes leves.
El segundo periodo tiene menor cantidad de centroides. En cuanto a la media global también como
en el periodo anterior con la participación y sin la participación de la severidad de los daños, la
avería es la misma y en el mismo lugar:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante.
Si se especifica la gravedad esta es media.
Sin la consideración de los datos de gravedad se observa:
Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante (92 %).
Además el resultado en evaluación tiene coherencia entre la avería y la parte del auto involucrada.
Para concluir con esta parte se pueden ver porcentajes mínimos en:
Transferencia ubicación y línea de carga, Otros, Abollado (3 %).
Transferencia ubicación y línea de carga, Puerta delantera izquierda, Rayado –
Rozado (1 %).
Ingreso a Puerto, Techo corredizo, Rayado – Rozado (2 %).
Ingreso a Puerto, Puerta trasera derecha, Rayado – Rozado (1 %).
Aquí se puede agrupar los lugares de averías en dos, el primero referido a la transferencia en línea
de carga (4 %) y el segundo en el ingreso a puerto (3 %). Mientras que los tipos de averías son
también son dos, rayados o rozados con un 4 % y los abollados con un 3 %. Las partes si están
divididas en cuatro partes en función de los centroides definidos.
Pasando a la evaluación de los resultados considerando la gravedad de las averías en los lugares en
estudio se ve que produce una dispersión de los porcentajes de mayor ocurrencia:
Bajada de Buque, Panel lateral izquierdo, Faltante, Leve (39 %).
Bajada de Buque, Llanta delantera derecha, Abollado, Leve (33 %).
El 72 % se produce en la bajada de un buque. En cuanto a los tipos de averías se observa faltantes
con el 39 % y abollados con el 33 %. Y en relación a las partes involucradas se puede ver que
ocurren en el panel lateral izquierdo y las llantas delanteras derechas. En los dos casos la gravedad
es solo leve.
Finalmente se ve que los porcentajes mínimos de ocurrencia de avería se producen según la
siguiente distribución:
Página 225 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Bajada de Buque, Cristales de parante delantero, Faltante, Intolerable (5 %).
Bajada de Buque, Llanta delantera derecha, Faltante, Grave (8 %).
Retiro de Puerto, Guardabarro trasero derecho, Faltante, Grave (13 %).
Ingreso a Puerto, Tapa posterior de techo, Pintura saltada, Mediano (2 %).
Se observa que el 13 % ocurren en la bajada de un buque, un 13 % en el retiro de un puerto y solo
un 2 % en ele ingreso a un puerto. En canto a los tipos de averías solo se presentan dos, los faltantes
con el 26 % y un 2 % para pinturas saltadas. En referencia a las partes involucradas estás se
distribuyen en cuatro en función de los centroides generados, un 13 % de guardabarros traseros
derechas, un 8 % de llantas delanteras derechas, un 5 % de cristales de parantes delanteros y un 2 %
de tapas posteriores de techo. Finalmente se observa que las gravedades encontradas se dividen en
tres grupos, 21 % de graves, 5 % de intolerables y 2 % de medias.
El tercer periodo se caracteriza por el daño global:
Retiro de Puerto, Tapa acceso gancho remolque, Faltante.
Y si se contempla la gravedad, esta es leve.
El lugar más importante donde ocurren las averías sin considerar su gravedad es:
Transferencia ubicación y línea de carga, Bolsa de herramientas, Faltante (87 %).
Luego en porcentajes mínimos se puede ver:
Ingreso a Puerto, Paragolpe trasero / Zona contacto, Rayado – Rozado (6 %).
Ingreso a Puerto, Luz de neblina trasera, Abollado (3 %).
Ingreso a Puerto, Barras de techo, Pintura saltada (1 %).
Ingreso a Puerto, Guardabarro trasero derecho, Pintura saltada (1 %).
Ingreso a Puerto, Luz de patente trasera, Rayado – Rozado (1 %).
Transferencia ubicación y línea de carga, Retrovisor externo izquierdo, Rayado –
Rozado (1 %).
Se observa que el 12 % de averías se produce en el ingreso a un puerto y solo el 1 % a los lugares
vinculados a la transferencia y línea de carga. En cuanto a las apartes afectadas se puede ver otra
distribución entre los porcentajes mínimos, esto es: un 6 % para los paragolpes traseros, un 3 %
para las luces de neblina trasera, un 1 % para las barras de techo al igual que los guardabarros
traseros derechos, las luces de patente traseras y los retrovisores externos izquierdos. En cuanto a
los tipos de averías se observa que el 8 % son rayados o rozados, el 3 % son abollados y solo un 1
% para pintura saltada.
Analizado los datos considerando la gravedad de las averías se observa:
Subida Buque Puerto de Origen, Otros, Faltante (78 %).
Se ve que el mayor porcentaje de incidentes se realiza a la subida a un buque.
Los porcentajes mínimos de ocurrencia se observan en:
Ingreso a Puerto, Retrovisor externo derecho, Proyección (11 %).
Subida Buque Puerto de Origen, Giro Delantero (derecho / izquierdo), Faltante, Grave
(9 %).
Ingreso a Puerto, Alfombra suplementarias, Proyección, Grave (1 %).
Ingreso a Puerto, Luz de neblina trasera, Faltante, Grave (1 %).
El 13 % ocurre al ingreso a un puerto mientras que un 9 % ocurre a la subida a un buque. En cuanto
a las partes que intervienen se observa que el 11 % se produce en retrovisores externos derechos, un
9 % en giros delanteros derechos o izquierdos, un 1 % son sobre las alfombras suplementarias y un
1 % sobre las luces de neblina trasera. En relación a los tipos de averías se observa que el 12 % son
de tipo proyección y un 10 % de faltantes. Finalmente se observa que las averías ocurridas son
graves.
Página 226 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
El cuarto periodo se caracteriza por averías global en retiro de puerto. Las partes que hacen a la
media global son el guardabarros trasero derecho. En cuanto al tipo de avería de la media son los
faltantes. La severidad de las averías de la media si es considerada es grave.
Los porcentajes de averías si la consideración de la gravedad no es tenida en cuenta es la siguiente:
Retiro de Puerto, Puerta trasera derecha, Faltante (81) %)
El mayor índice de siniestralidad no coincide con la media global solo en la parte dañada pero si en
el lugar y el tipo de daño.
Luego los porcentajes de siniestralidad bajan agrupándose de la siguiente manera:
Ingreso a Puerto, Capot, Rayado – Rozado (2 %).
Subida Buque Puerto de Origen, Tapa posterior de techo, Rayado – Rozado (3 %).
Retiro de Puerto, Taza, Faltante (6 %).
Retiro de Puerto, Llanta delantera izquierda, Faltante (8 %).
El 3 % se producen en la subida al buque, el 2 % en el ingreso a puerto y el 14 % en el retiro de
puerto. Las averías en los dos primero lugares son rayados y rozados y en retiro de puerto son
faltantes. Y las partes de los autos involucradas se dividen en un 2 % capot, un 3 % a las tapas
posteriores de techos, un 6 % a las tazas y 8 % a las llantas delanteras izquierdas.
Si la gravedad es considerada el mayor porcentaje de ocurrencia es en:
Bajada de Buque, Zócalo derecho, Faltante (60 %).
Luego los porcentajes se agrupan de la siguiente forma:
Subida Buque Puerto de Origen, Escape, Faltante, Observada (22 %).
Ingreso a Puerto, Cubierta delantera derecha, Faltante (11 %).
Ingreso a Puerto, Luz de neblina trasera, Proyección, Observada (4 %).
Ingreso a Puerto, Capot, Rayado – Rozado, Observada (2 %).
Ingreso a Puerto, Parabrisa, Faltante, Observada (1 %).
El 22 % se produce en la subida a buque y el 18 % en el ingreso a puerto. En referencia a las partes
se distribuyen en 11 % cubiertas delanteras derechas, 4 % luces de neblina traseras, 2 % en capot y
el 1 % en parabrisas. En relación a los tipos de averías se dividen en faltantes con un 34 %, un 4 %
proyecciones y un 2 % rayados o rozados. Y finalmente la severidad de las averías se distribuye en
un 29 % de solo observaciones y 11 % graves.
La media global para el quinto periodo se define en:
Retiro de Puerto, Guardabarro delantero derecho, Faltante.
La severidad es grave si es considerada.
Si no se considera la gravedad de las averías la ocurrencia de los siniestros se desarrolla de la
siguiente manera:
Retiro de Puerto, Cristales de parante delantero, Faltante (66 %).
Luego el porcentaje baja y se distribuye como sigue:
Retiro Fábrica de Origen, Paragolpe trasero / Spoiler trasero, Rayado – Rozado (26
%).
Bajada de Buque, Antena, Proyección (5 %).
Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado - Rozado
(2
%).
Bajada de Buque, Paragolpe delantero / Superior, Rayado – Rozado (1 %).
Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero Rayado –
Rozado (1 %).
En retiro de fábrica se produce el 26 % de las averías de este periodo, en bajada de buque el 8 % y
el 1 % en subida a buque. Luego analizando los resultados de las partes se ve que el paragolpe
delantero o protector delantero tiene un 3 %, antenas un 5 % y el 26 % los paragolpes traseros o
Página 227 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
spoilers traseros. En cuanto a las averías estás se caracterizan por rayado o rozado 30 % y el 5 %
proyecciones.
Considerando la gravedad de las averías se observa que el mayor porcentaje de siniestralidad de
este periodo es:
Subida Buque Puerto de Origen, Guardabarro delantero derecho, Faltante (76 %).
Luego los menores porcentajes se definen en los siguientes centroides:
Ingreso a Puerto, Llanta delantera derecha, Proyección, Observada (6 %).
Bajada de Buque, Zócalo derecho, Faltante, Observada (4 %).
Ingreso a Puerto, Llanta delantera izquierda, Proyección (3 %).
Ingreso a Puerto, Techo (inclusive convertible), Rayado – Rozado (2 %).
Ingreso a Puerto, Otros, Abollado (5 %).
Ingreso a Puerto, Techo (inclusive convertible), Pintura saltada (4 %).
En ingreso a puerto se produce el 20 % y el 4 % en la bajada de buque. En referencia a los tipos de
averías se subdividen en 9 % proyecciones, faltantes 4 %, rayados o rozados 2 %, un 5 % de
abollados y el 4 % pinturas saltadas. Observando las partes afectadas éstas se dividen en llantas
delanteras derechas el 6 %, llanta delanteras izquierdas 3 %, zócalos derechos 4 %, techos
(inclusive convertibles) 2 % y otros el 5 %. Finalmente se observa que el 10 % son solo
observaciones y el 14 %
A continuación se realiza la evaluación de los datos explotados para el periodo seis. Se puede ver
que la media global está constituida por:
Retiro de Puerto, Zócalo derecho, Faltante.
Y si la severidad es considerada esta es grave.
Analizados los datos del periodo seis sin la consideración de la gravedad de las averías se observa
como ocurrencia predominante:
Subida Buque Puerto de Origen, Guardabarro trasero derecho, Faltante (79 %).
El lugar especificado y el daño no coincide con la media global salvo en el tipo de avería que es
Faltante.
En cuanto a los porcentajes de ocurrencia menor esos se distribuyen de la siguiente manera:
Ingreso a Puerto, Tapa acceso gancho remolque, Faltante (12 %).
Ingreso a Puerto, Zócalo interno puerta delantera izquierda, Rayado – Rozado (3 %).
Ingreso a Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado (2 %).
Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado (1 %).
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero,
Rayado – Rozado (1 %).
Transferencia ubicación y línea de carga, Llave, Abollado (1 %).
Se observa que el 15 % de las averías se producen en el ingreso a un puerto. Las partes
intervinientes son las tapas de acceso a gancho de remolque con un 12 %, luego los zócalos internos
de puerta delantera izquierda con el 3 %, el paragolpe delantero o protector delantero con un 3 %, el
spoiler delantero con el 1 % al igual que las llaves con el 1 %. Luego se observa que las averías se
distribuyen en: un 7 % de rayados o rozados, un 12 % de faltantes y solo un 1 % de abollados.
Pasando al caso donde las severidades son consideradas se observa lo siguiente:
Bajada de Buque, Zócalo derecho, Faltante (88 %).
El mayor porcentaje de ocurrencia tampoco coincide con la media global del periodo salvo en el
tipo de averías que es Faltante.
Luego en porcentajes inferiores se observa:
Bajada de Buque, Tapa acceso gancho remolque, Abollado, Observada (7 %).
Bajada de Buque, Moldura protectora lateral derecha, Faltante, Observada (3 %).
Ingreso a Puerto, Tapa posterior de techo, Rayado – Rozado, Observada (1 %).
Página 228 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Transferencia ubicación y línea de carga, Puerta trasera izquierda, Abollado,
Observada (1 %).
Los daños ocurren en un 10 % a la bajada del buque, en un 1 % en el ingreso al puerto y al igual
que en la transferencia de ubicación y línea de carga. En referencia a los tipos de averías se observa
que el 8 % son abollados, el 3 % faltantes y el 1 % rayados o rozados. En cuanto a las partes
observadas se ve que el 7 % pertenece a las tapas de acceso a gancho de remolque, el 3 % a moldura
protectora lateral derecha, y el 1 % para tapa posterior de techo al igual que la puerta trasera
izquierda. Finalmente se observa que la severidad de la avería es solamente observable en todos los
casos (12 %).
La media global del séptimo periodo está caracterizada por los daños:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.
Si la gravedad es considerada entonces esta es grave.
Observando los resultados del procesamiento sin considerar la gravedad de los daños se puede ver
que hay una distribución homogénea de los centroides. Esto es:
Ingreso a Puerto, Parabrisa, Proyección (33 %).
Bajada de Buque, Guardabarro delantero izquierdo, Abollado (18 %).
Ingreso a Puerto, Faro de stop luneta, Abollado (18 %).
Ingreso a Puerto, Llave, Rayado – Rozado (16 %).
Bajada de Buque, Manijas externas de puertas traseras, Proyección (12 %).
Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado (2 %).
Las averías son producidas en un 67 % en el ingreso a puerto y el 32 % en la bajada de buque. En
referencia a las partes afectadas se divide en: un 33 % de parabrisas, 18 % guardabarros delanteros
izquierdos al igual que los faros de stop de luneta, el 17 % de llaves, el 12 % de manijas externas de
puertas traseras y el 2 % de paragolpes delanteros o protectores delanteros. Finalmente los tipos de
averías son de proyección en un 45 %, un 36 % de abollados y el 18 de rayados o rozados.
Luego analizando los resultados del proceso contemplando la severidad de las averías el resultado
es:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante (86
%).
En esta parte si el resultado muestra un mayor predominio en un centroide con casi un 90 % de
ocurrencia. Además se observa que tanto el lugar como la avería coinciden con la media global.
Luego los centroides se dividen en menor porcentaje de la siguiente manera:
Ingreso a Puerto, Guardabarro delantero derecho, Faltante, Observada (10 %).
Bajada de Buque, Parrilla delantera, Abollado, Observada (3 %).
Bajada de Buque, Panel trasero bajo baúl, Rayado – Rozado, Observada (1 %).
Bajada de Buque, Alfombra suplementarias, Proyección, Observada (1 %).
Los lugares de ocurrencia se mantienen como en el ítem anterior. El 10 % suceden en el ingreso al
puerto y el 5 % en la bajada de buque. En cuanto a las partes que intervienen se observa el 10 % son
guardabarros delanteros derechos, el 3 % en parrillas delanteras, y el 1 % tanto para los paneles
traseros bajo baúl como para alfombras suplementarias. En referencia al tipo de averías estas se
subdividen en 10 % de faltantes, 3 % de abollados, y 1 % de rayados y rozados al igual que
proyecciones. Finalmente se ve que la gravedad de las averías son solo observadas (15 %).
El octavo periodo es caracterizado por la media global:
Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.
Esta es la misma que para el periodo anterior tanto en el lugar de ocurrencia como el tipo de avería
y la gravedad de la misma.
Página 229 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Luego si se analiza detalladamente la distribución de las averías sin considerar la gravedad del
mismo se observa una distribución pareja entre los diferentes centroides generados.
Esto es:
Bajada de Buque, Moldura protectora lateral derecha, Faltante (30 %).
Transferencia ubicación y línea de carga, Manual, Faltante (24 %).
Ingreso a Puerto, Puerta trasera izquierda, Proyección (20 %).
Transferencia ubicación y línea de carga, Techo (inclusive convertible), Rayado –
Rozado (17 %).
Transferencia ubicación y línea de carga, Guardabarro trasero derecho, Pintura
saltada (10 %).
Los lugares de ocurrencia se distribuyen entre un 30 % en la bajada de buque, el 51 % en la
transferencia de ubicación de línea de carga y el 20 en el ingreso a puerto. En referencia a las partes
averiadas se observa el 30 % en moldura protectora lateral derecha, el 24 % de manuales, el 20 de
puertas traseras izquierdas, el 17 % techos (inclusive convertibles) y el 10 % de guardabarros
traseros derechos. En relación a los tipos de averías se observa que el 54 % son faltantes, el 20 %
son proyecciones, el 17 % de rayados y rozados y el 10 de pinturas saltadas.
Analizando los datos considerando la gravedad de las averías se observa que, al igual que en el
periodo anterior, se centralizan en un centroide. Esto es:
Transferencia ubicación y línea de carga, Zócalo derecho, Faltante (78 %).
Donde la misma coincide con la media global en el lugar, el tipo de avería y la gravedad.
Luego se observa que:
Subida Buque Puerto de Origen, Panel lateral derecho, Abollado, Observada (12 %).
Transferencia ubicación y línea de carga, Tapizado interno puerta delantera izquierda,
Rayado – Rozado, Observada (5 %).
Ingreso a Puerto, Zócalo izquierdo, Abollado, Observada (2 %).
Transferencia ubicación y línea de carga, Puerta trasera izquierda, Rayado – Rozado,
Observada (2 %).
Los lugares se distribuyen en el 12 % en subida a buque, el 7 % en transferencia ubicación y línea
de carga, y el 2 % en el ingreso a puerto. Las partes afectadas se subdividen en 12 % de paneles
laterales derechos, 5 % de tapizados internos de puertas delanteras izquierdas, 2 % en zócalos
izquierdos y el 2 % en puertas traseras izquierdas. En referencia a los tipos de averías son el 14 %
de abollados y el 7 % de rayados y rozados. Por último la severidad es grave.
El penúltimo periodo en estudio se caracteriza por la media de ocurrencia global:
Transferencia ubicación y línea de carga, Taza, Proyección.
Con gravedad si es tenida en cuenta, grave.
Si la gravedad no es considerada el centroide más importante es:
Ingreso a Puerto, Manijas externas de puertas delanteras, Proyección (62 %).
Luego se dividen de la siguiente forma:
Transferencia ubicación y línea de carga, Faro de stop luneta, Rayado – Rozado (23
%).
Bajada de Buque, Tapa acceso gancho remolque, Abollado (10 %).
Bajada de Buque, Barras de techo, Abollado (3 %).
Bajada de Buque, Capot, Rayado – Rozado (1 %).
Bajada de Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado (1 %).
El 23 % se produce en la transferencia ubicación y línea de carga y el 15 % en la bajada de buque.
Las partes afectadas son: un 23 % de faros de stop de lunetas, 10 % tapas de ganchos de remolque,
3 % barras de techos, 1 % en capot y zócalo interno de puertas delanteras izquierdas. Mientras que
el tipo de avería es 25 % de rayados o rozados y el 13 % de abollados.
Si la gravedad del daño es considerada entonces el centroide más importante es:
Página 230 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Transferencia ubicación y línea de carga, Limpiador y lavador de parabrisas,
Proyección (79 %).
No coincide totalmente con la media global.
Luego los porcentajes mínimos ocurren de la siguiente forma:
Subida Buque Puerto de Origen, Limpiador y lavador de parabrisas, Abollado,
Observada (5 %).
Transferencia ubicación y línea de carga, Tapa tanque combustible, Rayado – Rozado,
Observada (5 %).
Ingreso a Puerto, Tapizado interno puerta delantera izquierda, Proyección, Observada
(5 %).
Transferencia ubicación y línea de carga, Zócalo derecho, Rayado – Rozado,
Observada (2 %).
Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado,
Observada (1 %).
Ingreso a Puerto, Escape, Rayado – Rozado, Observada (1 %).
Subida Buque Puerto de Origen, Puerta delantera izquierda, Abollado, Observada (1
%).
El 6 % se observa en la subida a buque de puerto de origen, luego el 8 % en la transferencia
ubicación y línea de carga, el 6 % en el ingreso a puerto. Las partes que intervienen son: el 5 % el
limpiador y lavador de parabrisas, el 5 % de tapas de tanque de combustible, el 5 % de tapizado
interno de la puerta delantera izquierda, el 2 % del zócalo derecho, el 1 % de las llantas traseras
izquierdas, el 1 % del escape y el 1 % puertas delanteras izquierdas. Luego el tipo de avería se
divide en un 6 % de abollados, 9 % rayados o rozados y 5 % de proyecciones.
El último periodo se caracteriza por la media:
Transferencia ubicación y línea de carga, Zócalo derecho, Faltante.
Con el tipo de severidad grave si es considerada.
Si no se considera la severidad entonces el centroide de mayor peso es:
Transferencia ubicación y línea de carga, Giro Delantero (derecho / izquierdo),
Faltante (61 %).
Luego baja de forma considerable y se distribuye de la siguiente forma:
Bajada de Buque, Panel lateral derecho, Faltante (17 %).
Transferencia ubicación y línea de carga, Tapa posterior de techo, Rayado – Rozado
(14 %).
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero,
Rayado – Rozado (4 %).
Transferencia ubicación y línea de carga, Manijas externas de puertas traseras,
Reventado – Estallado (4 %).
Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado
(1 %).
El 17 % se producen en la bajada del buque y el 23 % en transferencia ubicación y línea de carga.
Las partes afectadas son: 17 % de paneles laterales derechos, 14 % de tapa posterior de techo, 4 %
de paragolpe delantero y protector delantero, 4 % de manijas externas de puertas traseras y el 1 %
de llantas traseras izquierdas. Lo tipos de averías son: 19 % de rayados o rozados y el 4 % de
estallados.
Si los datos de la gravedad de las averías son considerados entonces la ocurrencia de los daños es la
siguiente. El máximo porcentaje está centralizado en
Transferencia ubicación y línea de carga, Retrovisor externo derecho, Faltante: (79
%).
Como en el punto anterior no coincide con la media global.
Página 231 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Luego los porcentajes se reducen y queda conformado de la siguiente manera:
Transferencia ubicación y línea de carga, Llanta delantera izquierda, Rayado –
Rozado, Observada (8 %).
Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada (5
%).
Ingreso a Puerto, Encendedor, Manchado, Observada (5 %).
Bajada de Buque, Moldura protectora lateral derecha, Abollado, Observada (2 %).
Ingreso a Puerto, Giro Delantero (derecho / izquierdo), Pintura saltada, Observada (1
%).
El 8 % ocurre en la transferencia de ubicación y línea de carga, el 11 % en el ingreso a puerto y el 2
% en la bajada de buque. Las partes afectadas se dividen en 8 % llanta delantera izquierda, 5 % de
paragolpes traseros o spoilers traseros, 5 % de encendedores, 2 % de molduras protectoras laterales
derechas, y 1 % giro delantero (derecho o izquierdo). Los tipos de averías son rayados o rozados 13
%, manchados 5 %, abollados 2 % y pintura saltada un 1 %.
8.5.2.6. Modelos, Partes y Tipos de Averías.
A continuación se realiza una evaluación de los resultados vinculados con la ocurrencia de averías
en los modelos de autos en estudio. Se contemplan como en el ítem anterior el análisis de daños con
consideración de la severidad y sin la consideración de ella.
El primer periodo tiene como media global:
Modelo 12, Tapa acceso gancho remolque, Faltante.
Y si la gravedad es considerada esta es mediana.
Luego se observa la siguiente distribución de los centroides formados:
Modelo 10, Manual, Abollado (25 %).
Modelo 10, Panel lateral izquierdo, Abollado (22 %).
Modelo 18, Cubierta delantera derecha, Rayado – Rozado (18 %).
Modelo 17, Cubierta delantera izquierda, Abollado (14 %).
Modelo 4, Moldura protectora lateral derecha, Faltante (13 %).
Modelo 9, Cerraduras de puertas, Rayado – Rozado (6 %).
Modelo 10, Giro Delantero (derecho / izquierdo), Rayado – Rozado (2 %).
El modelos 10 tiene el 49 % de participación entre los daños detectados, luego el modelo 18 tiene el
18 %, el modelo 17 con un 14 %, el modelo 4 con un 13 % y finalmente el modelo 9 con solo un 6
%. En referencia a las partes que intervienen estas se subdividen en: 25 % manual, 22 % panel
lateral izquierdo, 18 % cubierta delantera derecha, 14 % cubierta delantera izquierda, 13 % en
moldura protectora lateral derecha, 6 % en cerraduras de puertas, y el 6 % en giros delanteros
(derechos o izquierdos). Finalmente el tipo de avería se divide en: 61 % de abollados, 26 % rayados
y rozados y el 13 % de faltantes.
La producción de averías considerando la gravedad tiene el siguiente el siguiente comportamiento:
Modelo 11, Luz de neblina trasera, Faltante, Leve (59 %).
Modelo 15, Puerta trasera derecha, Faltante, Grave (16 %).
Modelo 5, Giro Delantero (derecho / izquierdo), Faltante, Intolerable (8 %).
Modelo 17, Panel lateral derecho, Rayado – Rozado, Mediano (6 %).
Modelo 16, Bolsa de herramientas, Abollado, Mediano (5 %).
Modelo 9, Manijas externas de puertas traseras, Rayado – Rozado, Mediano (3 %).
Modelo 18, Paragolpe trasero / Spoiler trasero, Faltante, Mediano (2 %).
Modelo 14, Retrovisor externo derecho, Pintura saltada, Mediano (1 %).
El modelo 11 tiene el 59 % de participación, el modelo 15 le sigue con un 16 %, luego se observa el
modelo 5 con el 8 %, el modelo 17 con el 6 %, el modelo 16 con el 5 %, el modelo 9 con el 3 %, el
Página 232 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
modelo 18 con el 2 % y al final el modelo 14 con un 1 %. Las partes afectadas son: 59 % luces de
neblinas traseras, puertas traseras derechas con el 16 %, los giros delanteros (derechos o
izquierdos) con el 8 %, el panel lateral derecho con el 6 %, bolsas de herramientas con un 5 %,
manijas externas de puertas traseras con el 3 %, el 2 para los paragolpes traseros o spoilers traseros
y el 1 % para los retrovisores externos derechos. En cuanto a los tipos de averías estos se
subdividen en: faltantes con el 85 %, 9 % los rayados o rozados, abollados el 5 % y pintura saltada
el 1 %. Luego la severidad tiene el siguiente comportamiento: el 59 % con leves, 16 % graves,
intolerables 8 %, y finalmente medianos 12 %.
El segundo periodo se caracteriza por la combinación:
Modelo 14, Tapa acceso gancho remolque, Faltante.
Y cuando la severidad es considerada esta es media.
Luego los centroides quedan conformados de la siguiente manera:
Modelo 10, Guardabarro delantero izquierdo, Abollado (34 %).
Modelo 17, Aerosol antipinchazos, Proyección (20 %).
Modelo 17, Alfombra baúl / caja de carga, Faltante (14 %).
Modelo 17, Puerta delantera derecha, Abollado (12 %).
Modelo 17, Cubierta delantera izquierda, Rayado – Rozado (8 %).
Modelo 8, Panel lateral izquierdo, Rayado – Rozado (5 %).
Modelo 6, Limpiador y lavador de parabrisas, Abollado (4 %).
Modelo 7, Zócalo interno puerta delantera izquierda, Rayado – Rozado (3 %).
El modelo 10 participa con el 34 %, el modelo 17 tiene el 54 % de las averías, el modelo 8 con el 5
%, el modelo 6 con el 4 % y el modelo 7 con el 3 %. Luego las partes involucradas son:
guardabarros delanteros izquierdos con el 34 %, aerosol antipinchazos 20 %, alfombra baúl o caja
de carga con el 14 %, puerta delantera derecha con el 12 %, cubierta delantera izquierda con el 8 %,
panel lateral izquierdo el 5 %, limpiador y lavador de parabrisas con el 4 % y al final zócalo interno
de puerta delantera izquierda con el 3 %. En cuanto a los tipos de averías se dividen de la siguiente
forma: abollados 50 %, proyección el 20 %, faltantes el 14 % y rayados o rozados con el 16 %.
Luego con la consideración de las gravedades los daños se distribuyen del siguiente modo:
Modelo 13, Puerta delantera izquierda, Faltante, Leve (47 %).
Modelo 17, Alerón, Faltante, Mediano (22 %).
Modelo 16, Guardabarro trasero derecho, Faltante, Grave (16 %).
Modelo 8, Giro Delantero (derecho / izquierdo), Faltante, Mediano (7 %).
Modelo 8, Cristales de parante delantero, Faltante, Grave (5 %).
Modelo 10, Barras de techo, Proyección, Mediano (2 %).
El modelo 13 con el 47 % de ocurrencia, luego el modelo 17 con el 22 %, el modelo 16 el 16 %, el
modelo 8 con el 12 % y finalmente el modelo 10 con el 2 %. Los tipos de averías se subdividen en:
faltantes 97 % y proyección con el 2 %. Las partes se subdividen en: 47 % de puertas delanteras
izquierdas, 22 % de alerones, con el 16 % guardabarros traseros derechos, el 7 % de giros
delanteros (derecho o izquierdo), el 5 % de cristales de parante delantero y el 2 % de barras de
techo. Finalmente la severidad de las averías se distribuye en: 47 % leves, 31 % medios y graves 21
%.
La media global del tercer periodo es:
Modelo 15, Tapa acceso gancho remolque, Faltante.
Y la severidad de la avería es leve si es considerada en el procesamiento.
Luego los centroides arrojan la siguiente información:
Modelo 9, Giro Delantero (derecho / izquierdo), Abollado (28 %).
Modelo 17, Cubierta delantera izquierda, Faltante (22 %).
Modelo 17, Guardabarro trasero derecho, Abollado (17 %).
Página 233 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 18, Limpiador y lavador de parabrisas, Proyección (14 %).
Modelo 17, Llave de rueda, Faltante (11 %).
Modelo 17, Tapa posterior de techo, Faltante (6 %).
Modelo 13, Puerta trasera izquierda, Abollado (2 %).
El modelo 9 ocurre en un 28 %, el modelo 17 el 56 %, el modelo 18 ocurre en un 14 % y las avería
en el modelo 13 se producen en un 2 %. Luego se observa que el comportamiento de las parte se
distribuye de la siguiente manera: 28 % en giros delanteros (derechos o izquierdos), 22 % en
cubierta delantera izquierda, el 17 % en guardabarros traseros derechos, el 14 % en limpiador y
lavador de parabrisas, 11 % en llaves de ruedas, el 6 % en tapa posterior de techo y el 2 % en
puertas traseras izquierdas. Finalmente se observa que el 47 % son tipos de averías abollados, el 37
% de faltantes y el 14 % de proyecciones.
Considerando las severidades de las averías se observa el siguiente comportamiento:
Modelo 15, Tapa acceso gancho remolque, Faltante (89 %).
En casi un 90 % de ocurrencia el modelo 15 es el más afectado. Y coincide ciento por ciento con la
media global.
Luego los porcentajes mínimos quedan distribuidos de la siguiente forma:
Modelo 17, Manual, Faltante, Grave (5 %).
Modelo 10, Faro de stop luneta, Abollado, Grave (3 %).
Modelo 4, Retrovisor externo derecho, Faltante, Grave (1 %).
Modelo 17, Puerta trasera izquierda, Faltante, Grave (1 %).
6 % modelo 17, modelo 10 el 3 % y el modelo 4 el 1 %. Luego se observa que las partes afectadas
son: manuales el 5 %, faros de stop de luneta el 3 %, 1 % de retrovisor externo derecho y también el
mismo porcentaje para las puertas traseras izquierdas. Luego se observa que el 7 % son faltantes y
el 3 % abollados. Finalmente el tipo de avería entre los porcentajes mínimos es siempre grave.
El cuarto periodo está caracterizado por el centroide.
Modelo 15, Guardabarro trasero derecho, Faltante.
Con severidad grave si es considerada.
Luego sin la consideración de la gravedad de averías los centroides dan la siguiente información:
Modelo 18, Panel trasero bajo baúl, Rayado – Rozado (32 %).
Modelo 8, Llanta delantera izquierda, Abollado (21 %).
Modelo 18, Escape, Proyección (15 %).
Modelo 17, Guardabarro delantero izquierdo, Pintura saltada (14 %).
Modelo 6, Limpiador de Faros (derecho / izquierdo), Proyección (10 %).
Modelo 17, Separador interno de carga, Proyección (6 %).
Modelo 17, Llanta delantera derecha, Pintura saltada (2 %).
Modelo 9, Parante delantero, Rayado – Rozado (1 %).
El 47 % corresponde al modelo 18, el modelo 8 el 21 %, el modelo 17 con el 22 %, el modelo 6 con
el 10 % y el modelo 9 con el 1 %. Las partes se subdividen en: 32 % el panel trasero bajo baúl, el 21
% las llantas delanteras izquierdas, el 15 % de escapes, el 14 % de guardabarros delanteros
izquierdos, el 10 % limpiador de faros, el 6 % separador interno de carga, el 2 % de llanta delantera
derecha y el 1 % en los parantes delanteros. Luego se observa que los tipos de averías se distribuyen
de la siguiente forma: rayados o rozados 33 %, abollados con el 21 %, proyecciones con el 21 % y
pinturas saltadas con el 16 %.
Pasando a los resultados obtenidos con la consideración de la gravedad del daño se observa que el
mayor índice de ocurrencia es:
Modelo 15, Zócalo derecho, Faltante (71 %).
Luego los porcentajes bajan de forma importante y quedan distribuidos de la siguiente forma:
Modelo 18, Alfombra suplementarias, Faltante, Observada (13 %).
Modelo 8, Tapa acceso gancho remolque, Abollado, Observada (10 %).
Página 234 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 18, Luz de patente trasera, Proyección, Observada (4 %).
Modelo 9, Zócalo derecho, Manchado, Observada (2 %).
Modelo 16, Batería, Rayado – Rozado, Observada (1 %).
El modelo 18 con el 17 %, luego el modelo 8 con el 10 %, el modelo 9 con el 2 % y al final el
modelo 16 con el 1 %. Las partes que intervienen se dividen en: 13 % alfombras suplementarias, 10
% tapas de acceso gancho de remolque, 4 $ de luz de patente trasera, 2 % de zócalos derechos y 1
% en baterías. Los tipos de averías observados son: faltantes el 13 %, abollados con el 10 %,
proyecciones con el 4 %, manchados con el 2 % y rayados o rozados con el 1 %. En todos los casos
las averías son solo observables.
El quinto periodo está caracterizado por la media global:
Modelo 13, Guardabarro delantero derecho, Faltante.
Donde cuando se considera la severidad esta es grave.
Luego pasando a la evaluación de los resultados si la consideración de la gravedad de los daños se
observa:
Modelo 17, Tapa de Baúl o Puerta Trasera, Rayado – Rozado (34 %).
Modelo 7, Tapa acceso gancho remolque, Abollado (33 %).
Modelo 17, Faro de stop luneta, Abollado (17 %).
Modelo 18, Guardabarros y parante trasero izquierdo, Rayado – Rozado (7 %).
Modelo 6, Paragolpe trasero / Zona contacto, Rayado – Rozado (7 %).
Modelo 9, Paragolpe delantero / Superior, Rayado – Rozado (2 %).
Modelo 13, Techo (inclusive convertible), Abollado (1 %).
El 51 % de ocurrencias en el modelo 17, el 33 % en el modelo 7, luego el modelo 18 con el 7 %, el
modelo 6 con el 7 %, el modelo 9 con el 2 % y el modelo 13 con el 1 %. Las partes se agrupan en
los siguientes porcentajes según lo descrito en la lista previa. Los tipos de averías se subdividen en:
rayados o rozados el 50 % y abollados el 51 %.
Luego los datos a avaluar considerando la gravedad de los daños ocurre con el mayor porcentaje en:
Modelo 13, Guardabarro delantero derecho, Faltante (89 %).
Luego los porcentajes se reducen a los siguientes centroides:
Modelo 6, Taza, Proyección, Observada (4 %).
Modelo 18, Llave, Abollado, Observada (3 %).
Modelo 19, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada
(1 %).
Modelo 8, Guardabarro delantero izquierdo, Abollado, Observada (1 %).
Donde le modelo 6 aparece en un 4 %, el modelo 18 en el 4 %, el modelo 19 en el 1 % al igual que
el modelo 8. Los tipos de averías se dividen en: 4 % proyecciones, 4 % abollados y 1 % en rayados
o rozados. Las partes se distribuyen en: 4 % tazas, 3 % llaves, 3 % tapizados internos de puerta
delanteras izquierdas y 1 % en guardabarros delanteros izquierdos. Finalmente se debe mencionar
que en todos los casos las averías son solo observaciones.
El periodo seis tiene como media global:
Modelo 13, Zócalo derecho, Faltante.
Si se considera la severidad esta es grave.
Los porcentajes de ocurrencia en los centroides se dividen en:
Modelo 7, Escape, Faltante (45 %).
Modelo 17, Panel trasero bajo baúl, Rayado – Rozado (24 %).
Modelo 18, Giro Delantero (derecho / izquierdo), Abollado (15 %).
Modelo 16, Guardabarros y parante trasero izquierdo, Abollado (8 %).
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado (3 %).
Modelo 17, Otros, Rayado – Rozado (3 %).
Página 235 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelo 13, Barras de techo, Abollado (1 %).
El modelo 7 con el 45 %, el modelo 17 con el 27 %, el modelo 18 con el 15 %, el modelo 16 con el
8 %, el modelo 20 con el 3 % y el modelo 13 con el 1 %. Luego las partes que intervienen se
subdividen de la forma descrita en el listado anterior. En cuanto a loas tipos de averías estas se
distribuyen de la siguiente forma: faltantes el 45 %, rayados o rozados el 27 % y abollados el 24 %.
Los resultados del proceso considerando la gravedad de las averías se distribuyen como sigue:
Modelo 13, Zócalo derecho, Faltante (88 %).
El mayor porcentaje de ocurrencia es el modelo 13.
Luego se distribuye en forma mínima entre los siguientes centroides:
Modelo 7, Bolsa de herramientas, Faltante, Observada (7 %).
Modelo 19, Bolsa de herramientas, Proyección, Observada (2 %).
Modelo 16, Parrilla delantera, Pintura saltada, Observada (2 %).
Modelo 20, Spoiler delantero, Rayado – Rozado, Observada (1 %).
Modelo 19, Paragolpe trasero / Spoiler trasero, Proyección, Observada (1 %).
El modelo 7 con el 7 %, el modelo 19 con un 3 %, el modelo 16 con un 2 % y el modelo 20 con el 1
%. Luego las partes se distribuyen en: un 9 % bolsas de herramientas, el 2 % en parrilla delantera, el
1 % en spoilers delanteros y el 1 % para los paragolpes traseros o spoilers traseros. Los tipos de
averías observados son: el 7 % de faltantes, proyección el 3 %, pinturas saltadas en un 2 % y un 1 %
para rayados o rozados. Finalmente se debe mencionar que la severidad de las averías mínimas es
solo observación.
Los resultados del periodo siete tienen como media global:
General:
Modelo 15, Guardabarro delantero derecho, Faltante.
Y cuando la gravedad es considerada esta es grave.
Si no se considera la gravedad de las averías la distribución es la siguiente:
Modelo 6, Puerta delantera derecha, Faltante (33 %).
Modelo 20, Barras de techo, Proyección (27 %).
Modelo 19, Retrovisor externo izquierdo, Abollado (21 %).
Modelo 20, Parrilla delantera, Rayado – Rozado (10 %).
Modelo 18, Retrovisor externo derecho, Reventado – Estallado (4 %).
Modelo 11, Barras de techo, Proyección (3 %).
Modelo 13, Llanta delantera derecha, Abollado (1 %).
Donde el modelo 6 tiene el 33 % de participación, el modelo 20 el 37 %, el modelo 19 el 21 %, el
modelo 18 con el 4 %, el modelo 11 con el 3 % y modelo 13 con el 1 %. Luego las partes son
distribuidas de la siguiente forma: 33 % de puerta delantera derecha, 30 % de barras de techo, 21 %
de retrovisor externo izquierdo, 10 % de parrilla delantera, 4 % de retrovisor externo derecho y 1 %
de llanta delantera derecha. Finalmente los tipos de averías se distribuyen de la siguiente manera: 33
% de faltantes, 30 % de proyecciones, 22 % de abollados, 10 % de rayados o rozados y el 4 % de
reventado o estallado.
Sin considerar las severidades el mayor porcentaje de averías es:
Modelo 15, Guardabarro delantero derecho, Faltante (86 %).
Luego los porcentajes mínimos de ocurrencia son:
Modelo 19, Retrovisor externo derecho, Faltante, Observada (9 %).
Modelo 7, Zócalo izquierdo, Abollado, Observada (2 %).
Modelo 6, Manijas externas de puertas traseras, Proyección, Observada (2 %).
Modelo 5, Zócalo izquierdo, Rayado – Rozado, Observada (1 %).
Modelo 8, Retrovisor externo derecho, Pintura saltada, Observada (1 %).
El modelo 19 con el 9 %, el 7 % con el 2 % al igual que el modelo 6, el modelo 5 y el modelo 8 con
el 1 %. Las partes averiadas tienen los siguientes porcentajes: 10 % retrovisor externo derecho, 3 %
Página 236 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
zócalo izquierdo y 2 % de manijas externas de puertas traseras. Los tipos de averías que participan
son: 9 % faltantes, abollados 2 %, proyecciones 2 %, rayados o rozados 1 % al igual que pintura
saltada. Finalmente el tipo de severidad es observado.
El periodo ocho tiene como media global:
Modelo 14, Zócalo derecho, Faltante.
Con severidad grave.
En referencia a los resultados sin considerar la gravedad de la misma se divide de a siguiente forma:
Modelo 20, Limpiador y lavador de parabrisas, Proyección (37 %).
Modelo 7, Parrilla delantera, Faltante (24 %).
Modelo 19, Zócalo izquierdo, Abollado (15 %).
Modelo 5, Manijas externas de puertas traseras, Proyección (10 %).
Modelo 13, Guardabarro delantero izquierdo, Abollado (7 %).
Modelo 5, Capot, Rayado – Rozado (3 %).
Modelo 14, Techo corredizo, Faltante (3 %).
El 37 % para el modelo 20, el 24 % el modelo 7, el modelo 19 con el 15 %, el modelo 5 el 13 %, el
modelo 13 el 7 % y el modelo 14 con el 3 %. Las partes se subdividen según los porcentajes es
pacificados en el listado previo. En cuanto a los tipos de avería se puede observar: el 47 % son
proyecciones, el 27 % faltantes, el 22 % de abollados y el 3 % de rayados o rozados.
Considerando las severidades se observa la siguiente distribución:
Modelo 20, Cubierta delantera izquierda, Rayado – Rozado, Observada (56 %).
Modelo 14, Zócalo derecho, Faltante (16 %).
Modelo 17, Manijas externas de puertas traseras, Proyección, Observada (12 %).
Modelo 20, Tapa de Baúl o Puerta Trasera, Rayado – Rozado, Observada (10 %).
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (4
%).
Modelo 11, Panel lateral derecho, Faltante, Observada (1 %).
El 70 % para el modelo 20, el modelo 14 el 16 %, el modelo 17 con el 12 % y el modelo 11 con el 1
%.Las partes afectadas se distribuyen según los datos especificados en el listado anterior. En cuanto
a los tipos de averías estos son: rayados o rozados con el 70 %, faltantes con el 17 % y el 12 %
proyecciones. Finalmente el tipo de severidad se divide en un 16 % de graves y un 83 % de solo
observaciones.
El noveno periodo se caracteriza por el siguiente centroide:
Modelo 14, Taza, Proyección.
Y el tipo de severidad es grave.
Luego si la gravedad no es considerada la distribución de los centroides es como sigue a
continuación:
Modelo 20, Limpiador y lavador de parabrisas, Proyección (54 %).
Modelo 6, Tapizado interno puerta delantera izquierda, Rayado – Rozado (16 %).
Modelo 7, Guardabarro trasero derecho, Pintura saltada (14 %).
Modelo 7, Cable de carga, Rayado – Rozado (7 %).
Modelo 13, Guardabarro trasero derecho, Abollado (3 %).
Modelo 13, Techo (inclusive convertible), Abollado (3 %).
Modelo 14, Luz de neblina trasera, Abollado (2 %).
Modelo 13, Faro de stop luneta, Faltante (1 %).
El modelo 20 con el 54 %, el modelo 6 con el 16 %, el modelo 7 con el 21 %, el modelo 13 con el 5
% y el modelo 14 con el 2 %. Luego se observa la siguiente distribución entre las partes: 54 %
limpiador y lavador de parabrisas, tapizado interno puerta delantera izquierda el 17 %, guardabarros
trasero derecho con el 17 %, cable de carga 7 %, techo (inclusive convertible) 3 %, luz de neblina
Página 237 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
trasera el 2 % y el faro de stop de luneta el 1 %. Luego el tipo de avería se subdivide en: pintura
saltada 14 %, rayados o rozados el 7 %, el 8 % de abollados y el 1 % de faltantes.
En referencia a la evaluación de los resultados considerando su gravedad es la siguiente:
Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada (1 %).
Modelo 20, Alfombra baúl / caja de carga, Rayado – Rozado, Observada (3 %).
Modelo 8, Alfombra suplementarias, Proyección, Observada (9 %).
Modelo 16, Llanta delantera derecha, Faltante, Observada (7 %).
Modelo 7, Llanta delantera derecha, Faltante (32 %).
Modelo 20, Transponder, Proyección (47 %).
El modelo 20 con el 51 %, luego los modelos 8 con el 9 %, el modelo 16 con el 7 % y el modelo 7
con el 32 % son los resultados obtenidos. En cuanto a las partes averiadas se subdividen en rayados
o rozados con el 4 %, proyección con el 56 % y faltante con con el 39 %. Luego se observa que el
20 % son solo observaciones y averías el 80 %.
El último periodo en estudio muestra la media global:
Modelo 13, Zócalo derecho, Faltante.
Con severidad grave.
Sin la consideración de la severidad el proceso arroja los siguientes valores:
Modelo 7, Panel lateral derecho, Proyección (44 %).
Modelo 19, Puerta trasera derecha, Faltante (41 %).
Modelo 20, Manijas externas de puertas delanteras, Proyección (6 %).
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado (4 %).
Modelo 13, Techo corredizo
Pintura saltada (4 %).
Modelo 8, Capot, Faltante (1 %).
Modelo 10, Cristales de parante delantero, Reventado – Estallado (1 %).
El modelo 7 con el 44 %, el modelo 19 con el 41 %, luego el modelo 20 con el 10 %, el modelo 13
con el 4 %, el modelo 8 con el 1 % al igual que el modelo 10. Luego las partes afectadas se
distribuyen según se especificó el listado expuesto previamente. Los tipos de averías se distribuyen
de la siguiente forma: proyección con el 50 %, faltante con el 41 %, rayado o rozado con el 4 %,
pintura saltada con el 4 % y reventado o estallado con el 1 %.
Con la gravedad considerada el mayor índice de ocurrencia ocurre como sigue:
Modelo 14, Retrovisor externo derecho, Faltante (79 %).
Luego los porcentajes mínimos se dividen de la siguiente forma:
Modelo 7, Giro Delantero (derecho / izquierdo), Rayado – Rozado, Observada (11 %).
Modelo 16, Limpiador y lavador de parabrisas, Faltante, Observada (4 %).
Modelo 7, Conjunto carrocería, Manchado, Observada (3 %).
Modelo 20, Guardabarro delantero izquierdo, Rayado – Rozado, Observada (2 %).
El modelo 7 con el 14 %, el modelo 16 con el 4 % y el modelo 20 con el 2 %. Las partes se
subdividen según se ha definido en el listado previo. Los tipos de averías son: rayados o rozados
con el 13 %, faltante con el 4 % y manchados con el 3 %. Luego la gravedad de las averías es solo
observable en todos los casos (21 %).
8.5.2.7. Imputación Tipo de Transporte.
En este punto se van a evaluar los resultados obtenidos en cada periodo relacionados con el lugar
donde se producen los daños y a partir de estos se especificará el tipo de imputación al que
corresponde.
Página 238 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
En el periodo uno se observa que el 79 % de las averías corresponden al transporte terrestre. Luego
el 10 % transportes marítimos y finalmente el 5 % a la salida de planta. El detalle del resultado del
proceso es el siguiente:
74 % de averías en “Subida a Buque Puerto de Origen”. Imputación transporte
terrestre.
10 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
5 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
5 % de averías en “Transferencia Ubicación y Línea de Carga”. Imputación planta de
producción.
En el segundo periodo también el mayor índice de daños es realizado por el transporte terrestre con
un 89 % del total de datos explotados. Luego le sigue el transporte marítimo con el 6 % y
finalmente el puerto (averías en la playa de puerto) con solo el 2 %. El detalle porcentual de los
datos explotados es el siguiente:
83 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
6 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
6 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
2 % de averías en “Retiro de Puerto”. Imputación puerto.
Los datos del periodo tres muestran que todavía existe un predominio de las averías producidas por
el transporte terrestre con el 85 %. Luego las averías de trasporte marítimo con el 9 % y finalmente
el la playa de puerto con el 4 %. Este periodo coincide con las imputaciones del periodo anterior
pero los porcentuales son distintos. En cuanto a los detalles del periodo es el siguiente:
76 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
9 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
9 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
4 % de averías en “Subida a Buque”. Imputación puerto.
La información del periodo cuatro muestra que el 60 % solo es de trasporte terrestre. Luego el 15 %
son daños de salida de planta de producción. Y finalmente el 13 % son producidos en el transporte
marítimo. El detalle es el siguiente:
47 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
15 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción.
15 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
El comportamiento de los resultados del periodo cinco también muestra en el primer lugar a las
averías imputables al transporte terrestre con un 46 %. Luego le siguen las averías producidas en
planta con el 23 %. En tercer lugar aparecen las averías producidas por las compañías marítimas
con el 20 % y finalmente con un porcentaje mínimo se observan las averías en playa de puerto con
el 6 %. El detalle porcentual es el siguiente:
32 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
23 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción.
20 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
14 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
6 % de averías en “Retiro de Puerto”. Imputación puerto.
Página 239 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
En el periodo seis todavía existe el predominio de las averías imputables al transporte terrestre con
el 55 %. Luego, al igual que en el periodo anterior, las averías de planta de producción con el 17 %.
En tercer lugar las averías de transporte terrestre con el 13 % y finalmente con solo un 5 % las
averías imputables a la playa de puerto.
42 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
17 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción.
15 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
5 % de averías en “Retiro de Puerto”. Imputación puerto.
El resultado de los procesos del periodo siete muestra que el transporte terrestre aparece con un 46
% de participación. Luego en el segundo lugar se observan las averías de transporte marítimo con el
21 %. En tercer lugar están las averías imputables a planta con el 16 %. Y finalmente se observan
los daños imputables a la playa de puerto con el 10 %. El detalle porcentual es el siguiente:
40 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
21% de averías en “Bajada de Buque”. Imputación transporte marítimo.
16 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
10 % de averías en “Subida a Buque”. Imputación puerto.
6 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
En el periodo ocho se observa el cambio del primer lugar de imputabilidad. En este periodo el
porcentaje más alto de daños se encuentra en la salida de planta, o sea daños en producción con el
48 %. Luego con el 36 % le siguen los daños imputables al transporte terrestre. El transporte
marítimo tiene el 7 % de incidencia en los daños y finalmente el 5 % de los daños de este periodo
fueron producidos por la playa de puerto. El detalle es el siguiente:
48 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
19 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
17 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
7 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
5 % de averías en “Retiro de Puerto”. Imputación puerto.
Las averías en el periodo nueve mantienen el primer lugar de imputación del periodo anterior. Los
daños producidos en planta y detectados en la transferencia y línea de carga tienen el 63 % de
ocurrencia. Luego sigue el trasporte terrestre con el 23 % y finalmente el 4 % son averías
producidas por el transporte marítimo.
63 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
16 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
7 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
4 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
El último periodo en estudio tiene como mayor porcentaje de incidencia de las averías a la planta de
producción con el 56 %. Luego le siguen los daños de transporte terrestre con el 25 %. En el tercer
Página 240 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
lugar se encuentran las averías de playa de puerto con el 11 %. Y finalmente las averías de
transporte marítimo con el 6 %.
56 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de
producción.
17 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.
11 % de averías en “Subida a Buque”. Imputación puerto.
8 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte
terrestre.
6 % de averías en “Bajada de Buque”. Imputación transporte marítimo.
8.6. Desarrollo
En esta fase se realiza la evaluación de los resultados y la misma concluye con una estrategia para el
desarrollo de los resultados de la minería de datos en el negocio.
8.6.1. Plan de desarrollo
Resumen de resultados.
El Árbol de Clasificación arroja el siguiente resultado que es ilustrado resumidamente en el Gráfico
39. Se puede ver claramente los resultados obtenido sobre las cantidades de tipos de averías
producidos a lo largo de cada periodo. En el gráfico se han introducido solo los cuatro principales
tipos de averías: Faltante, Pintura Saltada, Rayado o Rozado y Abollado. Estos cuatro tipos de
averías constituyen el 96,04 por ciento en promedio del total de datos explotados.
Tipos de Averías
6000
5000
4000
3000
2000
1000
0
2003
Semest re 1-04
Semest re 2-04
Semest re 1-05
Semest re 2-05
Semest re 1-06
Semest re 2-06
Semestre 1-07
Semest re 2-07
Faltant e
494
184
274
264
240
247
339
605
641
Semestre 1-08
1771
Pintura salt ada
935
790
812
598
490
271
136
237
609
334
Rayado - Rozado
2023
1628
1794
1792
1887
1499
1207
1278
4689
2223
Abollado
5338
2855
2375
1099
1126
1681
780
761
1016
751
Per io d o
Gráfico 39: Barras detallado cantidades por tipo de avería
Con el Árbol de Clasificación también se proceso la información relacionada con los lugares donde
se producen las averías. En el Gráfico 40 se muestra el detalle de los resultados obtenidos. En este
caso a diferencia del resultado anterior, la información que se puede visualizar es el 100 % de los
resultados.
Página 241 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Un detalle a tener presente en el resultado que muestra a lugar “Subida a Buque en Puerto de
Origen” como el de mayor producción de daños es que la información procesada en la práctica
pertenece a dos cambios de responsabilidad. Esto es, las averías detectadas en la subida a un buque
son imputables tanto al transporte terrestre como a playa de puerto. Además, especialmente en los
periodos iniciales del presente proyecto también hubo cambios a nivel empresas que por motivos
políticos o internos. Es difícil estimar un porcentaje el cual sea representativo de lo que sucedió en
la realidad en el punto de control en cuestión pero esto nos lleva a deducir que como línea futura de
investigación se puede trabajar con los datos agrupados en función de los lugares de control y no
por periodos de tiempo como es estudio actual.
Lugares
8000
7000
6000
5000
4000
3000
2000
1000
0
2003
Semestre 1-04
Semestre 2-04
Semestre 1-05
Semestre 2-05
Semestre 1-06
Semestre 2-06
Semestre 1-07
Semestre 2-07
Semestre 1-08
Subida a Buque
104
82
228
201
104
138
265
95
523
633
Retiro de Puerto
352
89
71
137
248
187
119
156
60
Ingreso a Puerto
443
343
491
510
550
497
1069
575
1167
958
Salida de Planta
511
69
53
642
1003
767
454
1457
4521
3020
580
547
219
282
318
1585
144
517
635
454
Bajada de Buque
942
343
505
570
758
Subida Buque Puerto de Origen
6925
4741
4008
1849
1208
124
Per io d o
Gráfico 40:
Barras detallado cantidades por lugares de ocurrencia de averías
El resultado de la explotación de datos con Árbol de Clasificación también fue realizado sobre los
modelos de autos que participan proyecto de minería de datos. El Gráfico 41 muestra el resumen de
los resultados obtenidos.
En este caso como en el de los tipos de averías también se ha reducido la cuestión a los modelos que
participan en un 96,65 % de los registros explotados.
Como en el caso de los lugares de producción de averías aquí también hay una observación válida
que se puede realizar. Existen modelos que debido a que no están incluidos en determinados
periodos no porque no hayan tenido averías sino porque todavía no participaban del proceso o
porque no se fabricaban o porque no entraban en la cadena logística. Esto también lleva a
determinar la necesidad de realizar estudios futuros de minería de datos sobre la producción de
averías de determinados modelos. Posiblemente un agrupamiento interesante puede ser por modelo.
De esto se hablará en ítems posteriores cuando se especifiquen planes alternativos de explotación de
datos o líneas futuras de investigación.
Página 242 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Modelos
4500
4000
3500
3000
2500
2000
1500
1000
500
0
Semestre 2-06
Semest re 1-07
Semest re 2-07
Semest re 1-08
M odelo 9
4143
1785
833
433
469
789
170
209
156
142
M odelo 17
2003
2662
Semestre 1-04
2616
Semestre 2-04
3041
Semest re 1-05
2002
Semest re 2-05
1795
Semest re 1-06
1482
260
125
30
M odelo 5
595
244
252
200
398
533
565
712
839
433
M odelo 20
546
319
632
574
266
441
1268
1403
3819
2571
M odelo 18
467
28
40
86
39
10
29
37
M odelo 13
436
562
457
35
70
125
106
270
358
190
M odelo 7
0
0
0
0
0
0
2
94
1747
1883
M odelo 8
0
0
0
465
608
285
28
88
75
26
36
38
21
Per io d o
Gráfico 41: Barras detallado cantidades por modelos averiados
Para cada uno resultados obtenidos de la explotación de datos aplicando los modelos de
clasificación se han obtenido los conjuntos de reglas necesarios para establecer la ocurrencia de los
resultados linealmente. Por razones prácticas no se exponen en el proyecto el detalle de las reglas
pero las mismas pueden formar parte de futuras líneas de desarrollo de minería de datos para la
identificación de las reglas que llevan a la ocurrencia de las averías.
Resumiendo el resultado de los agrupamientos generados a partir del algoritmo de Clustering se
observan los siguientes patrones de comportamiento. Estos resultados pueden ser diferenciados para
los tipos de averías de mayor ocurrencia en todo el conjunto de datos estudiado. Por cuestiones de
practicidad los patrones expuestos a continuación representan el más alto porcentaje de probabilidad
de ocurrencia en relación a los datos analizados.
Debido a que la herramienta de clustering utilizada en el proyecto se basa específicamente en el
valor de los atributos y no en las relaciones entre los mismos sería necesario para afinar los
resultados introducirlos o analizarlos a través de algoritmos de inducción. La aplicación de
algoritmos de inducción sobre los resultados del agrupamiento por cada periodo o cada explotación
de datos en esta industria puede formar parte de líneas futuras de investigación muy interesantes a
desarrollar.
Como resultado del agrupamiento de averías se pueden especificar los siguientes patrones:
•
•
•
•
•
•
•
Capot, Abollado, Observada.
Abollado, Leve.
Abollado, Observada.
Ingreso a Puerto, Abollado.
Transferencia ubicación y línea de carga, Abollado.
Abollado.
Subida Buque Puerto de Origen, Luneta trasera / Cristal puerta trasera,
Arrancado - Roto – Fisurado, Grave.
Página 243 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector
delantero, Arrancado - Roto – Fisurado, Observada.
Paragolpe delantero / Protector delantero, Arrancado - Roto – Fisurado,
Observada.
Arrancado - Roto – Fisurado, Observada.
Modelo 17, Arrancado - Roto – Fisurado.
Manijas externas de puertas delanteras, Faltante, Observada.
Subida a Buque, Tapa acceso gancho remolque, Faltante.
Faltante, Grave.
Faltante, Leve.
Modelo 8, Faltante.
Faltante.
Modelo 13, Faltante.
Conjunto carrocería, Manchado, Observada.
Modelo 5, Otros, Manchado, Observada.
Paragolpe delantero / Protector delantero, Manchado, Observada.
Spoiler delantero, Manchado, Observada.
Manchado, Observada.
Guardabarro trasero derecho, Pintura saltada.
Modelo 17, Llanta delantera derecha, Pintura saltada.
Llanta trasera derecha, Pintura saltada, Observada.
Paragolpe delantero / Protector delantero, Pintura saltada, Observada.
Modelo 9, Pintura saltada, Mediano.
Pintura saltada, Observada.
Cable de carga, Proyección.
Retiro de Puerto, Proyección, Mediano.
Proyección, Observada.
Proyección.
Retiro de Puerto, Capot, Rayado – Rozado.
Llanta trasera izquierda, Rayado – Rozado, Observada.
Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada.
Transferencia ubicación y línea de carga, Manijas externas de puertas delanteras,
Rayado - Rozado
Manijas externas de puertas traseras, Rayado – Rozado, Mediano.
Modelo 17, Otros, Rayado – Rozado.
Panel trasero bajo baúl, Rayado – Rozado, Observada.
Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado,
Observada.
Retiro de Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado,
Observada.
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector
delantero, Rayado – Rozado, Observada.
Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado,
Observada.
Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada.
Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero,
Rayado – Rozado.
Página 244 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Transferencia ubicación y línea de carga, Paragolpe delantero / Protector
delantero, Rayado – Rozado.
Paragolpe delantero / Superior, Rayado – Rozado, Mediano.
Modelo 20, Paragolpe delantero / Superior, Rayado – Rozado, Observada.
Subida Buque Puerto de Origen, Paragolpe delantero / Superior, Rayado – Rozado.
Paragolpe delantero / Superior, Rayado – Rozado.
Modelo 13, Puerta delantera derecha, Rayado – Rozado.
Retiro de Puerto, Rayado – Rozado.
Modelo 13, Retrovisor externo izquierdo, Rayado – Rozado.
Subida a Buque, Spoiler delantero, Rayado – Rozado, Mediano.
Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada.
Ingreso a Puerto, Spoiler delantero, Rayado – Rozado, Observada.
Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado,
Observada.
Spoiler delantero, Rayado – Rozado, Observada.
Bajada de Buque, Spoiler delantero, Rayado – Rozado.
Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado.
Tapa posterior de techo, Rayado – Rozado, Observada.
Tapizado interno puerta delantera izquierda, Rayado – Rozado.
Subida a Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado,
Observada.
Rayado – Rozado, Grave.
Rayado – Rozado, Leve.
Rayado – Rozado, Mediano.
Modelo 20, Rayado – Rozado, Observada.
Subida a Buque, Rayado – Rozado, Observada.
Rayado – Rozado, Observada.
Modelo 20, Rayado – Rozado, Observada.
Rayado – Rozado, Observada.
Modelo 20, Rayado – Rozado, Observada.
Rayado – Rozado, Observada.
Bajada de Buque, Rayado – Rozado.
Ingreso a Puerto, Rayado – Rozado.
Paragolpe trasero / Spoiler trasero, Rayado – Rozado.
Transferencia ubicación y línea de carga, Rayado - Rozado.
Modelo 10, Rayado - Rozado.
Rayado – Rozado.
Modelo 5, Rayado – Rozado.
Modelo 13, Rayado – Rozado.
Moldura protectora lateral derecha, Rayado – Rozado.
Modelo 20, Rayado – Rozado.
Cubierta trasera derecha, Reventado – Estallado, Observada.
Reventado - Estallado.
Alerón.
Barras de techo.
Capot, Observada.
Conjunto carrocería, Observada.
Página 245 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Cubierta delantera izquierda.
Faro delantero izquierdo / derecho, Mediano.
Subida Buque Puerto de Origen, Guardabarro trasero derecho.
Llanta trasera izquierda, Observada.
Manijas externas de puertas traseras, Observada.
Manijas externas de puertas traseras.
Panel lateral derecho, Observada.
Parante delantero, Observada.
Modelo 9, Parrilla delantera, Observada.
Parrilla delantera.
Retrovisor externo derecho, Grave.
Retrovisor externo derecho, Observada.
Separador interno de carga.
Tapa acceso gancho remolque, Observada.
Tapa posterior de techo, Mediano.
Tapa posterior de techo, Observada.
Tapa posterior de techo.
Techo (inclusive convertible) .
Techo corredizo, Observada.
Zócalo derecho, Grave.
Zócalo derecho, Observada.
Zócalo derecho, Grave.
Modelo 13, Grave.
Transferencia ubicación y línea de carga, Leve.
Modelo 16, Mediano.
Subida Buque Puerto de Origen, Observada.
Transferencia ubicación y línea de carga, Observada.
Modelo 13, Observada.
Modelo 7, Observada.
Modelo 13, Observada.
Modelo 20, Observada.
Modelo 16, Observada.
Subida a Buque.
Transferencia ubicación y línea de carga.
Modelo 17.
Modelo 9.
Modelo 13.
Ingreso a Puerto, Capot, Rayado – Rozado.
Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado.
Ingreso a Puerto, Paragolpe trasesro / Zona contacto, Rayado – Rozado.
Subida a Buque, Rayado – Rozado, Grave.
El resumen expuesto anteriormente incluye todos los resultados coherentes en función de la relación
entre sus atributos.
La lista anterior muestra todos los resultados de la explotación de datos de clustering; esto es partes,
averías y gravedades; daños por lugar y daños por modelos.
Página 246 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Para resumir los resultados del Modelo de Predicción se puede decir que se hicieron los siguientes
procesos y los mismos agruparon la ocurrencia de partes averiadas, tipos de averías, lugares donde
se producen las averías y modelos con averías como se especifica a continuación.
Al igual que en el caso de los agrupamientos en los modelos de predicción empleados sería viable y
necesaria el estudio y aplicación de algoritmos de inducción debido a que los resultados generados
por sus atributos se basan en el valor numérico y no en la relación entre ellos.
Las partes predictivas resultantes a lo largo de los 10 periodos son:
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Manual
Cubierta delantera derecha
Escape
Guardabarro delantero derecho
Guardabarro trasero derecho
Llanta delantera derecha
Llave
Manijas externas de puertas traseras
Panel trasero bajo baúl
Puerta delantera derecha
Puerta trasera derecha
Tapa acceso gancho remolque
Taza
Alerón
Aerosol antipinchazos
Estos resultados fueron obtenidos realizando la variación del tipo de avería y la gravedad de los
mismos por cada periodo. Estas partes resultantes de los procesamientos de datos representan el 15
% de la cantidad de partes posibles de participación en un siniestro.
En cuanto a los tipos de averías se puede ver un comportamiento mucho más acotado en cantidad:
•
•
•
Faltante
Abollado
Proyección
A pesar que la cantidad resultante resumida es menor que en el análisis de partes, en este caso los
tipos de averías representan el 27 % del total de tipos de averías entre las cuales se puede encontrar
un siniestro.
En referencia a los lugares donde se producen las averías el resultado arrojó el siguiente valor:
•
•
•
•
Bajada de Buque
Ingreso a Puerto
Retiro de Puerto
Salida de Planta
En este caso se puede ver que la posibilidad que se encuentre una avería en la subida a un buque es
tan baja como para que el modelo de predicción no la considere como resultado posible. Lo mismo
Página 247 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
sucede con las averías encontradas en la subida a un buque en puerto de origen, si bien en ese punto
de control se han encontrado gran porcentaje de las averías en estudio el modelo no arroja como
resultado posible de ocurrencia en su predicción.
Finalmente se observa que de los modelos de auto explotados en el presente estudio el resultado se
resume a la ocurrencia de:
•
•
•
•
•
•
•
•
•
Modelo 9
Modelo 17
Modelo 16
Modelo 15
Modelo 14
Modelo 13
Modelo 12
Modelo 11
Modelo 10
En este caso representan el 45 % de la cantidad de modelos posibles de aparecer.
Procesamiento de información
La información fue procesada según la siguiente distribución de datos dentro de cada software:
•
•
•
Explotación de datos usando Árbol de Clasificación: Tipo de Averías, Lugares y Modelos de
autos. Para cada herramienta se ingresan las columnas de daños distribuidas según el
formato parte + avería + gravedad.
Explotación de datos usando Clustering de Averías, Modelos averiados y Lugares donde se
producen las averías. La distribución de datos se realiza encolumnando las averías en
función del formato parte más avería y más gravedad.
Explotación de datos usando Modelo de Predicción de Averías, Lugares donde se producen
las averías, y Modelos averiados. El ingreso de datos a cada modelo se realiza según el
formato parte + avería + gravedad.
En el procesamiento de datos vinculado directamente a los lugares donde se producen las averías se
realizan dos actividades:
1. Agrupar en función de la imputabilidad a la salida de planta dos de los puntos de control.
Estos puntos se identifican en el proyecto como Salida de Planta y la imputabilidad es a
Calidad o Línea de Producción.
2. Y para el caso específico de los datos relacionados con el punto de control Subida a Buque
en Puerto de Origen se realiza la salvedad que la imputabilidad del daño está distribuida
entre los daños producidos por el transporte terrestre y la playa de puerto (donde también se
debe incluir la estiba).
Todos los modelos de datos son explotados para cada periodo desde el año 2003 hasta mediados del
año 2008. El proyecto se ha desarrollado sobre 7 puntos de control. El total global de inspecciones
realizadas para obtener la información es de 595393 inspecciones distribuidas entre los 7 puntos de
control. El número total de autos es de 183926 unidades inspeccionadas a lo largo de las cadenas de
logísticas, estas unidades corresponden a 20 tipos de modelos de autos diferentes. Finalmente y
Página 248 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
como se mencionó en la etapa de Preparación de Datos el número total de registro de daños
explotados en el proyecto es de 50246.
Planes alternativos
Un plan alternativo de desarrollo de minería de datos puede ser el que se detalla a continuación.
-
Extracción de datos en formato SQL desde las bases de datos.
Normalización y transformación de datos si es necesario.
Generación de registros con el formato: parte, avería, gravedad, modelo, y lugar.
Distribución de las tablas para introducir los datos en función de periodos por
columna.
El modelo de Clustering se forma por las columnas:
•
•
•
•
•
•
•
•
•
•
-
Periodo 1
Periodo 2
Periodo 3
Periodo 4
Periodo 5
Periodo 6
Periodo 7
Periodo 8
Periodo 9
Periodo 10
Luego para cada periodo / columna introducir los registros extraídos de la base de
datos. O sea que se puede invertir la introducción de los datos a ser explotados para
procesar por separado partes, luego averías, luego lugares, etc.
Otro plan alternativo que puede resultar interesante para la industria es el de separar la información
por lugar y luego procesar cada lugar independientemente. Esto quedaría conformado de la
siguiente forma:
•
•
•
•
•
Punto de control salida de línea de producción.
Punto de control ingreso a puerto.
Punto de control despachos de puerto.
Punto de control subidas a buque.
Punto de control bajada de buque.
Luego para cada lugar donde se produce la información se ingresa en cada modelo según el
procesamiento actual los datos vinculados a las averías en formato parte más avería y más gravedad.
Dentro de cada uno de los puntos de control se pueden encontrar más de una compañía responsable
por el movimiento de la unidad automotriz por lo que también puede ser una línea de análisis valida
para llevar a la práctica la realización de una subdivisión por cada lugar en función de la compañía
que interviene.
Continuando con ese análisis la minería de datos también puede ser llevada a cabo distribuyendo los
grupos de datos por imputabilidad. Esto sería:
Página 249 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
Averías provocadas por líneas marítimas.
Averías producidas por transportes terrestres.
Averías de calidad.
Averías de puerto o playa.
Y cada grupo contendría en la explotación de datos los códigos de averías en formato parte más
avería más gravedad.
En resumen y concluyendo con la mención de los planes alternativos que se podrían llevar a la
práctica en un proyecto de minería de datos se puede decir que al contar con la información
normalizada desde la producción de la misma (inspecciones según los estándares) pasando por la
captura de datos y llegando a su almacenamiento en bases de datos centralizadas las estrategias para
un futuro procesamiento de datos aplicando técnicas de minería de datos solo depende de los
requerimientos de las partes interesadas en la industria y la creatividad de los responsables de llevar
a cabo el proyecto.
El descubrimiento de la información obtenida a partir del presente proyecto directamente podría ser
usado para consolidar prácticas empíricas realizadas en la industria. Se puede dar un marco teórico
por ejemplo al hecho de trabajar siempre sobre la base que el comportamiento de los tipos de
averías siempre esta vinculado directamente a 4 tipos del total que impone el estándar de inspección
de este estudio. Esto está justificado debido a que la ocurrencia de averías se produce con cuatro
tipos de averías que participan en un porcentaje medio del 96 % del total en explotación.
8.6.2. Supervisión y mantenimiento del plan
La supervisión y el mantenimiento de la implementación del presente proyecto es importante
debido a que los datos que se procesan diariamente pueden ser modificados por el personal
operativo de la compañía. Los datos son modificados por diferentes motivos como puede ser haber
realizado una codificación incorrecta, haber asignado una imputabilidad incorrecta, etc. El volumen
de datos en movimiento diario es grande y dinámico motivo por el cual la extracción de las
muestras debe ser realizada cuidadosamente y realizando backups de los datos explotados por cada
proceso.
La minería de datos debería ser realizada por periodos de 6 meses. En función del presente proyecto
se puede establecer el semestre como una unidad de medida representativa importante para la
obtención de resultados prácticos.
Como plan de supervisión y mantenimiento se podría establecer:
-
-
Extracción y almacenamiento semestral de datos guardando en formato de hoja de
cálculo toda la información.
Verificación de los modelos de autos y lugares de inspección que intervienen. Si
aparecen nuevos puntos de control o nuevos modelos se debe proceder a su
codificación.
Distribución de los datos en función de los modelos de software de minería de datos
a trabajar.
Los archivos de la explotación de datos semestrales deben ser guardado en soporte
magnético en la compañía. Lo conveniente es almacenar en carpetas y por procesos
semestralmente.
Página 250 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
-
-
Los resultados obtenidos por cada explotación de datos debe ser llevado a formato de
hoja de cálculos con generación de gráficos de barras y tortas para una mejor visión
e interpretación de los resultados obtenidos por cada periodo.
Al final de cada proceso de minería de datos la evaluación de los resultados debe ser
realizado por un equipo compuesto por la parte operación encargada de la captura de
la información y el área de tecnología de la compañía.
8.6.3. Producción de Informe definitivo
La utilización de la metodología CRISP-DM para este proyecto ha permitido encontrar un
comportamiento predictivo de los daños y/o en función del estándar utilizado para la realización de
la inspección de unidades.
Se ha podido encontrar un plan de extracción, normalización, y codificación de datos para la
realización de procesos de minería de datos semestrales. Como se ha mencionado en puntos
anteriores además estos procesos de minería de datos pueden tener como objetivos otros aspectos
como pueden ser: realizar procesos de minería sobre las averías producidas en determinados puntos
de control, por determinadas compañías o por tipos de imputación.
Entre los objetivos logrados por la aplicación de la metodología se puede mencionar:
•
•
•
•
•
•
•
•
•
•
Se han determinado los daños y/o averías para cada periodo.
Se han determinado responsabilidades en la siniestralidad en función del tipo de avería y
tipo de transporte por cada periodo.
El estudio de las averías ha permitido encontrar un referente de imputación estableciendo
patrones de comportamiento.
Se han podido encontrar los tipos de averías y sus porcentajes de ocurrencia por cada
periodo.
Las partes averiadas han sido identificadas como así también las cantidades y porcentajes de
ocurrencia en cada periodo.
El comportamiento de los daños ha sido establecido especificando la gravedad de los
mismos.
Se han establecido cuales son los modelos de autos más afectados por los daños como así
también las partes que normalmente aparecen averiadas en las unidades.
Los lugares donde se producen las averías han podido ser identificados como así también las
partes y tipos de averías.
Se han especificado las cantidades de averías por tipos de transportes, partes averías, tipos
de averías, lugares donde se producen las averías y los modelos afectados.
En referencia a información “oculta” descubierta en el proyecto lo más importante fue lo
relacionado con la cantidad de tipos de avería normalmente producidos, las partes
normalmente afectadas y los modelos mayoritariamente averiados.
La presentación final del proyecto se encuentra en el anexo 5. En este se encuentra un subconjunto
de resultados obtenidos como así también la explicación global de la metodología utilizada y los
pasos a seguir en la implementación práctica.
Página 251 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
8.6.4. Revisión del proyecto
Entre las cosas acertadas para el desarrollo del proyecto actual se puede decir que la determinación
de la división en periodos de tipo ha sido determinante para poder encontrar un estándar de cantidad
de tiempo para realizar la explotación de los datos.
Posiblemente uno de los errores en el proyecto fue el hecho de no invertir las columnas de datos a
ser explotados dentro de cada modelo.
Lo acertado dentro de la explotación de datos de proyecto se puede mencionar la
Evaluar que fue lo correcto y que fue lo errado, cual fue el éxito obtenido, y que necesidades serán
mejoradas.
Posiblemente para futuros proyectos haya que analizar la posibilidad de evitar el procesamiento o la
obtención de resultados inconsistentes debido a la combinación de partes con tipos de averías que
en la realidad no aparecen. Este proyecto puede ser de utilidad para especificar en el software de
captura o de almacenamiento en la base de datos todas las restricciones para el ingreso de averías
con estructura inconsistente.
Otro resultado interesante que se ha podido corroborar dentro de un contexto metodológico debido a
la explotación de datos desde el 2003 a mediados del 2008 con la base de datos en cuestión es que
el cambio de compañía de inspección en el punto de control “Subida a Buque en Puerto de Origen”
ha generado un cambio significativo en la detección de daños y/o averías. Los motivos que
provocaron ese comportamiento distintivo en los datos no son discutidos en el presente proyecto,
pero si se puede decir que para evitar este inconveniente en futuros proyectos de minería de datos
uno de los caminos factibles para explotar los datos puede ser el de agrupar la información por
puntos de control o por tipo de imputación.
Página 252 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
9. Conclusiones
A partir del análisis de los diferentes métodos para el desarrollo de esta minería de datos se puede
concluir que la metodología CRISP-DM es apropiada para la explotación de datos en esta industria.
Posiblemente en futuros proyectos podrían utilizarse otras herramientas de software pero en
términos generales es apropiado considerar al presente proyecto con todos los pasos y las
herramientas de software para la minería de datos en la detección de patrones de daños y/o averías.
Otro de los motivos por los cuales resulta apropiado trabajar con la metodología mencionada
anteriormente es que es totalmente independiente de las herramientas de software. Esto último,
característica particular de CRISP-DM, es una de las grandes ventajas sobre otras metodologías.
Además, siguiendo los pasos según lo detalla la metodología se ha probado que es completa y
flexible por lo cual es aconsejable recomendarla como base metodológica para futuros proyectos en
la industria de automóviles.
Como se ha mencionado a lo largo del presente trabajo en la industria automotriz a nivel global
existen diferentes estándares de inspección, codificación y sistemas de captura de datos por lo tanto
la generalidad que presenta la metodología CRISP-DM le permite hacerse recomendable para
futuras implementaciones. Cambiar de un estándar a otro no representa inconvenientes importantes
para la explotación de información.
En referencia a la minería de datos realizada también se puede concluir que la misma puede tomar
formas diferentes de explotación de datos tanto a nivel de formato de registros como a los periodos
de tiempos en los cuales se puede distribuir la información. El sistema de datos está normalizado
casi en su totalidad.
En relación a las cantidades consideradas estadísticamente para la ocurrencia de los diferentes
siniestros se observa de forma clara como es su distribución. Inclusive los resultados obtenidos
desde el punto de vista práctico permiten establecer como patrones de comportamiento los tipos de
averías y los modelos afectados en este nicho de mercado específico (considerando el estándar de
inspección para la toma de datos y los modelos de autos que intervienen en este proyecto
particularmente).
Si bien los resultados del trabajo muestran patrones de comportamiento satisfactorios es interesante
ver que se pueden realizar más combinaciones para la explotación de datos en lo que se refiere a los
lugares, modelos de autos o tipo de formato de registros introducidos en cada modelo de software.
Inclusive puede también considerarse como parámetro de separación las empresas responsables en
cada punto de control.
Teniendo en cuenta lo expuesto en los puntos iniciales de esta tesis se puede decir que cualquiera
sea el problema a resolver y con cualquier estándar de inspección no existe una única técnica para
solucionarlo, sino que puede ser resuelto con distintas herramientas. Los aspectos estadísticos de la
minería de datos aquí pueden dar resultados globales que permitan guiar el proyecto en esta
industria hacia los aspectos inteligentes de explotación de datos. Esto es, posiblemente sea
conveniente comenzar los proyectos de data mining en esta industria con técnicas estadísticas y
luego en la medida que se va profundizando en el análisis y conocimiento de los resultados se puede
ir hacia la aplicación de sistemas inteligentes.
La aplicación del Árbol de Clasificación es totalmente óptima para este proyecto y en futuros
proyectos de minería de datos de esta industria. Inclusive independientemente de la distribución o el
Página 253 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
agrupamiento de la información. Resulta de alta importancia siempre utilizarlo al inicio de cada
explotación de datos para tener una referencia clara de la situación global de las cantidades de
datos. El modelo gráfico de los resultados obtenidos detallando cantidades y porcentajes en toda la
distribución en forma de tortas permite ver, seguir y analizar en todos los momentos del proyecto la
información y coherencia con que se va trabajando.
Cada Árbol de Clasificación del software utilizado genera las reglas de producción de cada nodo.
Esas reglas pueden ser aplicables directamente al desarrollo de cualquier software para la
administración de datos en el proceso de almacenamiento de información. Constituirían las
denominadas reglas de negocio para la validación de datos de partes con tipos de averías y
gravedades. En este trabajo las reglas no han sido incluidas debido a su gran cantidad y a que cada
una tiene que ser sometida a un estudio previo para filtrarlas.
En cuanto al Clustering quizás sea necesario estudiar la posibilidad de trabajar con matrices de
menor tamaño puesto que este estudio ha demostrado que se necesita mucho tiempo de
computación para el procesamiento de matrices de 10 x 10 y posiblemente no se justifique debido a
la similitud obtenida en los resultados con otras matrices de menor tamaño. Otro factor a ser
estudiado es la aplicación o no de la gravedad de las averías puesto que pueden no ser necesarias,
pero no se debe dejar de lado que quizás el estándar lo precise. También se puede realizar la
explotación de datos con está técnica considerando solamente datos relacionados con las partes por
un lado por periodos, o bien por tipos de averías en determinados periodos, o por lugares o modelos
en diferentes periodos. Es decir que la combinación de posibilidades en función de la gran cantidad
de información disponible es muy alta y es posible considerar que lo más importante es que con este
proyecto de tesis se ha podido demostrar la viabilidad de líneas de investigación futuras con la
aplicación del agrupamiento como técnica de explotación de datos.
Es interesante ver también que la combinación de posibilidades para la producción de los centroides
es grande debido al sistema de codificación con el que se trabaja en el registro de averías en la
industria y al sistema de datos normalizado desde donde se extraen los datos. O sea que es posible
obtener resultados finales válidos y erróneos a partir de la explotación. Los errores son descubiertos
a partir de la inconsistencia entre las combinaciones posibles de: partes más averías más
gravedades.
Si bien los resultados obtenidos son satisfactorios es importante destacar que es necesario trabajar,
en etapas posteriores o en una futura implementación de esta metodología en la industria, con
algoritmos de inducción para tratar de mejorar la explotación de datos en lo que respecta a la
relación entre ellos. Como se ha mencionado a lo largo de este proyecto de tesis la tendencia de las
técnicas empleadas hacia el valor de los atributos y no entre sus relaciones muestra que algunos de
los datos resultantes son inconsistentes con la realidad. Algunas de las herramientas posibles de
utilizar pueden ser árboles de decisión o de clasificación.
En relación al Modelo de Predicción es importante su aplicación y determinante a la hora de
encontrar los patrones de ocurrencia en las averías, lugares, partes averiadas y modelos de autos
averiados. Al igual que con las otras dos herramientas utilizadas se han dejado fuera de este trabajo
algunos de los resultados obtenidos. Esto es, para el caso de las variaciones posibles de realizar
entre determinado rango de tipos de averías o partes la ocurrencia de los resultados predictivos
puede variar.
Las pendientes obtenidas sobre las tendencias pueden ser positivas o negativas, y también pueden
tener como ocurrencia de resultados posibles un determinado rango de valores. Estos últimos son
Página 254 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
aspectos matemáticos que estudiados profundamente pueden dar información útil sobre el
comportamiento o la predictibilidad de las averías.
Además, también como en el caso del Clustering es posible realizar la búsqueda de otro tipo de
predicciones como por ejemplo determinados tipos de averías en determinados meses del año. O
bien, se puede realizar la predicción sobre partes solamente en determinados periodos, o lugares o
modelos de autos.
Este software de predicción empleado también se basa fuertemente en el valor de sus atributos más
que en la relación entre ellos en los resultados finales por lo que sería conveniente también como el
caso del Clustering trabajar con algoritmos de inducción para mejorar los resultados.
Concluyendo con el resultado de la utilización del software empleado la información de esta
industria en su formato tradicional y con el sistema de seguimiento almacenado en una base de
datos central puede ser explotada en un proyecto de minería de datos con la aplicación de técnicas
como el clustering, la clasificación o la predicción.
Los periodos de tiempo para el desarrollo de una minería de datos en la industria podría ser el
semestre. La muestra semestral de datos es considerada suficiente como para lograr los objetivos
según se plantearon en el presente proyecto de tesis, y teniendo en cuenta el movimiento de los
vehículos de mercado argentino. Los tipos de transportes también pueden determinar los límites y
alcances de un proyecto de minería de datos para detectar patrones de comportamiento.
También es importante mencionar como conclusión de este proyecto que la estructura de las bases
de datos desde donde se extrajo el mayor porcentaje de información contiene todas las relaciones y
el formato necesarios para el desarrollo de cualquier tipo de herramienta de software para la gestión
de la información. O sea que es recomendable para el desarrollo de aplicaciones de software de
captura o almacenamiento de información para cada punto de control de una cadena logística,
realizar un análisis detallado de las combinaciones posibles de averías o tipos de averías en función
de esta base de datos.
El mecanismo para la obtención de las reglas de negocios para aplicaciones informáticas en el
seguimiento y control de siniestros de este estudio no esta desarrollada en este mercado, motivo por
el cual este proyecto puede servir de antecedente para mostrar lo lineamientos generales a tener en
cuenta para el desarrollo de la tecnología en la industria automotriz.
El descubrimiento de patrones de comportamiento de las averías o los resultados estadísticos en la
explotación de datos realizada en este trabajo permite definir el camino que se debe seguir para la
realización de presupuestos y la definición de políticas de distribución de los operadores logísticos
encargados de los movimientos de los automóviles 0 KM. Teniendo en consideración que el costo
de producción de las unidades es menor al costo de su posterior distribución desde que sale de línea
de producción hasta que llega a su destino final, hace de la minería de datos con técnicas
estadísticas e inteligentes una alternativa más que importante para ser desarrollada por las empresas
interesadas en el descubrimiento de patrones de comportamiento como así también en el control y
asignación de responsabilidad por siniestralidad.
Página 255 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 256 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
10. Líneas futuras de investigación
Las líneas futuras de investigación pueden ser las siguientes:
•
•
•
•
•
•
•
Implementación de la metodología para el estudio de comportamiento de averías agrupando
la información por empresas responsables de siniestros.
Desarrollo de la metodología con información extraída de base de datos con otros estándares
de inspección de unidades. Se recuerda que cada compañía puede tener su propio estándar
de inspección el cual define el formato en el que los registros pueden ser explotados.
Al igual que la implementación por empresas responsables también se puede procesar la
información para determinadas marcas o modelos de autos.
Implementación de proyecto con datos agrupados en función de la imputabilidad también es
otra futura línea de investigación viable.
Con la aplicación del Modelo de Clasificación se puede extraer todo el conjunto de reglas de
negocio generado para ser aplicado en el software tanto de captura de datos como en la
aplicación que alimenta la base de datos. Esto es, a partir de las reglas generadas por el
modelo validar todos los datos que ingresan al sistema.
Como se ha mencionado en otros ítems a lo largo de esta tesis también es viable la
explotación de datos de este sistema de información considerando cada uno de los puntos de
control por separado.
El Modelo de Clstering también puede ser considerado definiendo matrices de menor
tamaño.
En cuanto a la utilización de nuevas herramientas o herramientas complementarias para el
tratamiento de la información en esta industria es necesario hacer mención como posibles líneas
futuras de investigación la utilización de algoritmos de inducción. Tanto en el Clustering como en el
Modelo de Predicción los resultados obtenidos hacen hincapié fundamentalmente en sus valores
numéricos y no en la relación entre los atributos. O sea que antes de dar los resultados finales de la
aplicación de cada modelo sería conveniente una introducción previa de los mismos en algoritmos
que permitan una aproximación más cercana a la realidad en lo referente a la relación entre los
datos procesados.
Concluyendo con los posibles caminos de investigación se puede hacer referencia a que en esta
industria uno de los sistemas de información estándares en el mundo (seguimiento y control de
unidades automotrices) es el que se ha expuesto en el presente proyecto. Con la información
normalizada electrónicamente es posible su estudio y explotación con la aplicación de la
metodología CRISP-DM considerando diferentes tipos de agrupación de datos y distintas
herramientas de software para obtener resultados exitosos para los interesados.
Página 257 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 258 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
11. Bibliografías y Documentación
Britos, P., et al, Minería de Datos, Basada en Sistemas Inteligentes (Editorial Nueva Librería,
2005).
De Ville, B., Microsoft Data Mining: Integrated Business Intelligence for e-Commerce and
Knowledge Management (Butterworth-Heinemann, 2001).
Diché, J., E-data, Transformando datos en información con Data Warehouse (Editorial Prentice
Hall, 2001).
Gill, H. y Rao, P., Data Warehousing, la integración de información para la mejor toma de
decisiones (Editorial Prentice Hall 1996).
Groth, R., Data Mining: A Hands-On Approach for Business Professionals (Editorial Prentice Hall
PTR, 1998).
Han, J. y Kamber, M., Data Mining: Concepts and Techniques (Editorial Morgan Kauffman
Publishers, 2001).
Hernández, O., Introducción a la Minería de Datos (Editorial Pearson Educion, 2004).
Hornick, F., et al, Java Data Mining: Strategy, Standard, and Practice: A Practical Guide for
architecture, design, and implementation (The Morgan Kaufmann Series in Data Management
Systems) (Elsevier Inc., 2007).
Inmon, W., Building the Data Warehouse (Editorial John Wiley & Sons, Inc., 2002).
Jean-Michel Franco y EDS-Instituc Prometheus, El Data Warehouse, El Data Minning (Ediciones
Gestión 2000, 1997).
Jean-Pasal, A., Inteligencia Artificial (Editorial Paraninfo, 1986).
Larose, T., Data Mining Methods and Models (John Wiley & Sons, Inc., 2006).
Mccorduck, P., Máquinas que piensan, historia de la Inteligencia Artificial (Editorial Tecnos, 1991).
Mundy, J., et al, The Microsoft Data Warehouse Toolkit: With SQL Server 2005 and the Microsoft
Business Intelligence Toolset (Wiley Publishing, Inc., 2006).
Nilsson Nils, J., Inteligencia Artificial Una Nueva Síntesis (Editorial MCGrow-Hill, 2001).
Pajares Martinsanz, G., Inteligencia Artificial e Ingeniería del Conocimiento (Editorial Alfaomega
Grupo Editor, 2006).
Peña, D., Análisis de datos Multivariantes (Editorial McGraw Hill/Interamericana de España,
2002).
Pérez López, C. y Santin Gonzalez, D., Minería de Datos, Técnicas y Herramientas (Editorial
Paraninfo, 2007).
Russel, S y Norvig P., Inteligencia Artificial - Un Enfoque Moderno (Editorial. Pearson Education,
2003).
Singh, H., Data Warehousing (Editorial Prentice Hall, 1998).
Sitio de ADEFA (Asociación de Fábricas de Automotores) http://www.adefa.com.ar (Octubre,
2007).
Sitio de comunidad de personas interesadas en compartir conocimiento sobre temas relacionados
con los datos, y como tratarlos para transformarlos en información que a su vez nos permita obtener
conocimiento y saber: http://www.dataprix.com/categorias-de-dataprix.
Sitio de Estadística (Metodología para el desarrollo de proyectos de Data Mining)
http://www.estadistico.com/arts.html?20040426 (Septiembre, 2007).
Sitio de ITBA (Instituto Tecnológico Buenos Aires, Centro de Ingeniería de Software e Ingeniería
del Conocimiento, Escuela de Postgrado) http://www.itba.edu.ar/capis/webcapis/planma-esp.html
(Septiembre de 2007).
Sitio de Metodología CRISP-DM (Cross Industry Standard Process for Data Mining)
http://www.crisp-dm.org (Agosto, 2007).
Sitio de Microsoft http://technet.microsoft.com/es-es/library/ms174861.aspx (Octubre, 2007).
Sitio de SAMAS (Sociedad Argentina de Mastología) http://www.samas.org.ar (Agosto, 2007).
Página 259 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Sitio
de
SECYT
(Biblioteca
Electrónica
de
Ciencia
y
Tecnología)
http://www.biblioteca.secyt.gov.ar (Agosto, 2007).
Sitio de Universidad de Sevilla http://www.us.edu.es (Septiembre, 2007).
Sitio de Universidad Politécnica de Madrid http://www.upm.es (Septiembre, 2007).
Sitio de Universidad Politécnica de Valencia http://www.upv.es (Septiembre, 2007).
Tang, Z. and MacLennan, J., (Author), Data Mining with SQL Server 2005 (Wiley Publishing, Inc.,
2005).
Página 260 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
12. Anexos
Anexo 1: Terminología de negocio.
Término
Area
Avería
Bajada de buque
Barcaza
Batea
Buque
Cadena logística
Check point
Códificación de avería
Colector de datos
CP
Dealer
Estándar de inspección
Gravedad
Hand held
Ingreso a puerto
Línea de producción
Línea de transferencia
Patio
Perito
Perito naval
Playa
Proyección
Retiro de puerto
Severidad
Spoiler
Subida a buque
Significado
Parte de un vehículo.
Tipo de daño.
Operación de translado de un auto desde un barco hacia
el puerto.
Buque específicamente usado para transporte de autos.
Camión con estructura para transporte de vehículos.
Barco especial acondicionada y dimensionada para el
transporte de automóviles, camiones, tractores, etc.
Conjunto de lugares por donde va pasando una
determinada unidad automotriz.
Punto de control.
Sistema de código establecido para tomar un daños. Por
ej. Parte + Avería + Gravedad.
Equipo electrónico de datos con lector de código de
barras.
Punto de control.
Punto final de distribución de una cadena logística.
Conjunto de reglas para establecer un criterio de
inspección donde se especifica como inspeccionar y
define como son las averías en función de un nivel de
importancia.
Nivel de un daño.
Colector de datos elctrónico con lector de código de
barras.
Entrada de autos a la playa de un puerto.
Fábrica donde se producen los autos.
Lugar donde se transfiere una unidad luego de su salida
de planta.
Lugar donde se almacenan vehículos.
Inspector que verifica estado de un vehículo.
Persona que realiza inspección de barcos y sus cargas.
Lugar donde se almacenan vehículos.
Tipo de daño colectivo que provine de una variedad de
acciones.
Salida de autos de la playa de un puerto.
Gravedad de un daño.
Alerón u otro elemento de la carrocería de un automóvil
que sirve para hacerlo más aerodinámico.
Operación de translado de un auto desde la playade
puerto hacia un barco.
Página 261 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Survey
Surveyor
Transponder
Operación de inspección autos.
Persona que realiza un inspacción de un auto.
Dispositivo a bordo de un auto que recibe señales de
radio correspondientes a una banda de frecuencias
determinada, las amplifica y desplaza su frecuencia a otra
del espectro y la retransmite.
Transporte marítimo
Transporte terrestre
Trincado
Sistema de traslado de autos por mar.
Sistema de traslado de autos por tierra.
Forma de amarrar un auto al piso de un buque.
Anexo 2: Terminología de minería de datos.
Término
Algoritmos genéticos
Significado
Técnicas de optimización que usan procesos tales como
combinación genética, mutación y selección natural en un diseño
basado en los conceptos de evolución natural.
Análisis de series de
tiempo (time-series)
Análisis de una secuencia de medidas hechas a intervalos
específicos. El tiempo es usualmente la dimensión dominanate de
los datos.
Análisis exploratorio de Uso de técnicas estadísticas tanto gráficas como descriptivas para
datos
aprender acerca de la estructura de un conjunto de datos.
Análisis prospectivo de
Análisis de datos que predice futuras tendencias, comportamientos
datos
o eventos basado en datos históticos.
Análisis retrospectivo de Análisis de datos que provee una visión de las tendencias,
datos
comportamientos o eventos basado en datos históricos.
Árbol de decisión
Estructura en forma de árbol que representa un conjunto de
decisiones. Estas decisiones generan reglas para la clasificación de
un conjunto de datos.
Base de datos
multidimensional
CART Árboles de
clasificación y regresión
Base de datos diseñada para procesamiento analítico on-line
(OLAP). Estructurada como un hipercubo con un eje por
dimensión.
Una técnica de árbol de decisión usada para la clasificación de un
conjunto da datos. Provee un conjunto de reglas que se pueden
aplicar a un nuevo (sin clasificar) conjunto de datos para predecir
cuáles registros darán un cierto resultado. Segmenta un conjunto
de datos creando 2 divisiones. Requiere menos preparación de
datos que CHAID .
Una técnica de árbol de decisión usada para la clasificación de un
CHAID Detección de
interacción automática de conjunto da datos. Provee un conjunto de reglas que se pueden
aplicar a un nuevo (sin clasificar) conjunto de datos para predecir
Chi cuadrado
cuáles registros darán un cierto resultado. Segmenta un conjunto
de datos utilizando tests de chi cuadrado para crear múltiples
divisiones. Antecede, y requiere más preparación de datos, que
CART.
Página 262 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Clasificación
Proceso de dividir un conjunto de datos en grupos mutuamente
excluyentes de tal manera que cada miembro de un grupo esté lo
"más cercano" posible a otro, y grupos diferentes estén lo "más
lejos" posible uno del otro, donde la distancia está medida con
respecto a variable(s) específica(s) las cuales se están tratando de
predecir. Por ejemplo, un problema típico de clasificación es el de
dividir una base de datos de compañías en grupos que son lo más
homogéneos posibles con respecto a variables como "posibilidades
de crédito" con valores tales como "Bueno" y "Malo".
Clustering
(agrupamiento)
Proceso de dividir un conjunto de datos en grupos mutuamente
excluyentes de tal manera que cada miembro de un grupo esté lo
"más cercano" posible a otro, y grupos diferentes estén lo "más
lejos" posible uno del otro, donde la distancia está medida con
respecto a todas las variables disponibles.
Computadoras con
multiprocesadores
Data cleansing
Una computadora que incluye múltiples procesadores conectados
por una red.
Proceso de asegurar que todos los valores en un conjunto de datos
sean consistentes y correctamente registrados.
La extracción de información predecible escondida en grandes
bases de datos.
Sistema para el almacenamiento y distribución de cantdades
masivas de datos.
Datos que resultan de errores (por ej. errores en el tipeado durante
la carga) o que representan eventos inusuales.
En una base de datos relacional o plana, cada campo en un registro
representa una dimensión. En una base de datos multidimensional,
una dimensión es un conjunto de entidades similares; por ej. una
base de datos multidimensional de ventas podría incluir las
dimensiones Producto, Tiempo y Ciudad.
Data Mining
Data Warehouse
Datos anormales
Dimensión
Modelo analítico
Una estructura y proceso para analizar un conjunto de datos. Por
ejemplo, un árbol de decisión es un modelo para la clasificación de
un conjunto de datos.
Modelo lineal
Un modelo analítico que asume relaciones lineales entre una
variable seleccionada (dependiente) y sus predictores (variables
independientes).
Modelo no lineal
Un modelo analítico que no asume una relación lineal en los
coeficientes de las variables que son estudiadas.
Modelo predictivo
Estructura y proceso para predecir valores de variables
especificadas en un conjunto de datos.
Navegación de datos
Proceso de visualizar diferentes dimensiones, "fetas" y niveles de
una base de datos multidimensional.
Se refiere a aplicaciones de bases de datos orientadas a array que
OLAP Procesamiento
permite a los usuarios ver, navegar, manipular y analizar bases de
analítico on-line (On
Line Analitic prossesing) datos multidimensionales.
Página 263 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Outlier
Un item de datos cuyo valor cae fuera de los límites que encierran
a la mayoría del resto de los valores correspondientes de la
muestra. Puede indicar datos anormales. Deberían ser examinados
detenidamente; pueden dar importante información.
Procesamiento paralelo
Uso coordinado de múltiples procesadores para realizar tareas
computacionales. El procesamiento paralelo puede ocurrir en una
computadora con múltiples procesadores o en una red de
estaciones de trabajo o PCs.
RAID
Formación redundante de discos baratos (Redundant Array of
inexpensive disks). Tecnología para el almacenamiento paralelo
eficiente de datos en sistemas de computadoras de alto
rendimiento.
Técnica estadística utilizada para encontrar la mejor relación lineal
que encaja entre una variable seleccionada (dependiente) y sus
predicados (variables independientes).
Regresión lineal
Regresión logística
Una regresión lineal que predice las proporciones de una variable
seleccionada categórica, tal como Tipo de Consumidor, en una
población.
SMP Multiprocesador
simétrico (Symmetric
multiprocessor)
Tipo de computadora con multiprocesadores en la cual la memoria
es compartida entre los procesadores.
Vecino más cercano
Técnica que clasifica cada registro en un conjunto de datos basado
en una combinación de las clases del/de los k registro (s) más
similar/es a él en un conjunto de datos históricos (donde k = 1).
Algunas veces se llama la técnica del vecino k-más cercano.
Anexo 3: Consultas estructuradas para base de datos.
/*cantidad de inspecciones total*/
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20030101' and '20080631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
/*cantidad de inspecciones por periodo*/
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20030101' and '20031231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
Página 264 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20040101' and '20040631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20040701' and '20041231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20050101' and '20050631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20050701' and '20051231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20060101' and '20060631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
Página 265 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20060701' and '20061231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20070101' and '20070631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20070701' and '20071231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20080101' and '20080631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20080701' and '20081231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
/*cantidad de unidades total*/
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20030101' and '20080631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
Página 266 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
/*cantidad de unidades por periodo*/
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20030101' and '20031231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20040101' and '20040631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20040701' and '20041231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20050101' and '20050631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20050701' and '20051231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
Página 267 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20060101' and '20060631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20060701' and '20061231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20070101' and '20070631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20070701' and '20071231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20080101' and '20080631'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20080701' and '20081231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
Página 268 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
/*cantidad de modelos*/
select distinct operativos_chasis.idchasis from chasis
inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis
inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
where operativos.fechaoperativo between '20030101' and '20031231'
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or
left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')
and chasis.modelo='307'
/*cantidad de abollados*/
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=54
and idaveria=6
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=51
and idaveria=6
and chasis.modelo='boxer'
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=3
and idaveria=6
and (operativos.idcp=30)
Página 269 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
select idaveria, idarea, count(iddanio)
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idaveria=6
group by idaveria, idarea
order by idaveria, idarea
/*cantidad de rayados*/
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=13
and idaveria=9
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=51
and idaveria=9
and chasis.modelo='307'
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=8
Página 270 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
and idaveria=9
and (operativos.idcp=10 or operativos.idcp=300)
select idaveria, idarea, count(iddanio)
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idaveria=9
group by idaveria, idarea
order by idaveria, idarea
/*cantidad de pintura*/
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=73
and idaveria=5
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
where idarea=35
and idaveria=5
and chasis.modelo='c4'
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=6
Página 271 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
and idaveria=5
and (operativos.idcp=360 or operativos.idcp=360)
select idaveria, idarea, count(iddanio)
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idaveria=5
group by idaveria, idarea
order by idaveria, idarea
/*cantidad de faltantes*/
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=41
and idaveria=7
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=34
and idaveria=7
and chasis.modelo='c3'
select *
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
Página 272 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idarea=43
and idaveria=7
and (operativos.idcp=420 or operativos.idcp=420)
select idaveria, idarea, count(iddanio)
from danios
inner join operativos on operativos.idoperativo=danios.idoperativo
and operativos.fechaoperativo between '20030101' and '20080630'
and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or
operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60)
inner join chasis on chasis.idchasis=danios.idchasis
and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or
left(chasis.vin,2)='8a')
where idaveria=7
group by idaveria, idarea
order by idaveria, idarea
Anexo 4: Codificación
Modelos de autos.
Código
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Desccripción
Modelo 1
Modelo 2
Modelo 3
Modelo 4
Modelo 5
Modelo 6
Modelo 7
Modelo 8
Modelo 9
Modelo 10
Modelo 11
Modelo 12
Modelo 13
Modelo 14
Modelo 15
Modelo 16
Modelo 17
Modelo 18
Modelo 19
Modelo 20
Códigos de puntos de control
Página 273 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Código
30
300
420
60
10
25
360
Descripción
Bajada de Buque
Transferencia ubicación y línea de carga
Subida a Buque
Retiro de Puerto
Retiro Fábrica de Origen
Subida Buque Puerto de Origen
Ingreso a Puerto
Códigos de tipos de transportes.
Código
30
300
420
60
10
25
360
Descripción
Transporte marítimo
Transporte terrestre
Transporte terrestre
Transporte terrestre
Transporte terrestre
Transporte terrestre
Transporte terrestre
Códigos de partes.
Código
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Descripción
Spoiler delantero
Paragolpe delantero / Protector delantero
Capot
Paragolpe delantero / Superior
Parante delantero
Techo (inclusive convertible)
Techo corredizo
Barras de techo
Tapa posterior de techo
Parabrisa
Tapa de Baúl o Puerta Trasera
Paragolpe trasero / Spoiler trasero
Panel trasero bajo baúl
Paragolpe trasero / Zona contacto
Tapizado interno puerta delantera izquierda
Zócalo interno puerta delantera izquierda
Manijas externas de puertas delanteras
Manijas externas de puertas traseras
Aerosol antipinchazos
Transponder
Antena
Página 274 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
Faldillas para barro
Limpiador de Faros (derecho / izquierdo)
Limpiador y lavador de parabrisas
Limpiador y lavador de vidrios traseros
Alerón
Taza
Alfombra suplementarias
Manual
Retrovisor externo derecho
Guardabarro delantero derecho
Llanta delantera derecha
Cubierta delantera derecha
Zócalo derecho
Guardabarro trasero derecho
Puerta delantera derecha
Puerta trasera derecha
Panel lateral derecho
Moldura protectora lateral derecha
Giro Delantero (derecho / izquierdo)
Cristales de parante delantero
Escape
Tapa acceso gancho remolque
Bolsa de herramientas
Otros
Llave
Parrilla delantera
Luz de neblina trasera
Faro de stop luneta
Retrovisor externo izquierdo
Guardabarro delantero izquierdo
Llanta delantera izquierda
Cubierta delantera izquierda
Zócalo izquierdo
Guardabarros y parante trasero izquierdo
Puerta delantera izquierda
Puerta trasera izquierda
Panel lateral izquierdo
Moldura protectora lateral izquierda
Tapa tanque combustible
Insignia
Alfombra baúl / caja de carga
Luz de patente trasera
Cable de carga
Luz trasera izquierda
Página 275 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
Cristales parante trasero / fijos
Cristales fijos / Móviles paneles
Plip
Cerraduras de puertas
Bajo chasis trasero
Bajo chasis delantero
Asientos delanteros / traseros
Llanta trasera derecha
Cubierta trasera derecha
Giro guardabarros delantero derecho / izquierdo
Faro delantero izquierdo / derecho
Faro antiniebla / largo alcance
Rejilla retenedora de carga
Separador interno de carga
Luneta trasera / Cristal puerta trasera
Llave de rueda
Cristales de puertas delanteras
Cristales de puertas traseras
Encendedor
Sistema de navegación
Stereo / Radio
Compactera / Porta CD
Apoya cabezas delantero / izquierdo / derecho
Apoya cabezas trasero / izquierdo / centro /
derecho
Conjunto carroceria
Batería
Críquet
Llanta trasera izquierda
Cubierta trasera izquierda
Rueda de auxilio
Gancho de remolque
xxxxxxxxxx
Botiquín
-
Códigos de tipos de averías.
Código
1
2
3
4
5
Descripción
Quemado
Arrancado - Roto - Fisurado
Desgarrado - Cortado
Reventado - Estallado
Pintura saltada
Página 276 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
6
7
8
9
10
11
Abollado
Faltante
Proyección
Rayado - Rozado
Manchado
Exceso kilometraje
Códigos de gravedades.
Código
1
2
3
4
20
21
Descripción
Intolerable
Grave
Mediano
Leve
Observada
-
Anexo 5: Presentación final.
Carátula
Presentación Final
Detección de Patrones para la Prevención de Daños y/o Averías
Ing. Hugo Daniel Flores
Página 1
Presentación
•
•
•
•
•
•
•
•
Detección de Patrones para la Prevención de Daños y/o Averías en
Automóviles 0 KM.
Metodología de desarrollo de minería de datos.
Metodología CRISP-DM.
Desarrollo de la industria automotriz.
Procesos en la industria automotriz
Información de la industria automotriz
Aplicación de metodología de desarrollo de minería de datos.
Conclusión.
Página 2
Objetivos
1. Identificar daños y/o averías.
2. Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de
transporte.
Página 277 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
3.
4.
5.
6.
7.
8.
Imputar incidentes según el tipo de transporte.
Determinar tipos de averías y/o daños.
Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento.
Especificar gravedad de daños y/o averías.
Definir e identificar modelos con daños especificando partes, tipo de daño y gravedad.
Especificar lugares donde se producen daños y/o averías tratando de definir patrones de
comportamiento.
9. Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así
también, partes, tipos de averías, gravedades, lugares donde se producen.
10. Descubrir información “oculta” en función de los modelos generados a partir de los datos
disponibles.
Página 3
Tecnología
Minería de Datos
Es un proceso con el cual se pueden descubrir y cuantificar relaciones predictivas en los datos con
la aplicación de un conjunto de técnicas, y del resultado de este proceso es posible obtener
conocimiento útil para el negocio.
Técnicas de Mineria de Datos
Análisis estadístico
Se preocupa por el poder de generalización de los resultados obtenidos para poder inferir los
resultados a situaciones más generales que la estudiada.
Análisis con sistemas inteligentes
Se preocupa por ofrecer soluciones algorítmicas con un coste computacional aceptable.
Página 4
Tecnología
Metodologías de Minería de Datos
Metodología SEMMA
1. Muestreo
2. Exploración
3. Manipulación
4. Modelado
5. Valoración
Metodología MS
1.
2.
3.
4.
5.
6.
Definición del problema
Preparación de datos
Exploración de datos
Generación del modelos
Validación del modelos
Implementación y actualización de los modelos
Página 5
Página 278 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Tecnología
Metodología CRISP-DM
1.
2.
3.
4.
5.
6.
Análisis del problema
Análisis de datos
Preparación de datos
Modelado
Explotación
Evaluación
Página 6
Metodología CRISP-DM
Fue concebido a finales de 1996. Daimler Chrysler (entonces Daimler-Benz) estaba delante
de la mayoría de las organizaciones industriales y comerciales en la aplicación de la minería de
datos en sus operaciones de negocios.
Introducción
1. La metodología CRISP-DM
2. Pasaje de modelos genéricos a modelos especializados
Modelo de referencia
1.
2.
3.
4.
5.
6.
Comprensión del negocio
Comprensión de datos
Preparación de datos
Modelado
Evaluación
Desarrollo
Página 7
Metodología CRISP-DM
Guía de usuario
Comprendiendo el negocio
Comprensión de datos
Preparación de los datos
Modelado
Evaluación
Desarrollo
Salidas
Comprensión del negocio
Comprensión de datos
Preparación de los datos
Modelado
Evaluación
Desarrollo
Resumen de dependencias
Página 279 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 8
Metodología CRISP-DM
Apéndice
Glosario/Terminología
Tipos de problemas de minería de datos
Página 9
Industria automotriz
1. La industria automotriz y la identificación de daños y/o averías.
2. Globalización de marcas.
3. Diversificación de modelos.
4. Especialización en producción de modelos.
5. Desarrollo de tecnología de las comunicaciones y medios de transportes.
6. Implementación de controles.
7. Reducción de costos.
8. Incorporación de operadores logísticos.
9. Tercerización de sistemas de transporte y lugares de almacenamiento.
10. Puntos de control estratégicos.
11. Creación de los estándares de inspección:
12. Procedimientos de inspección.
13. Sistemas codificación de daños y/o averías.
14. Circuitos logísticos
Página 10
Industria
Circuitos logísticos
Exportación
Importación
Página 280 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 11
Procesos, Información y Datos
Puntos de control
Los check points son los nodos de las cadenas logísticas que conforman lo circuitos que
recorren las unidades desde que salen de producción hasta que llegan a su destino final.
Estándares de inspección
En cada punto de control se realiza la inspección de unidades según un conjunto de reglas o
procedimientos especificados por el estándar de isnepcción.
Captura de datos
Normalmente en la industria los datos son tomados por lectores de código de barras debido a
que toda unidad viene con una hoja detallada donde se indica el código de barras con datos
relacionados al vehículo.
Procesamiento de datos
Los datos son tomados donde se reliza cada inspección y luego son almacenados en una base
de datos. Actualmente hay dos sistemas de almacenamiento uno en batch y otro de línea a través de
radiofrecuencia.
Base de datos
Sistema de datos estructurado y normalizado.
Página 12
Aplicación de la metodología CRISP-DM
Comprensión del negocio
El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o
averías. De esto último también se puede inferir que es de utilidad para la toma de decisiones el
poder determinar o definir los lugares donde se producen los daños y las imputaciones de las
mismas.
Comprensión de datos
Identificación de autos, modelos, lugares, tipos de trasportes, empresas, partes, averías,
gravedades, observación, fechas.
Preparación de datos
Número de chasis, Modelo, Fecha, Lugar, Parte, Tipo Avería, Gravedad, Observación.
Página 13
Aplicación de la metodología CRISP-DM
Modelado
El conjunto de datos de entrenamiento fue almacenado en archivos con formato de hoja de
cálculo y se dividió en función de los períodos establecidos previamente para el presente proyecto.
Las cantidades de datos de entrenamiento para los respectivos modelos es variable en función del
software utilizado, lo cual fue especificado previamente.
Evaluación
La ejecución de los modelos ha generado los datos esperados en función de los objetivos de
negocio establecidos previamente para el proyecto. Si bien en el primer análisis se pudo decir que
Página 281 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
se han cubierto todas las alternativas para lograr los objetivos de negocio y de minería de datos no
se descartó la posibilidad de arribar a nuevas preguntas de negocio o nuevas aproximaciones de
resultados.
Página 14
Aplicación de la metodología CRISP-DM
Desarrollo
Árbol de Clasificación
Construcción de un árbol que en cada nodo establece condiciones sobre atributos, divide el
conjunto de casos en subconjuntos que cumplen cada condición. Los subconjuntos se vuelven a
dividir añadiendo nuevos niveles al árbol hasta detenerse mediante algún criterio.
Agrupamiento
Técnica que agrupa los datos en función de una distancia sin utilizar ningún tipo de
información externa para organizar los grupos.
Modelo de Clasificación
La diferencia con la primera técnica está en que en la predicción el atributo objetivo no es un
atributo cualitativo discreto, sino es uno continuo. El objetivo de la predicción esta en encontrar el
valor numérico del atributo objetivo para objetos no vistos.
Página 15
Aplicación de la metodología CRISP-DM
Desarrollo
Tipos de Averías
6000
5000
4000
3000
2000
1000
0
2003
Semest re 1-04
Semest re 2-04
Semestre 1-05
Semestre 2-05
Semest re 1-06
Semest re 2-06
Semest re 1-07
Semest re 2-07
Semest re 1-08
Falt ant e
494
184
274
264
240
247
339
605
641
1771
Pint ura salt ada
935
790
812
598
490
271
136
237
609
334
Rayado - Rozado
2023
1628
1794
1792
1887
1499
1207
1278
4689
2223
Abollado
5338
2855
2375
1099
1126
1681
780
761
1016
751
Per i o d o
Página 16
Aplicación de la metodología CRISP-DM
Página 282 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Desarrollo
Lugares
8000
7000
6000
5000
4000
3000
2000
1000
0
2003
Semest re 1-04
Semest re 2-04
Semestre 1-05
Semestre 2-05
Semest re 1-06
Semest re 2-06
Semestre 1-07
Semestre 2-07
Semest re 1-08
Subida a Buque
104
82
228
201
104
138
265
95
523
633
Retiro de Puert o
352
89
71
137
248
187
119
156
60
124
Ingreso a Puert o
443
343
491
510
550
497
1069
575
1167
958
3020
454
1457
4521
Bajada de Buque
942
343
505
570
758
580
547
219
282
318
Subida Buque Puert o de Origen
6925
511
4741
4008
1849
1208
1585
144
517
635
454
Salida de Planta
69
53
642
1003
767
Per i o d o
Página 17
Aplicación de la metodología CRISP-DM
Desarrollo
Modelos
4500
4000
3500
3000
2500
2000
1500
1000
500
0
2003
Semestre 1-04
Semestre 2-04
Semestre 1-05
Semestre 2-05
Semestre 1-06
Semestre 2-06
Semestre 1-07
Semestre 2-07
Semestre 1-08
M odelo 9
4143
1785
833
433
469
789
170
209
156
142
M odelo 17
2662
2616
3041
2002
1795
1482
260
125
30
38
M odelo 5
595
244
252
200
398
533
565
712
839
433
M odelo 20
546
319
632
574
266
441
1268
1403
3819
2571
M odelo 18
467
28
40
86
39
10
29
37
36
M odelo 13
436
562
457
35
70
125
106
270
358
190
M odelo 7
0
0
0
0
0
0
2
94
1747
1883
M odelo 8
0
0
0
465
608
285
28
88
75
26
21
Per io d o
Página 18
Aplicación de la metodología CRISP-DM
Desarrollo
Abollados
Capot, Observada.
Página 283 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Capot.
Leve.
Observada.
Transferencia ubicación y línea de carga.
Página 19
Aplicación de la metodología CRISP-DM
Desarrollo
Rayados o rozados
Manijas externas de puertas traseras, Mediano.
Panel trasero bajo baúl, Observada.
Spoiler delantero, Observada.
Tapa posterior de techo, Observada.
Paragolpe delantero / Protector delantero, Observada.
Paragolpe delantero / Superior, Mediano.
Tapizado interno puerta delantera izquierda.
Paragolpe delantero / Superior.
Manijas externas de puertas traseras.
Panel trasero bajo baúl.
Paragolpe delantero / Protector delantero.
Paragolpe delantero / Superior.
Spoiler delantero.
Tapa posterior de techo.
Tapizado interno puerta delantera izquierda.
Página 20
Aplicación de la metodología CRISP-DM
Desarrollo
Faltantes
Manijas externas de puertas delanteras, Observada.
Manijas externas de puertas delanteras.
Grave.
Leve.
Observada.
Modelo 8.
Subida a Buque, Tapa acceso gancho remolque.
Página 21
Aplicación de la metodología CRISP-DM
Desarrollo
Pintura saltada
Llanta trasera derecha, Observada.
Paragolpe delantero / Protector delantero, Observada.
Guardabarro trasero derecho.
Página 284 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Llanta trasera derecha.
Paragolpe delantero / Protector delantero.
Mediano.
Observada.
Modelo 17, Llanta delantera derecha.
Modelo 9, Mediano.
Página 22
Aplicación de la metodología CRISP-DM
Desarrollo
Predicción
Aerosol antipinchazos
Alerón
Cubierta delantera derecha
Escape
Guardabarro delantero derecho
Guardabarro trasero derecho
Llanta delantera derecha
Llave
Manijas externas de puertas traseras
Manual
Panel trasero bajo baúl
Puerta delantera derecha
Puerta trasera derecha
Tapa acceso gancho remolque
Taza
Página 23
Conclusión
1. La metodología CRISP DM es aplicable a la industria.
2. La aplicación de las técnicas de Árbol de Clasificación, Clustering y Modelo de Predicción
permiten obtener resultados satisfactorios.
3. Resulta óptimo el desarrollo y ejecución de la metodología en periodos semestrales.
4. La explotación de datos puede tomar diferentes formas: por periodos diferentes, modelos o
empresas específicas, puntos de control, tipos de averías o partes averiadas.
5. Los resultados obtenidos de la minería de datos pueden ser de utilidad para el desarrollo de
sistemas de información.
6. En referencia a los datos y estructura de datos de los sistemas de base de datos desde donde
se ha tomado la información se puede observar que los mismos son satisfactorios.
Página 24
Conclusión
En cuanto a los objetivos los mismos han sido logrados:
• Se han identificado daños y/o averías.
• Se han determinado las responsabilidades en función de la avería y tipos de
transporte.
Página 285 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
•
•
•
•
•
•
•
Las imputaciones de los incidentes según el tipo de transporte se han establecido.
Se han determinado los tipos de averías y/o daños.
Se han determinado las partes averiadas y se ha podido establecer sus
comportamientos.
Se han especificado gravedades de daños y/o averías.
Se han definido e identificado los modelos de autos con daños especificando partes,
tipo de daño y gravedad.
Se han especificado lugares donde se producen daños y/o averías y se han definido
patrones de comportamiento.
Se han especificado estadísticamente tipos de transporte que producen daños y/o
averías como así también, partes, tipos de averías, gravedades, lugares donde se
producen.
Página 286 de287
Ing. Hugo Daniel Flores
DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS
Página 287 de287
Ing. Hugo Daniel Flores
Descargar