Subido por Diego Libardo Acosta Muñoz

Preparación de datos

Anuncio
3.1 Selección de Datos:
Se toman los datos de las reparaciones realizadas en Bogotá zona sur en el primer semestre
del año 2.019, lo que arroja un total de 188.823 registros de falla visitados y/o reparados.
Etiquetas de fila
ene-19
feb-19
mar-19
abr-19
may-19
jun-19
Total general
Cuenta de ID
PQR
28,929
29,227
31,951
30,289
34,214
34,213
188,823
Inicialmente la data solo contiene 24 campos que no son suficientes para realizar el ejercicio,
razón por la cual se complementan con otra BD que agregan 5 campos más para un total de
29 campos, de estos utilizaremos 13 campos por el momento los cuales nos permitirán
identificar las fallas más comunes reportadas por los clientes.
Los campos a utilizar son:
CAMPOS A UTILIZAR
CAMPOS
ORIGEN
ID de Servicio
Nombre Cuenta Cliente
Num Identificación Cliente
Teléfono Activo
Dirección
Nivel 1 de categorización operacional
Nivel 2 de categorización operacional
Nivel 3 de categorización operacional
Estado Final
Nivel 1 Resolucion
Nivel 2 Resolucion
Nivel 3 Resolucion
Mes de ejecución
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD adicional
BD adicional
BD adicional
BD adicional
BD adicional
Estos campos nos permitirán identificar cuales son las principales causales de reclamación
de los clientes y su solución.
CAMPOS EXCLUIDOS
CAMPOS EXCLUIDOS
CAMPOS
Estado*
Fecha Agendada
Fecha de envío
Fecha de última modificación
Franja Horaria
Grupo asignado*+
ID de la incidencia*+
ID PQR
Molécula
Prioridad*
Resumen*
Teléfono Contacto
Total de Reaperturas:
Transferencias entre grupos:
Vías
Zona Cliente
ORIGEN
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
BD inicial
Excluido por
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
No relevante para el caso de estudio
Se valido el valor de cada uno de los campos de la data para ver su aporte al objeto del
estudio, por tal motivo se escogieron unos y se excluyeron otros campos.
3.2. Limpieza de los datos
Para el ejercicio se plantea identificar las principales causales de falla en el segmento de
telefonía al centro-sur de la ciudad de Bogotá.
Razón por la que se depura la data, dejando el segmento de producto de Línea telefónica o
Línea Básica (LB en adelante) para trabajar.
Etiquetas de fila
ene-19
feb-19
mar-19
abr-19
may-19
jun-19
Total general
BA
LB
Total general
21,613 7,316
28,929
21,694 7,533
29,227
23,874 8,077
31,951
22,554 7,735
30,289
25,897 8,317
34,214
25,896 8,317
34,213
141,528 47,295
188,823
Se realizan las siguientes acciones a fin de depurar los datos.
REGISTROS
1313
1002
311
433
OBSERVACIÓN
Se encuentran vacíos sin teléfono activo
Se agregan datos en el campo teléfono activo
Se eliminan registros por falta de teléfono activo
Registros se encuentran con Num Identificación Cliente negativo se corrigen
Obteniendo la siguiente data actualizada.
Etiquetas de fila
ene-19
feb-19
mar-19
abr-19
may-19
jun-19
Total general
LB
7,245
7,471
8,037
7,683
8,274
8,274
46,984
Total
general
7,245
7,471
8,037
7,683
8,274
8,274
46,984
3.3. Construcción de nuevos datos:
Se generan nuevas variables para facilitar el manejo de los indicadores propuestos, algunos
campos se obtienen de realizar operaciones matemáticas entre varios campo, otros surgen
de la necesidad de agrupación de otros campos.
NUEVAS
VARIABLES
CUMPLE AGENDA
DIA
DISPATCHER
FINAL
FRANJA AGENDA
FRANJA CIERRE
MES DE
EJECUCIÓN
OPERATIVIDAD
SEGM
TMB
3.4. Integración de datos:
Para complementar la información que teníamos y poder realizar los cálculos requeridos a
fin de evaluar el comportamiento de las reparaciones entre otros indicadores, nos vimos en
la necesidad de importar datos de otras BD, utilizando identificadores únicos como lo son el
ID PQR y TÉCNICO BALANCE, con estos dos campos pudimos obtener los siguientes campos
adicionales.
CAMPOS
IMPORTADOS DE
OTRA BD
CFH
ESTADO ETA
ESTADO REM
HORA CIERRE
HORA INICIO
Nivel 1 Resolucion
Nivel 2 Resolucion
Nivel 3 Resolucion
TÉCNICO BALANCE
Tipo
Descargar