MAPAS AUTO-ORGANIZADOS

Anuncio
SUPERFICIE DEL CEREBRO
MAPAS
AUTO-ORGANIZADOS
Gustavo Meschino
© 2005
SOM – ALGORITMO
SOM
Parámetros de Entrenamiento
Cada celda tiene asociado un vector. Las componentes de este vector son los
pesos, análogos a otros tipos de redes neuronales.
El conjunto de vectores se denomina Codebook.
CÁLCULO DE BMU
Vector del que se quiere conocer la BMU.
Vectores del codebook.
FÓRMULA DE ACTUALIZACIÓN DE CODEBOOK
Función vecindad.
Distancia entre codebook
y dato de entrenamiento..
SOM – TIPOS DE CELDAS
U-MATRIX
Celdas Originales del mapa
Representación de la distancia
entre dos celdas adyacentes
según un código de color
(o de grises).
La U-Matrix permite detectar
agrupamientos en los datos
según las distancias entre los
codebooks de celdas
adyacentes.
1
CLASIFICACIÓN DEL
CONJUNTO IRIS.DATA
CLASIFICACIÓN DEL
CONJUNTO IRIS.DATA
Sepal length in cm
Sepal width in cm
Petal length in cm
Petal width in cm
Class
5.1
4.9
4.7
4.6
5.0
5.4
4.6
5.0
4.4
4.9
5.4
4.8
4.8
4.3
5.8
3.5
3.0
3.2
3.1
3.6
3.9
3.4
3.4
2.9
3.1
3.7
3.4
3.0
3.0
4.0
1.4
1.4
1.3
1.5
1.4
1.7
1.4
1.5
1.4
1.5
1.5
1.6
1.4
1.1
1.2
0.2
0.2
0.2
0.2
0.2
0.4
0.3
0.2
0.2
0.1
0.2
0.2
0.1
0.1
0.2
1
1
1
1
1
1
2
2
2
2
3
3
3
3
3
CLASIFICACIÓN DEL
CONJUNTO IRIS.DATA
“CHURN” DE UNA
EMPRESA DE TELEFONÍA
Churn: Término que describe la infidelidad o
falta de lealtad de los clientes. Una tasa de
churn alta indica una gran deslealtad de los
clientes.
| Otra definición: “The cancellation of online,
cell phone or other subscription in order to
switch to another service.”
|
“CHURN”
Conjunto de datos disponible
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
account length
area code
phone number
international plan
voice mail plan
number vmail messages
total day minutes
total day calls
total day charge
total eve minutes
total eve calls
total eve charge
total night minutes
total night calls
total night charge
total international minutes
total international calls
total international charge
number customer service calls
continuous.
continuous.
discrete.
discrete.
discrete.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
continuous.
No se sabe que indica
Se descarta
Zona “Peligrosa” de potenciales
clientes que se irán de la empresa.
2
Estos clientes efectúan las mayores
cantidades de llamadas
internacionales.
Estos clientes tienen
pocas llamadas
internacionales.
CONCLUSIONES
Clientes con valores altos de minutos
en llamadas internacionales.
Estos clientes tienen
pocas llamadas
internacionales, pero
altas en minutos.
ANÁLISIS DE PACIENTES
DIABÉTICOS INTERNADOS
Los clientes probables de abandonar la
empresa son los que realizan gran cantidad
de llamadas internacionales o bien llamadas
internacionales largas.
| Hablan preponderantemente durante el día
más que de noche.
| Debe replantearse el servicio que ofrece
la empresa de llamadas internacionales.
|
Análisis de la variable “Costo Institucional”
Matriz de distancias con interpolación
conjuntamente con los motivos de internación. de intensidades de niveles de gris.
PACIENTES DIABÉTICOS
Factores de Riesgo
PACIENTES DIABÉTICOS
Variables Socio-culturales
3
RIESGO BANCARIO
Variables de los Datos
RIESGO BANCARIO
Clasificación y zonas del mapa
Zona de Bancos
sin riesgo
Variables:
Ratios
Económicos,
Capital,
Efectivo,
Liquidez, etc.
Casos de
consulta del
mapa
Resultado:
Quiebra (1) o
Solidez (0)
Zona de Riesgo Bancario
RIESGO BANCARIO
4
Descargar