full paper - IPSA Online Paper Room

Anuncio
21 CONGRESO MUNDIAL DE CIENCIA POLITICA, SANTIAGO DE CHILE
DEPARTAMENTO DE SOCIOLOGIA, FACULTAD DE CIENCIAS SOCIALES
UNIVERSIDAD DE CHILE
PONENCIA
PERFIL DEL VOTANTE DE SANTIAGO DE CALI. UN ANALISIS EXPLORATORIO A PARTIR DEL
ALGORITMO DE CHAID EN LAS ELECCIONES DE ALCALDE 2008
PRESENTADA POR
WILSON FERNANDO HERRERA BALTAN
JULIO 2009
TABLA DE CONTENIDO
INTRODUCCION
1. CUESTIONES TEORICAS
Enfoques del análisis del comportamiento electoral
La sociología electoral
Análisis ecológico
Estudio de las redes sociales
2. CUESTIONES METODOLOGICAS
Sobre los procesos de clasificación
Qué es un segmento
Características de un segmento
El Algoritmo de Chaid y el proceso de clasificación
Ventajas y características del algoritmo de Chaid
Modelo de clasificación para el estudio de caso de Santiago de Cali
Selección de la técnica
Hipótesis estadísticas
Tratamiento de los datos
Características del Modelo de clasificación propuesto
3. ANALISIS DE LOS RESULTADOS: EL PERFIL DEL VOTANTE EN CALI
Análisis de los resultados
Clasificación de las comunas de Santiago de Cali
Comuna 16
Comuna 3
Comuna 22
BIBLIOGRAFIA
INTRODUCCION
Este estudio exploratorio pretende clasificar 1 a los ciudadanos de Santiago de Cali según
los niveles de asociación que se presentan entre las más importantes variables sociodemográficas y los resultados electorales del 28 de octubre de 2007. Se construye un
perfil del votante mediante el análisis de segmentación algorítmico de CHAID (Chi-square
Automatic Interaction Detection) e identifican las variables explicativas con mayor peso
a la hora de dar cuenta del comportamiento electoral de los ciudadanos.
CHAID es un algoritmo basado en tablas de contingencia y pruebas X2 asociadas y que
no parte de supuestos de normalidad subyacentes. En cada iteración, el algoritmo elige
la variable independiente (para nuestro caso: estrato, etnia, escolaridad, rangos de edad
y genero) que presenta la interacción más fuerte con la variable dependiente (para
nuestro caso: votación).
Los resultados de la investigación nos muestran estadísticamente que las variables estrato
socioeconómico, identificación étnica y escolaridad son significativas para explicar el
comportamiento electoral. Por ejemplo en el 74% de las comunas la variable estrato,
obtuvo el menor P-Valor corregido entre las variables explicativas, seguido por la variable
etnia con un 26%. Esta investigación entrega indicios sobre cómo las preferencias
electorales de los caleños son mediadas en su orden de importancia por las variables
enunciadas, así como por los contextos geográficos donde habitan sus ciudadanos.
CUESTIONES TEORICAS
La investigación sobre el comportamiento electoral se vincula al estudio de la actuación
de los ciudadanos con respecto del poder, es decir, a la relación entre la sociedad y el
Estado que se manifiesta a través del instrumento del voto. Esta relación está
caracterizada por su naturaleza institucional ya que la definen reglas claramente
establecidas en varios niveles entre los que sobresale: a) el carácter de la decisión
(directa o indirecta), b) las características de la corporación a elegir (poderes ejecutivos
y legislativos), c) la temporalidad en la que se produce la decisión y la duración de la
1
En esta investigación se utilizaran los términos clasificar y segmentar como símiles, ya que, ambos connotan el
proceso de dividir y/o unir una población en grupos donde cada miembro sea más parecido o este más cohesionado que
con los de cualquier otro grupo.
misma (los tiempos que demarcan las leyes electorales), y d) el lugar (a través de las
circunscripciones o distritos electorales).
El voto es importante en las sociedades democráticas occidentales modernas porque en
él reside, y a través de él se expresa, la voluntad de los ciudadanos quienes deciden qué
tipo de proyecto político es el que ha de gobernarlos. En otras palabras, la distribución de
la autoridad y del poder en las instituciones del gobierno y los objetivos o intereses que
ellos sirven. Al mismo tiempo el voto legitima a los gobiernos electos y les entregan una
base de consenso para la toma de decisiones (Alker 1969: 29).
En el siglo XIX en Europa, cuando se ampliaron las libertades civiles y políticas, el voto fue
transformándose en un acto de carácter secreto, surgiendo desde este momento el
análisis electoral. Este tema se desarrollo tanto en la academia como en el mundo de los
políticos en la búsqueda de identificar los factores que explicaran las preferencias del
votante anónimo (Olamendi 2000: 68).
Enfoques del análisis del comportamiento electoral
Los enfoques de estudio del comportamiento electoral han pretendido dar cuenta de
aquellas variables o grupo de variables que inciden en la decisión del elector. Teniendo
en cuenta, por una parte, el tipo de variables que explican el voto (estructurales,
culturales, coyunturales) y, por la otra, el tipo de datos que se utilizan (agregados o
individuales). A partir de estas líneas gruesas se han desarrollado tres escuelas o modelos
del análisis del comportamiento electoral (Olamendi 2000):
1. El enfoque sociológico o estructural que supone que la toma de decisiones
electoral parten de la localización del ciudadano en la estructura social.
2. El enfoque psico-social o de la escuela de Michigan que hace énfasis en la
identificación partidista de cada elector como motivador de la elección.
3. El modelo racional en el cual el votante maximiza sus propios intereses a través de
la votación y donde la política se asemeja a las interacciones que se presentan en
el mercado económico y, entonces, el mercado político es uno donde se
intercambian votos por bienes públicos (ver Downs*).
Como se observa, la mayoría de los estudiosos del análisis del comportamiento electoral
se diferencian, sobre todo, en las razones por las cuales el votante elige un
partido/candidato frente a otro. Los enfoques estructurales se centran en el estudio de los
determinantes que condicionan el voto, restándole importancia a la interacción del
candidato con el electorado y a los mecanismos de decisión. Asuntos que se consideran
fundamentales en los modelos racionales. Por tal razón la elección del modelo
conceptual utilizado dependerá, en gran medida, del objetivo final de la investigación
(Castellanos 2002: 30).
Actualmente estos enfoques se siguen utilizando como perspectivas de investigación,
inclusive de manera combinada en aras explicar de manera más completa los factores
que incidente en una determinada elección. Para el caso de la presente investigación el
enfoque
trabajado
será
el
sociológico
con
varias
aproximaciones
particulares
(ecológico, redes sociales y geográfico).
La sociología electoral
El enfoque sociológico del comportamiento electoral es una rama de la sociología
política que concibe el voto como una conducta colectiva y
el comportamiento
electoral es explicado por características sociales, económicas, demográficas o
geográficas que son comunes a los individuos de cierta comunidad o grupo social. Así
mismo, investiga las preferencias políticas de los electores mediante el análisis de los
resultados electorales, identificando los factores que influencian a los ciudadanos. En
consecuencia, pretende contribuir a la comprensión del comportamiento político y,
donde es posible, proponer explicaciones causales (Atteslander 1985: 104).
Las investigaciones de Lazarsfeld, Berelson, Gaudet y Mcphee en la Universidad de
Columbia entre 1944 y 1954 contribuyeron a entregarle solidez empírica al enfoque
sociológico. Estos autores han sido identificados con el paradigma del "determinismo
social". Según Lazarsfeld (1944: 206) “está comprobado que las personas que viven juntas
y sometidas a condiciones externas similares adquieren, en general, iguales intereses y
necesidades”.
Una primera variante de este enfoque sociológico fue la disciplina de la geografía
política. Max Derruau (1964: 636) en su tratado de geografía humana plantea que la
geografía política puede ser interpretada desde tres enfoques. El primero, supone que las
condiciones geográficas son la base de las reivindicaciones de los pueblos, ya que
“siempre es factible basar una reivindicación territorial en una interpretación unilateral de
la geografía y de la historia”; el segundo, donde la geografía política es la simple
constatación de los hechos territoriales sin búsqueda de explicación de tipo causal y; por
último, como una tendencia inversa donde se anexiona toda la geografía a la geografía
política teniendo en cuenta que los hechos políticos dominan la economía.
Particularmente, la geografía electoral se desarrolló en Francia desde principios del siglo
pasado con los trabajos de Siegfried en 1930 y 1949. Esta área del conocimiento
pretendía dar cuenta de la distribución regional del voto y, consecuentemente, del
apoyo que tenían los partidos y los candidatos en cada región del país. Algunos teóricos
consideran que las condiciones biofísicas del territorio inciden como factores explicativos
en el comportamiento electoral, mientras que otros autores plantean que las
características estructurales de orden social y económicas son mucho más importantes
que la naturaleza física del territorio, aunque a veces estas características dependan de
de ella (Derruau 1964: 649).
La actual geografía electoral se relaciona estrechamente con las teóricas de la
geografía humana que centran su atención en la distribución sobre el espacio de los
fenómenos sociales, así como en el estudio de los procesos que han generado tales
distribuciones espaciales. Los tres temas electorales de interés geográfico son: a) la
geografía de las votaciones, b) las influencias espaciales sobre el comportamiento del
voto, y c) la organización espacial de la representación parlamentaria (Bosque 1998: 10).
Para
el
enfoque
sociológico
existen
una
serie
de
factores
explicativos
del
comportamiento electoral que se han ido incorporado la luz de nuevos hallazgos
investigativos y de los aportes de otras aproximaciones teóricas y disciplinares
(específicamente los particularidades del análisis ecológico, el estudio de las redes
sociales y la geografía electoral).
Análisis ecológico
En las Ciencias Sociales, muchas veces se presenta el problema de no contar con los
datos de las unidades de análisis que interesa analizar, sino tan sólo con la información
agregada de las características que presentan los agrupamientos geográficos de tales
unidades. La causa de esta carencia de información puede ser de dos tipos (Balsa 2008:
2):
1. La pérdida de los datos registrados a nivel individual ya que solo se conservan las
frecuencias, de algunas variables y la unidad geográfica a la que corresponden.
2. El dato ha sido producido secretamente (como las votaciones) y nunca pudo, ni
podrá, conocerse el registro individual, por lo cual únicamente contamos con la
información agregada, en el mejor de los casos, los resultados por mesas
electorales
Para responder a estas dificultades los investigadores han desarrollado el “análisis
ecológico” para, desde datos agregados, inferir conductas individuales Este recurso es
tradicionalmente utilizado por la sociología electoral y en la geografía política haciendo
uso del análisis estadístico (correlaciones y regresiones entre variables) para encontrar
una relación cuantitativa entre los resultados electorales y otros hechos sociales de
carácter socioeconómico y político. Entre las dificultades que presenta este enfoque se
resalta la falacia ecológica 2 (Bosque 1998: 15).
Cuando el análisis ecológico del proceso electoral se lleva a cabo en una pequeña
ciudad o distrito, se puede aislar fácilmente la influencia que ejercen factores como el
estatus económico, la nacionalidad, religión… de tal manera que sus conclusiones nos
permiten comprender mejor algunos de los determinantes más importantes de las
decisiones políticas de los individuos (Lazarsfeld 1944: 32).
Estudio de las redes sociales
Uno de los hallazgos más importantes realizados por los investigadores Lazarsfeld,
Berelson, Gaudet y Mcphee plantean que los contactos personales directos fueron los
estímulos más fuertes en los cambios de opinión electoral de los individuos objetos de
investigación. Por su parte, Hackfeldt y Sprague (1987) muestran como las distintas
preferencias políticas están mediadas por la distribución de esas preferencias sociales en
la transmisión de la información política. Así empieza a surgir el análisis de las redes
sociales.
Según esta aproximación, los sujetos construyen con intencionalidad redes de
información que se ajustan a sus preferencias políticas, y también perciben
selectivamente la información que circula socialmente. Este proceso individual es
susceptible de ser condicionado por las limitaciones impuestas producto de la
distribución de las preferencias políticas en el contexto social. De tal manera que cada
contexto ejerce un control sobre la información política que circula a través de la red de
relaciones, por ende, esta información resulta parcial e incompleta (Huckfeldt 1987).
2
Al intentar formular afirmaciones sobre relaciones individuales de las personas, se puede caer en la conocida falacia
ecológica ya que los datos de los candidatos utilizados están referidos a los distritos electorales, no a las personas
propiamente dichas.
En este sentido, el elector compone una imagen personal de cada partido y candidato a
la luz de las informaciones sobre los distintos partidos y candidatos que recibe. Dicha
imagen se compara con las metas personales de cada elector, que dependen de las
circunstancias personales de su vida, de su posición económica y social, de su ideología
y de su religión, etc” (Bosque 1998: 18). Pero la información política se transmite no sólo a
través de discursos y medios de comunicación, sino también a través de una variedad de
mecanismos sociales informales (las redes sociales) que se hubican en el lugar de trabajo,
en la calle o en los lugares habituales de socialización (por ejemplo, la iglesia, las
reuniones sociales).
De tal manera que la información política no es procesada por individuos aislados sino
por grupos de personas interdependientes que realizan sus actividades cotidianas en
medios socialmente estructurados y que envían y reciben distintas interpretaciones de los
acontecimientos políticos en un proceso repetitivo de la interacción social. (Huckfeldt*:
1198). Por lo tanto, el comportamiento electoral puede interpretarse en términos de
personas unidas por, y situadas en el interior de, redes, grupos y otras formaciones
sociales que determinan en gran medida sus oportunidades para el intercambio de
información política significativa (Eulau 1986).
Cuando se argumenta que la elección de las fuentes de información (¿a quién
consulto?) prevalece sobre la influencia social, se equipara a afirmar que las preferencias
políticas individuales dominan las preferencias políticas sociales; cuando este es un
procesos que se ejecuta en la ultima dirección. Es una burda simplificación suponer que
los intereses individuales se traducen directamente en las preferencias individuales. Las
preferencias políticas se construyen en lugares estructurales particulares, y son
configurados por las múltiples interacciones de los individuos dentro de esos lugares
estructurales (Huckfeldt*: 1200).
Una descripción de las dinámicas de interacción que se presenta en al interior de las
redes sociales la presenta (Bosque, 1998): cada elector individual es considerado un
nodo de una red, un punto conectado a otros muchos de un circuito de flujo de
información. Cada nodo realiza tres funciones dentro de la red:
1. Recibe información: política, electoral y de otros tipos, de una diversidad de
fuentes.
2. Procesa y compara las informaciones con sus planteamientos previos, con dos
alternativa: el elector es políticamente neutro y su decisión está determinada
únicamente por el volumen, calidad y tendencia de la información recibida, lo
que debe ocurrir en muy pocos casos; o, por el contrario, el elector tiene una
identificación previa con algún partido político (identificación determinada sobre
todo por las condiciones personales de su situación social).
3. Por último, cada elector es también un camino, una senda por donde pasa la
información a otras personas. Por supuesto existen emisores de información
electoral de distinta potencia. La influencia de esta emisión de información variar
según los distintos factores:
a) La acción del espacio físico, de la distancia y de la disposición geométrica de los
emisores y receptores.
b) El grado de densidad de las interconexiones de la red de flujo de información.
c) La existencia o no de fuentes de información privilegiadas, que ocupen con sus
emisiones los canales de difusión, que son de tamaño limitado, saturándolos e
impidiendo su uso por otras personas.
Todas estas características definen un modelo conceptual de los factores influyentes en
el comportamiento electoral, el paso siguiente es hacer operativo este modelo. Para ello
se formulan los factores y variables explicativas más cercanas y observables en relación a
todas las ideas anteriormente planteadas.
En conclusión, el medio ambiente desempeña un papel crucial en las estructuras sociales
que afectan el flujo de la información política. Las personas escogen sus amigos y el
contenido de sus conversaciones, pero cada una de estas opciones es, a su vez,
delimitada por un entorno que, para muchos propósitos, debe tomarse como dado
(Huckfeldt* : 1199).
CUESTIONES METODOLOGICAS:
En este aparte, pretendemos hacer explicitas los referentes metodológicos, los factores y
variables explicativas más cercanas y observables en relación a todas las ideas
planteadas anteriormente; en aras en establecer un dialogo entre la teoría y las
estrategias utilizadas para dar cuenta del comportamiento electoral de los ciudadanos
de Santiago de Cali en las elecciones de Alcalde 2007.
Con un ejercicio de segmentación podemos comprender mejor la realidad política
electoral antes y después de una elección. En nuestro caso, partimos de la evidencia que
la población de votantes estuvo configurada por individuos que difieren entre sí tanto en
preferencias electorales como en sus características demográficas y socioeconómicas al
segmentar a los ciudadanos que acudieron a las urnas en octubre de 2007 en Santiago
de Cali.
Aceptamos como supuesto teórico que los discursos políticos circulan a través de redes
sociales delimitadas algunas geográficamente y que por ende estos discursos no llegan a
todos los ciudadanos de manera homogénea (Huckfeldt; Sprague 1995). Así mismo, que
las propuestas y discursos de cada uno de los candidatos en contienda no son de la
preferencia de toda la población debido a sus particularidades sociales y de sus
intereses. Además, que los candidatos nunca logran un escenario de competencia
electoral donde se satisfacen todas las demandas y preferencias individuales de todos los
ciudadanos. Por ende se obtienen resultados diferenciados dependiendo de las
características sociales y del contexto electoral en el que se desarrollo la disputa políticaelectoral.
En este sentido, seguimos a Bosque (1998) para el cual los principales factores explicativos
del comportamiento seria el efecto de grupo o de la estructura social (características de
los votantes como individuos) Cada elector pertenece a uno o varios grupos sociales de
algún tipo, lo que determina una cierta disposición, más o menos marcada, a votar a
algún partido, disposición compartida con cierta intensidad con el resto de los miembros
del grupo (grupos de intereses). Los grupos sociales que se pueden considerar son muy
diferentes y, además, pueden cambiar de un lugar a otro y de un momento temporal al
siguiente. Los más obvios son:
a) Los basados en hechos económicos y sociales, esencialmente la pertenencia a
una clase social con las mismas condiciones de trabajo.
b) Los determinados por el nivel de ingresos económicos y el nivel de consumo.
c) Los relacionados con la edad de los electores, es decir los grupos de personas
unificados por la vivencia de las mismas vicisitudes históricas.
d) Los grupos étnicos y culturales diferenciados por la lengua, la religión y las
creencias.
Para este estudio exploratorio de caso pretende modelar la influencia de algunas
variables demográficas en los resultados electorales del 28 de octubre de 2007 en
Santiago de Cali. Construyendo una aproximación al perfil del votante e identificando las
variables explicativas con mayor peso a la hora de dar cuenta del comportamiento
electoral de los ciudadanos. Las siguientes preguntas orientan la investigación:
•
•
•
•
•
¿Qué variables socioeconómicas influyeron en las preferencias electorales de los
ciudadanos de Cali?
¿Con que grado de significación han influido las variables socioeconómicas en la
explicación del comportamiento electoral?
¿Cuáles fueron las preferencias electorales de los diferentes segmentos
poblacionales frente a las distintas opciones políticas en competencia?
¿Cuál es el perfil socioeconómico del votante de la ciudad?
¿Cuál es el perfil socioeconómico del votante de la ciudad desagregado por
comunas?
La selección de las variables que se utilizaron para encontrar los distintos segmentos o
“grupos de ciudadanos” estuvo marcada por restricciones en el acceso a la información
y el costo de la misma. Con la información recolectada, se construyeron las variables
independientes (género, identificación étnica, escolaridad, rangos de edad, estrato
socioeconómico) y las variables dependientes (votación por candidatos, votos en
blanco, votos nulos y votos no marcados).
Sobre los procesos de clasificación
En lo que resta de este acápite describiremos los elementos conceptuales que nos
permitirán a partir de los datos agregados del número de votos otorgados a cada
candidato en las comunas de la ciudad, y el número de ciudadanos residentes en la
misma que corresponden a ciertas características socio-demográficas, establecer una
clasificación de los votantes y del nivel de significación o peso que poseen las variables
explicativas al dar cuenta del comportamiento electoral.
Qué es un segmento:
Cuando se hace referencia a un segmento hablamos de los “contextos en las cuales las
percepciones, las preferencias u otros aspectos de la toma de decisiones de los
individuos difieren entre grupos de una población” (Green y Tull, 1981 pp. 524). Estos
grupos de personas poseen características homogéneas en cuanto a sus condiciones
sociodemográficas y preferencias políticas diferenciándose de otros segmentos que
pertenecen a una misma población. (Thompson, 2005) 3 .
La segmentación es un proceso de subdivisión de individuos en grupos homogéneos
entre si y heterogéneos respecto del resto en función de una serie de características que
3
Tomado de: http://www.promonegocios.net/mercadotecnia/segmento-mercado-definicion-concepto.htm, en enero de
2008.
los define (Gondar, 2001) 4 . Existe segmentación geográfica cuando se divide una
población con base a características de ubicación geográfica (región, tamaño,
densidad del área, clima) y segmentación demográfica cuando recurrimos a criterios
como: Edad, sexo, estado civil, tamaño de la familia, ingresos, ocupación y escolaridad
entre otras variables demográficas 5 .
El análisis de segmentación fue concebido y debe ser utilizado principalmente con una
finalidad exploratoria. La razón radica en que su mecanismo consiste en la búsqueda de
las mejores asociaciones de las variables independientes con la dependiente. Su
potencia, al mismo tiempo que su peligro, reside en la selección automática de aquellas
categorías que pronostica mejor los valores de la variable considerada objetivo (Escobar,
1992) 6 .
Este tipo de análisis en los estudios del comportamiento electoral se ha utilizado en el
mayor de los casos como una herramienta de Marketing Político, partiendo de la
realización de encuestas donde se pretende identificar las preferencias electorales de los
votantes en diferentes grupos sociodemográficos de una población.
Características de un segmento:
Un segmento, en nuestro caso electoral, presenta una respuesta similar a determinadas
propuestas y/o estímulos: esta condición se encuentra asociada a característica en
común que logran particularizar pero al mismo tiempo diferenciar a los diferentes grupos
o segmentos poblacionales con respecto de otros (Thompson, 2005). Como supuestos
teóricos se plantea que 7 :
•
•
•
•
•
•
Un segmento electoral presenta respuestas similares frente los diferentes estímulos
(discursos, compromisos, dádivas, etc.).
Un segmento electoral posee unas características similares en su nivel económico y
demográfico.
Un segmento electoral es sensible a determinadas grupo de propuestas y
mensajes, por ende puede ser influenciado por diversas estrategias de
comunicación utilizadas en campaña.
Un segmento electoral concurre a lugares comunes y geoespacialmente
identificables, interactuando con el medio de manera similar.
Un segmento electoral busca satisfactores específicos de sus preferencias políticas
e intereses.
El tamaño de un segmento depende directamente de las variables que se
determinan para su identificación y selección.
El Algoritmo de Chaid y el proceso de clasificación
4
Gondar Nores, “Análisis cluster, análisis Discriminante y Segmentación Jerárquica” 2001 en:
http://www.estadistico.com/arts.html?20010709+1#start
5
Tomado de: http://nefijacob.itgo.com/SEGMENTACIN%20DE%20MERCADO.htm en diciembre de 2007
6
Escobar Modesto, “Aplicaciones del análisis de segmentación: el procedimiento de CHAID” Working Paper, Numero
31 Universidad de Salamanca, Instituto Juan March 1992.
7
Estos supuestos teóricos son abordados desde diferentes estudios por Lasswell, berelson, jhonson, redes
El Algoritmo de CHAID (Chi-square Automatic Interactíve Detector) 8 forma parte de una
serie de modelos conocidos como árboles de decisión y fue desarrollado por Kass
Gordon en 1980 con el objetivo de realizar segmentaciones en estudios exploratorios o
confirmatorios en ciencias sociales y marketing. En 1993 Jay Madison lo perfeccionó,
transformando la segmentación en una herramienta descriptiva y explicativa mediante la
cual una variable discreta dependiente puede ser predicha por clases o perfiles de
variables discretas (Gondar 2001).
Ventajas y características del algoritmo de Chaid:
Entre las ventajas que consideramos más relevantes de la técnica de CHAID esbozadas
por autores 9 varios tenemos:
•
•
•
•
•
•
•
•
Permite suprimir de un estudio las variables no significativas de forma segura.
Identifica las variables que poseen una interacción fuerte entre ellas.
Es capaz de correr bases de datos de gran tamaño de distintos tipos: discretas,
nominales, ordinales o de frecuencia.
El algoritmo divide la muestra en dos o más grupos que difieren con respecto al
criterio del mejor predictor de la variable.
Las variables explicativas son evaluadas por el test X2 (chi squared test) y la
variable con X2 más significativo se utiliza como el predictor principal.
Es un método explicativo donde todos los segmentos clasificados son excluyentes y
exhaustivos por lo tanto, cada elemento pertenece a un solo segmento y el total
de los segmentos equivale al total de la muestra.
No dicotomiza como otras técnicas de segmentación, sino que, politomiza la
muestra o parte de ella, pudiendo encontrar más de dos segmentos a un mismo
nivel de clasificación.
Este tipo de análisis posee muchas semejanzas con la regresión múltiple para
variables dicotómicas o politomica, con la diferencia que una vez incorporada
una variable. Esta no puede volver a surgir (como en una regresión paso a paso)
aunque puede volver a ser considerada en otra rama del árbol jerárquico.
Modelo de clasificación para el estudio de caso de Santiago de Cali
Selección de la técnica:
La selección de la técnica (Talledo, 1994) 10 a utilizar para llevar a cabo la segmentación
dependió de las características particulares que presentaba cada comuna (Unidad
Mínima Geográfica). Así, como de la necesidad de explicar de manera exploratoria, el
comportamiento de un grupo de variables dependientes mediante un procedimiento no
binario como sucedería por ejemplo en un análisis de conglomerados. Al examinar los
diferentes procedimientos se opto por la utilización del algoritmo de CHAID 11 .
Tabla No 1. Variables utilizadas en la segmentación
Variable
Votación
8
Descripción
Resultados electorales
Escala
Nominal
Categorías
Ospina, Lloreda, Otros, Voto
Para una descripción del Algoritmo de Chaid y su expresión matemática ver el Anexo 1.
9
Gondar, Galindo, Goicochea
Tomado de: http://mexico.pmfarma.com/articulos/?id=4, Publicado en Julio de 2004
11
El análisis clasificatorio se ha realizado con el uso del módulo CHAID (Chi-squared Automatic Interaction Detector)
del programa SPSS.
10
por comuna
Estrato
socioeconómico por
manzanas según
comuna
Genero según censo
electoral por comuna
Autoidentificación
étnica por comuna
Ordinal
en Blanco, Voto Nulo, Voto
No Marcado.
Bajo, Medio, Alto
Nominal
Hombre, Mujer
Nominal
Escolaridad Años aprobados de
educación formal por
comuna
Edad
Rangos de edad por
comuna
Ordinal
negro (a)-mulatoafrocolombiano, Ninguno,
Otros
Primaria o Menos, Secundaria
o Menos, Superior, Ninguna
Estrato
Genero
Étnica
ordinal
18-24, 25-34, 35-44, 45-54, 55 y
Mas
Ya que las variables utilizadas en la investigación han sido identificadas es necesario el
plantear las Hipótesis estadísticas de contraste.
Hipótesis estadísticas:
: La variable votación para cada una de las comunas de Cali, es independientes de
las variables explicativas y por ende de las características socioeconómicas que
connotan. En
consecuencia
el
coeficiente
de
contingencia calculado
no
es
estadísticamente significativo, de tal manera que no existe una diferencia sustantiva
entre las frecuencias esperadas ( ) y las frecuencias observadas ( ).
o( -
0)
: La variable votación para cada una de las comunas de Cali, es dependientes de las
variables explicativas y por ende de las características socioeconómicas que connotan.
En consecuencia el coeficiente de contingencia calculado es estadísticamente
significativo, de tal manera que existe una diferencia sustantiva entre las frecuencias
esperadas ( ) y las frecuencias observadas ( ).
o( -
Nivel de confianza:
0)
(0.01)
Modelo estadístico: Prueba no paramétrica (
)
Regla decisión (RD): si
se rechaza
Tratamiento de los datos:
Se construyeron bases de datos de los comicios electorales de 2007 para la alcaldía de
Santiago de Cali agregados por comunas y corregimientos 12 . Para ello se parte de la
certeza de que los totales por candidatos son una muestra sólida estadísticamente y
sirven de criterio de selección proporcional del número de los casos asignados a las
demás variables explicativas de manera aleatoria. Además, se supone que las variables
independientes presentan un comportamiento monótono al interior de cada comuna.
En general todas las variables utilizadas pertenecen a los ciudadanos de Santiago de Cali
mayores de 18 años. La variable de autoidentificación étnica se agrupo en tres
categorías (negro (a), mulato, afrocolombiano; ninguna; otra). La variable escolaridad
hace referencia a los años cursados y aprobados por los ciudadanos. Esta variable fue
agregada en cuatro categorías (primaria, secundaria, superior, ninguna). Para el caso de
las categorías primaria y secundaria fueron incluidos los casos que presentaron un
número menor o igual a los requeridos para dar por aprobada esta etapa educativa. Así
mismo, la categoría de “ninguna educación” fue agregada con los casos de no
respuesta (que nos son significativos).
Con respecto a la variable estrato socioeconómico se agrupo en tres categorías bajo
(estrato 1 y 2), medio (estrato 3) y alto (estrato 4 y 5) según el número de manzanas
presentes en cada estrato al interior de las comunas 13 . Respetó a los rangos de edad se
establecieron cinco categorías: 18-24, 25-34, 35-44, 45-54, 55 y más. Para determinar la
variable de género se tomo como patrón distributivo por comunas el censo electoral de
hombres y mujeres.
De tal manera que cada voto obtenidos por los candidatos en las distintas comunas fue
convertido en un registro individual al cual se le asignaron de manera proporcional las
características socioeconómicas de las variables explicativas, con la ayuda de un
proceso de automatización diseñado para esta investigación en el lenguaje de
programación PHP 14 . A cada uno de estos casos se le asignó la cantidad derivada en la
distribución de las variables explicativas de manera proporcional, así que la rutina de
automatización genero una base de datos según las siguientes variables categóricas:
candidatos, genero, etnia, estrato, escolaridad, edad.
Características del Modelo de clasificación propuesto:
El modelo de clasificación fue construido para la ciudad de Santiago de Cali y para el
conjunto de las comunas bajo los siguientes criterios:
Tabla No 2. Características del modelo de clasificación
12
Registraduría del Estado Civil “Resultados electorales para alcaldía de 2007 mesa a mesa”. Los resultados electorales
fueron agregados al nivel de comunas en aras de darle homogeneidad geográfica, política y administrativa a las
variables utilizadas ya que la variable dependiente (resultados electorales) se encontraba agrupadas en 31 zonas
electorales determinadas por la Registraduría del Estado Civil.
13
Planeación municipal, “Cali en Cifras 2005”, “Planes de Desarrollo de las comunas 2004”.
14
La base de datos fue construida con la ayuda del Mg. en Matemáticas Néstor Orlando Forero de la Universidad
Nacional de Colombia.
Categorías
Criterios del Modelo
Variables evaluadas
6
Método
CHAID exhaustivo
Validación cruzada
Numero de pliegues de la
muestra=10
Limite de crecimiento
5
Número de casos mínimos
Nodo Paretal (1000), Nodo Final
(300)
Nivel de significación para
Nodos (0,05)
división
Estimación del modelo
Numero de iteraciones 1000
Cambio mínimo en las
Convergencia=0,05
frecuencias esperadas
Corrector de estimaciones
Método de Bonferroni
Costos de clasificación errónea
Ospina (2), Llorera (2)
Estadístico de Chi-cuadrado
Pearson
ANALISIS DE LOS RESULTADOS: EL PERFIL DEL VOTANTE EN CALI
Para el análisis de los resultados obtenidos al ejecutar el algoritmo CHAID es necesario
tener en cuenta dos tipos de nodos que caracterizan la estructura arbórea de la
segmentación:
1. Nodo raíz (NR): Es el nodo inicial o madre y está compuesto por la distribución
porcentual y absoluta de la población total que se analiza cómo variable
dependiente.
2. Nodo terminal (NT): Son el o los nodos que no presentan más bifurcaciones
después de un ejercicio de clasificación. Se encuentran configurados por
individuos homogéneos entre si y, a su vez, diferentes con respecto a los demás
grupos (o nodos) de individuos que conforman la población analizada. Los nodos
terminales se han clasificado a su vez en varias denominaciones:
a) Nodo Terminal Hegemónico (NTH): Se asigna a los NT en los cuales cualquiera de
los candidatos obtuvo una probabilidad de haber sido votado en una categoría
>= 66%.
b) Nodo Terminal Predominante (NTP): Se asigna a los NT en los cuales cualquiera de
los candidatos obtuvo una probabilidad de haber sido votado en el rango <= 51%65%.
c) Nodo Terminal Competitivo (NTC): Se asigna a los NT en los cuales cualquiera de
los candidatos obtuvo una probabilidad de haber sido votado en el rango <=37%50%.
Los nodos NR y NT hacen referencia específica a la estructura clásica de un árbol de
clasificación. Las tres denominaciones adicionales (NTH, NTP y NTC) tienen como objetivo
identificar los diferentes segmentos poblacionales que inclinaron sus preferencias a favor
de los candidatos en contienda. (Ver grafico 1)
Una visión general de las particiones obtenidas mediante el algoritmo de CHAID presenta
el siguiente orden de clasificación según la significación que obtuvieron las variables
independientes a la hora de explicar la variable dependiente en cada una de las
comunas (ver Tabla 3)
Grafico No 1. : Ilustrativo de Análisis de los Resultados
Candidatos
Nodo 0
Categoría
%
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Nodo Raíz
o Paretal
Total
n
28 ,3 10851
60 ,9 23370
4,7 1801
3,9 1515
0,9
334
1,4
526
100 ,0 38397
Genero
Valor P corregido=0,757, Chi-cuadrado=2,626, gl=5
Nodo
Terminal
Hombre
Mujer
Nodo 1
Categoría
Nodo Raíz
o paretal
Nodo 3
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
NTLP Ll
%
37 ,2
48 ,7
6,0
5,1
1,1
1,8
n
779
1019
126
107
23
38
5,4
2092
<= 45-54
d
Nodo Raíz
o paretal
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
Nodo
Terminal
NTLP Ll
d
n
Categoría
27 ,9
61 ,5
4,5
3,9
0,8
1,4
425
938
69
59
12
21
4,0
1524
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
Nodo
Terminal
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
28 ,3 5192
61 ,1 11223
4,6
841
3,8
705
0,8
156
1,3
247
Total
52 ,2 20033
Total
47 ,8 18364
> Secundaria o Menos
Nodo 5
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
%
25 ,6
63 ,4
4,7
4,0
0,9
1,4
n
2041
5058
379
320
71
110
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
%
28 ,5
60 ,9
4,6
3,8
0,8
1,3
n
2839
6070
455
383
84
131
Total
20 ,8
7979
Total
25 ,9
9962
<= 18-24
(18-24, 25-34]
Nodo 8
%
n
n
28 ,2 5659
60 ,6 12147
4,8
960
4,0
810
0,9
178
1,4
279
Edad
Valor P corregido=0,000, Chi-cuadrado=258,248,
gl=10
Nodo 7
%
%
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Nodo 4
> 45-54
Nodo 6
Categoría
(Primaria o Menos, Secundaria o Menos]
Edad
Valor P corregido=0,000, Chi-cuadrado=370,454,
gl=5
Categoría
n
Escolaridad
Valor P corregido=0,000, Chi-cuadrado=158,429,
gl=10
Nodo
Terminal
<= Primaria o Menos
Nodo 2
%
Categoría
62 ,3
14 ,3
10 ,0
8,5
1,9
3,0
354
81
57
48
11
17
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
1,5
568
Total
Nodo
Terminal
> 25-34
Nodo 9
%
n
Categoría
28 ,5
60 ,9
4,6
3,9
0,8
1,3
644
1377
104
88
19
30
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
5,9
2262
Total
Nodo
Terminal
Nodo 10
%
n
Categoría
%
n
4,3
81 ,6
6,1
5,1
1,2
1,8
41
779
58
49
11
17
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
28 ,5
60 ,9
4,6
3,8
0,9
1,3
1356
2902
217
183
41
63
2,5
955
Total
12 ,4
4762
Nodo
Terminal
Análisis de los resultados
Tabla No 3. Orden de significación de las Variables explicativas por comuna según la
secuencia de clasificación
Comuna
Primera
Segunda
Tercera
Cuarta
6,13,14,16,20,21,22 ESTRATO ETNIA
4,5,7,8,12,
ESTRATO ETNIA
ESCOLARIDAD
3,18
ETNIA
ESTRATO
10,RURAL
ETNIA
ESTRATO:ESCOLARIDAD
2,19
ETNIA
ESTRATO:ESCOLARIDAD ESTRATO
15
ESTRATO ESCOLARIDAD
17
ESTRATO ETNIA
GENERO
1
ESTRATO ETNIA
ETNIA
9
ESTRATO ETNIA
ESTRATO
11
ESTRATO ETNIA
ESCOLARIDAD EDAD
ESCOLARIDAD
Los resultados presentados en la Tabla 3 manifiestan que, a la hora de explicar el
comportamiento electoral en aquellas comunas que fueron segmentadas por el
algoritmo CHAID, resultan relevantes, en su orden, las siguientes variables: estrato,
identificación étnica y escolaridad. En 74% de las comunas, el menor Valor P corregido
entre las variables explicativas en una primera segmentación la obtuvo la variable
estrato, seguido por la variable etnia con un 26%.
En una segunda segmentación el menor Valor P corregido en el conjunto de las comunas
se particionó siguiendo la siguiente proporción en el agregado de las comunas: a) la
variable etnia obtuvo un 70%, b) las variables estrato-escolaridad un 17%, c) el estrato un
8%, y d) la variable escolaridad un 5%. Finalmente la variable escolaridad se hace
presente en una tercera segmentación en el 8%, el estrato con el 8%, el género en 4%, la
escolaridad 4% de las comunas de Cali.
Clasificación de las comunas de Santiago de Cali
Con el ánimo de socializar en este 21° Congreso Mundial de Ciencia Política algunos
resultados de esta investigación, a la cual hoy se le entrega continuidad con el proyecto
“La cotidianidad en la selección entre opciones políticas. Pesquisa del comportamiento
electoral desde la vecindad y las redes sociales en elección de alcalde en Cali” hemos
seleccionado tres comunas o sectores de la ciudad de Santiago de Cali que
consideramos representativos del conglomerado de la ciudad y que nos ejemplarizan el
comportamiento electoral de los ciudadanos (ver Grafico 2)
Grafico 2. Mapa de Santiago de Cali por Comunas estudiadas
Comuna 16
La comuna 16 se encuentra ubicada en el oriente de la ciudad y hace parte del
denominado Distrito de Agua Blanca. Limita con la comuna 11, 13, 15 y 17 (estratos 2, 1, 1
y 5, respectivamente). Esta comuna es representativa del estrato socioeconómico bajo.
Presenta una densidad poblacional de 312 habitantes/hectárea, con una densidad de
68.7 viviendas construidas por hectárea y un promedio de 4.5 personas por vivienda. De
un total de 160 manzanas que conforman la comuna se encuentran catalogadas como
estrato Bajo-Bajo 62,3%, Bajo 0,9%, Medio 1,9%, Medio-Alto 34,9; como se puede observar
esta compuesta por una mistura de diferentes estrato socioeconómicos, donde
predomina el estrato bajo seguido por el estrato medio.
La población en edad de votar que se encuentra inscrita en el censo electoral está
distribuida según genero así: 44% mujeres y 56% hombres. El 26% se autoidentifica como,
afrodescendiente, el 1% como otro, y el 73% de sus habitantes no se auto identifican con
las categorías mencionadas. Según el DANE el 35,7% de la población residente en
Comuna 16 ha alcanzado el nivel educativo de básica primaria y el 40,1% secundaria; el
4,6% ha alcanzado el nivel profesional y el 0,5% ha realizado estudios de especialización,
maestría o doctorado. La población residente sin ningún nivel educativo es el 5,0%. La
tasa de analfabetismo para la población mayor de 18 años es de 2.23%, mientras que el
índice de escolaridad para el mismo rango de edad es de 8 años cursados en promedio.
La estructura arbórea de la clasificación (ver Grafico No. 3) nos presenta un nodo raíz
bajo (NROP1), el 3% al
(NROC0), donde el 92% de los votantes pertenecen un estrato
estrato socioeconómico medio (NTOC2) y 5% al estrato medio-alto (NROC3) En el
segundo proceso de clasificación aparece la autoidentificación étnica como variable
explicativa que segmenta los nodos NROP1 y NROC3. El primero en las categorías étnicas,
afrodescendiente y ninguna (NTOP4) y otra (NTOC5). El segundo de los nodos se
fragmenta de acuerdo a los grupos étnicos, afrodescendiente - otra (NTOP6) y ninguna
(NTOP7).
Al analizar el Gráfico No 3 podemos decir que el perfil del votante de este sector se
caracteriza por ciudadanos de estrato socioeconómico bajo fundamentalmente y auto
identificación étnica no diferenciada, ya que las categoría Afrodesendiente al igual que
la categoría Ninguno se han fundido en un solo conjunto o segmento que constituyen el
90% de la población analizada (NTOP4); con un alto porcentaje de pobladores no
identificados étnicamente superior al grupo poblacional identificado como
afrodesendiente. Así mismo nos encontramos con un segmento de la población
perteneciente al estrato medio alto que posee como característica clasificadora ligada
a una identificación étnica diferenciada (NTOP6 y NTOP7).
El análisis de los segmentos obtenidos en la comuna 16 nos muestra cinco (5) grupos clara
mente definidos:
1. Este segmento el cual está representado por el nodo 2 (NTOC) de la grafica 3, está
integrado por el 2.8% de los votantes de la comuna analizada y se caracteriza por
agrupar a ciudadanos de estrato medio. Aquí no se presentan diferencias
porcentuales entre los apoyos recibidos por los candidatos ya que los votos se
distribuyen de manera casi que equitativa.
2. El segmento NTOC4 hace referencia al nodo 4. Este cobra relevancia en el análisis
ya que da cuenta del grupo poblacional más grande de esta comuna agrupando
el 90.5% de los votantes. Este nodo terminal o segmento tiene como características
significativas el pertenecer en primera instancia al estrato bajo. Llamando la
atención que en este nivel socioeconómico no se presentan diferenciaciones de
tipo étnico a la hora de elegir entre los diferentes candidatos, este segmento
agrupa aquellos ciudadanos que se auto identificaron como afrodecendientes y
los que manifiestan no identificarse con ninguna de las opciones propuestas en el
último Censo. En este grupo poblacional el candidato Ospina obtuvo el 50,8% de
probabilidad de ser votado, superando al candidato Lloreda en 24 puntos
porcentuales, sin imponer un predominio electoral según los criterios de
clasificación ya expuestos.
3. El segmento NTOC5 da cuenta de la población que se ha autoidentificado
étnicamente como otro y representa el 1.3% de los votantes de este sector de la
ciudad. El escenario de probabilidades calculadas para este grupo poblacional
nos indican que sus elecciones se distribuyeron de manera muy equilibradas entre
las diferentes opciones; aunque el candidato Ospina obtiene la mayor
probabilidad de ser votado con el 32% de los apoyos, este porcentaje no es tan
contundente como en otros segmentos pues la diferencia con su contendor es de
13 puntos porcentuales.
4. Este segmento poblacional NTOC6 reúne aquellos ciudadanos que se
autoidentifican como afrodecendiente y otros en contraste con el segmento
NTOC7 que se encuentra compuesto por habitantes de esta comuna con
identificación étnica ninguno, ambos segmentos poseen en común su pertenecía
al estrato medio-alto. El nodo NTOC6, se evidencia como al incrementarse el
estrato socioeconómico de la población los apoyos electorales se distribuyen de
manera muy similar entre las diferentes opciones políticas y la probabilidad del
apoyo al candidato Ospina se ve disminuida en 23 puntos porcentuales si la
contrasto con la obtenida en el segmento NTOC4.
5. Finalmente los resultados del modelo en este sector de la ciudad nos indican que
aquellas personas pertenecientes al segmento NTOC7 poseen una probalilidad
menor de eleguir al candidato Ospina que aquellas con similares características
étnicas pertenecientes a un estrato socioeconómico inferior
En general, esta comuna presenta un apoyo al candidato Jorge Iván Ospina (49%). Sin
embargo, cuando observamos las preferencias electorales de los ciudadanos que
habitan en este sector se evidencia como a medida que se incrementa el estrato
socioeconómico se disminuye la votación por este candidato.
Los resultados del nodo NROC3 reiteran una tendencia en la ciudad entre los grupos
afrodescendientes y sin ninguna identificación étnica a votar menos por el candidato
Ospina cuando aumenta la estratificación a la que se pertenecen. En otras palabras,
mayor es la votación por el candidato Lloreda según aumenta el estrato
socioeconómico sin importar la identificación étnica.
Los nodos NROP1 y NROC3 también evidencian como, a mayor estrato socioeconómico,
se hacen más claras las divisiones de carácter étnico en la ciudad. Por una parte, NROP1
es segmentado en un grupo que integra las categorías afrodescendientes y ninguno por
no encontrar distinciones significativas entre dichas categorías al interios de esta variable.
Mientras que al incrementarse el estrato socioeconómico como se muestra en nodo
NROC3 el modelo segmenta las categorías afrodescendientes y ninguno como grupos
terminales disyuntos, pero similares al interior de ellos mismos.
Grafico 3. Árbol de Segmentación
Perfil del Votante de la Comuna 16 de Santiago de Cali
Candidatos
Nodo 0
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
n
%
48,8 12526
26,1 6696
8,2 2116
7,4 1905
3,2
822
6,2 1587
100 ,0 25652
Estrato
Valor P corregido=0,000, Chi-cuadrado=1191,736,
gl=10
(Bajo, Medio]
<= Bajo
Nodo 1
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
> Medio
Nodo 2
%
n
Categoría
50,5 11905
26,6 6274
7,8 1842
6,9 1636
2,5
579
5,6 1329
91,9 23565
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
Nodo 3
%
n
17,4
16,5
16,5
16,5
16,5
16,5
2,8
126
120
120
120
120
120
726
Etnia
Valor P corregido=0,000, Chi-cuadrado=196,275,
gl=5
Negro, Mulato, Afrodecendiente; Ninguno
Nodo 4
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
90,5 23224
Total
%
36,4
22,2
11,3
10,9
9,0
10,1
5,3
Negro, Mulato, Afrodecendiente; Otro
Nodo 5
%
n
50,8 11796
26,7 6206
7,7 1799
6,9 1595
2,3
539
5,6 1289
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
n
495
302
154
149
123
138
1361
Etnia
Valor P corregido=0,000, Chi-cuadrado=66,624,
gl=5
Otro
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Categoría
Ninguno
Nodo 6
%
32,0
19,9
12,6
12,0
11,7
11,7
n
109
68
43
41
40
40
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
1,3
341
Total
Nodo 7
%
27,8
19,5
13,7
13,4
12,8
12,9
n
174
122
86
84
80
81
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
2,4
627
Total
%
43,7
24,5
9,3
8,9
5,9
7,8
n
321
180
68
65
43
57
2,9
734
Proponemos como factor explicativo el efecto de mayoría social según lo planteado por
el profesor Bosque Sendra como elemento clave en el comportamiento electoral de los
ciudadanos de este sector. Ya que se observan grupos homogéneos a los cuales los
candidatos se dirigen de manera selectiva (sendra, 1988:20). Para nuestro caso los grupos
que claramente muestra el ejercicio de segmentación son: a). los determinados por el
nivel de ingresos y el nivel de consumo, b). los grupos étnicos y culturales.
Al mismo tiempo, planteamos que se hace presente un efecto de contagio de las
preferencias electorales de los ciudadanos en el nodo NROP1, esto debido a la presencia
de un grupo mayoritario (50% de los votantes) afecto al candidato Ospina; y favorecido
por la alta densificación del espacio geográfico y por ende de sus redes sociales.
Consideramos que a través de estas redes sociales circularon mayoritariamente discursos
políticos y recursos económicos con un sesgo a favor del candidato en cuestión
El efecto de vecindad que consideramos puede estar siendo reforzado por la relación
espacial de colindancia que presenta en sus límites geográficos del segmento NROP1
(comunas 13, 14, 15 claramente afectas al médico Ospina y de estrato socioeconómico
bajo). Mientras que NROC3 hace referencia a un sector poblacional, donde su mayoría
es de estrato medio-alto y que posee en su frontera sur a la comuna 17 la cual es de
estrato alto. En los segmentos analizados se considera que las características descritas
amplifican las actitudes políticas de la mayoría presentes en cada subsector de la
comuna. La confirmación de estas hipótesis han de ser objeto de estudio de posteriores
investigaciones.
Comuna 3
Esta comuna es representativa del estrato socioeconómico medio de la ciudad de Cali,
está localizada al norte de la ciudad. Limita con las Comunas 2, 9 y 19 (estratos 5, 3 y 5,
respectivamente); posee una densidad poblacional de 120 habitantes/hectárea, con
una densidad de viviendas construidas por hectárea con 33.19 y con un promedio de 3.6
personas por vivienda. De un total de 997 manzanas que conforman la comuna están
catalogada como estrato Bajo-Bajo 6.3%, Bajo 12.6%, Medio 73.8%, Medio-Alto 2.1%, Alto
5% y 1% Alto-Alto.
De la población de la Comuna 3 en edad de votar y que se encuentran inscritas en el
censo electoral son mujeres el 48,8% y el 51,2% hombres. El 15% se autoidentifica como
afrocolombiano, el 2% como otro, y el 83% como ninguno de los anteriores. Según el
DANE el 39,9% de la población residente de la Comuna 3 ha alcanzado únicamente el
nivel de escolaridad de básica primaria y el 36,3% secundaria; el 1,9% ha alcanzado el
nivel profesional y el 0,3% ha realizado estudios de especialización, maestría o doctorado.
La población residente sin ningún nivel educativo es el 8,5%. La tasa de analfabetismo
para la población mayor de 18 años es de 4.3%, mientras que el índice de escolaridad
para el mismo rango de edad es de 9.3 años cursados en promedio.
En la comuna 3 las variables que obtuvieron una mayor significación a la hora de explicar
el comportamiento electoral son: identificación étnica y estrato socioeconómico.
Mientras que han sido descartadas por el modelo de clasificación las variables de
género, escolaridad y rangos de edad al aceptarse la hipótesis nula. Es decir que para
estas tres últimas variables la variable votación es independiente de las variables
explicativas y por ende de las características socioeconómicas que connotan.
Derivado del nodo raíz (NR0) se observa como primer parámetro de clasificación la
identificación étnica estableciéndose las siguientes categorías: afrodecendiente
representa el 16% de los electores (NR1), ninguno 79.6% (NR2), otro 4.1% (NTLC3) (ver
Grafico No. 4). Una segunda clasificación está determinada por el estrato
socioeconómico y particiona los nodos NR1 y NR2. En el caso del nodo NR1 se han
bajo
generado según el estrato socioeconómico las categorías (nodos terminales):
(NTLC 4) con el 3.4%, medio (NTLC 5) con 11%
medio (NTLC6) con el 1.9% de la
votación. Mientras que el nodo NR2 las categorías segmentadas son estrato
(NTLC7) 73% y
medio
medio (NTLC8) con el 6.3%
El ejerció de clasificación presenta 6 segmentos claramente definidos:
El nodo NTLC3 posee como característica general el estar conformado por ciudadanos
que se autoidentifican étnicamente como otros (Indígenas y Rom), esta porción de los
ciudadanos representan el 4,1% de los pobladores de la ciudad. En segmento
poblacional prefirió al candidato Lloreda con 21% de la probabilidad de haber sido
votado, en un contienda estrecha, donde la diferencia porcentual con el candidato
Ospina solo fue de 1.1%.
Este segmento NTLC4 se encuentra conformado por aquellos ciudadanos que se
autoidentificaron como afrocolombianos y que pertenecen al estrato socioeconómico
bajo. Los ciudadanos que hacen parte de este grupo poblacional representan el 3,4% de
la población analizada, al igual que en el anterior segmento el quien obtuvo la mayor
probalilidad de ser votado fue el candidato Lloreda quien con el 38.8% aventaja al
candidato Ospina en 4.5 puntos porcentuales.
Este segmento poblacional NTLC5 hace parte posee como características clasificadora
la pertenencia al estrato medio de aquellas personas que se autoidentificaron como
afrodecendientes. Aquí el candidato Lloreda logra aventajar a su contendor en 5 puntos
porcentuales en la probabilidad de ser votado por los miembros de este grupo
poblacional.
De manera muy similar el segmento anterior el nodo NTCL6 que hace referencia a los
ciudadanos que se autoidentificaron como afrodecendientes y que pertenecen al
estrato socioeconómico medio alto de este sector de la ciudad, representan el 2% de la
poblacion del mismo. mantienen una tendencia similar a los demás miembros de su nodo
raíz.
Los dos siguientes nodos terminales NTLC7 y NTLC8 son nodos hijos de aquellos
ciudadanos que se autoidentificaron como no pertenecientes a ninguna categoría
étnica, se evidencia como este sector que en su conjunto representa el 79,6% de la
población analizada en esta comuna prefieren al candidato Lloreda ampliando un poco
la diferencia presentada entre él y su seguidor levemente.
Entonces un perfil del votante en esta comuna caracterizado por la autoidentificacion
de sus ciudadanos como no pertenecientes a ningún grupo étnico en particular, de
al medio, en contraste con una población afrodesendiente,
estrato socioeconómico
negra o mulata la cual se distribuye entre los diferentes estratos y representa el 16.4% de
los ciudadanos que acudieron a votar en esta comuna de la ciudad.
Grafico 5. Árbol de Segmentación
Perfil del Votante de la Comuna 3 de Santiago de Cali
Candidatos
Nodo 0
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Categoría
%
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
38 ,3
43 ,3
6,8
5,3
2,3
4,0
Total
n
7514
8489
1327
1049
458
775
100 ,0 19612
Etnia
Valor P corregido=0,000, Chi-cuadrado=1327,777,
gl=10
Negro, Mulato, Afrodecendiente
Ninguno
Otro
Nodo 2
Nodo 3
Nodo 1
Categoría
Categoría
%
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
36,5
41,2
7,4
6,1
3,9
5,0
%
1173
1323
238
196
124
161
n
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
39 ,6
44 ,9
6,2
4,7
1,4
3,2
Total
16,4
3215
Total
79,5 15584
Estrato
Valor P corregido=0,000, Chi-cuadrado=163,798,
gl=10
(Bajo, Medio]
> Medio
<= Medio
Nodo 4
Nodo 5
Nodo 6
Nodo 7
%
n
%
n
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
34,3
38,8
8,0
7,0
5,9
5,9
231
261
54
47
40
40
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
38,8
43,8
6,6
5,0
2,0
3,7
843
953
144
109
44
81
3,4
673
Total
11,1
2174
Total
Categoría
Categoría
%
n
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
19,9
21,0
14,8
14,8
14,8
14,8
162
171
120
120
120
120
4,1
813
Total
Estrato
Valor P corregido=0,000, Chi-cuadrado=47,678,
gl=5
<= Bajo
Categoría
n
6179
6995
969
733
214
494
> Medio
Nodo 8
Categoría
%
n
Categoría
%
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
26,9
29,6
10,9
10,9
10,9
10,9
99
109
40
40
40
40
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
39,8
45,1
6,2
4,6
1,2
3,1
1,9
368
Total
73,2 14353
Total
n
5717
6475
883
664
174
440
Categoría
%
n
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
37,5
42,2
7,0
5,6
3,2
4,4
462
520
86
69
40
54
6,3
1231
Total
En general los ciudadanos de esta comuna evidenciaron una preferencia electoral por el
candidato Lloreda en disputa competitiva con el candidato Ospina, sin embargo
cuando se analizan los resultados según la estratificación socioeconómica puede
observarse que no existen variaciones significativas entre un segmento poblacional y otro.
La relación entre estrato socioeconómico y la votación obtenida por el candidato
Lloreda es atípica en esta comuna pues rompe con una constante observada en el
conjunto de la ciudad, ya que este logra obtener porcentualmente una probabilidad
mayor de ser votado entre los demás candidatos en los ciudadanos de estratos bajos y
medios que en el estrato socioeconómico al cual pertenece.
Teniendo en cuanta que los sectores medios apoyaron a Jorge Iván Ospina (explicación
básica del efecto estructura social) nosotros proponemos una primera hipótesis
explicativa (que sería necesario explorar con otros estudios) de este comportamiento
atípico (que la clase media apoyo a Lloreda). Proponemos que en esta zona se dio el
efecto de amigos y vecinos, el cual plantea que electores y candidatos son focos
emisores de información (para el caso de los candidatos favorables a sí mismo) a través
de redes de conocidos que socializan e intercambian datos: “cada elector es un foco
emisor de informaciones, lo cual aplica a cada candidato: donde este es una fuente
emisora de informaciones en principio favorables a sí mismo” (Bosque:1988 23). En este
sentido, consideramos que los ciudadanos del sector estuvieron más proclives a recibir
información emitida por el candidato Lloreda y su equipo de campaña con mayor
frecuencia e intensidad debido a que en esta comuna fue precisamente donde se
estableció su centro de operaciones logísticas (sede de campaña) del candidato en
cuestión.
Comuna 22
Esta comuna es representativa del estrato socioeconómico alto-alto de la ciudad de
Cali, está localizada al sur de la ciudad. Limita con las Comunas 17 (estratos 5); posee
una densidad poblacional de 9 habitantes/hectárea, con una densidad de viviendas
construidas por hectárea de 0.44 y con un promedio de 3.7 personas por vivienda. De un
total de 367 manzanas que conforman la comuna están catalogada como estrato Bajo
3,3 %, Medio-Alto 0,3%, Alto 8,4% y 88,0% Alto-Alto.
Del total de la población de la Comuna 22 en edad de votar y que se encuentran
inscritas en el censo electoral un 46% son mujeres y el 54% hombres. El 12% se
autoidentifica como afrodecendiente, el 1% como otro, y el 87% como ninguno de los
anteriores. Según el DANE el 19% de la población residente de la Comuna 22, ha
alcanzado únicamente la escolaridad básica primaria y el 25,6% secundaria; el 27,8% ha
alcanzado el nivel profesional y el 12,2% ha realizado estudios de especialización,
maestría o doctorado. La población residente sin ningún nivel educativo es el 1,24%. La
tasa de analfabetismo para la población mayor de 18 años es de 4.3%, mientras que el
índice de escolaridad para el mismo rango de edad es de 10,13 años cursados en
promedio.
En la comuna 22 las variables que obtuvieron una mayor significación a la hora de
explicar el comportamiento electoral son: estrato socioeconómico e identificación
étnica. Mientras que han sido descartadas por el modelo de clasificación las variables de
género, escolaridad y rangos de edad al aceptarse la hipótesis nula.
El nodo raíz (NR0) posee como primer parámetro de clasificación el estrato
socioeconómico ramificándose en las categorías:
bajo (NTLC1) con 11.2%, medio
(NTLC2) con 9.5% y
medio (NTLH3) con 79.2% (ver grafico No 5). Una segunda
clasificación está determinada por la auto identificación étnica con nodo raíz NRLH3 en
la categoría afrodecendiente- otro (NTLP4) que representa el 14.5% y, el nodo NRLH5 que
agrupa a los ciudadanos no identificados con ninguna categoría con el 80.3% de la
votación.
El perfil del votante de esta comuna está caracterizado por una población de estrato
socioeconómico alto-alto que no se autoidentifica como perteneciente a ninguna
categoría étnica en 64.7% y un segmento equivalente al 14.5% de los votantes constituido
por ciudadanos autoidentificados como afrodescendientes y otros.
Al realizar los análisis consideramos esta comuna como de contraste pues su población se
encuentra mayoritariamente en el estrato socioeconómico alto. Siguiendo la dinámica
de los otros sectores de la ciudad no nos sorprende que la primera clasificación que es
obtenida por medio del modelo, encuentra a la variable estrato como la de mayor
significación. En el conjunto de la comuna se evidencia un efecto amplificado de
estructura social, la cual se materializa con la disposición marcada del grupo social que
habita en esta comuna a votar por el candidato Lloreda. Del 100% de los votos efectivos
en disputa el candidato Ospina solo obtuvo 13%, consideramos que al interior de esta
comuna se presenta un efecto de contagio espacial y porque no de amigos y vecinos
cuando analizamos los resultados de la última clasificación obtenida mediante el
modelo. El grupo con características socioeconómicas altas es segmentado en dos
nuevas categorías según su auto identificación étnica. De manera semejantes que en el
resto de las comunas al incrementarse el nivel socioeconómico e introducirse la variable
étnica como determinante de las divisiones presentes; las categorías afrodecendiente otro (NTLP4) se configuran en una categoría homogénea y disyunta del grupo de
ciudadanos que se autoidentifican como ninguna (NTLH5).
Cuando contrastamos los resultados obtenidos por el nodo NTLP4 con las demás
comunas de la ciudad es sorprendente la fuerza explicativa que llega a obtener el
estrato socioeconómico, ya que, la condición étnica no representa mayor incidencia a
la hora de elegir al candidato de su preferencia. Al igual que en la comuna 2, 17,19 que
presentan un alto porcentaje de su población clasificada en estratos medios y altos, los
afrodecendiente tendieron a votar en concordancia con su grupo socioeconómico más
que con su condición étnica. Situación que se corrobora al comparar las votaciones
obtenidas por cada uno de los candidatos en estos sectores de la ciudad.
Grafico 6. Árbol de Segmentación
Perfil del Votante de la Comuna 22 de Santiago de Cali
Candidatos
Nodo 0
Categoría
%
n
Ospina
13,1 988
Lloreda
65,0 4904
Otros
6,2 471
Voto en Blanco
5,8 434
Voto Nulo
4,8 362
Voto No Marcado
5,1 383
Total
100 ,0 7542
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Estrato
Valor P corregido=0,000, Chi-cuadrado=2016,176,
gl=10
<= Bajo
Nodo 1
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
(Bajo, Medio]
%
15,1
28,2
14,2
14,2
14,2
14,2
11,2
n
128
239
120
120
120
120
847
Nodo 2
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
> Medio
%
16,7
16,7
16,7
16,7
16,7
16,7
9,5
Nodo 3
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
n
120
120
120
120
120
120
720
%
n
12,4 740
76,1 4545
3,9 231
3,2 194
2,0 122
2,4 143
79,2 5975
Etnia
Valor P corregido=0,000, Chi-cuadrado=500,892,
gl=5
Negro, Mulato, Afrodecendiente; Otro
Nodo 4
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
%
n
13,0 142
57,3 627
7,8
85
7,3
80
7,3
80
7,3
80
14,5 1094
Ninguno
Nodo 5
Categoría
Ospina
Lloreda
Otros
Voto en Blanco
Voto Nulo
Voto No Marcado
Total
%
n
12,3 598
80,3 3918
3,0 146
2,3 114
0,9
42
1,3
63
64,7 4881
BIBLIOGRAFÍA
ROKKAN, Stein (1970): Citizens, Elections, Parties: Approaches to the Comparative Study of
the Process of Development, Nueva York, McKay.
Siegfried. André (1930), Tableau des paris en france, B, Grasset, Paris.
Siegfried. André (1949), Geographie électorale L´Ardéche sous la IIIe Republique, A. Colin
Paris.
Taylor, Peter (1989), Political Geography, World Economy, Nation-State and Locality.
Longman Scientific & Tecnical, Longman House, Londres.
Miller, Warren E, y J Merrill Shanks (1996), The New American Voter, Harvar University Press,
Harvard Mass.
LAZARSFELD, Paul y McPHEE, William N. (1959): Voting, Chicago, University of Chicago
Press.
LAZARSFELD, Paul; BERELSON, Bernard y GAUDET, Hazel (1944): The People's Choice: How
the Voter Makes Up His Mind in a Presidential Campaign, Nueva York, Columbia University
Press.
BOSQUE SENDRA, Joaquín (1988): Geografía electoral, geografía política y elecciones en
España,
http://www.ucm.es/BUCM/revistas/ghi/02119803/articulos/AGUC8282110263A.PDF
HERMET, Guy; ROUQUIE, Alan y LINZ, Juan J. (1982): ¿Para que sirven las elecciones?,
México, Siglo XXI, 1987.
JOHNSTON, R. J. “Class and the geography of voting in England: towards measurement
and understanding”, Transactions of the Institute of British Geographers, New Series, Vol.
10, No. 2, (1985), pp. 245-255
ATTESLANDER Peter; “La investigación social empírica del comportamiento electoral.”,
UNIVERSITAS Vol. 23, No 2; Universidad de Angurgo, 1985
RAE, Douglas W; “Leyes electorales y sistemas de partidos.”, CITEC, Madrid, 1977
BOSQUE Joaquín; “Geografía Electoral.”, Ed. Síntesis S.A. Madrid, 1988
Olamendi, Laura “Léxico de la política”, Fondo de Cultura Económica, FLACSO México.
2000
ALKER H.R. “Mathematics and politics”, Amorrortu editores S.A. 1969
PINZON P. “Un siglo de tradición electoral" COLCIENCIAS-PRESENCIA, 1997.
CASTELLANOS L. “Análisis de los factores determinantes de la abstención electoral en
España”, Universidad de Oviedo, metodología de encuestas, vol. 4, Núm. 1. 2002 pp. 2944
BALSA J. “Ventajas y Limitaciones de la Metodología de Inferencia Ecológica propuesta
por G. King”, UNLP-CONICET, Argentina. 2008.
En http://redalyc.uaemex.mx/redalyc/src/inicio/ArtPdfRed.jsp?iCve=10101304
Descargar