21 CONGRESO MUNDIAL DE CIENCIA POLITICA, SANTIAGO DE CHILE DEPARTAMENTO DE SOCIOLOGIA, FACULTAD DE CIENCIAS SOCIALES UNIVERSIDAD DE CHILE PONENCIA PERFIL DEL VOTANTE DE SANTIAGO DE CALI. UN ANALISIS EXPLORATORIO A PARTIR DEL ALGORITMO DE CHAID EN LAS ELECCIONES DE ALCALDE 2008 PRESENTADA POR WILSON FERNANDO HERRERA BALTAN JULIO 2009 TABLA DE CONTENIDO INTRODUCCION 1. CUESTIONES TEORICAS Enfoques del análisis del comportamiento electoral La sociología electoral Análisis ecológico Estudio de las redes sociales 2. CUESTIONES METODOLOGICAS Sobre los procesos de clasificación Qué es un segmento Características de un segmento El Algoritmo de Chaid y el proceso de clasificación Ventajas y características del algoritmo de Chaid Modelo de clasificación para el estudio de caso de Santiago de Cali Selección de la técnica Hipótesis estadísticas Tratamiento de los datos Características del Modelo de clasificación propuesto 3. ANALISIS DE LOS RESULTADOS: EL PERFIL DEL VOTANTE EN CALI Análisis de los resultados Clasificación de las comunas de Santiago de Cali Comuna 16 Comuna 3 Comuna 22 BIBLIOGRAFIA INTRODUCCION Este estudio exploratorio pretende clasificar 1 a los ciudadanos de Santiago de Cali según los niveles de asociación que se presentan entre las más importantes variables sociodemográficas y los resultados electorales del 28 de octubre de 2007. Se construye un perfil del votante mediante el análisis de segmentación algorítmico de CHAID (Chi-square Automatic Interaction Detection) e identifican las variables explicativas con mayor peso a la hora de dar cuenta del comportamiento electoral de los ciudadanos. CHAID es un algoritmo basado en tablas de contingencia y pruebas X2 asociadas y que no parte de supuestos de normalidad subyacentes. En cada iteración, el algoritmo elige la variable independiente (para nuestro caso: estrato, etnia, escolaridad, rangos de edad y genero) que presenta la interacción más fuerte con la variable dependiente (para nuestro caso: votación). Los resultados de la investigación nos muestran estadísticamente que las variables estrato socioeconómico, identificación étnica y escolaridad son significativas para explicar el comportamiento electoral. Por ejemplo en el 74% de las comunas la variable estrato, obtuvo el menor P-Valor corregido entre las variables explicativas, seguido por la variable etnia con un 26%. Esta investigación entrega indicios sobre cómo las preferencias electorales de los caleños son mediadas en su orden de importancia por las variables enunciadas, así como por los contextos geográficos donde habitan sus ciudadanos. CUESTIONES TEORICAS La investigación sobre el comportamiento electoral se vincula al estudio de la actuación de los ciudadanos con respecto del poder, es decir, a la relación entre la sociedad y el Estado que se manifiesta a través del instrumento del voto. Esta relación está caracterizada por su naturaleza institucional ya que la definen reglas claramente establecidas en varios niveles entre los que sobresale: a) el carácter de la decisión (directa o indirecta), b) las características de la corporación a elegir (poderes ejecutivos y legislativos), c) la temporalidad en la que se produce la decisión y la duración de la 1 En esta investigación se utilizaran los términos clasificar y segmentar como símiles, ya que, ambos connotan el proceso de dividir y/o unir una población en grupos donde cada miembro sea más parecido o este más cohesionado que con los de cualquier otro grupo. misma (los tiempos que demarcan las leyes electorales), y d) el lugar (a través de las circunscripciones o distritos electorales). El voto es importante en las sociedades democráticas occidentales modernas porque en él reside, y a través de él se expresa, la voluntad de los ciudadanos quienes deciden qué tipo de proyecto político es el que ha de gobernarlos. En otras palabras, la distribución de la autoridad y del poder en las instituciones del gobierno y los objetivos o intereses que ellos sirven. Al mismo tiempo el voto legitima a los gobiernos electos y les entregan una base de consenso para la toma de decisiones (Alker 1969: 29). En el siglo XIX en Europa, cuando se ampliaron las libertades civiles y políticas, el voto fue transformándose en un acto de carácter secreto, surgiendo desde este momento el análisis electoral. Este tema se desarrollo tanto en la academia como en el mundo de los políticos en la búsqueda de identificar los factores que explicaran las preferencias del votante anónimo (Olamendi 2000: 68). Enfoques del análisis del comportamiento electoral Los enfoques de estudio del comportamiento electoral han pretendido dar cuenta de aquellas variables o grupo de variables que inciden en la decisión del elector. Teniendo en cuenta, por una parte, el tipo de variables que explican el voto (estructurales, culturales, coyunturales) y, por la otra, el tipo de datos que se utilizan (agregados o individuales). A partir de estas líneas gruesas se han desarrollado tres escuelas o modelos del análisis del comportamiento electoral (Olamendi 2000): 1. El enfoque sociológico o estructural que supone que la toma de decisiones electoral parten de la localización del ciudadano en la estructura social. 2. El enfoque psico-social o de la escuela de Michigan que hace énfasis en la identificación partidista de cada elector como motivador de la elección. 3. El modelo racional en el cual el votante maximiza sus propios intereses a través de la votación y donde la política se asemeja a las interacciones que se presentan en el mercado económico y, entonces, el mercado político es uno donde se intercambian votos por bienes públicos (ver Downs*). Como se observa, la mayoría de los estudiosos del análisis del comportamiento electoral se diferencian, sobre todo, en las razones por las cuales el votante elige un partido/candidato frente a otro. Los enfoques estructurales se centran en el estudio de los determinantes que condicionan el voto, restándole importancia a la interacción del candidato con el electorado y a los mecanismos de decisión. Asuntos que se consideran fundamentales en los modelos racionales. Por tal razón la elección del modelo conceptual utilizado dependerá, en gran medida, del objetivo final de la investigación (Castellanos 2002: 30). Actualmente estos enfoques se siguen utilizando como perspectivas de investigación, inclusive de manera combinada en aras explicar de manera más completa los factores que incidente en una determinada elección. Para el caso de la presente investigación el enfoque trabajado será el sociológico con varias aproximaciones particulares (ecológico, redes sociales y geográfico). La sociología electoral El enfoque sociológico del comportamiento electoral es una rama de la sociología política que concibe el voto como una conducta colectiva y el comportamiento electoral es explicado por características sociales, económicas, demográficas o geográficas que son comunes a los individuos de cierta comunidad o grupo social. Así mismo, investiga las preferencias políticas de los electores mediante el análisis de los resultados electorales, identificando los factores que influencian a los ciudadanos. En consecuencia, pretende contribuir a la comprensión del comportamiento político y, donde es posible, proponer explicaciones causales (Atteslander 1985: 104). Las investigaciones de Lazarsfeld, Berelson, Gaudet y Mcphee en la Universidad de Columbia entre 1944 y 1954 contribuyeron a entregarle solidez empírica al enfoque sociológico. Estos autores han sido identificados con el paradigma del "determinismo social". Según Lazarsfeld (1944: 206) “está comprobado que las personas que viven juntas y sometidas a condiciones externas similares adquieren, en general, iguales intereses y necesidades”. Una primera variante de este enfoque sociológico fue la disciplina de la geografía política. Max Derruau (1964: 636) en su tratado de geografía humana plantea que la geografía política puede ser interpretada desde tres enfoques. El primero, supone que las condiciones geográficas son la base de las reivindicaciones de los pueblos, ya que “siempre es factible basar una reivindicación territorial en una interpretación unilateral de la geografía y de la historia”; el segundo, donde la geografía política es la simple constatación de los hechos territoriales sin búsqueda de explicación de tipo causal y; por último, como una tendencia inversa donde se anexiona toda la geografía a la geografía política teniendo en cuenta que los hechos políticos dominan la economía. Particularmente, la geografía electoral se desarrolló en Francia desde principios del siglo pasado con los trabajos de Siegfried en 1930 y 1949. Esta área del conocimiento pretendía dar cuenta de la distribución regional del voto y, consecuentemente, del apoyo que tenían los partidos y los candidatos en cada región del país. Algunos teóricos consideran que las condiciones biofísicas del territorio inciden como factores explicativos en el comportamiento electoral, mientras que otros autores plantean que las características estructurales de orden social y económicas son mucho más importantes que la naturaleza física del territorio, aunque a veces estas características dependan de de ella (Derruau 1964: 649). La actual geografía electoral se relaciona estrechamente con las teóricas de la geografía humana que centran su atención en la distribución sobre el espacio de los fenómenos sociales, así como en el estudio de los procesos que han generado tales distribuciones espaciales. Los tres temas electorales de interés geográfico son: a) la geografía de las votaciones, b) las influencias espaciales sobre el comportamiento del voto, y c) la organización espacial de la representación parlamentaria (Bosque 1998: 10). Para el enfoque sociológico existen una serie de factores explicativos del comportamiento electoral que se han ido incorporado la luz de nuevos hallazgos investigativos y de los aportes de otras aproximaciones teóricas y disciplinares (específicamente los particularidades del análisis ecológico, el estudio de las redes sociales y la geografía electoral). Análisis ecológico En las Ciencias Sociales, muchas veces se presenta el problema de no contar con los datos de las unidades de análisis que interesa analizar, sino tan sólo con la información agregada de las características que presentan los agrupamientos geográficos de tales unidades. La causa de esta carencia de información puede ser de dos tipos (Balsa 2008: 2): 1. La pérdida de los datos registrados a nivel individual ya que solo se conservan las frecuencias, de algunas variables y la unidad geográfica a la que corresponden. 2. El dato ha sido producido secretamente (como las votaciones) y nunca pudo, ni podrá, conocerse el registro individual, por lo cual únicamente contamos con la información agregada, en el mejor de los casos, los resultados por mesas electorales Para responder a estas dificultades los investigadores han desarrollado el “análisis ecológico” para, desde datos agregados, inferir conductas individuales Este recurso es tradicionalmente utilizado por la sociología electoral y en la geografía política haciendo uso del análisis estadístico (correlaciones y regresiones entre variables) para encontrar una relación cuantitativa entre los resultados electorales y otros hechos sociales de carácter socioeconómico y político. Entre las dificultades que presenta este enfoque se resalta la falacia ecológica 2 (Bosque 1998: 15). Cuando el análisis ecológico del proceso electoral se lleva a cabo en una pequeña ciudad o distrito, se puede aislar fácilmente la influencia que ejercen factores como el estatus económico, la nacionalidad, religión… de tal manera que sus conclusiones nos permiten comprender mejor algunos de los determinantes más importantes de las decisiones políticas de los individuos (Lazarsfeld 1944: 32). Estudio de las redes sociales Uno de los hallazgos más importantes realizados por los investigadores Lazarsfeld, Berelson, Gaudet y Mcphee plantean que los contactos personales directos fueron los estímulos más fuertes en los cambios de opinión electoral de los individuos objetos de investigación. Por su parte, Hackfeldt y Sprague (1987) muestran como las distintas preferencias políticas están mediadas por la distribución de esas preferencias sociales en la transmisión de la información política. Así empieza a surgir el análisis de las redes sociales. Según esta aproximación, los sujetos construyen con intencionalidad redes de información que se ajustan a sus preferencias políticas, y también perciben selectivamente la información que circula socialmente. Este proceso individual es susceptible de ser condicionado por las limitaciones impuestas producto de la distribución de las preferencias políticas en el contexto social. De tal manera que cada contexto ejerce un control sobre la información política que circula a través de la red de relaciones, por ende, esta información resulta parcial e incompleta (Huckfeldt 1987). 2 Al intentar formular afirmaciones sobre relaciones individuales de las personas, se puede caer en la conocida falacia ecológica ya que los datos de los candidatos utilizados están referidos a los distritos electorales, no a las personas propiamente dichas. En este sentido, el elector compone una imagen personal de cada partido y candidato a la luz de las informaciones sobre los distintos partidos y candidatos que recibe. Dicha imagen se compara con las metas personales de cada elector, que dependen de las circunstancias personales de su vida, de su posición económica y social, de su ideología y de su religión, etc” (Bosque 1998: 18). Pero la información política se transmite no sólo a través de discursos y medios de comunicación, sino también a través de una variedad de mecanismos sociales informales (las redes sociales) que se hubican en el lugar de trabajo, en la calle o en los lugares habituales de socialización (por ejemplo, la iglesia, las reuniones sociales). De tal manera que la información política no es procesada por individuos aislados sino por grupos de personas interdependientes que realizan sus actividades cotidianas en medios socialmente estructurados y que envían y reciben distintas interpretaciones de los acontecimientos políticos en un proceso repetitivo de la interacción social. (Huckfeldt*: 1198). Por lo tanto, el comportamiento electoral puede interpretarse en términos de personas unidas por, y situadas en el interior de, redes, grupos y otras formaciones sociales que determinan en gran medida sus oportunidades para el intercambio de información política significativa (Eulau 1986). Cuando se argumenta que la elección de las fuentes de información (¿a quién consulto?) prevalece sobre la influencia social, se equipara a afirmar que las preferencias políticas individuales dominan las preferencias políticas sociales; cuando este es un procesos que se ejecuta en la ultima dirección. Es una burda simplificación suponer que los intereses individuales se traducen directamente en las preferencias individuales. Las preferencias políticas se construyen en lugares estructurales particulares, y son configurados por las múltiples interacciones de los individuos dentro de esos lugares estructurales (Huckfeldt*: 1200). Una descripción de las dinámicas de interacción que se presenta en al interior de las redes sociales la presenta (Bosque, 1998): cada elector individual es considerado un nodo de una red, un punto conectado a otros muchos de un circuito de flujo de información. Cada nodo realiza tres funciones dentro de la red: 1. Recibe información: política, electoral y de otros tipos, de una diversidad de fuentes. 2. Procesa y compara las informaciones con sus planteamientos previos, con dos alternativa: el elector es políticamente neutro y su decisión está determinada únicamente por el volumen, calidad y tendencia de la información recibida, lo que debe ocurrir en muy pocos casos; o, por el contrario, el elector tiene una identificación previa con algún partido político (identificación determinada sobre todo por las condiciones personales de su situación social). 3. Por último, cada elector es también un camino, una senda por donde pasa la información a otras personas. Por supuesto existen emisores de información electoral de distinta potencia. La influencia de esta emisión de información variar según los distintos factores: a) La acción del espacio físico, de la distancia y de la disposición geométrica de los emisores y receptores. b) El grado de densidad de las interconexiones de la red de flujo de información. c) La existencia o no de fuentes de información privilegiadas, que ocupen con sus emisiones los canales de difusión, que son de tamaño limitado, saturándolos e impidiendo su uso por otras personas. Todas estas características definen un modelo conceptual de los factores influyentes en el comportamiento electoral, el paso siguiente es hacer operativo este modelo. Para ello se formulan los factores y variables explicativas más cercanas y observables en relación a todas las ideas anteriormente planteadas. En conclusión, el medio ambiente desempeña un papel crucial en las estructuras sociales que afectan el flujo de la información política. Las personas escogen sus amigos y el contenido de sus conversaciones, pero cada una de estas opciones es, a su vez, delimitada por un entorno que, para muchos propósitos, debe tomarse como dado (Huckfeldt* : 1199). CUESTIONES METODOLOGICAS: En este aparte, pretendemos hacer explicitas los referentes metodológicos, los factores y variables explicativas más cercanas y observables en relación a todas las ideas planteadas anteriormente; en aras en establecer un dialogo entre la teoría y las estrategias utilizadas para dar cuenta del comportamiento electoral de los ciudadanos de Santiago de Cali en las elecciones de Alcalde 2007. Con un ejercicio de segmentación podemos comprender mejor la realidad política electoral antes y después de una elección. En nuestro caso, partimos de la evidencia que la población de votantes estuvo configurada por individuos que difieren entre sí tanto en preferencias electorales como en sus características demográficas y socioeconómicas al segmentar a los ciudadanos que acudieron a las urnas en octubre de 2007 en Santiago de Cali. Aceptamos como supuesto teórico que los discursos políticos circulan a través de redes sociales delimitadas algunas geográficamente y que por ende estos discursos no llegan a todos los ciudadanos de manera homogénea (Huckfeldt; Sprague 1995). Así mismo, que las propuestas y discursos de cada uno de los candidatos en contienda no son de la preferencia de toda la población debido a sus particularidades sociales y de sus intereses. Además, que los candidatos nunca logran un escenario de competencia electoral donde se satisfacen todas las demandas y preferencias individuales de todos los ciudadanos. Por ende se obtienen resultados diferenciados dependiendo de las características sociales y del contexto electoral en el que se desarrollo la disputa políticaelectoral. En este sentido, seguimos a Bosque (1998) para el cual los principales factores explicativos del comportamiento seria el efecto de grupo o de la estructura social (características de los votantes como individuos) Cada elector pertenece a uno o varios grupos sociales de algún tipo, lo que determina una cierta disposición, más o menos marcada, a votar a algún partido, disposición compartida con cierta intensidad con el resto de los miembros del grupo (grupos de intereses). Los grupos sociales que se pueden considerar son muy diferentes y, además, pueden cambiar de un lugar a otro y de un momento temporal al siguiente. Los más obvios son: a) Los basados en hechos económicos y sociales, esencialmente la pertenencia a una clase social con las mismas condiciones de trabajo. b) Los determinados por el nivel de ingresos económicos y el nivel de consumo. c) Los relacionados con la edad de los electores, es decir los grupos de personas unificados por la vivencia de las mismas vicisitudes históricas. d) Los grupos étnicos y culturales diferenciados por la lengua, la religión y las creencias. Para este estudio exploratorio de caso pretende modelar la influencia de algunas variables demográficas en los resultados electorales del 28 de octubre de 2007 en Santiago de Cali. Construyendo una aproximación al perfil del votante e identificando las variables explicativas con mayor peso a la hora de dar cuenta del comportamiento electoral de los ciudadanos. Las siguientes preguntas orientan la investigación: • • • • • ¿Qué variables socioeconómicas influyeron en las preferencias electorales de los ciudadanos de Cali? ¿Con que grado de significación han influido las variables socioeconómicas en la explicación del comportamiento electoral? ¿Cuáles fueron las preferencias electorales de los diferentes segmentos poblacionales frente a las distintas opciones políticas en competencia? ¿Cuál es el perfil socioeconómico del votante de la ciudad? ¿Cuál es el perfil socioeconómico del votante de la ciudad desagregado por comunas? La selección de las variables que se utilizaron para encontrar los distintos segmentos o “grupos de ciudadanos” estuvo marcada por restricciones en el acceso a la información y el costo de la misma. Con la información recolectada, se construyeron las variables independientes (género, identificación étnica, escolaridad, rangos de edad, estrato socioeconómico) y las variables dependientes (votación por candidatos, votos en blanco, votos nulos y votos no marcados). Sobre los procesos de clasificación En lo que resta de este acápite describiremos los elementos conceptuales que nos permitirán a partir de los datos agregados del número de votos otorgados a cada candidato en las comunas de la ciudad, y el número de ciudadanos residentes en la misma que corresponden a ciertas características socio-demográficas, establecer una clasificación de los votantes y del nivel de significación o peso que poseen las variables explicativas al dar cuenta del comportamiento electoral. Qué es un segmento: Cuando se hace referencia a un segmento hablamos de los “contextos en las cuales las percepciones, las preferencias u otros aspectos de la toma de decisiones de los individuos difieren entre grupos de una población” (Green y Tull, 1981 pp. 524). Estos grupos de personas poseen características homogéneas en cuanto a sus condiciones sociodemográficas y preferencias políticas diferenciándose de otros segmentos que pertenecen a una misma población. (Thompson, 2005) 3 . La segmentación es un proceso de subdivisión de individuos en grupos homogéneos entre si y heterogéneos respecto del resto en función de una serie de características que 3 Tomado de: http://www.promonegocios.net/mercadotecnia/segmento-mercado-definicion-concepto.htm, en enero de 2008. los define (Gondar, 2001) 4 . Existe segmentación geográfica cuando se divide una población con base a características de ubicación geográfica (región, tamaño, densidad del área, clima) y segmentación demográfica cuando recurrimos a criterios como: Edad, sexo, estado civil, tamaño de la familia, ingresos, ocupación y escolaridad entre otras variables demográficas 5 . El análisis de segmentación fue concebido y debe ser utilizado principalmente con una finalidad exploratoria. La razón radica en que su mecanismo consiste en la búsqueda de las mejores asociaciones de las variables independientes con la dependiente. Su potencia, al mismo tiempo que su peligro, reside en la selección automática de aquellas categorías que pronostica mejor los valores de la variable considerada objetivo (Escobar, 1992) 6 . Este tipo de análisis en los estudios del comportamiento electoral se ha utilizado en el mayor de los casos como una herramienta de Marketing Político, partiendo de la realización de encuestas donde se pretende identificar las preferencias electorales de los votantes en diferentes grupos sociodemográficos de una población. Características de un segmento: Un segmento, en nuestro caso electoral, presenta una respuesta similar a determinadas propuestas y/o estímulos: esta condición se encuentra asociada a característica en común que logran particularizar pero al mismo tiempo diferenciar a los diferentes grupos o segmentos poblacionales con respecto de otros (Thompson, 2005). Como supuestos teóricos se plantea que 7 : • • • • • • Un segmento electoral presenta respuestas similares frente los diferentes estímulos (discursos, compromisos, dádivas, etc.). Un segmento electoral posee unas características similares en su nivel económico y demográfico. Un segmento electoral es sensible a determinadas grupo de propuestas y mensajes, por ende puede ser influenciado por diversas estrategias de comunicación utilizadas en campaña. Un segmento electoral concurre a lugares comunes y geoespacialmente identificables, interactuando con el medio de manera similar. Un segmento electoral busca satisfactores específicos de sus preferencias políticas e intereses. El tamaño de un segmento depende directamente de las variables que se determinan para su identificación y selección. El Algoritmo de Chaid y el proceso de clasificación 4 Gondar Nores, “Análisis cluster, análisis Discriminante y Segmentación Jerárquica” 2001 en: http://www.estadistico.com/arts.html?20010709+1#start 5 Tomado de: http://nefijacob.itgo.com/SEGMENTACIN%20DE%20MERCADO.htm en diciembre de 2007 6 Escobar Modesto, “Aplicaciones del análisis de segmentación: el procedimiento de CHAID” Working Paper, Numero 31 Universidad de Salamanca, Instituto Juan March 1992. 7 Estos supuestos teóricos son abordados desde diferentes estudios por Lasswell, berelson, jhonson, redes El Algoritmo de CHAID (Chi-square Automatic Interactíve Detector) 8 forma parte de una serie de modelos conocidos como árboles de decisión y fue desarrollado por Kass Gordon en 1980 con el objetivo de realizar segmentaciones en estudios exploratorios o confirmatorios en ciencias sociales y marketing. En 1993 Jay Madison lo perfeccionó, transformando la segmentación en una herramienta descriptiva y explicativa mediante la cual una variable discreta dependiente puede ser predicha por clases o perfiles de variables discretas (Gondar 2001). Ventajas y características del algoritmo de Chaid: Entre las ventajas que consideramos más relevantes de la técnica de CHAID esbozadas por autores 9 varios tenemos: • • • • • • • • Permite suprimir de un estudio las variables no significativas de forma segura. Identifica las variables que poseen una interacción fuerte entre ellas. Es capaz de correr bases de datos de gran tamaño de distintos tipos: discretas, nominales, ordinales o de frecuencia. El algoritmo divide la muestra en dos o más grupos que difieren con respecto al criterio del mejor predictor de la variable. Las variables explicativas son evaluadas por el test X2 (chi squared test) y la variable con X2 más significativo se utiliza como el predictor principal. Es un método explicativo donde todos los segmentos clasificados son excluyentes y exhaustivos por lo tanto, cada elemento pertenece a un solo segmento y el total de los segmentos equivale al total de la muestra. No dicotomiza como otras técnicas de segmentación, sino que, politomiza la muestra o parte de ella, pudiendo encontrar más de dos segmentos a un mismo nivel de clasificación. Este tipo de análisis posee muchas semejanzas con la regresión múltiple para variables dicotómicas o politomica, con la diferencia que una vez incorporada una variable. Esta no puede volver a surgir (como en una regresión paso a paso) aunque puede volver a ser considerada en otra rama del árbol jerárquico. Modelo de clasificación para el estudio de caso de Santiago de Cali Selección de la técnica: La selección de la técnica (Talledo, 1994) 10 a utilizar para llevar a cabo la segmentación dependió de las características particulares que presentaba cada comuna (Unidad Mínima Geográfica). Así, como de la necesidad de explicar de manera exploratoria, el comportamiento de un grupo de variables dependientes mediante un procedimiento no binario como sucedería por ejemplo en un análisis de conglomerados. Al examinar los diferentes procedimientos se opto por la utilización del algoritmo de CHAID 11 . Tabla No 1. Variables utilizadas en la segmentación Variable Votación 8 Descripción Resultados electorales Escala Nominal Categorías Ospina, Lloreda, Otros, Voto Para una descripción del Algoritmo de Chaid y su expresión matemática ver el Anexo 1. 9 Gondar, Galindo, Goicochea Tomado de: http://mexico.pmfarma.com/articulos/?id=4, Publicado en Julio de 2004 11 El análisis clasificatorio se ha realizado con el uso del módulo CHAID (Chi-squared Automatic Interaction Detector) del programa SPSS. 10 por comuna Estrato socioeconómico por manzanas según comuna Genero según censo electoral por comuna Autoidentificación étnica por comuna Ordinal en Blanco, Voto Nulo, Voto No Marcado. Bajo, Medio, Alto Nominal Hombre, Mujer Nominal Escolaridad Años aprobados de educación formal por comuna Edad Rangos de edad por comuna Ordinal negro (a)-mulatoafrocolombiano, Ninguno, Otros Primaria o Menos, Secundaria o Menos, Superior, Ninguna Estrato Genero Étnica ordinal 18-24, 25-34, 35-44, 45-54, 55 y Mas Ya que las variables utilizadas en la investigación han sido identificadas es necesario el plantear las Hipótesis estadísticas de contraste. Hipótesis estadísticas: : La variable votación para cada una de las comunas de Cali, es independientes de las variables explicativas y por ende de las características socioeconómicas que connotan. En consecuencia el coeficiente de contingencia calculado no es estadísticamente significativo, de tal manera que no existe una diferencia sustantiva entre las frecuencias esperadas ( ) y las frecuencias observadas ( ). o( - 0) : La variable votación para cada una de las comunas de Cali, es dependientes de las variables explicativas y por ende de las características socioeconómicas que connotan. En consecuencia el coeficiente de contingencia calculado es estadísticamente significativo, de tal manera que existe una diferencia sustantiva entre las frecuencias esperadas ( ) y las frecuencias observadas ( ). o( - Nivel de confianza: 0) (0.01) Modelo estadístico: Prueba no paramétrica ( ) Regla decisión (RD): si se rechaza Tratamiento de los datos: Se construyeron bases de datos de los comicios electorales de 2007 para la alcaldía de Santiago de Cali agregados por comunas y corregimientos 12 . Para ello se parte de la certeza de que los totales por candidatos son una muestra sólida estadísticamente y sirven de criterio de selección proporcional del número de los casos asignados a las demás variables explicativas de manera aleatoria. Además, se supone que las variables independientes presentan un comportamiento monótono al interior de cada comuna. En general todas las variables utilizadas pertenecen a los ciudadanos de Santiago de Cali mayores de 18 años. La variable de autoidentificación étnica se agrupo en tres categorías (negro (a), mulato, afrocolombiano; ninguna; otra). La variable escolaridad hace referencia a los años cursados y aprobados por los ciudadanos. Esta variable fue agregada en cuatro categorías (primaria, secundaria, superior, ninguna). Para el caso de las categorías primaria y secundaria fueron incluidos los casos que presentaron un número menor o igual a los requeridos para dar por aprobada esta etapa educativa. Así mismo, la categoría de “ninguna educación” fue agregada con los casos de no respuesta (que nos son significativos). Con respecto a la variable estrato socioeconómico se agrupo en tres categorías bajo (estrato 1 y 2), medio (estrato 3) y alto (estrato 4 y 5) según el número de manzanas presentes en cada estrato al interior de las comunas 13 . Respetó a los rangos de edad se establecieron cinco categorías: 18-24, 25-34, 35-44, 45-54, 55 y más. Para determinar la variable de género se tomo como patrón distributivo por comunas el censo electoral de hombres y mujeres. De tal manera que cada voto obtenidos por los candidatos en las distintas comunas fue convertido en un registro individual al cual se le asignaron de manera proporcional las características socioeconómicas de las variables explicativas, con la ayuda de un proceso de automatización diseñado para esta investigación en el lenguaje de programación PHP 14 . A cada uno de estos casos se le asignó la cantidad derivada en la distribución de las variables explicativas de manera proporcional, así que la rutina de automatización genero una base de datos según las siguientes variables categóricas: candidatos, genero, etnia, estrato, escolaridad, edad. Características del Modelo de clasificación propuesto: El modelo de clasificación fue construido para la ciudad de Santiago de Cali y para el conjunto de las comunas bajo los siguientes criterios: Tabla No 2. Características del modelo de clasificación 12 Registraduría del Estado Civil “Resultados electorales para alcaldía de 2007 mesa a mesa”. Los resultados electorales fueron agregados al nivel de comunas en aras de darle homogeneidad geográfica, política y administrativa a las variables utilizadas ya que la variable dependiente (resultados electorales) se encontraba agrupadas en 31 zonas electorales determinadas por la Registraduría del Estado Civil. 13 Planeación municipal, “Cali en Cifras 2005”, “Planes de Desarrollo de las comunas 2004”. 14 La base de datos fue construida con la ayuda del Mg. en Matemáticas Néstor Orlando Forero de la Universidad Nacional de Colombia. Categorías Criterios del Modelo Variables evaluadas 6 Método CHAID exhaustivo Validación cruzada Numero de pliegues de la muestra=10 Limite de crecimiento 5 Número de casos mínimos Nodo Paretal (1000), Nodo Final (300) Nivel de significación para Nodos (0,05) división Estimación del modelo Numero de iteraciones 1000 Cambio mínimo en las Convergencia=0,05 frecuencias esperadas Corrector de estimaciones Método de Bonferroni Costos de clasificación errónea Ospina (2), Llorera (2) Estadístico de Chi-cuadrado Pearson ANALISIS DE LOS RESULTADOS: EL PERFIL DEL VOTANTE EN CALI Para el análisis de los resultados obtenidos al ejecutar el algoritmo CHAID es necesario tener en cuenta dos tipos de nodos que caracterizan la estructura arbórea de la segmentación: 1. Nodo raíz (NR): Es el nodo inicial o madre y está compuesto por la distribución porcentual y absoluta de la población total que se analiza cómo variable dependiente. 2. Nodo terminal (NT): Son el o los nodos que no presentan más bifurcaciones después de un ejercicio de clasificación. Se encuentran configurados por individuos homogéneos entre si y, a su vez, diferentes con respecto a los demás grupos (o nodos) de individuos que conforman la población analizada. Los nodos terminales se han clasificado a su vez en varias denominaciones: a) Nodo Terminal Hegemónico (NTH): Se asigna a los NT en los cuales cualquiera de los candidatos obtuvo una probabilidad de haber sido votado en una categoría >= 66%. b) Nodo Terminal Predominante (NTP): Se asigna a los NT en los cuales cualquiera de los candidatos obtuvo una probabilidad de haber sido votado en el rango <= 51%65%. c) Nodo Terminal Competitivo (NTC): Se asigna a los NT en los cuales cualquiera de los candidatos obtuvo una probabilidad de haber sido votado en el rango <=37%50%. Los nodos NR y NT hacen referencia específica a la estructura clásica de un árbol de clasificación. Las tres denominaciones adicionales (NTH, NTP y NTC) tienen como objetivo identificar los diferentes segmentos poblacionales que inclinaron sus preferencias a favor de los candidatos en contienda. (Ver grafico 1) Una visión general de las particiones obtenidas mediante el algoritmo de CHAID presenta el siguiente orden de clasificación según la significación que obtuvieron las variables independientes a la hora de explicar la variable dependiente en cada una de las comunas (ver Tabla 3) Grafico No 1. : Ilustrativo de Análisis de los Resultados Candidatos Nodo 0 Categoría % Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Nodo Raíz o Paretal Total n 28 ,3 10851 60 ,9 23370 4,7 1801 3,9 1515 0,9 334 1,4 526 100 ,0 38397 Genero Valor P corregido=0,757, Chi-cuadrado=2,626, gl=5 Nodo Terminal Hombre Mujer Nodo 1 Categoría Nodo Raíz o paretal Nodo 3 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total NTLP Ll % 37 ,2 48 ,7 6,0 5,1 1,1 1,8 n 779 1019 126 107 23 38 5,4 2092 <= 45-54 d Nodo Raíz o paretal Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total Nodo Terminal NTLP Ll d n Categoría 27 ,9 61 ,5 4,5 3,9 0,8 1,4 425 938 69 59 12 21 4,0 1524 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total Nodo Terminal Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 28 ,3 5192 61 ,1 11223 4,6 841 3,8 705 0,8 156 1,3 247 Total 52 ,2 20033 Total 47 ,8 18364 > Secundaria o Menos Nodo 5 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado % 25 ,6 63 ,4 4,7 4,0 0,9 1,4 n 2041 5058 379 320 71 110 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado % 28 ,5 60 ,9 4,6 3,8 0,8 1,3 n 2839 6070 455 383 84 131 Total 20 ,8 7979 Total 25 ,9 9962 <= 18-24 (18-24, 25-34] Nodo 8 % n n 28 ,2 5659 60 ,6 12147 4,8 960 4,0 810 0,9 178 1,4 279 Edad Valor P corregido=0,000, Chi-cuadrado=258,248, gl=10 Nodo 7 % % Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Nodo 4 > 45-54 Nodo 6 Categoría (Primaria o Menos, Secundaria o Menos] Edad Valor P corregido=0,000, Chi-cuadrado=370,454, gl=5 Categoría n Escolaridad Valor P corregido=0,000, Chi-cuadrado=158,429, gl=10 Nodo Terminal <= Primaria o Menos Nodo 2 % Categoría 62 ,3 14 ,3 10 ,0 8,5 1,9 3,0 354 81 57 48 11 17 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 1,5 568 Total Nodo Terminal > 25-34 Nodo 9 % n Categoría 28 ,5 60 ,9 4,6 3,9 0,8 1,3 644 1377 104 88 19 30 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 5,9 2262 Total Nodo Terminal Nodo 10 % n Categoría % n 4,3 81 ,6 6,1 5,1 1,2 1,8 41 779 58 49 11 17 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 28 ,5 60 ,9 4,6 3,8 0,9 1,3 1356 2902 217 183 41 63 2,5 955 Total 12 ,4 4762 Nodo Terminal Análisis de los resultados Tabla No 3. Orden de significación de las Variables explicativas por comuna según la secuencia de clasificación Comuna Primera Segunda Tercera Cuarta 6,13,14,16,20,21,22 ESTRATO ETNIA 4,5,7,8,12, ESTRATO ETNIA ESCOLARIDAD 3,18 ETNIA ESTRATO 10,RURAL ETNIA ESTRATO:ESCOLARIDAD 2,19 ETNIA ESTRATO:ESCOLARIDAD ESTRATO 15 ESTRATO ESCOLARIDAD 17 ESTRATO ETNIA GENERO 1 ESTRATO ETNIA ETNIA 9 ESTRATO ETNIA ESTRATO 11 ESTRATO ETNIA ESCOLARIDAD EDAD ESCOLARIDAD Los resultados presentados en la Tabla 3 manifiestan que, a la hora de explicar el comportamiento electoral en aquellas comunas que fueron segmentadas por el algoritmo CHAID, resultan relevantes, en su orden, las siguientes variables: estrato, identificación étnica y escolaridad. En 74% de las comunas, el menor Valor P corregido entre las variables explicativas en una primera segmentación la obtuvo la variable estrato, seguido por la variable etnia con un 26%. En una segunda segmentación el menor Valor P corregido en el conjunto de las comunas se particionó siguiendo la siguiente proporción en el agregado de las comunas: a) la variable etnia obtuvo un 70%, b) las variables estrato-escolaridad un 17%, c) el estrato un 8%, y d) la variable escolaridad un 5%. Finalmente la variable escolaridad se hace presente en una tercera segmentación en el 8%, el estrato con el 8%, el género en 4%, la escolaridad 4% de las comunas de Cali. Clasificación de las comunas de Santiago de Cali Con el ánimo de socializar en este 21° Congreso Mundial de Ciencia Política algunos resultados de esta investigación, a la cual hoy se le entrega continuidad con el proyecto “La cotidianidad en la selección entre opciones políticas. Pesquisa del comportamiento electoral desde la vecindad y las redes sociales en elección de alcalde en Cali” hemos seleccionado tres comunas o sectores de la ciudad de Santiago de Cali que consideramos representativos del conglomerado de la ciudad y que nos ejemplarizan el comportamiento electoral de los ciudadanos (ver Grafico 2) Grafico 2. Mapa de Santiago de Cali por Comunas estudiadas Comuna 16 La comuna 16 se encuentra ubicada en el oriente de la ciudad y hace parte del denominado Distrito de Agua Blanca. Limita con la comuna 11, 13, 15 y 17 (estratos 2, 1, 1 y 5, respectivamente). Esta comuna es representativa del estrato socioeconómico bajo. Presenta una densidad poblacional de 312 habitantes/hectárea, con una densidad de 68.7 viviendas construidas por hectárea y un promedio de 4.5 personas por vivienda. De un total de 160 manzanas que conforman la comuna se encuentran catalogadas como estrato Bajo-Bajo 62,3%, Bajo 0,9%, Medio 1,9%, Medio-Alto 34,9; como se puede observar esta compuesta por una mistura de diferentes estrato socioeconómicos, donde predomina el estrato bajo seguido por el estrato medio. La población en edad de votar que se encuentra inscrita en el censo electoral está distribuida según genero así: 44% mujeres y 56% hombres. El 26% se autoidentifica como, afrodescendiente, el 1% como otro, y el 73% de sus habitantes no se auto identifican con las categorías mencionadas. Según el DANE el 35,7% de la población residente en Comuna 16 ha alcanzado el nivel educativo de básica primaria y el 40,1% secundaria; el 4,6% ha alcanzado el nivel profesional y el 0,5% ha realizado estudios de especialización, maestría o doctorado. La población residente sin ningún nivel educativo es el 5,0%. La tasa de analfabetismo para la población mayor de 18 años es de 2.23%, mientras que el índice de escolaridad para el mismo rango de edad es de 8 años cursados en promedio. La estructura arbórea de la clasificación (ver Grafico No. 3) nos presenta un nodo raíz bajo (NROP1), el 3% al (NROC0), donde el 92% de los votantes pertenecen un estrato estrato socioeconómico medio (NTOC2) y 5% al estrato medio-alto (NROC3) En el segundo proceso de clasificación aparece la autoidentificación étnica como variable explicativa que segmenta los nodos NROP1 y NROC3. El primero en las categorías étnicas, afrodescendiente y ninguna (NTOP4) y otra (NTOC5). El segundo de los nodos se fragmenta de acuerdo a los grupos étnicos, afrodescendiente - otra (NTOP6) y ninguna (NTOP7). Al analizar el Gráfico No 3 podemos decir que el perfil del votante de este sector se caracteriza por ciudadanos de estrato socioeconómico bajo fundamentalmente y auto identificación étnica no diferenciada, ya que las categoría Afrodesendiente al igual que la categoría Ninguno se han fundido en un solo conjunto o segmento que constituyen el 90% de la población analizada (NTOP4); con un alto porcentaje de pobladores no identificados étnicamente superior al grupo poblacional identificado como afrodesendiente. Así mismo nos encontramos con un segmento de la población perteneciente al estrato medio alto que posee como característica clasificadora ligada a una identificación étnica diferenciada (NTOP6 y NTOP7). El análisis de los segmentos obtenidos en la comuna 16 nos muestra cinco (5) grupos clara mente definidos: 1. Este segmento el cual está representado por el nodo 2 (NTOC) de la grafica 3, está integrado por el 2.8% de los votantes de la comuna analizada y se caracteriza por agrupar a ciudadanos de estrato medio. Aquí no se presentan diferencias porcentuales entre los apoyos recibidos por los candidatos ya que los votos se distribuyen de manera casi que equitativa. 2. El segmento NTOC4 hace referencia al nodo 4. Este cobra relevancia en el análisis ya que da cuenta del grupo poblacional más grande de esta comuna agrupando el 90.5% de los votantes. Este nodo terminal o segmento tiene como características significativas el pertenecer en primera instancia al estrato bajo. Llamando la atención que en este nivel socioeconómico no se presentan diferenciaciones de tipo étnico a la hora de elegir entre los diferentes candidatos, este segmento agrupa aquellos ciudadanos que se auto identificaron como afrodecendientes y los que manifiestan no identificarse con ninguna de las opciones propuestas en el último Censo. En este grupo poblacional el candidato Ospina obtuvo el 50,8% de probabilidad de ser votado, superando al candidato Lloreda en 24 puntos porcentuales, sin imponer un predominio electoral según los criterios de clasificación ya expuestos. 3. El segmento NTOC5 da cuenta de la población que se ha autoidentificado étnicamente como otro y representa el 1.3% de los votantes de este sector de la ciudad. El escenario de probabilidades calculadas para este grupo poblacional nos indican que sus elecciones se distribuyeron de manera muy equilibradas entre las diferentes opciones; aunque el candidato Ospina obtiene la mayor probabilidad de ser votado con el 32% de los apoyos, este porcentaje no es tan contundente como en otros segmentos pues la diferencia con su contendor es de 13 puntos porcentuales. 4. Este segmento poblacional NTOC6 reúne aquellos ciudadanos que se autoidentifican como afrodecendiente y otros en contraste con el segmento NTOC7 que se encuentra compuesto por habitantes de esta comuna con identificación étnica ninguno, ambos segmentos poseen en común su pertenecía al estrato medio-alto. El nodo NTOC6, se evidencia como al incrementarse el estrato socioeconómico de la población los apoyos electorales se distribuyen de manera muy similar entre las diferentes opciones políticas y la probabilidad del apoyo al candidato Ospina se ve disminuida en 23 puntos porcentuales si la contrasto con la obtenida en el segmento NTOC4. 5. Finalmente los resultados del modelo en este sector de la ciudad nos indican que aquellas personas pertenecientes al segmento NTOC7 poseen una probalilidad menor de eleguir al candidato Ospina que aquellas con similares características étnicas pertenecientes a un estrato socioeconómico inferior En general, esta comuna presenta un apoyo al candidato Jorge Iván Ospina (49%). Sin embargo, cuando observamos las preferencias electorales de los ciudadanos que habitan en este sector se evidencia como a medida que se incrementa el estrato socioeconómico se disminuye la votación por este candidato. Los resultados del nodo NROC3 reiteran una tendencia en la ciudad entre los grupos afrodescendientes y sin ninguna identificación étnica a votar menos por el candidato Ospina cuando aumenta la estratificación a la que se pertenecen. En otras palabras, mayor es la votación por el candidato Lloreda según aumenta el estrato socioeconómico sin importar la identificación étnica. Los nodos NROP1 y NROC3 también evidencian como, a mayor estrato socioeconómico, se hacen más claras las divisiones de carácter étnico en la ciudad. Por una parte, NROP1 es segmentado en un grupo que integra las categorías afrodescendientes y ninguno por no encontrar distinciones significativas entre dichas categorías al interios de esta variable. Mientras que al incrementarse el estrato socioeconómico como se muestra en nodo NROC3 el modelo segmenta las categorías afrodescendientes y ninguno como grupos terminales disyuntos, pero similares al interior de ellos mismos. Grafico 3. Árbol de Segmentación Perfil del Votante de la Comuna 16 de Santiago de Cali Candidatos Nodo 0 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total n % 48,8 12526 26,1 6696 8,2 2116 7,4 1905 3,2 822 6,2 1587 100 ,0 25652 Estrato Valor P corregido=0,000, Chi-cuadrado=1191,736, gl=10 (Bajo, Medio] <= Bajo Nodo 1 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total > Medio Nodo 2 % n Categoría 50,5 11905 26,6 6274 7,8 1842 6,9 1636 2,5 579 5,6 1329 91,9 23565 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total Nodo 3 % n 17,4 16,5 16,5 16,5 16,5 16,5 2,8 126 120 120 120 120 120 726 Etnia Valor P corregido=0,000, Chi-cuadrado=196,275, gl=5 Negro, Mulato, Afrodecendiente; Ninguno Nodo 4 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total 90,5 23224 Total % 36,4 22,2 11,3 10,9 9,0 10,1 5,3 Negro, Mulato, Afrodecendiente; Otro Nodo 5 % n 50,8 11796 26,7 6206 7,7 1799 6,9 1595 2,3 539 5,6 1289 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total n 495 302 154 149 123 138 1361 Etnia Valor P corregido=0,000, Chi-cuadrado=66,624, gl=5 Otro Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Categoría Ninguno Nodo 6 % 32,0 19,9 12,6 12,0 11,7 11,7 n 109 68 43 41 40 40 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 1,3 341 Total Nodo 7 % 27,8 19,5 13,7 13,4 12,8 12,9 n 174 122 86 84 80 81 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 2,4 627 Total % 43,7 24,5 9,3 8,9 5,9 7,8 n 321 180 68 65 43 57 2,9 734 Proponemos como factor explicativo el efecto de mayoría social según lo planteado por el profesor Bosque Sendra como elemento clave en el comportamiento electoral de los ciudadanos de este sector. Ya que se observan grupos homogéneos a los cuales los candidatos se dirigen de manera selectiva (sendra, 1988:20). Para nuestro caso los grupos que claramente muestra el ejercicio de segmentación son: a). los determinados por el nivel de ingresos y el nivel de consumo, b). los grupos étnicos y culturales. Al mismo tiempo, planteamos que se hace presente un efecto de contagio de las preferencias electorales de los ciudadanos en el nodo NROP1, esto debido a la presencia de un grupo mayoritario (50% de los votantes) afecto al candidato Ospina; y favorecido por la alta densificación del espacio geográfico y por ende de sus redes sociales. Consideramos que a través de estas redes sociales circularon mayoritariamente discursos políticos y recursos económicos con un sesgo a favor del candidato en cuestión El efecto de vecindad que consideramos puede estar siendo reforzado por la relación espacial de colindancia que presenta en sus límites geográficos del segmento NROP1 (comunas 13, 14, 15 claramente afectas al médico Ospina y de estrato socioeconómico bajo). Mientras que NROC3 hace referencia a un sector poblacional, donde su mayoría es de estrato medio-alto y que posee en su frontera sur a la comuna 17 la cual es de estrato alto. En los segmentos analizados se considera que las características descritas amplifican las actitudes políticas de la mayoría presentes en cada subsector de la comuna. La confirmación de estas hipótesis han de ser objeto de estudio de posteriores investigaciones. Comuna 3 Esta comuna es representativa del estrato socioeconómico medio de la ciudad de Cali, está localizada al norte de la ciudad. Limita con las Comunas 2, 9 y 19 (estratos 5, 3 y 5, respectivamente); posee una densidad poblacional de 120 habitantes/hectárea, con una densidad de viviendas construidas por hectárea con 33.19 y con un promedio de 3.6 personas por vivienda. De un total de 997 manzanas que conforman la comuna están catalogada como estrato Bajo-Bajo 6.3%, Bajo 12.6%, Medio 73.8%, Medio-Alto 2.1%, Alto 5% y 1% Alto-Alto. De la población de la Comuna 3 en edad de votar y que se encuentran inscritas en el censo electoral son mujeres el 48,8% y el 51,2% hombres. El 15% se autoidentifica como afrocolombiano, el 2% como otro, y el 83% como ninguno de los anteriores. Según el DANE el 39,9% de la población residente de la Comuna 3 ha alcanzado únicamente el nivel de escolaridad de básica primaria y el 36,3% secundaria; el 1,9% ha alcanzado el nivel profesional y el 0,3% ha realizado estudios de especialización, maestría o doctorado. La población residente sin ningún nivel educativo es el 8,5%. La tasa de analfabetismo para la población mayor de 18 años es de 4.3%, mientras que el índice de escolaridad para el mismo rango de edad es de 9.3 años cursados en promedio. En la comuna 3 las variables que obtuvieron una mayor significación a la hora de explicar el comportamiento electoral son: identificación étnica y estrato socioeconómico. Mientras que han sido descartadas por el modelo de clasificación las variables de género, escolaridad y rangos de edad al aceptarse la hipótesis nula. Es decir que para estas tres últimas variables la variable votación es independiente de las variables explicativas y por ende de las características socioeconómicas que connotan. Derivado del nodo raíz (NR0) se observa como primer parámetro de clasificación la identificación étnica estableciéndose las siguientes categorías: afrodecendiente representa el 16% de los electores (NR1), ninguno 79.6% (NR2), otro 4.1% (NTLC3) (ver Grafico No. 4). Una segunda clasificación está determinada por el estrato socioeconómico y particiona los nodos NR1 y NR2. En el caso del nodo NR1 se han bajo generado según el estrato socioeconómico las categorías (nodos terminales): (NTLC 4) con el 3.4%, medio (NTLC 5) con 11% medio (NTLC6) con el 1.9% de la votación. Mientras que el nodo NR2 las categorías segmentadas son estrato (NTLC7) 73% y medio medio (NTLC8) con el 6.3% El ejerció de clasificación presenta 6 segmentos claramente definidos: El nodo NTLC3 posee como característica general el estar conformado por ciudadanos que se autoidentifican étnicamente como otros (Indígenas y Rom), esta porción de los ciudadanos representan el 4,1% de los pobladores de la ciudad. En segmento poblacional prefirió al candidato Lloreda con 21% de la probabilidad de haber sido votado, en un contienda estrecha, donde la diferencia porcentual con el candidato Ospina solo fue de 1.1%. Este segmento NTLC4 se encuentra conformado por aquellos ciudadanos que se autoidentificaron como afrocolombianos y que pertenecen al estrato socioeconómico bajo. Los ciudadanos que hacen parte de este grupo poblacional representan el 3,4% de la población analizada, al igual que en el anterior segmento el quien obtuvo la mayor probalilidad de ser votado fue el candidato Lloreda quien con el 38.8% aventaja al candidato Ospina en 4.5 puntos porcentuales. Este segmento poblacional NTLC5 hace parte posee como características clasificadora la pertenencia al estrato medio de aquellas personas que se autoidentificaron como afrodecendientes. Aquí el candidato Lloreda logra aventajar a su contendor en 5 puntos porcentuales en la probabilidad de ser votado por los miembros de este grupo poblacional. De manera muy similar el segmento anterior el nodo NTCL6 que hace referencia a los ciudadanos que se autoidentificaron como afrodecendientes y que pertenecen al estrato socioeconómico medio alto de este sector de la ciudad, representan el 2% de la poblacion del mismo. mantienen una tendencia similar a los demás miembros de su nodo raíz. Los dos siguientes nodos terminales NTLC7 y NTLC8 son nodos hijos de aquellos ciudadanos que se autoidentificaron como no pertenecientes a ninguna categoría étnica, se evidencia como este sector que en su conjunto representa el 79,6% de la población analizada en esta comuna prefieren al candidato Lloreda ampliando un poco la diferencia presentada entre él y su seguidor levemente. Entonces un perfil del votante en esta comuna caracterizado por la autoidentificacion de sus ciudadanos como no pertenecientes a ningún grupo étnico en particular, de al medio, en contraste con una población afrodesendiente, estrato socioeconómico negra o mulata la cual se distribuye entre los diferentes estratos y representa el 16.4% de los ciudadanos que acudieron a votar en esta comuna de la ciudad. Grafico 5. Árbol de Segmentación Perfil del Votante de la Comuna 3 de Santiago de Cali Candidatos Nodo 0 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Categoría % Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 38 ,3 43 ,3 6,8 5,3 2,3 4,0 Total n 7514 8489 1327 1049 458 775 100 ,0 19612 Etnia Valor P corregido=0,000, Chi-cuadrado=1327,777, gl=10 Negro, Mulato, Afrodecendiente Ninguno Otro Nodo 2 Nodo 3 Nodo 1 Categoría Categoría % Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 36,5 41,2 7,4 6,1 3,9 5,0 % 1173 1323 238 196 124 161 n Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 39 ,6 44 ,9 6,2 4,7 1,4 3,2 Total 16,4 3215 Total 79,5 15584 Estrato Valor P corregido=0,000, Chi-cuadrado=163,798, gl=10 (Bajo, Medio] > Medio <= Medio Nodo 4 Nodo 5 Nodo 6 Nodo 7 % n % n Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 34,3 38,8 8,0 7,0 5,9 5,9 231 261 54 47 40 40 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 38,8 43,8 6,6 5,0 2,0 3,7 843 953 144 109 44 81 3,4 673 Total 11,1 2174 Total Categoría Categoría % n Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 19,9 21,0 14,8 14,8 14,8 14,8 162 171 120 120 120 120 4,1 813 Total Estrato Valor P corregido=0,000, Chi-cuadrado=47,678, gl=5 <= Bajo Categoría n 6179 6995 969 733 214 494 > Medio Nodo 8 Categoría % n Categoría % Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 26,9 29,6 10,9 10,9 10,9 10,9 99 109 40 40 40 40 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 39,8 45,1 6,2 4,6 1,2 3,1 1,9 368 Total 73,2 14353 Total n 5717 6475 883 664 174 440 Categoría % n Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado 37,5 42,2 7,0 5,6 3,2 4,4 462 520 86 69 40 54 6,3 1231 Total En general los ciudadanos de esta comuna evidenciaron una preferencia electoral por el candidato Lloreda en disputa competitiva con el candidato Ospina, sin embargo cuando se analizan los resultados según la estratificación socioeconómica puede observarse que no existen variaciones significativas entre un segmento poblacional y otro. La relación entre estrato socioeconómico y la votación obtenida por el candidato Lloreda es atípica en esta comuna pues rompe con una constante observada en el conjunto de la ciudad, ya que este logra obtener porcentualmente una probabilidad mayor de ser votado entre los demás candidatos en los ciudadanos de estratos bajos y medios que en el estrato socioeconómico al cual pertenece. Teniendo en cuanta que los sectores medios apoyaron a Jorge Iván Ospina (explicación básica del efecto estructura social) nosotros proponemos una primera hipótesis explicativa (que sería necesario explorar con otros estudios) de este comportamiento atípico (que la clase media apoyo a Lloreda). Proponemos que en esta zona se dio el efecto de amigos y vecinos, el cual plantea que electores y candidatos son focos emisores de información (para el caso de los candidatos favorables a sí mismo) a través de redes de conocidos que socializan e intercambian datos: “cada elector es un foco emisor de informaciones, lo cual aplica a cada candidato: donde este es una fuente emisora de informaciones en principio favorables a sí mismo” (Bosque:1988 23). En este sentido, consideramos que los ciudadanos del sector estuvieron más proclives a recibir información emitida por el candidato Lloreda y su equipo de campaña con mayor frecuencia e intensidad debido a que en esta comuna fue precisamente donde se estableció su centro de operaciones logísticas (sede de campaña) del candidato en cuestión. Comuna 22 Esta comuna es representativa del estrato socioeconómico alto-alto de la ciudad de Cali, está localizada al sur de la ciudad. Limita con las Comunas 17 (estratos 5); posee una densidad poblacional de 9 habitantes/hectárea, con una densidad de viviendas construidas por hectárea de 0.44 y con un promedio de 3.7 personas por vivienda. De un total de 367 manzanas que conforman la comuna están catalogada como estrato Bajo 3,3 %, Medio-Alto 0,3%, Alto 8,4% y 88,0% Alto-Alto. Del total de la población de la Comuna 22 en edad de votar y que se encuentran inscritas en el censo electoral un 46% son mujeres y el 54% hombres. El 12% se autoidentifica como afrodecendiente, el 1% como otro, y el 87% como ninguno de los anteriores. Según el DANE el 19% de la población residente de la Comuna 22, ha alcanzado únicamente la escolaridad básica primaria y el 25,6% secundaria; el 27,8% ha alcanzado el nivel profesional y el 12,2% ha realizado estudios de especialización, maestría o doctorado. La población residente sin ningún nivel educativo es el 1,24%. La tasa de analfabetismo para la población mayor de 18 años es de 4.3%, mientras que el índice de escolaridad para el mismo rango de edad es de 10,13 años cursados en promedio. En la comuna 22 las variables que obtuvieron una mayor significación a la hora de explicar el comportamiento electoral son: estrato socioeconómico e identificación étnica. Mientras que han sido descartadas por el modelo de clasificación las variables de género, escolaridad y rangos de edad al aceptarse la hipótesis nula. El nodo raíz (NR0) posee como primer parámetro de clasificación el estrato socioeconómico ramificándose en las categorías: bajo (NTLC1) con 11.2%, medio (NTLC2) con 9.5% y medio (NTLH3) con 79.2% (ver grafico No 5). Una segunda clasificación está determinada por la auto identificación étnica con nodo raíz NRLH3 en la categoría afrodecendiente- otro (NTLP4) que representa el 14.5% y, el nodo NRLH5 que agrupa a los ciudadanos no identificados con ninguna categoría con el 80.3% de la votación. El perfil del votante de esta comuna está caracterizado por una población de estrato socioeconómico alto-alto que no se autoidentifica como perteneciente a ninguna categoría étnica en 64.7% y un segmento equivalente al 14.5% de los votantes constituido por ciudadanos autoidentificados como afrodescendientes y otros. Al realizar los análisis consideramos esta comuna como de contraste pues su población se encuentra mayoritariamente en el estrato socioeconómico alto. Siguiendo la dinámica de los otros sectores de la ciudad no nos sorprende que la primera clasificación que es obtenida por medio del modelo, encuentra a la variable estrato como la de mayor significación. En el conjunto de la comuna se evidencia un efecto amplificado de estructura social, la cual se materializa con la disposición marcada del grupo social que habita en esta comuna a votar por el candidato Lloreda. Del 100% de los votos efectivos en disputa el candidato Ospina solo obtuvo 13%, consideramos que al interior de esta comuna se presenta un efecto de contagio espacial y porque no de amigos y vecinos cuando analizamos los resultados de la última clasificación obtenida mediante el modelo. El grupo con características socioeconómicas altas es segmentado en dos nuevas categorías según su auto identificación étnica. De manera semejantes que en el resto de las comunas al incrementarse el nivel socioeconómico e introducirse la variable étnica como determinante de las divisiones presentes; las categorías afrodecendiente otro (NTLP4) se configuran en una categoría homogénea y disyunta del grupo de ciudadanos que se autoidentifican como ninguna (NTLH5). Cuando contrastamos los resultados obtenidos por el nodo NTLP4 con las demás comunas de la ciudad es sorprendente la fuerza explicativa que llega a obtener el estrato socioeconómico, ya que, la condición étnica no representa mayor incidencia a la hora de elegir al candidato de su preferencia. Al igual que en la comuna 2, 17,19 que presentan un alto porcentaje de su población clasificada en estratos medios y altos, los afrodecendiente tendieron a votar en concordancia con su grupo socioeconómico más que con su condición étnica. Situación que se corrobora al comparar las votaciones obtenidas por cada uno de los candidatos en estos sectores de la ciudad. Grafico 6. Árbol de Segmentación Perfil del Votante de la Comuna 22 de Santiago de Cali Candidatos Nodo 0 Categoría % n Ospina 13,1 988 Lloreda 65,0 4904 Otros 6,2 471 Voto en Blanco 5,8 434 Voto Nulo 4,8 362 Voto No Marcado 5,1 383 Total 100 ,0 7542 Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Estrato Valor P corregido=0,000, Chi-cuadrado=2016,176, gl=10 <= Bajo Nodo 1 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total (Bajo, Medio] % 15,1 28,2 14,2 14,2 14,2 14,2 11,2 n 128 239 120 120 120 120 847 Nodo 2 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total > Medio % 16,7 16,7 16,7 16,7 16,7 16,7 9,5 Nodo 3 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total n 120 120 120 120 120 120 720 % n 12,4 740 76,1 4545 3,9 231 3,2 194 2,0 122 2,4 143 79,2 5975 Etnia Valor P corregido=0,000, Chi-cuadrado=500,892, gl=5 Negro, Mulato, Afrodecendiente; Otro Nodo 4 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total % n 13,0 142 57,3 627 7,8 85 7,3 80 7,3 80 7,3 80 14,5 1094 Ninguno Nodo 5 Categoría Ospina Lloreda Otros Voto en Blanco Voto Nulo Voto No Marcado Total % n 12,3 598 80,3 3918 3,0 146 2,3 114 0,9 42 1,3 63 64,7 4881 BIBLIOGRAFÍA ROKKAN, Stein (1970): Citizens, Elections, Parties: Approaches to the Comparative Study of the Process of Development, Nueva York, McKay. Siegfried. André (1930), Tableau des paris en france, B, Grasset, Paris. Siegfried. André (1949), Geographie électorale L´Ardéche sous la IIIe Republique, A. Colin Paris. Taylor, Peter (1989), Political Geography, World Economy, Nation-State and Locality. Longman Scientific & Tecnical, Longman House, Londres. Miller, Warren E, y J Merrill Shanks (1996), The New American Voter, Harvar University Press, Harvard Mass. LAZARSFELD, Paul y McPHEE, William N. (1959): Voting, Chicago, University of Chicago Press. LAZARSFELD, Paul; BERELSON, Bernard y GAUDET, Hazel (1944): The People's Choice: How the Voter Makes Up His Mind in a Presidential Campaign, Nueva York, Columbia University Press. BOSQUE SENDRA, Joaquín (1988): Geografía electoral, geografía política y elecciones en España, http://www.ucm.es/BUCM/revistas/ghi/02119803/articulos/AGUC8282110263A.PDF HERMET, Guy; ROUQUIE, Alan y LINZ, Juan J. (1982): ¿Para que sirven las elecciones?, México, Siglo XXI, 1987. JOHNSTON, R. J. “Class and the geography of voting in England: towards measurement and understanding”, Transactions of the Institute of British Geographers, New Series, Vol. 10, No. 2, (1985), pp. 245-255 ATTESLANDER Peter; “La investigación social empírica del comportamiento electoral.”, UNIVERSITAS Vol. 23, No 2; Universidad de Angurgo, 1985 RAE, Douglas W; “Leyes electorales y sistemas de partidos.”, CITEC, Madrid, 1977 BOSQUE Joaquín; “Geografía Electoral.”, Ed. Síntesis S.A. Madrid, 1988 Olamendi, Laura “Léxico de la política”, Fondo de Cultura Económica, FLACSO México. 2000 ALKER H.R. “Mathematics and politics”, Amorrortu editores S.A. 1969 PINZON P. “Un siglo de tradición electoral" COLCIENCIAS-PRESENCIA, 1997. CASTELLANOS L. “Análisis de los factores determinantes de la abstención electoral en España”, Universidad de Oviedo, metodología de encuestas, vol. 4, Núm. 1. 2002 pp. 2944 BALSA J. “Ventajas y Limitaciones de la Metodología de Inferencia Ecológica propuesta por G. King”, UNLP-CONICET, Argentina. 2008. En http://redalyc.uaemex.mx/redalyc/src/inicio/ArtPdfRed.jsp?iCve=10101304