Asociación entre Ruralidad, Oportunidades y Pobreza en los cantones de Costa Rica Universidad de Costa Rica Maestría en Estadística Keylor Carmona Introducción Si bien existe consenso entre los distintos analistas en que las causas de la pobreza son complejas, y multidimensionales tanto entre las áreas urbanas como rurales; el tema de la pobreza rural retoma especial interés entre los promotores del desarrollo económico latinoamericano por cuanto su incidencia y “severidad” parecen mantenerse o agravado en el último cuarto de siglo (Echeverría, 2000), adicionalmente, una buena parte de la pobreza urbana se origina en los esfuerzos de los pobres rurales por intentar escapar de la pobreza desplazándose a las ciudades (FMI, 2001). En cuanto a las causas, si bien el tema particular de la pobreza rural constituye y comprende entre otros elementos, aspectos relacionados con la cultura, el clima, el género, los mercados y las políticas públicas (FMI, 2001), también existe consenso en que la pobreza en este caso se debe a la ausencia de oportunidades de empleo, educación, salud, infraestructura productiva, acceso al crédito, y demás servicios de apoyo. La presente investigación aplica la técnica de modelos estructurales lineales a partir de variables latentes y variables observadas (modelos LISREL), con el objetivo cuantificar la asociación entre la ruralidad y la ausencia de oportunidades y el nivel socieconómico de los cantones. Metodología Variables y fuentes de información La información a nivel cantonal se obtuvo de las estadísticas censales a partir del Censo de Población y Vivienda del año 2000 (CPV-2000) realizado por el Instituto Nacional de Estadística y Censos (INEC). Ciertas variables fueron procesadas directamente de la información censal a partir de la página web del INEC www.inec.go.cr entre estas: Proporción de ocupados en agricultura, cobertura de agua potable dentro de las viviendas, y densidad de población. Otras variables fueron recopiladas gracias al programa Info-Censos del Centro Centroamericano de Población (CCP) que publica estas estadísticas en su página web www.ccp.ucr.ac.cr . Entre éstas se encuentran: Mortalidad Infantil por cada 100 hijos en mujeres entre 20 y 34 años, porcentaje de analfabetismo, asistencia escolar entre jóvenes entre 5 y 24 años, desempleo abierto, porcentaje de población sin seguro social, personas con discapacidad por cada 1000 habitantes, y razón de dependencia demográfica. 1 Otro conjunto de estadísticas fueron obtenidas de las variables que emplea el Ministerio de Planificación Nacional (MIDEPLAN) para construir el Índice de Desarrollo Social Cantonal (IDS) y disponibles en su página web www.mideplan.go.cr . Específicamente: Nacimientos en madres menores a 19 años, tasa general de mortalidad, tasa de diarrea por cada 1000 habitantes, porcentaje de aprobación del I y II ciclo de enseñanza primaria, deserción de secundaria, y la cobertura eléctrica. Adicionalmente otros indicadores particularmente sobre nivel socioeconómico se obtuvieron de los resultados de la estimación para áreas pequeñas realizadas por Carmona, Ramos y Sánchez (2005) para el año 2001. Específicamente: Mediana del ingreso de los habitantes de cada cantón, el porcentaje de población pobre según línea de ingreso, y el índice de polarización social1. Finalmente es importante notar que todas las variables fueron normalizadas cuando así se requirió y homogenizadas en sus rangos de variación y dirección de tal forma que todas variaran entre 0 y 100, y adicionalmente que todas estuvieran asociadas a mayores niveles de ruralidad, escasez de oportunidades (laborales, educativas, etc) y bajos niveles socioeconómicos. Técnica de análisis Como instrumento de análisis, se utilizó la técnica de modelos estructurales lineales a partir de variables latentes y variables observadas (modelos LISREL). Para una introducción a esta técnica y especificaciones para el uso del programa respectivo véase Diamantopoulos y Siguaw (2000). En términos generales, esta técnica permite estimar modelos de ecuaciones simultáneas entre variables no observadas directamente, conocidas como latentes, y sus variables observadas. En términos prácticos representa una combinación de las técnicas estadístcas de análisis de factores y los modelos de ecuaciones simultáneas desarrolladas en la econometría. Sus procedimientos estadísticos parten de la proyección de la matriz de varianzas y covarianzas a partir de las variables explicativas y con las restricciones estructurales derivadas de las relaciones establecidas entre las mismas. Especificación del modelo Luego de análisis previos a partir de la técnica de análisis de factores, se decidió incorporar al análisis 7 variables observables y tres variables latentes. La variable latente Rural se construyó a partir de las variables observables densidad de población (dens) y proporción de ocupados en el sector agrícola (Ocupag). 1 Este último indicador mide el distanciamiento entre el grupo de mayor ingreso y el de menor ingreso en cada cantón. 2 La variable latente Deficiencia de oportunidades (Def_opor), se construyó a partir de las variables observables deficiencia en la cobertura de agua potable dentro de la vivienda (Def_Agua), Deserción en secundaria (DescIII), Deficiencia en la cobertura del Seguro Social (Def_SS). Finalmente, la variable latente Bajo Nivel Socioeconómico (Bajo_NSE), se construyó a partir de las variables observables índice de rezago en mediana del ingreso del cantón (Meding2), e índice de pobreza a partir de la línea de pobreza (PbY). La interacción de las ecuaciones se muestra a continuación: Modelo Estructural: Def _ Opor = γ 1 Rural + ζ Bajo _ NSE = β1 Def _ Opor + γ 2 Rural + ξ Modelos de Medición: Dens = λ1 Rural + δ 1 Ocupag = λ2 Rural + δ 2 Def _ Agua = λ3 Def _ Opor + ε 1 DescIII = λ4 Def _ Opor + ε 2 Def _ SS = λ5 Def _ Opor + ε 3 PbY = λ6 Bajo _ NSE + ε 4 Meding 2 = λ7 Bajo _ NSE + ε 5 3 Resultados y Análisis Tal y como se muestra en las figuras 1 y 2, el modelo especificado puede ser estimado, observándose que todos los parámetros son positivos tal y como se esperaba. Sin embargo se presentan dificultades en la estimación de determinados errores estandar, así como en las pruebas “t”. Así mismo, los resultados demuestran contrario a lo esperado una baja relación entre la variable latente Deficiencia de oportunidades (def_opor) y Bajo nivel socioeconómico (Bajo_NSE) de 0.01. Este resultado plantea a pesar de las posibles deficiencias en las variables utilizadas para construcción de ambas variables latentes, la hipótesis de que la deficiencia de oportunidades no es la causa del bajo nivel socioeconómico, sino una consecuencia del mismo. Sin embargo este resultado puede deberse a la condición transversal del análisis, por lo que es posible que la asociación esperada inicialmente entre oportunidades y nivel socioeconómico resulte más evidente en estudio con información temporal, especialmente estudios de cohorte. La asociación causal observada entre la variable latente de ruralidad con la correspondiente a deficiencia de oportunidades, y bajo nivel socioeconómico si resulta significativa y cercanas a la unidad (0.71 y 0.95 respectivamente). Este resultado sugiere que la dinámica de las áreas rurales están estadísticamente relacionadas con la deficiencia de oportunidades, y con bajos niveles socioeconómicos. En cuanto a la eficiencia interna del modelo estimado, es importante notar que dos ecuaciones, particularmente la que asocia deficiencia de acceso a agua con el constructo de deficiencia de oportunidades, y la que asocia el índice de resago en el ingreso (MEDING2) con el constructo de bajo nivel socioeconómico, presenta problemas de especificación generando errores estándar negativos y R2 superiores a uno. Por otra parte el estudio de la validez del modelo y su bondad de ajuste, muestran que es necesario mejorar en futuros estudios sus especificaciones debido a que no es apropiado para ajustar las interacciones poblacionales (chi2 presenta un nivel de significancia cercano al 3%). Otros indicadores que prueban la bondad del ajuste de la matriz de varianzas y covarianzas, como el RMSEA, y el ECVI se encuentran en límites de baja aceptabilidad (0.079, 0.07 , respectivamente), lo que confirma la necesidad de mejorar la especificación del modelo. 4 Figura 1: Resultados de los parámetros estandarizados del modelo estimado. Figura 2: Valor de los estadísticos “t” significativos del modelo estimado. 5 Cuadro 2. Resultados de las ecuaciones del modelo Cuadro 1. Resultados de ajuste del modelo Degrees of Freedom Minimum Fit Function Chi-Square Normal Theory Weighted Least Squares Chi-Square Estimated Non-centrality Parameter (NCP) 90 Percent Confidence Interval for NCP Minimum Fit Function Value Population Discrepancy Function Value (F0) 90 Percent Confidence Interval for F0 Root Mean Square Error of Approximation (RMSEA) 90 Percent Confidence Interval for RMSEA P-Value for Test of Close Fit (RMSEA < 0.05) Expected Cross-Validation Index (ECVI) 90 Percent Confidence Interval for ECVI ECVI for Saturated Model ECVI for Independence Model Chi-Square for Indep. Model 21 DF Independence AIC Model AIC Saturated AIC Independence CAIC Model CAIC Saturated CAIC Normed Fit Index (NFI) Non-Normed Fit Index (NNFI) Parsimony Normed Fit Index (PNFI) Comparative Fit Index (CFI) Incremental Fit Index (IFI) Relative Fit Index (RFI) Critical N (CN) 11 .83 (P = 0.019) .60 (P = 0.028) 10.6 (1.10 ; 27.85) 0.29 0.13 (0.014 ; 0.35) 0.11 (0.035 ; 0.18) 0.079 0.7 (0.58 ; 0.91) 0.7 7.89 617.28 631.28 55.6 56 655.04 113.31 151.04 0.96 0.96 0.5 0.98 0.98 0.93 LISREL Estimates (Maximum Likelihood) Measurement Equations DESCIII = 0.56*Def_Opor, Errorvar.= 0.69 , R² = 0.31 -0.11 6.06 AGUA = 1.03*Def_Opor, Errorvar.= -0.056, R² = 1.06 (0.21) (0.12) 4.95 -0.46 SINSS = 0.47*Def_Opor, Errorvar.= 0.78 , R² = 0.22 (0.12) (0.12) 3.85 6.24 PBY = 0.97*Bajo_NSE, Errorvar.= 0.061 , R² = 0.94 -0.014 4.35 MEDING2 = 1.01*Bajo_NSE, Errorvar.= -0.011 , R² = 1.01 (0.028) (0.011) 35.43 -1.01 DENS = 0.91*Rural, Errorvar.= 0.17 , R² = 0.83 (0.087) (0.039) 10.49 4.35 OCUPAG = 0.87*Rural, Errorvar.= 0.24 , R² = 0.76 (0.089) (0.046) 9.80 5.19 87.64 Structural Equations Def_Opor = 0.71*Rural, Errorvar.= 0.50 , R² = 0.50 (0.18) (0.18) 4.01 2.74 Bajo_NSE = 0.014*Def_Opor + 0.95*Rural, Errorvar.= 0.070 , R² = 0.93 (0.074) (0.11) (0.036) 0.19 8.95 1.96 6 Conclusiones Se concluye que los esfuerzos en el diseño de modelos que demuestren el efecto de la ausencia de oporturnidades sobre la pobreza deben profundizarse, ya que aunque la presente investigación encuentra una asociación débil (0.01), probablemente estudios de análisis temporal y cohortes, podrán ser más encontrar evidencias más claras al respecto. Por su parte si se demuestra una fuerte y significativa asociación entre el la ruralidad de los territorios y su ausencia de oportunidades y su bajo nivel socioeconómico (0.71 y 0.95 respectivamente). Las estrategias de desarrollo se deberán enfocar a la promoción de las áreas rurales con especial atención a las deficiencias de oportunidades que esta población enfrenta. Finalmente nuevas variables y transformaciones de estas deberán ser evaluadas con el objetivo de mejorar la especificación y resultados del modelo, ya que los indicadores estadísticos al respectos se encuentran en los márgenes de baja confiabilidad. Bibliografía Alvarado C, Ronald; Arce A, Rodrigo; Gómez G, Bernabé; Mendiera A, Melania; Torres B, Erick. Tesis: Modelos de ecuaciones estructurales: una aplicación al estudio de los determinantes del tipo de método anticonceptivo utilizado en Costa Rica. Universidad de Costa Rica, 2002 Diamantopoulos y Siguaw, 2000. Introduction to Lisrel. Sage Publications Echeverri Rafael, 2004. Pobreza Rural y Territorio. Instituto Interamericano de Cooperación Agrícola IICA. Echeverri Rubén, 2000. Opciones para reducir la pobreza rural en América Latina y el Caribe. En Revista de la Cepal 70. Escobal, Javier y Ponce, Carmen, 2000. Innovaciones en la lucha contra la pobreza rural en América Latina. CEPAL Fondo Monetario Intenacional, 2001. La pobreza rural en los países en desarrollo. En: Temas de Economía 26. 7 Anexos DATE: 11/14/2006 TIME: 14:32 P R E L I S 2.72S BY Karl G. Jöreskog & Dag Sörbom This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A. Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2005 Use of this program is subject to the terms specified in the Universal Copyright Convention. Website: www.ssicentral.com The following lines were read from file C:\Ruralidad\BD3.PR2: !PRELIS SYNTAX: Can be edited SY='C:\Ruralidad\BD3.PSF' OU MA=KM XT XM W_A_R_N_I_N_G: DESCIII has more than 15 categories and will be treated as continuous. ERROR CODE 201. W_A_R_N_I_N_G: AGUA has more than 15 categories and will be treated as continuous. ERROR CODE 201. W_A_R_N_I_N_G: DENS has more than 15 categories and will be treated as continuous. ERROR CODE 201. W_A_R_N_I_N_G: OCUPAG has more than 15 categories and will be treated as continuous. ERROR CODE 201. W_A_R_N_I_N_G: PBY has more than 15 categories and will be treated as continuous. ERROR CODE 201. W_A_R_N_I_N_G: MEDING2 has more than 15 categories and will be treated as continuous. ERROR CODE 201. W_A_R_N_I_N_G: SINSS has more than 15 categories and will be treated as continuous. ERROR CODE 201. Total Sample Size = 81 8 Univariate Summary Statistics for Continuous Variables Variable Mean St. Dev. T-Value Skewness Kurtosis Minimum Freq. Maximum Freq. -------- ---- -------- ------- -------- -------- ------- ----- ------- ----DESCIII 13.443 5.042 23.999 0.411 0.087 2.900 1 27.300 1 AGUA 46.691 22.836 18.402 0.331 -0.587 0.000 1 100.000 1 SINSS 38.388 17.265 20.011 0.516 1.697 0.000 1 100.000 1 DENS 61.662 26.063 21.293 -0.652 -0.661 0.000 1 100.000 OCUPAG 38.384 28.719 12.029 0.355 -0.998 0.000 1 100.000 1 PBY 32.286 16.702 17.398 0.330 -0.710 5.100 1 68.700 1 MEDING2 54.905 22.054 22.406 -0.107 -0.464 0.000 1 100.000 1 Test of Univariate Normality for Continuous Variables Skewness Kurtosis Skewness and Kurtosis Variable Z-Score P-Value Z-Score P-Value Chi-Square P-Value DESCIII 1.550 0.121 0.367 0.714 AGUA 1.261 0.207 -1.355 0.175 SINSS 1.917 0.055 2.310 0.021 DENS -2.365 0.018 -1.628 0.103 OCUPAG 1.350 0.177 -3.311 0.001 PBY 1.258 0.208 -1.824 0.068 MEDING2 -0.417 0.677 -0.949 0.342 2.537 0.281 3.425 0.180 9.008 0.011 8.247 0.016 12.787 0.002 4.911 0.086 1.075 0.584 Histograms for Continuous Variables DESCIII Frequency Percentage Lower Class Limit 3 3.7 2.900 8 9.9 5.340 9 11.1 7.780 18 22.2 10.220 17 21.0 12.660 10 12.3 15.100 6 7.4 17.540 6 7.4 19.980 2 2.5 22.420 2 2.5 24.860 AGUA Frequency Percentage Lower Class Limit 2 2.5 0.000 6 7.4 10.000 12 14.8 20.000 18 22.2 30.000 10 12.3 40.000 11 13.6 50.000 5 6.2 60.000 11 13.6 70.000 3 3.7 80.000 3 3.7 90.000 SINSS Frequency Percentage Lower Class Limit 9 5 5 10 25 22 9 2 1 1 1 6.2 6.2 12.3 30.9 27.2 11.1 2.5 1.2 1.2 1.2 0.000 10.000 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 DENS Frequency Percentage Lower Class Limit 2 2.5 0.000 5 6.2 10.000 7 8.6 20.000 5 6.2 30.000 7 8.6 40.000 6 7.4 50.000 6 7.4 60.000 21 25.9 70.000 12 14.8 80.000 10 12.3 90.000 OCUPAG Frequency Percentage Lower Class Limit 18 22.2 0.000 10 12.3 10.000 5 6.2 20.000 12 14.8 30.000 10 12.3 40.000 5 6.2 50.000 6 7.4 60.000 7 8.6 70.000 5 6.2 80.000 3 3.7 90.000 PBY Frequency Percentage Lower Class Limit 13 16.0 5.100 8 9.9 11.460 6 7.4 17.820 10 12.3 24.180 14 17.3 30.540 9 11.1 36.900 8 9.9 43.260 4 4.9 49.620 4 4.9 55.980 5 6.2 62.340 MEDING2 Frequency Percentage Lower Class Limit 1 1.2 0.000 3 3.7 10.000 10 12.3 20.000 8 9.9 30.000 10 10 13 18 7 7 4 12.3 16.0 22.2 8.6 8.6 4.9 40.000 50.000 60.000 70.000 80.000 90.000 Correlation Matrix DESCIII AGUA SINSS DENS OCUPAG PBY -------- -------- -------- -------- -------- -------DESCIII 1.000 AGUA 0.573 1.000 SINSS 0.250 0.485 1.000 DENS 0.360 0.692 0.322 1.000 OCUPAG 0.322 0.591 0.194 0.796 1.000 PBY 0.290 0.644 0.323 0.843 0.850 1.000 MEDING2 0.379 0.707 0.344 0.880 0.856 0.975 Correlation Matrix MEDING2 -------MEDING2 1.000 Means DESCIII AGUA SINSS DENS OCUPAG -------- -------- -------- -------- -------- -------13.443 46.691 38.388 61.662 38.384 32.286 PBY Means MEDING2 -------54.905 Standard Deviations DESCIII AGUA SINSS DENS OCUPAG -------- -------- -------- -------- -------- -------5.042 22.836 17.265 26.063 28.719 16.702 PBY Standard Deviations MEDING2 -------22.054 The Problem used 8944 Bytes (= 0.0% of available workspace) 11