Asociación entre Ruralidad, Oportunidades y Pobreza en los

Anuncio
Asociación entre Ruralidad, Oportunidades y Pobreza en
los cantones de Costa Rica
Universidad de Costa Rica
Maestría en Estadística
Keylor Carmona
Introducción
Si bien existe consenso entre los distintos analistas en que las causas de la pobreza son
complejas, y multidimensionales tanto entre las áreas urbanas como rurales; el tema de la
pobreza rural retoma especial interés entre los promotores del desarrollo económico
latinoamericano por cuanto su incidencia y “severidad” parecen mantenerse o agravado en
el último cuarto de siglo (Echeverría, 2000), adicionalmente, una buena parte de la pobreza
urbana se origina en los esfuerzos de los pobres rurales por intentar escapar de la pobreza
desplazándose a las ciudades (FMI, 2001).
En cuanto a las causas, si bien el tema particular de la pobreza rural constituye y
comprende entre otros elementos, aspectos relacionados con la cultura, el clima, el género,
los mercados y las políticas públicas (FMI, 2001), también existe consenso en que la
pobreza en este caso se debe a la ausencia de oportunidades de empleo, educación, salud,
infraestructura productiva, acceso al crédito, y demás servicios de apoyo.
La presente investigación aplica la técnica de modelos estructurales lineales a partir de
variables latentes y variables observadas (modelos LISREL), con el objetivo cuantificar la
asociación entre la ruralidad y la ausencia de oportunidades y el nivel socieconómico de los
cantones.
Metodología
Variables y fuentes de información
La información a nivel cantonal se obtuvo de las estadísticas censales a partir del Censo de
Población y Vivienda del año 2000 (CPV-2000) realizado por el Instituto Nacional de
Estadística y Censos (INEC). Ciertas variables fueron procesadas directamente de la
información censal a partir de la página web del INEC www.inec.go.cr entre estas:
Proporción de ocupados en agricultura, cobertura de agua potable dentro de las viviendas, y
densidad de población. Otras variables fueron recopiladas gracias al programa Info-Censos
del Centro Centroamericano de Población (CCP) que publica estas estadísticas en su página
web www.ccp.ucr.ac.cr . Entre éstas se encuentran: Mortalidad Infantil por cada 100 hijos
en mujeres entre 20 y 34 años, porcentaje de analfabetismo, asistencia escolar entre jóvenes
entre 5 y 24 años, desempleo abierto, porcentaje de población sin seguro social, personas
con discapacidad por cada 1000 habitantes, y razón de dependencia demográfica.
1
Otro conjunto de estadísticas fueron obtenidas de las variables que emplea el Ministerio de
Planificación Nacional (MIDEPLAN) para construir el Índice de Desarrollo Social
Cantonal (IDS) y disponibles en su página web www.mideplan.go.cr . Específicamente:
Nacimientos en madres menores a 19 años, tasa general de mortalidad, tasa de diarrea por
cada 1000 habitantes, porcentaje de aprobación del I y II ciclo de enseñanza primaria,
deserción de secundaria, y la cobertura eléctrica.
Adicionalmente otros indicadores particularmente sobre nivel socioeconómico se
obtuvieron de los resultados de la estimación para áreas pequeñas realizadas por Carmona,
Ramos y Sánchez (2005) para el año 2001. Específicamente: Mediana del ingreso de los
habitantes de cada cantón, el porcentaje de población pobre según línea de ingreso, y el
índice de polarización social1.
Finalmente es importante notar que todas las variables fueron normalizadas cuando así se
requirió y homogenizadas en sus rangos de variación y dirección de tal forma que todas
variaran entre 0 y 100, y adicionalmente que todas estuvieran asociadas a mayores niveles
de ruralidad, escasez de oportunidades (laborales, educativas, etc) y bajos niveles
socioeconómicos.
Técnica de análisis
Como instrumento de análisis, se utilizó la técnica de modelos estructurales lineales a partir
de variables latentes y variables observadas (modelos LISREL). Para una introducción a
esta técnica y especificaciones para el uso del programa respectivo véase Diamantopoulos y
Siguaw (2000).
En términos generales, esta técnica permite estimar modelos de ecuaciones simultáneas
entre variables no observadas directamente, conocidas como latentes, y sus variables
observadas. En términos prácticos representa una combinación de las técnicas estadístcas
de análisis de factores y los modelos de ecuaciones simultáneas desarrolladas en la
econometría.
Sus procedimientos estadísticos parten de la proyección de la matriz de varianzas y
covarianzas a partir de las variables explicativas y con las restricciones estructurales
derivadas de las relaciones establecidas entre las mismas.
Especificación del modelo
Luego de análisis previos a partir de la técnica de análisis de factores, se decidió incorporar
al análisis 7 variables observables y tres variables latentes. La variable latente Rural se
construyó a partir de las variables observables densidad de población (dens) y proporción
de ocupados en el sector agrícola (Ocupag).
1
Este último indicador mide el distanciamiento entre el grupo de mayor ingreso y el de menor ingreso en cada
cantón.
2
La variable latente Deficiencia de oportunidades (Def_opor), se construyó a partir de las
variables observables deficiencia en la cobertura de agua potable dentro de la vivienda
(Def_Agua), Deserción en secundaria (DescIII), Deficiencia en la cobertura del Seguro
Social (Def_SS).
Finalmente, la variable latente Bajo Nivel Socioeconómico (Bajo_NSE), se construyó a
partir de las variables observables índice de rezago en mediana del ingreso del cantón
(Meding2), e índice de pobreza a partir de la línea de pobreza (PbY).
La interacción de las ecuaciones se muestra a continuación:
Modelo Estructural:
Def _ Opor = γ 1 Rural + ζ
Bajo _ NSE = β1 Def _ Opor + γ 2 Rural + ξ
Modelos de Medición:
Dens = λ1 Rural + δ 1
Ocupag = λ2 Rural + δ 2
Def _ Agua = λ3 Def _ Opor + ε 1
DescIII = λ4 Def _ Opor + ε 2
Def _ SS = λ5 Def _ Opor + ε 3
PbY = λ6 Bajo _ NSE + ε 4
Meding 2 = λ7 Bajo _ NSE + ε 5
3
Resultados y Análisis
Tal y como se muestra en las figuras 1 y 2, el modelo especificado puede ser estimado,
observándose que todos los parámetros son positivos tal y como se esperaba. Sin embargo
se presentan dificultades en la estimación de determinados errores estandar, así como en las
pruebas “t”.
Así mismo, los resultados demuestran contrario a lo esperado una baja relación entre la
variable latente Deficiencia de oportunidades (def_opor) y Bajo nivel socioeconómico
(Bajo_NSE) de 0.01. Este resultado plantea a pesar de las posibles deficiencias en las
variables utilizadas para construcción de ambas variables latentes, la hipótesis de que la
deficiencia de oportunidades no es la causa del bajo nivel socioeconómico, sino una
consecuencia del mismo. Sin embargo este resultado puede deberse a la condición
transversal del análisis, por lo que es posible que la asociación esperada inicialmente entre
oportunidades y nivel socioeconómico resulte más evidente en estudio con información
temporal, especialmente estudios de cohorte.
La asociación causal observada entre la variable latente de ruralidad con la correspondiente
a deficiencia de oportunidades, y bajo nivel socioeconómico si resulta significativa y
cercanas a la unidad (0.71 y 0.95 respectivamente). Este resultado sugiere que la dinámica
de las áreas rurales están estadísticamente relacionadas con la deficiencia de oportunidades,
y con bajos niveles socioeconómicos.
En cuanto a la eficiencia interna del modelo estimado, es importante notar que dos
ecuaciones, particularmente la que asocia deficiencia de acceso a agua con el constructo de
deficiencia de oportunidades, y la que asocia el índice de resago en el ingreso (MEDING2)
con el constructo de bajo nivel socioeconómico, presenta problemas de especificación
generando errores estándar negativos y R2 superiores a uno.
Por otra parte el estudio de la validez del modelo y su bondad de ajuste, muestran que es
necesario mejorar en futuros estudios sus especificaciones debido a que no es apropiado
para ajustar las interacciones poblacionales (chi2 presenta un nivel de significancia cercano
al 3%).
Otros indicadores que prueban la bondad del ajuste de la matriz de varianzas y covarianzas,
como el RMSEA, y el ECVI se encuentran en límites de baja aceptabilidad (0.079, 0.07 ,
respectivamente), lo que confirma la necesidad de mejorar la especificación del modelo.
4
Figura 1: Resultados de los parámetros estandarizados del modelo estimado.
Figura 2: Valor de los estadísticos “t” significativos del modelo estimado.
5
Cuadro 2. Resultados de las ecuaciones del
modelo
Cuadro 1. Resultados de ajuste del modelo
Degrees of Freedom
Minimum Fit Function Chi-Square
Normal Theory Weighted Least Squares Chi-Square
Estimated Non-centrality Parameter (NCP)
90 Percent Confidence Interval for NCP
Minimum Fit Function Value
Population Discrepancy Function Value (F0)
90 Percent Confidence Interval for F0
Root Mean Square Error of Approximation (RMSEA)
90 Percent Confidence Interval for RMSEA
P-Value for Test of Close Fit (RMSEA < 0.05)
Expected Cross-Validation Index (ECVI)
90 Percent Confidence Interval for ECVI
ECVI for Saturated Model
ECVI for Independence Model
Chi-Square for Indep. Model 21 DF
Independence AIC
Model AIC
Saturated AIC
Independence CAIC
Model CAIC
Saturated CAIC
Normed Fit Index (NFI)
Non-Normed Fit Index (NNFI)
Parsimony Normed Fit Index (PNFI)
Comparative Fit Index (CFI)
Incremental Fit Index (IFI)
Relative Fit Index (RFI)
Critical N (CN)
11
.83 (P = 0.019)
.60 (P = 0.028)
10.6
(1.10 ; 27.85)
0.29
0.13
(0.014 ; 0.35)
0.11
(0.035 ; 0.18)
0.079
0.7
(0.58 ; 0.91)
0.7
7.89
617.28
631.28
55.6
56
655.04
113.31
151.04
0.96
0.96
0.5
0.98
0.98
0.93
LISREL Estimates (Maximum Likelihood)
Measurement Equations
DESCIII = 0.56*Def_Opor, Errorvar.= 0.69 , R² = 0.31
-0.11
6.06
AGUA = 1.03*Def_Opor, Errorvar.= -0.056, R² = 1.06
(0.21)
(0.12)
4.95
-0.46
SINSS = 0.47*Def_Opor, Errorvar.= 0.78 , R² = 0.22
(0.12)
(0.12)
3.85
6.24
PBY = 0.97*Bajo_NSE, Errorvar.= 0.061 , R² = 0.94
-0.014
4.35
MEDING2 = 1.01*Bajo_NSE, Errorvar.= -0.011 , R² = 1.01
(0.028)
(0.011)
35.43
-1.01
DENS = 0.91*Rural, Errorvar.= 0.17 , R² = 0.83
(0.087)
(0.039)
10.49
4.35
OCUPAG = 0.87*Rural, Errorvar.= 0.24 , R² = 0.76
(0.089)
(0.046)
9.80
5.19
87.64
Structural Equations
Def_Opor = 0.71*Rural, Errorvar.= 0.50 , R² = 0.50
(0.18)
(0.18)
4.01
2.74
Bajo_NSE = 0.014*Def_Opor + 0.95*Rural, Errorvar.= 0.070 , R² = 0.93
(0.074)
(0.11)
(0.036)
0.19
8.95
1.96
6
Conclusiones
Se concluye que los esfuerzos en el diseño de modelos que demuestren el efecto de la
ausencia de oporturnidades sobre la pobreza deben profundizarse, ya que aunque la
presente investigación encuentra una asociación débil (0.01), probablemente estudios de
análisis temporal y cohortes, podrán ser más encontrar evidencias más claras al respecto.
Por su parte si se demuestra una fuerte y significativa asociación entre el la ruralidad de los
territorios y su ausencia de oportunidades y su bajo nivel socioeconómico (0.71 y 0.95
respectivamente). Las estrategias de desarrollo se deberán enfocar a la promoción de las
áreas rurales con especial atención a las deficiencias de oportunidades que esta población
enfrenta.
Finalmente nuevas variables y transformaciones de estas deberán ser evaluadas con el
objetivo de mejorar la especificación y resultados del modelo, ya que los indicadores
estadísticos al respectos se encuentran en los márgenes de baja confiabilidad.
Bibliografía
Alvarado C, Ronald; Arce A, Rodrigo; Gómez G, Bernabé; Mendiera A, Melania; Torres
B, Erick. Tesis: Modelos de ecuaciones estructurales: una aplicación al estudio de los
determinantes del tipo de método anticonceptivo utilizado en Costa Rica. Universidad de
Costa Rica, 2002
Diamantopoulos y Siguaw, 2000. Introduction to Lisrel. Sage Publications
Echeverri Rafael, 2004. Pobreza Rural y Territorio. Instituto Interamericano de
Cooperación Agrícola IICA.
Echeverri Rubén, 2000. Opciones para reducir la pobreza rural en América Latina y el
Caribe. En Revista de la Cepal 70.
Escobal, Javier y Ponce, Carmen, 2000. Innovaciones en la lucha contra la pobreza rural
en América Latina. CEPAL
Fondo Monetario Intenacional, 2001. La pobreza rural en los países en desarrollo. En:
Temas de Economía 26.
7
Anexos
DATE: 11/14/2006
TIME: 14:32
P R E L I S 2.72S
BY
Karl G. Jöreskog & Dag Sörbom
This program is published exclusively by
Scientific Software International, Inc.
7383 N. Lincoln Avenue, Suite 100
Lincolnwood, IL 60712, U.S.A.
Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140
Copyright by Scientific Software International, Inc., 1981-2005
Use of this program is subject to the terms specified in the
Universal Copyright Convention.
Website: www.ssicentral.com
The following lines were read from file C:\Ruralidad\BD3.PR2:
!PRELIS SYNTAX: Can be edited
SY='C:\Ruralidad\BD3.PSF'
OU MA=KM XT XM
W_A_R_N_I_N_G: DESCIII has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
W_A_R_N_I_N_G: AGUA has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
W_A_R_N_I_N_G: DENS has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
W_A_R_N_I_N_G: OCUPAG has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
W_A_R_N_I_N_G: PBY has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
W_A_R_N_I_N_G: MEDING2 has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
W_A_R_N_I_N_G: SINSS has more than 15 categories and will be
treated as continuous. ERROR CODE 201.
Total Sample Size =
81
8
Univariate Summary Statistics for Continuous Variables
Variable Mean St. Dev. T-Value Skewness Kurtosis Minimum Freq. Maximum Freq.
-------- ---- -------- ------- -------- -------- ------- ----- ------- ----DESCIII 13.443 5.042 23.999 0.411 0.087 2.900 1 27.300 1
AGUA 46.691 22.836 18.402 0.331 -0.587 0.000 1 100.000 1
SINSS 38.388 17.265 20.011 0.516 1.697 0.000 1 100.000 1
DENS 61.662 26.063 21.293 -0.652 -0.661 0.000 1 100.000
OCUPAG 38.384 28.719 12.029 0.355 -0.998 0.000 1 100.000 1
PBY 32.286 16.702 17.398 0.330 -0.710 5.100 1 68.700 1
MEDING2 54.905 22.054 22.406 -0.107 -0.464 0.000 1 100.000 1
Test of Univariate Normality for Continuous Variables
Skewness
Kurtosis
Skewness and Kurtosis
Variable Z-Score P-Value Z-Score P-Value Chi-Square P-Value
DESCIII 1.550 0.121 0.367 0.714
AGUA 1.261 0.207 -1.355 0.175
SINSS 1.917 0.055 2.310 0.021
DENS -2.365 0.018 -1.628 0.103
OCUPAG 1.350 0.177 -3.311 0.001
PBY 1.258 0.208 -1.824 0.068
MEDING2 -0.417 0.677 -0.949 0.342
2.537 0.281
3.425 0.180
9.008 0.011
8.247 0.016
12.787 0.002
4.911 0.086
1.075 0.584
Histograms for Continuous Variables
DESCIII
Frequency Percentage Lower Class Limit
3
3.7
2.900
8
9.9
5.340
9
11.1
7.780
18
22.2
10.220
17
21.0
12.660
10
12.3
15.100
6
7.4
17.540
6
7.4
19.980
2
2.5
22.420
2
2.5
24.860
AGUA
Frequency Percentage Lower Class Limit
2
2.5
0.000
6
7.4
10.000
12
14.8
20.000
18
22.2
30.000
10
12.3
40.000
11
13.6
50.000
5
6.2
60.000
11
13.6
70.000
3
3.7
80.000
3
3.7
90.000
SINSS
Frequency Percentage Lower Class Limit
9
5
5
10
25
22
9
2
1
1
1
6.2
6.2
12.3
30.9
27.2
11.1
2.5
1.2
1.2
1.2
0.000
10.000
20.000
30.000
40.000
50.000
60.000
70.000
80.000
90.000
DENS
Frequency Percentage Lower Class Limit
2
2.5
0.000
5
6.2
10.000
7
8.6
20.000
5
6.2
30.000
7
8.6
40.000
6
7.4
50.000
6
7.4
60.000
21
25.9
70.000
12
14.8
80.000
10
12.3
90.000
OCUPAG
Frequency Percentage Lower Class Limit
18
22.2
0.000
10
12.3
10.000
5
6.2
20.000
12
14.8
30.000
10
12.3
40.000
5
6.2
50.000
6
7.4
60.000
7
8.6
70.000
5
6.2
80.000
3
3.7
90.000
PBY
Frequency Percentage Lower Class Limit
13
16.0
5.100
8
9.9
11.460
6
7.4
17.820
10
12.3
24.180
14
17.3
30.540
9
11.1
36.900
8
9.9
43.260
4
4.9
49.620
4
4.9
55.980
5
6.2
62.340
MEDING2
Frequency Percentage Lower Class Limit
1
1.2
0.000
3
3.7
10.000
10
12.3
20.000
8
9.9
30.000
10
10
13
18
7
7
4
12.3
16.0
22.2
8.6
8.6
4.9
40.000
50.000
60.000
70.000
80.000
90.000
Correlation Matrix
DESCIII
AGUA SINSS
DENS OCUPAG
PBY
-------- -------- -------- -------- -------- -------DESCIII 1.000
AGUA 0.573 1.000
SINSS 0.250 0.485 1.000
DENS 0.360 0.692 0.322 1.000
OCUPAG 0.322 0.591 0.194 0.796 1.000
PBY 0.290 0.644 0.323 0.843 0.850 1.000
MEDING2 0.379 0.707 0.344 0.880 0.856 0.975
Correlation Matrix
MEDING2
-------MEDING2 1.000
Means
DESCIII
AGUA SINSS
DENS OCUPAG
-------- -------- -------- -------- -------- -------13.443 46.691 38.388 61.662 38.384 32.286
PBY
Means
MEDING2
-------54.905
Standard Deviations
DESCIII
AGUA SINSS
DENS OCUPAG
-------- -------- -------- -------- -------- -------5.042 22.836 17.265 26.063 28.719 16.702
PBY
Standard Deviations
MEDING2
-------22.054
The Problem used
8944 Bytes (= 0.0% of available workspace)
11
Descargar