movilidad social en el ecuador. - Biblioteca UCE

UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA CARRERA DE INGENIERÍA MATEMÁTICA. MOVILIDAD SOCIAL EN EL ECUADOR. TRABAJO DE GRADUACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO MATEMÁTICO. AUTOR: Viviana Isabel Pujos Culque TUTOR: Mat. Juan Carlos Garcı́a Navas MSc. QUITO-ECUADOR 2015 Dirección de Análisis y Estadı́stica DEDICATORIA A mi padre, porque gracias a su ejemplo de vida, se lo que es ser persona y como vivir siempre persiguiendo las realidades posibles. A mi madre, que con su coraje cobijado de lágrimas un dı́a me empujó a seguir. ii AGRADECIMIENTO Gracias a esas personas que entraron en esta etapa de mi vida universitaria y que siempre me brindaron su ayuda, con este trabajo que ha implicado un gran esfuerzo quiero demostrar mi agradecimiento a todo lo que me han otorgado. Sra. Zoila Toapanta Sr. Luis Olmedo Manotoa iii AUTORIZACIÓN DE LA AUTORÍA INTELECTUAL Yo, Pujos Culque Viviana Isabel en calidad de autor del proyecto de tesis realizada sobre “MOVILIDAD SOCIAL EN EL ECUADOR”, por la presente autorizo hacer uso de todos los contenidos que me pertenecen o parte de los contenidos en esta obra, con fines estrictamente académicos o de investigación. Los derechos que como autor me corresponden, con excepción de la presente autorización seguirán vigentes a mi favor, en conformidad con lo establecido en los artı́culos 5, 6, 8, 19 y demás pertinentes de la Ley de Propiedad Intelectual y su Reglamento. Quito, Abril 2015 VIVIANA ISABEL PUJOS CULQUE C.I.1804481933 iv v vi vii viii CONTENIDO Dedicatoria ii Agradecimiento iii Autorización Intelectual iv Certificado del Tutor v Informe del Tutor vi Certificado Revisores vii Calificaciones viii Contenido ix Lista de Figuras xii Resumen xiii ix Abstract xiv Introducción 1 1. Presentación del Problema 4 1.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . 4 1.2. Formulación del problema . . . . . . . . . . . . . . . . . . . . . . 5 1.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . 5 1.3.2. Objetivos Especı́ficos . . . . . . . . . . . . . . . . . . . . . 5 1.4. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2. Fundamento 8 2.1. Base Teórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.1.1. Procesos estocásticos . . . . . . . . . . . . . . . . . . . . . 8 2.1.2. Cadenas de Markov . . . . . . . . . . . . . . . . . . . . . 9 2.1.3. Sistema de ecuaciones lineales . . . . . . . . . . . . . . . 12 2.1.4. Mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . 14 2.1.5. Regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . 19 2.1.6. Regresión lineal simple . . . . . . . . . . . . . . . . . . . 20 x 2.1.7. Regresión lineal múltiple . . . . . . . . . . . . . . . . . . 23 2.1.8. Método de Householder y mı́nimos cuadrados . . . . . . 26 2.2. Base Metodológica . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.2.1. Registro Social . . . . . . . . . . . . . . . . . . . . . . . . 30 3. Réplica del Índice del Registro Social (Índice RSII) 3.1. Selección del instrumento . . . . . . . . . . . . . . . . . . . . . . 37 38 3.1.1. Encuesta Nacional de Empleo, Desempleo y Subempleo (ENEMDU) . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.1.2. Identificación de variables en la ENEMDU . . . . . . . . 40 3.2. Definición del modelo . . . . . . . . . . . . . . . . . . . . . . . . 41 3.2.1. Aplicación del modelo de regresión múltiple . . . . . . . 43 4. Estimación de Índice de Movilidad Social 48 4.1. Estimación de las probabilidades de transición con datos agregados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Conclusiones y Recomendaciones 55 Bibiografı́a 57 Anexos 60 xi LISTA DE FIGURAS 2.1. Subespacio W y W ⊥ . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2. Variables del Índice RSII . . . . . . . . . . . . . . . . . . . . . . . 33 2.3. Histograma del puntaje RSII en la ESSHO-2012 [16] . . . . . . . 33 3.1. Estimación de los parámetros . . . . . . . . . . . . . . . . . . . . 44 3.2. Estadı́sticos del los residuos . . . . . . . . . . . . . . . . . . . . . 46 3.3. Distribución de los residuos . . . . . . . . . . . . . . . . . . . . . 46 xii RESUMEN “ÍNDICE DE MOVILIDAD SOCIAL EN EL ECUADOR” El presente trabajo muestra un Índice de Movilidad Social, el mismo que se estima, utilizando la teorı́a de los procesos estocásticos particularmente las Cadenas de Markov. Se presenta adicionalmente la matriz de transición entre los estados de vulnerabilidad establecidos por el Registro Social 2013 del Ecuador, con la cual se estima el Índice de Movilidad Social, este trabajo servirá para analizar el impacto de la inversión social en los últimos 5 años. DESCRIPTORES: PROCESOS ESTOCÁSTICOS / CADENAS DE MARKOV / MATRIZ DE TRANSICIÓN/ REGRESIÓN LINEAL MÚLTIPLE / MÉTODO DE HOUSEHOLDER / ÍNDICE DE MOVILIDAD SOCIAL. xiii ABSTRACT “INDEX OF SOCIAL MOBILITY IN ECUADOR” This work demostrate an Index of Social Mobility, using the stochastic processes theory especially Markov Chains. Additionally, there is the transition matrix between the vulnerability states established by the Social Registry 2013 of Ecuador, which estimated the Index of Social Mobility; this work will serve analyse the impact of social investment in the last five years . DESCRIPTORS: / TRANSITION STOCHASTIC MATRIX/ PROCESS MULTIPLE / MARKOV LINEAR REGRESSION HOUSEHOLDER’S METHOD / INDEX OF SOCIAL MOBILITY. xiv CHAINS / xv xvi INTRODUCCIÓN En la actualidad las variables aleatorias se usan como el tipo de variables mediante las que se recogen datos de una encuesta determinada en temas como: laborales, socioeconónicos, salud, entre otros, las mismas que bajo las caracterı́sticas de variables aleatorias permanecen constantes a través del tiempo o a su vez varı́an con la presencia de la variable determinı́stica tiempo t, en este último caso la variable aleatoria dependerá del fenómeno probabilista y del tiempo. Las encuestas son una herramienta necesaria para generar indicadores en torno al desarrollo sostenido de un paı́s, estos pueden ser de educación, empleo, ingresos, pobreza, socioecoómicos entre otros. Ante la necesidad de indicadores que muestren el desarrollo de un paı́s, en este caso del Ecuador, uno de los objetivos de este trabajo es determinar el ı́ndice de movilidad social; que es un indicador de transición o de paso de un estado de vulnerabilidad a otro que se calcula a través de la matriz de transición de estados de las cadenas de Markov que permite explicar la estructura y conocer el comportamiento, al menos a corto plazo, de la variable que se observa en el tiempo, en esta oportunidad la variable social “Estado de vulnerabilidad” de un individuo. En este trabajo se supone que los datos se obtienen en intervalos regulares de tiempo (horas, dı́as, años). El Registro Social 2013 es un catastro nacional que contiene datos levantados 1 por encuesta directa en la vivienda de una determinada familia y a través de la cual se asigna un Índice RS o puntaje entre 0 y 100 puntos a la familia registrada para luego asignarle a un grupo de vulnerabilidad (pobreza) determinado por lı́neas de corte fijas de extrema vulnerabilidad y vulnerabilidad, las mismas que se relacionan con las lı́neas de pobreza por consumo, en efecto se considera un sistema que puede caracterizarse por estar en cualquier estado de vulnerabilidad definido por el Registro Social Ecuatoriano 2013 previamente especificado. Suponiendo que el sistema cambia de un estado a otro a lo largo del tiempo de acuerdo a una cierta ley de movimiento, y sea Sr (t) el estado del sistema al tiempo t. Si se considera que la forma en la que el sistema evoluciona no es determinista, sino provocada por algún mecanismo azaroso, entonces puede considerarse que Sr (t) es una variable aleatoria para cada valor de t, esta colección es parte de un proceso estocástico, con el cual es posible representar la evolución aleatoria de un sistema a lo largo de tiempo. La hipótesis de esta investigación es que en el Ecuador se ha presentado movilidad social ascendente en los últimos 5 años, la cual es transmitida y replicada a través de las generaciones de las familias durante el tiempo, logrando de alguna manera que al menos exista un subconjunto de la población vulnerable que no entre a un cı́rculo vicioso o una trampa de vulnerabilidad perpetua. La matriz de transición se obtendrá con estimaciones de las probabilidades no condicionales de las cuales se puede tener estimaciones a partir de los datos agregados, la probabilidad no condicional establece la probabilidad de estar en un estado cualquiera en el momento t, sin tener en cuenta los demás tiempos. Finalmente se estimará el Índice de Movilidad Social con el modelo propuesto por de Shorrocks (1978) [8]. En el Capı́tulo 1, se hace una descripción general de la concepción de problema. 2 En el Capı́tulo 2, se detalla conceptos y propiedades básicas que se utilizará para el desarrollo del trabajo, mismos que se dan desde el fundamento matemático. En el Capı́tulo 3, se presentan detalles de la réplica del Índice de vulnerabilidad RSII del Registro Social 2013, en la encuesta ENEMDU-(INEC). En el Capı́tulo 4, se describe el modelo con el que se obtiene la matriz de probabilidad de transición y el Índice de Movilidad Social. 3 CAPÍTULO I PRESENTACIÓN DEL PROBLEMA 1.1. Planteamiento del problema En general, la movilidad social se vincula a la teorı́a de las clases sociales y consiste en los movimientos que efectúan los individuos, las familias o los grupos definidos dentro de un determinado sistema socioeconómico. La movilidad social se presenta cuando se da un movimiento significativo en la posición económica, social o polı́tica de un individuo, los estudios sobre la movilidad se basan en el hecho que los sistemas de estratificación del mundo moderno no son rı́gidos y permiten el paso de un individuo de una clase social a otra. El Índice del Registro Social 2013 del Ecuador, define tres estados de vulnerabilidad: Extrema Vulnerabilidad, Vulnerabilidad, No Vulnerabilidad, estados que se generan en función de varios indicadores sociales y económicos (detalles en el Capı́tulo 2). En el Ecuador, el paso de un individuo de un estado de vulnerabilidad a otro 4 se torna factible1 , y esto es el cambio de estado de vulnerabilidad. Al referirse que el cambio de estado es factible, medir el impacto o la intensidad con la que los cambios de estado se producen es posible a través de un ı́ndice de movilidad estimado desde la probabilidad, sabiendo que dichos cambios de estado no han sido evaluados bajo la medida de la probabilidad y más aún no se ha realizado un análisis de movilidad social explicándolo a través de procesos estocásticos. 1.2. Formulación del problema Estimar el Índice de Movilidad Social en el Ecuador 1.3. Objetivos 1.3.1. Objetivo General Explicar la movilidad social en el Ecuador a través de los procesos estocásticos. 1.3.2. Objetivos Especı́ficos • Obtener el ı́ndice de movilidad social en el Ecuador. • Estimar la matriz de transición entre los estados de vulnerabilidad por Registro Social 2013. 1 La pobreza por ingresos y por necesidades básicas insatisfechas no ha desaparecido en el Ecuador y han disminuido en 9,54 y 8,29 puntos porcentuales respectivamente entre los años 2008 y 2013. Fuente:ENEMDU-INEC. 5 • Analizar la movilidad social en el Ecuador. • Describir las notaciones matemáticas básicas, definiciones y resultados que son necesarios durante el presente trabajo. 1.4. Justificación El gobierno nacional del Ecuador en los últimos cinco años ha levantado uno de los procesos más profundos de la polı́tica de inclusión social y económica de las últimas décadas. El proceso en mención está construyendo un sistema de protección social inclusivo sustentado por la Constitución de 2008, en la que se muestra un amplio reconocimiento de los derechos de la población (protección y seguridad social). La Constitución es el principal referente para los procesos de planificación, definición de polı́ticas y un fundamento para los procesos de construcción de pactos tanto sociales como fiscales, puesto que define rutas de polı́tica pública que se están traduciendo en reformas, polı́ticas y programas sociales concretos. Muestra de ello son el Plan Nacional para el Buen Vivir (PNBV), la Estrategia Nacional de Igualdad y Erradicación de la Pobreza (ENIEP), la propuesta de reforma a la seguridad social, Estrategia Nacional el Buen Vivir Rural, Estrategia Infancia Plena. En el Ecuador a partir del año 2007 hasta el año 2013, la inversión en el sector social tiene un incremento promedio anual de $1.043,6 millones2 , mientras que entre los años 2001 y 2006 la inversión en el sector social tuvo un incremento promedio anual de $206,9 millones2 que representa una quinta 2 Fuente: Ministerio de Finanzas e-SIGEF(e-SIGEF es la herramienta informática del Sistema de Administración Financiera del Estado(Ecuador) que permite realizar la gestión presupuestaria, contable y de pagos de las entidades públicas). 6 parte del promedio del incremento anual de la inversión social a partir del 2007. Sabiendo ahora que la inversión en el sector social es creciente se debe realizar un análisis de la evolución de los indicadores sociales para medir de alguna manera si los servicios se han vuelto eficientes y la asistencia a los grupos vulnerables se ha fortalecido. Uno de los indicadores sociales es el que se presenta como Índice del Registro Social 2013, el mismo que refleja su medida en función de varios indicadores sociales (ver detalle en Capı́tulo 2). Bajo este detalle breve de la inversión social que ha realizado el gobierno ecuatoriano se hace pertinente realizar un estudio en el que se presente un Índice de movilidad social al año 2013 y la probabilidad con la cual un individuo cambia de estado de vulnerabilidad entre los definidos por el Índice del Registro Social Ecuatoriano 2013 (1.- Extrema Vulnerabilidad, 2.- Vulnerabilidad y 3.- No Vulnerabilidad), adicionalmente este trabajo constituirá un instrumento de consulta para los equipos de planificación que hacen uso de los fondos de inversión social en el estado ecuatoriano. 7 CAPÍTULO II FUNDAMENTO 2.1. Base Teórica En esta sección se describen diferentes, teoremas, proposiciones, definiciones entre otras teorı́as, que se deben conocer para la comprensión del proceso de estimación del Índice de Movilidad Social. 2.1.1. Procesos estocásticos Dado un sistema que puede tener como estado inicial cualquiera de los estados de un conjunto previamente especificado. Suponga que el sistema cambia de un estado a otro a lo largo del tiempo de acuerdo a una cierta ley de movimiento, y sea Xt el estado del sistema al tiempo t. Si se considera que la forma de evolución del sistema no es determinista, sino provocada con las mediciones en un experimento aleatorio, entonces puede considerarse que Xt es una variable aleatoria para cada valor del subı́ndice t. Esta colección de variables aleatorias es la definición de proceso estocástico, con este modelo 8 se puede representar la evolución aleatoria de un sistema a lo largo del tiempo. En general, las variables aleatorias que conforman un proceso no son independientes entre sı́, sino que están relacionadas unas con otras. La defenición de proceso estocástico toma como base un espacio de probabilidad y puede enunciarse ası́: Definición 2.1. Un proceso estocástico es una colección de variables aleatorias {Xt : t ∈ T } parametrizada por un conjunto T , llamado espacio parametral, y con valores en un conjunto S llamado espacio de estados. [1] En lo que sigue se tomará el espacio parametral el conjunto T = {0, 1, 2, ...}, y estos números se interpretan como tiempos. En este caso se dice que el proceso es a tiempo discreto, y en general este tipo de procesos consideran como espacio de estados un subconjunto de Z que se denotará por {Xn : n = 0, 1, ...}. 2.1.2. Cadenas de Markov Las cadenas de Markov fueron inventadas por el matemático ruso Andréi Andréyevich Márkov (14 de junio de 1856 - 20 de julio de 1922) alrededor de 1905. Propiedad de Markov Considere un proceso estocásticos a tiempo discreto Xn el mismo que sigue la propiedad de Markov. Para escribir esta propiedad y algunas de sus condiciones equivalentes, a la probabilidad P (Xn = xn ) se escribe como p(xn ), lo que implica que el subı́ndice indica también la variable a la que se hace referencia. 9 Definición 2.2. Una cadena de Markov es un proceso estocástico a tiempo discreto {Xn : n ∈ {0, 1, ...}}, con espacio de estados discreto, y que satisface la propiedad de Markov, esto es, para cualquier entero n ≥ 0, y para cualquier estado x0 , ..., xn+1 , se cumple [1]: p(xn+1 |x0 , ..., xn ) = p(xn+1 |xn ) (2.1) Para realizar un análisis breve de la definición (2.2) considere al tiempo n + 1 como el tiempo futuro, n como el tiempo presente y a los tiempos 0, 1, 2, 3, ..., n − 1, cada uno como tiempo pasado siendo el tiempo n − 1 el más cercano al tiempo presente y el tiempo 0 el más lejano, entonces la condición (2.1) establece que la distribución de la probabilidad del estado del proceso al tiempo n + 1 depende únicamente del estado del proceso al tiempo n, es decir, que no depende de los estados en ningún tiempo pasado. Para continuar sin pérdida de generalidad tome como espacio de estados de una cadena de Markov al conjunto discreto {0, 1, 2, ...}, o a su vez cualquier subconjunto finito en el que sus elementos consten de los primeros elementos de este conjunto. Una cadena de Markov se dice finita si su espacio de estados es un conjunto finito. Probabilidades de transición A la probabilidad P (Xn+1 = j|Xn = i) se escribe como: pij (n, n + 1) y se interpreta como la probabilidad de pasar del estado i en el tiempo n al estado j en el tiempo n + 1, a estas probabilidades se las conoce como probabilidades de transición en un paso. Cuando los números pij (n, n + 1) no dependen de n se dice que la cadena de Markov es estacionaria en el tiempo. Asumiendo tal situación y para los objetivos planteados las probabilidades de transición en 10 un paso se denota como pij . Variando los ı́ndices i y j, sobre el conjunto de estados 0, 1, 2, 3, se obtiene la siguiente matriz de probabilidades de transición en un paso:  p00  p10  P = p  20  p30  p01 p02 p03   p11 p12 p13    p21 p22 p23    p31 p32 p33 (2.2) Si en la matriz anterior (2.2) se enumera las filas y columnas desde 0 hasta 3, entonces el término de la matriz cuya entrada es (i, j) con i, j ∈ {0, 1, 2, 3}, de esta matriz es la probabilidad de transición pij , es decir, la probabilidad de pasar del estado i al estado j en una unidad de tiempo. Proposición 2.1. La matriz de probabilidades de transición P = (pij ) cumple las siguientes propiedades [1]: a) pij ≥ 0 b) P j pij = 1 Demostración. La primera propiedad es evidente partiendo de la teorı́a de probabilidades y sabiendo que pij es una probabilidad para cualquier i y j. Para la segunda propiedad se tiene que para cualquier estado i y cualquier tiempo n. 11 1 = P (Xn+1 ∈ {0, 1, 2, ...}) = P (Xn+1 ∈ {0, 1, 2, ...}|Xn = i) [ = P ( Xn+1 = j|Xn = i) j = X = X P (Xn+1 = j|Xn = i) j pij j 2.1.3. Sistema de ecuaciones lineales Ecuación lineal Una ecuación lineal o también llamada ecuación de primer grado, es un planteamiento de igualdad, involucrando una o más variables a la primera potencia, es decir, que no contiene productos entre las variables, sino solo sumas y restas entre las mismas, un ejemplo didáctico es la representación de la recta; sean (m, b, x, y) ∈ K donde K es un cuerpo, entonces la ecuación y = mx + b es propiamente la ecuación de una recta. Sistema ecuaciones lineales Un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales de la forma: 12   a x + . . . + a1n xn = b1    11 1 .. .     am1 x1 + . . . + amn xn = bm (2.3) donde los x1 , . . . , xn , son las incógnitas que se quiere determinar y los aij y bi con i = 1, 2, 3, . . . , m y j = 1, 2, 3, . . . , n, son constantes reales conocidas. El sistema (2.3), se lo puede también representar de la siguiente manera:  a11     am1     . . . a1n x b   1  1    ..   ..  ..  .  =  .  .     . . . amn xn bm (2.4) o lo que es lo mismo A~x = ~b, (2.5) donde A es una matriz de m × n, esto es A ∈ Mm×n [R]. Con estos detalles sobre los sistemas de ecuaciones lineales, se puede considerar tres problemas: 1. Cuando m > n, es decir más ecuaciones que incógnitas. 2. Cuando m < n, es decir más incógnitas que ecuaciones. 3. Cuando m = n, es decir igual número de incógnitas y ecuaciones. Para este trabajo se analiza el caso m > n, es decir cuando hay más ecuaciones que incógnitas. Esta clase de sistemas de ecuaciones tienen, por lo general solución única o ninguna solución. Denote con Aj , la j-ésima columna de la matriz A. El siguiente conjunto se 13 llama espacio generado por las columnas de la matriz A: ( n ) X αj Aj | αj ∈ R, j = 1, 2, . . . , n (2.6) j=1 si el vector ~b es elemento del espacio generado por las columnas de A, entonces el sistema de ecuaciones lineales posee una única solución (~x)T ∈ Rn tal que (~x)T = (x1 , x2 , . . . , xn ). Si ~b ∈ / nP n o α A | α ∈ R, j = 1, 2, . . . , n , el sistema de ecuaciones no tiene j j=1 j j solución por lo tanto se considerara el problema siguiente: hallar x̂ ∈ Rn 2 2 tal que Ax̂ − ~b = mı́nn A~x − ~b ~ x∈R (2.7) x̂ se conoce como solución en mı́nimos cuadrados de (2.7). Cabe recalcar que no se pretende resolver (2.5), pues este problema bajo la hipótesis establecida (m > n) no tiene solución, en efecto, como el sistema de ecuaciones A~x = ~b no tiene solución, se define el residuo ~r(~x) como: ~r(~x) = A~x − ~b, ~x ∈ Rn entonces para estimar una posible solución al sistema de ecuaciones se utilizará mı́nimos cuadrados que consiste en determinar en vector x̂ ∈ Rn que 2 minimice ~r(~x) cuando ~x recorre todo Rn , lo que equivale a hallar x̂ ∈ Rn tal que: ~r(x̂)2 = mı́n ~r(~x)2 n ~ x∈R 2.1.4. (2.8) Mı́nimos cuadrados En la actualidad varias investigaciones cientı́ficas recaen en el hecho que para ciertas observaciones se deben determinar constantes a1 , . . . , an , pero 14 al enfrentarse a tal situación se encuentra que medir o determinar estas constantes resulta muy difı́cil y de manera general imposible, en tales casos el método siguiente es aplicado para estimar las mencionadas constantes: en lugar de tratar de observar las ai resulta más fácil tomar una muestra de una cantidad que se pueda medir “y” la cual depende de los ai y de las mediciones experimentales que se denotan x, esto se expresa ası́: y = f (x, a1 , . . . , an ), como se mencionó al inicio de esta sección el propósito es determinar todos los ai , i = 1, . . . , n, en efecto si se realizan experimentos bajo m condiciones diferentes x1 , . . . , xm , de manera que al final se obtienen m resultados diferentes: yk = f (xk , a1 , . . . , an ), k = 1, . . . , m. Estos valores ai , i = 1, . . . , n, deben satisfacer la relación precedente. Ahora bien, si m > n entonces los yk = f (xk , a1 , . . . , an ), k = 1, . . . , m, forman un sistema de ecuaciones lineales sobredeterminado (más ecuaciones que incógnitas) para los a1 , . . . , an y además usualmente no tiene solución exacta porque las cantidades observadas yk , k = 1, . . . , m, están perturbadas por errores de medición. Con estos antecedentes en lugar de hallar la solución exacta del sistema de ecuaciones el problema se traduce en hallar la mejor solución aproximada, en esta oportunidad con el método de mı́nimos cuadrados1 . Solución de sistemas de ecuaciones lineales en mı́nimos cuadrados Sean m, n ∈ Z+ , con m > n (más filas que columnas), A = (aij ) ∈ Mm×n [R] matriz no nula y de rango R(A) = n, ~(b)T = (b1 , . . . , bm ) ∈ Rm , si se considera 1 Publicado por primera vez por el francés Adrien-Marie Legendre Legendre en 1,805 15 el siguiente problema: hallar ~x ∈ Rn tal que A~x = ~b, (2.9) como se vió al inicio de esta sección (2.1.4), estos sistemas surgen en la determinación de ciertos parámetros x1 , . . . , xn los mismos, que deben calcularse a partir de información experimental y que corresponden a un modelo lineal. Si se considera A = [A1 , . . . , An ], donde Aj es la j-ésima columna de la matriz A y por otra parte sea: ( n X W = L(A1 , . . . , An ) = αj Aj | αj ∈ R, ) j = 1, 2, . . . , n , j=1 el espacio formado por todas las combinaciones lineales de A1 , . . . , An . Definición 2.3. El rango de una matriz A = (aij ) ∈ Mm×n [R] esta dado por [10]: R(A) = dim imagen(A) . Dada la matriz A = (aij ) ∈ Mm×n [R], se puede probar que el espacio generado por las columnas de A es igual a la imagen de A. Ahora bien, por lo dicho en los dos párrafos precedentes y de la definición de W se tiene que n = dim W . Entonces el sistema de ecuaciones A~x = ~b, tiene solución si y solo si ~b ∈ W , este hecho se presenta en muy pocos casos, pues prácticamente el sistema de ecuaciones planteado, no tiene solución. Se propone entonces un problema alterno denominado problema en mı́nimos cuadrados (Pa ), para lo cual se define ~r(~x) = A~x − ~b, ~r(~x) ∈ Rn que se conoce como residuo, en efecto el problema queda planteado ası́: hallar si existe x̂ ∈ Rn 2 2 tal que ~r(x̂) ≤ ~r(~x) 16 ∀~x ∈ Rn lo que es equivalente a hallar si existe x̂ ∈ Rn 2 2 tal que Ax̂ − ~b = mı́nn A~x − ~b , ~ x∈R donde · es la norma euclidiana en Rn [9]. En lo que sigue para probar la existencia de x̂ ∈ Rn , se aplica el resultado de la proyección ortogonal: Sea A = [A1 , . . . , An ], donde cada Aj se denomina la j-ésima columna de la matriz A y sea (~x)T = (x1 , . . . , xn ) ∈ Rn , entonces: A~x = n X xj Aj ∈ W. j=1 Definición 2.4. El ortogonal de W , es el conjunto que se denota como W ⊥ tal que [9]: W ⊥ = {~y ∈ Rm |h~y , A~xi = 0, ∀~x ∈ Rn } = {~y ∈ Rm |(A~x)T ~y = 0, ∀~x ∈ Rn } = {~y ∈ Rm |~xT AT ~y = 0, ∀~x ∈ Rn }. Por otra parte, ~y ∈ W ⊥ ⇔ ~y ∈ ker(AT ) = {~y ∈ Rm |AT ~y = 0}. Como Rm = W ⊕ W ⊥ , entonces para cada ~b ∈ Rm , existe un único x̂ ∈ Rn y ŷ ∈ W ⊥ tal que   Ax̂ ⊥ ŷ,  ~b = Ax̂ + ŷ, de donde ŷ = ~b − Ax̂, en la figura siguiente se ilustra W y W ⊥ , en los que respectivamente se visualiza Ax̂ ∈ W y ~y ∈ W ⊥ . 17 ~ b y ~ W Ax̂ Figura 2.1: Subespacio W y W ⊥ Sea ~x ∈ Rn entonces A~x ∈ W de donde: (A~x)T ŷ = 0 ⇔ (A~x)T (~b − Ax̂) = 0 ⇔ ~xT AT (~b − Ax̂) = 0 ⇔ ~xT (AT~b − AT Ax̂) = 0. de donde AT Ax̂ = AT~b, el sistema de ecuaciones precedente se lo llama sistema de ecuaciones normales, note que la matriz AT A es una matriz simétrica de donde se sigue que también es una matriz normal. De la hipótesis R(A) = n, se tiene R(AT ) = n y luego R(AT A) = n. Como la matriz AT A ∈ Mn×n [R] y R(AT A) = n, entonces AT A es invertible de donde: AT Ax̂ = AT~b ⇔ x̂ = (AT A)−1 AT~b. En la figura (2.1) se puede ver claramente que Ax̂ ∈ W , ~b ∈ Rm y ~y ∈ W ⊥ , estas 18 hipótesis se utilizan en lo siguiente: k~b − Ax̂k2 = h~b − Ax̂, ~b − Ax̂i = h~b − Ax̂, ~b − A~x − Ax̂ + A~xi = h~b − Ax̂, ~b − A~xi + h~b − Ax̂, A~x − Ax̂i = h~b − Ax̂, ~b − A~xi + h~b − Ax̂, A~xi − h~b − Ax̂, Ax̂i. como A~x, Ax̂ ∈ W y ŷ = ~b − Ax̂ ∈ W ⊥ , de las propiedades del producto escalar :0 :0 A~ Ax̂i, de donde: en R se concluye que, h~b −Ax̂, xi y h~b −Ax̂, k~b − Ax̂k2 = h~b − Ax̂, ~b − A~xi, aplicando la desigualdad de Cauchy-Schwarz se obtiene: k~b − Ax̂k2 ≤ k~b − Ax̂kk~b − A~xk ⇒ k~b − Ax̂k2 ≤ k~b − A~xkk~b − A~xk como ~x ∈ Rn cualquiera se sigue que: k~b − Ax̂k2 ≤ k~b − A~xk2 ∀~x ∈ Rn , lo que es equivalente a: k~b − Ax̂k2 = mı́nn k~b − A~xk2 . ~ x∈R El resultado que se acaba de obtener se conoce como la proyección de un vector ~b ∈ Rm con ~b ∈ / W , sobre el espacio cerrado W de Rm , por otra parte x̂ ∈ Rn , es lo que se conoce como la solución en mı́nimos cuadrados del problema (2.9) planteado al inicio de esta sección. 2.1.5. Regresión lineal En el estudio de las aplicaciones de la estadı́stica, se requiere saber al menos una estimación de la relación que existe entre dos o más variables, el análisis de 19 regresión lineal, es una técnica estadı́stica que se puede utilizar para identificar y analizar la relación entre variables, este análisis se lo puede aplicar en áreas como: investigación social, análisis de medidas económicas, hasta aspectos del comportamiento humano entre otros. Tanto en el caso de dos variables como en el de más de dos variables, el análisis de regresión lineal puede utilizarse para explorar y cuantificar la relación entre una variable llamada dependiente y una o más variables llamadas independientes. 2.1.6. Regresión lineal simple La regresión lineal simple, es un técnica que nos permite conocer la relación existente entre dos variables aleatorias. Para continuar es necesario conocer la siguiente definición. Definición 2.5. Se llama variable aleatoria a una función X definida en un espacio muestral Ω con recorrido en un subconjunto finito o infinito de R [6]. X :Ω → R ω → X(ω) Considere un par de variables aleatorias (X, Y ), una de las cuales se denomina variable de entrada o predictora X y la otra variable respuesta Y , suponga que para un valor dado de la variable de entrada x, el valor de la variable de respuesta Y se puede expresar de la siguiente manera: y = β0 + β1 x + e, (2.10) donde β0 , β1 ∈ R son parámetros y la variable e ∈ R se denomina error aleatorio que tiene medida 0. 20 Definición 2.6. La relación entre la variable de respuesta Y y el valor de la variable aleatoria de entrada x especificada en la ecuación (2.10 ) se denomina regresión lineal simple [6]. Para estimar los coeficientes de la ecuación de regresión se emplea el método de los mı́nimos cuadrados, el mismo que busca minimizar la suma de los cuadrados de los errores, si se nota a la ecuación de predicción por: ŷ = b0 + b1 x, donde b0 , b1 son los estimadores de β0 , β1 , respectivamente y estos son tales que los cuadrados de las diferencias entre los valores observados de la variable respuesta y su estimación por la ecuación de regresión es mı́nima, o que de todas las rectas posibles, existe una y sólo una que consigue que las distancias verticales entre cada punto (observaciones) y la recta sean mı́nimas. Si se dispone de n pares de observaciones de las variables independiente y dependiente (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) y si ŷi , i = 1, 2, . . . , n, son los valores de las predicciones de cada yi , i = 1, 2, . . . , n, respectivamente ŷi = b0 + b1 xi , entonces, los residuos de la predicción se calculan ası́ ei = yi − ŷi , i = 1, 2, . . . , n. Una vez que se halla una estimación de la recta de regresión, es necesario determinar si la ecuación que se ha obtenido es un buen modelo para los datos y medir el error al que esta expuesto si se usa la ecuación, esto se logra a través de los coeficientes de correlación y determinación. 21 Coeficiente de correlación Recuerde que entre dos variables aleatorias, una medida de la relación que existe entre entre ellas es el coeficiente de correlación ρ, el mismo que mide la dependencia entre las variables aleatorias (0 si la variables son independientes entre sı́). Similarmente, para determinar si existe una relación lineal entre las variables predictora y de respuesta se utiliza el coeficiente de correlación lineal de Pearson. Definición 2.7. El coeficiente de correlación de Pearson se denota por r y se define por: SCxy r=p SCxx SCyy n P xi yi − nx̄ȳ i=1 =r n , n P P 2 2 2 2 xi − nx̄ yi − nȳ i=1 i=1 donde SCyy es la suma de los cuadrados alrededor de la media de y similarmente para x y SCxy es la suma de los productos cruzados de x y y alrededor de sus medias [15]. El coeficiente de correlación lineal de Pearson tiene las siguientes propiedades: 1. r ∈ [−1, 1] ⊂ R, siendo su signo el mismo de b1 . 2. Mientras más cercanos se encuentran los valores de r a −1 o 1 más fuerte es la relación lineal entre las variables. 3. Un valor de r cercano a 0 indica que hay poca relación lineal entre las variables. 22 A partir del coeficiente de correlación de Pearson se puede determinar el coeficiente de determinación. Coeficiente de determinación Este coeficiente determina la calidad del modelo para replicar los resultados y la proporción o medida de variación de los resultados, que puede explicarse por el modelo. Definición 2.8. Sean x, y, como antes, entonces: 2 SCxy , r = SCxx SCyy 2 o también n P (yi − ŷi )2 r2 = i=1 n P , yi2 − nȳ 2 i=1 r2 se puede interpretar como medida de linealidad de los puntos, cuando r2 se acerca a 1 los datos se ajustan a una lı́nea recta y si la relación no es lineal r2 = 0. 2.1.7. Regresión lineal múltiple El análisis de regresión lineal múltiple, permite utilizar más de una variable independiente. Por lo tanto, en el análisis de regresión múltiple la ecuación de regresión ya no define una recta en el plano R2 , sino un hiperplano en un espacio multidimensional Rm , m > 2. Definición 2.9. El modelo de regresión lineal múltiple liga a una variable dependiente Y con k variables independientes xi , i = 1, 2, . . . , k, mediante la 23 ecuación [6]: y = β0 + β1 x1 + β2 x2 + . . . + βk xk + e, (2.11) y se lo conoce como modelo de regresión lineal múltiple con k variables regresoras. A los parámetros βj , j = 1, 2, . . . , k, se denomina coeficientes de la regresión. Similar al caso de una sola variable, e tiene medida cero. El coeficiente βj , j = 1, 2, . . . , k, muestra la variación de la respuesta y, cuando varı́a xj y las demás variables permanecen constantes. Para la determinación de los parámetros se utiliza el método de los mı́nimos cuadrados. Suponga que dispone de n > k observaciones de las variables xj , j = 1, 2, . . . , k y si denota xij , j = 1, 2, . . . , k; i = 1, 2, . . . , n, al valor de la i-ésima observación de la variable xj , como se puede observar en la tabla siguiente: y x1 x2 ... xk y1 x11 x12 ... x1k y2 .. . x21 .. . x22 .. . ... .. . x2k .. . yn xn1 xn2 ... xnk Tabla 2.1: Observaciones de la variable xj si ŷ es la predicción de y, la ecuación de regresión lineal múltiple queda como: ŷ = b0 + b1 x1 + b2 x2 + . . . + bk xk . La ecuación (2.12 ) se puede escribir para cada observación ası́: ŷi = b0 + k X bj xij j=1 24 i = 1, 2, . . . , n. (2.12) Formulación matricial del modelo de regresión múltiple Si se plantea las matrices de la forma siguiente:     y1  1 x11 x12     y2  1 x21 x22    Y =  . , X =  ..  ..  1 ... .       yn 1 xn1 xn2      β1   e1       β2   e2      β =  . , e =  .   ..   ..          βk en  . . . x1k   . . . x2k   ..  ... .    . . . xnk el modelo de regresión múltiple, se puede representar de la siguiente manera: Y = Xβ + e. Si b es el vector de los estimadores de los parámetros de la regresión lineal múltiple:    b0     b1    b =  . ,  ..      bk el sistema de ecuaciones para la estimación de los parámetros es Ŷ = Xb Sea la suma de los cuadrados de los errores SCE, SCE = eT e = Y T Y − bT X T Y, 25 y la suma total de los cuadrados SCyy n 2 P yi SCyy = Y T Y − i=1 n , el coeficiente de determinación múltiple se define como: R2 = 1 − SCE , SCyy (2.13) R2 ∈ [0, 1] ⊂ R. Un valor de R2 cercano a 1, significa que el modelo de regresión es bueno y si R2 es cercano a 0, el modelo podrı́a no ajustarse a las necesidades para las cuales se construyó. 2.1.8. Método de Householder y mı́nimos cuadrados El siguiente resultado constituye la base del algoritmo de Householder para la resolución de sistemas de ecuaciones lineales y factorización de una matriz A en la forma QR, donde Q es una matriz ortogonal y R es una matriz triangular superior. Teorema 2.1. Sea ~v ∈ Rn con ~v 6= 0. Existe una matriz ortogonal H y α ∈ R tales que: H~v = α~e1 , donde, ~e1 = (1, 0, . . . , 0) es el primer vector de la base canónica de Rn [9]. Demostración. Sea ~u ∈ Rn tal que k~uk = 1, la matriz de Householder H = I − 2~u~uT , es simétrica y ortogonal. Sea ~v ∈ Rn con ~v 6= 0. Se mostrará que existe ~u ∈ Rn tal que k~uk = 1 y H~v = α~e1 . Sea α ∈ R tal que kvk = |α|, entonces: H~v = (I − 2~u~uT )~v = ~v − 2~u~uT ~v , 26 y como H~v = α~e1 , se sigue que ~v − 2~u~uT ~v = α~e1 2~u~uT ~v = ~v − α~e1 . Sea p = 2~uT ~v , entonces p~u = ~v − α~e1 , de donde k~v − α~e1 k = kp~uk = |p|k~uk = |p|, (2.14) de modo que p 6= 0, elija α tal que:   v1 − α    v2    ~v − α~e1 =  .   ..      vn entonces   −sign(v1 )k~v k, si v1 6= 0, α=  −k~v k, si v = 0 1 Suponga en primera instancia que v1 6= 0, entonces α = −sign(v1 )k~v k, luego 2 2 2 k~v − α~e1 k = k~v + sign(v1 )k~v k~e1 k = (v1 + sign(v1 )k~v k) + n X vk2 . k=2 Si v1 > 0, sign(v1 ) = 1, y v1 + sign(v1 )k~v k = v1 + k~v k. Si v1 < 0, sign(v1 ) = −1, y v1 + sign(v1 )k~v k = v1 − k~v k = −(−v1 + k~v k) = −(|v1 | + k~v k), entonces: k~v − α~e1 k2 = (|v1 | + k~v k)2 + n X vk2 = v12 + 2|v1 |k~v k + k~v k2 + k=2 = 2|v1 |k~v k + kvk2 + n X k=2 n X k=1 27 vk2 = 2|v1 |k~v k + 2k~v k2 . vk2 . Ahora para el caso v1 = 0, α = −k~v k, entonces 2 2 2 k~v − α~e1 k = k~v + k~v k~e1 k = kvk + n X vk2 2 = kvk + k=2 n X vk2 = 2k~v k2 , k=1 de la definición, de p se tiene: ~v − α~e1 ~v − α~e1 ~v − α~e1 = = 1 p k~v − α~e1 k (2k~v k2 + 2|v1 |k~v k) 2 ~v − α~e1 ~u = √ si v1 = 0 2k~v k ~u = si v1 6= 0 La matriz H definida como H = I − 2~u~uT = I − k~v k2 1 (~v − α~e1 )(~v − α~e1 )T + |v1 |k~v k si v1 6= 0 y H=I− 1 (~v − α~e1 )(~v − α~e1 )T k~v k2 si v1 = 0. Finalmente si:   k~v k2 + |v1 |k~v k, si v1 6= 0 r=  2k~v k2 , si v = 0 1 w ~ = ~v − α~e1 entonces 1 H=I− w ~w ~T. r Método de Householder El método de Householder puede aplicarse para resolver problemas de aproximación con mı́nimos cuadrados. Sea A ∈ Mm×n [R] con m ≤ n y 28 ~b ∈ Rm . Considere el sistema de ecuaciones A~x = ~b y el problema en mı́nimos cuadrados: hallar si existe x̂ ∈ Rn 2 2 tal que Ax̂ − ~b = mı́nn A~x − ~b . ~ x∈R En esta sección se aplica el método de ortogonalización de Householder para resolver el sistema de ecuaciones A~x = ~b. Sean A(0) = A y ~b(0) = ~b, utilizando el método de Householder se construyen matrices ortogonales Qi ∈ Mm×m [R], matrices A(i) tales que A(i) = Qi A(i−1) y ~b(i) = Qi~b(i−1) , i = 1, . . . , n.   R Sean Q = Qn−1 Qn−2 . . . Q1 entonces QA =  , donde el 0 de la matriz 0   r11 . . . r1n    ..  . . anterior es tal que, 0 ∈ Mm×m [R] y R =  . . .   0 rnn Si ~h = ~b(n)   ~h1 = Q~b y ~h =   con ~h1 ∈ Rn y ~h2 ∈ Rm−n . ~h2 Como la matriz Q es ortogonal, se tiene kQ~uk = k~uk ∀~u ∈ Rm luego: kA~x − ~bk = kQ A~x − ~b k = kQA~x − Q~bk = kA(n−1)~x − ~hk y como       ~h1 ~h1 R R~ x − , A(n−1)~x − ~h =   ~x −   =  ~ ~ 0 h2 −h2 en consecuencia   1 ~ R~x − h1 (n−1) ~ = kR~x − ~h1 k2 + k~h2 k2 2 ,   kA ~x − hk = −~h2 29 de la igualdad precedente se sigue que kA(n−1)~x − ~hk tendrá norma mı́nima si se elige ~x como la solución del sistema de ecuaciones lineales R~x = ~h1 , de donde se tiene, ~x = R−1~h1 . Note que la matriz R tiene inversa sı́ y sólo si las columnas de la matriz A son linealmente independientes (l.i.), esto es R(A) = n. Teorema 2.2. Sea A ∈ Mm×n [R] tal que, R(A) = n con m ≤ n, entonces A puede factorarse de la forma A = QR̃, donde Q ∈ Mm×m [R] es una matriz ortogonal   R y R̃ =   con R ∈ Mn×n [R] una matriz triangular superior invertible [9]. 0 Demostración. Basta aplicar el método de Householder. 2.2. Base Metodológica Es esta sección se presenta la metodologı́a construida para el Índice de Bienestar la misma que utiliza teorı́a estadı́stica tanto en la construcción como la prueba su validez. 2.2.1. Registro Social Mediante Decreto Ejecutivo N◦ 1877 del 4 de agosto de 2009,“el presidente de la República delega al Ministerio Coordinador de Desarrollo Social (MCDS), para que mediante acuerdo establezca un registro social en el que conste la información social, económica y demográfica individualizada a nivel de familias” [19]. El Ministerio Coordinador de Desarrollo Social en efecto en el acuerdo menciona: “Las familias que consten en la base de datos del Registro Social serán clasificadas según su nivel de bienestar mediante el uso del 30 Índice de Bienestar, que es elaborado mediante la técnica de estadı́stica de componentes principales no lineales que combina un conjunto de variables tales como las caracterı́sticas de la vivienda, acceso a servicios, disponibilidad de bienes, composición familiar, niveles de educación, entre otras” [18]. El Registro Social bajo los lineamientos mencionados en el Decreto Ejecutivo N◦ 1874 y en el Acuerdo Ministerial N◦ 0016 del MCDS, se ha levantado dos veces: la primera en año 2008 y la segunda en en año 2013, basada en la periodicidad de 5 años establecida2 . Índice de Bienestar En función del levantamiento de datos del año 2013 que lo realizó el MCDS a nivel nacional, se establece la metodologı́a de cálculo del ı́ndice de bienestar según el Registro Social que se denomina Índice RSII, se construye como un proxy de consumo per cápita, es decir, es una medida que se puede presentar como un indicador de consumo monetario de una persona, para tener claridad sobre la variable proxy se cita unos ejemplos: “El Producto Interno Bruto per cápita se usa con frecuencia como un proxy de medida del nivel de vida o de la calidad de vida”, o también “si se quiere utilizar una variable que mida el nivel cultural de un paı́s (variable cualitativa) se puede utilizar como variable proxy el número de bibliotecas existentes en un paı́s”, que si bien no recoge el concepto exacto que se quiere medir, si se aproxima al mismo. El Índice RSII utiliza información de la encuesta de la Situación Socioeconómica de los Hogares (ESSHO-2012-MCDS), la cual se hizo efectiva con una muestra de 3076 hogares, cuya representatividad es nacional, urbana y rural; esta encuesta se realizó en diciembre del año 2012. Adicionalmente 2 Articulo 2 Acuerdo Ministerial N◦ 0016 del MCDS [18]. 31 se incluyen variables del censo nacional de población y vivienda, levantado por el Instituto Nacional de Estadı́stica y Censos (INEC)(CPV-2010), el mismo que permite incorporar la medida de necesidades básicas insatisfechas por área geográfica, en base a los criterios homologados para el cálculo de este indicador los mismos que los regula el Instituto Nacional de Estadı́stica y Censos(INEC). Con la información que se deriva de la ESSHO-2012 y utilizando la prueba de correlación de Pearson entre las variables, se establece el conjunto de variables que se utiliza para el cálculo del Índice RSII, luego mediante un análisis de componentes principales no lineales se realiza el cálculo de los pesos de las categorı́as de cada variable. Finalmente se establecen los puntos o lı́neas de corte de vulnerabilidad por consumo, en base la lı́nea de pobreza fijada por el INEC en el 2006 en función de la Encuesta de Condiciones de Vida (ECV-2006) y deflactada al año 2012. Como resultado quedaron para el cálculo del Índice RSII 34 variables las cuales cumplen la condición de estar presentes como tales en el Registro Social 2008, con el fin de que los Índices 2008 y 2013 sean comparables [16]. La figura(2.2) muestra el aporte máximo al valor calculado del Índice RSII; se realiza una agrupación de las 34 variables por temáticas relacionadas con el Sector Social, entre las más importantes las mencionadas en el Acuerdo Ministerial N◦ 0016 [18]: Una vez que se ha estimado el peso de cada una de las variables y categorı́as de la misma se calcula el puntaje para cada familia (núcleo familiar). El Índice queda definido de la siguiente manera [16]: Iv = 34 X pi . (2.15) i=1 Donde cada pi , i = 1, . . . , 34 es el valor numérico asignado a la categorı́a de 32 Aporte de variables agrupadas 5,14% 5,14% Disponibilidad de bienes Acceso a servicios 31,29% 17,81% Educación Vivienda Composicion familiar 18,40% 22,22% Ubicación geográfica Figura 2.2: Variables del Índice RSII cada variable según el registro, además pi ∈ [0; 4, 93389536913389] ⊂ R y el resultado Iv ∈ [0; 100] ⊂ R. Estadı́sticos descriptivos del Índice RSII El Índice del Registro Social II sigue una distribución normal: Figura 2.3: Histograma del puntaje RSII en la ESSHO-2012 [16] 33 la figura (2.3) se obtiene con una frecuencia de puntajes de las personas registradas en la ESSHO-2012 el mismo, que tiene como variable independiente el Índice RSII de cada persona, los estadı́sticos descriptivos del Índice RSII son los siguientes: Media Desviación Mı́nimo Máximo Asimetrı́a Kurtosis 90,8347 0,1886 2,4336 Estándar 44,1384 15,8672 6,4527 Tabla 2.2: Estadı́sticos Índice RSII [16] note que el valor de la Kurtosis es 2, 4336 y el valor esperado cuando la distribución es normal es de 3, además hay que indicar que el valor esperado de la asimetrı́a es 0 cuando la distribución normal es perfectamente simétrica. Los valores obtenidos de la media y desviación estándar se utilizan y se explican en la fijación de las lı́neas de corte para Extrema Vulnerabilidad y Vulnerabilidad. Recuerde que lo que se busca es generar un indicador de Vulnerabilidad por consumo, por lo que se realiza un comparativo de los sujetos de estudio divididos por deciles del Índice RSII y por deciles de consumo per cápita de donde se obtiene (2.3). En la tabla (2.3) se puede concluir que; del total de familias que se encuentran en el decil 1 el cual representa los más vulnerables por Índice RSII el 70 % se encuentran en los deciles 1 y 2 de consumo lo cuales representan a las familias más pobres por consumo per cápita, similarmente del total de familias que se encuentran en el decil 10 por Índice RSII el 83 % aproximadamente también se encuentran en los deciles 9 y 10 por consumo, note que el decil 10 por Índice RSII abarca a las familias no vulnerables y los deciles 9 y 10 por consumo 34 deciles de consumo per cápita deciles por Indice RSII D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D1 45,2 % 25,2 % 10,7 % 6,8 % 7,4 % 2,9 % 0,4 % 1,1 % 0,3 % 0,0 % D2 22,8 % 19,4 % 19,2 % 13,7 % 9,2 % 4,3 % 4,0 % 3,8 % 3,1 % 0,6 % D3 12,5 % 16,1 % 16,6 % 20,5 % 12,6 % 9,2 % 7,5 % 3,2 % 1,5 % 0,3 % D4 10,3 % 16,3 % 16,1 % 15,2 % 13,6 % 9,9 % 8,1 % 6,6 % 2,8 % 1,2 % D5 7,4 % 10,6 % 13,8 % 12,6 % 13,8 % 14,8 % 9,7 % 8,6 % 6,5 % 2,3 % D6 2,4 % 7,5 % 11,5 % 14,9 % 14,5 % 14,5 % 13,1 % 11,2 % 6,7 % 3,4 % D7 0,4 % 4,1 % 9,7 % 9,6 % 11,8 % 18,5 % 15,9 % 15,8 % 9,0 % 5,2 % D8 0,3 % 1,0 % 3,4 % 5,6 % 12,9 % 12,2 % 20,4 % 18,7 % 17,6 % 7,9 % D9 0,0 % 0,7 % 1,3 % 2,3 % 3,7 % 10,6 % 15,5 % 19,6 % 27,4 % 18,8 % D10 0,0 % 0,0 % 0,0 % 0,0 % 1,0 % 1,9 % 3,9 % 10,0 % 23,1 % 60,1 % Tabla 2.3: deciles por Índice RSII vs. deciles de consumo per cápita [16] abarcan a las familias no pobres por consumo. Para poder traer las lı́neas de pobreza establecidas en la ESSHO-2012 a unidades del Índice RSII se lo hace con un modelo de regresión lineal el cual tiene como variable dependiente el Índice RSII y como variable independiente el logaritmo natural del consumo per cápita, a partir de la ecuación generada se construyen los puntos de corte para definir las condiciones de bienestar de las familias. La ecuación es la siguiente [16]: I˜v = −45, 375 + 18, 472ln(consumo per cápita) (2.16) La correlación entre el Índice RSII y el consumo per cápita es 0, 63, el modelo de regresión lineal muestra un R2 = 0, 5551 con un 95 % de significancia, de esto se puede indicar que 0, 5551 es la proporción de la variabilidad de Iv es explicada por el modelo. Finalmente con el modelo (2.16) se fijan los puntos de corte para las lı́neas 35 de extrema vulnerabilidad y vulnerabilidad del Registro Social, utilizando las lı́neas de extrema pobreza y pobreza por consumo fijadas en la ESSHO-2012. En la siguiente tabla se presentan los puntos de corte según el Índice RSII: Punto crı́tico Valor medio del Valor consumo per cápita Índice RSII Lı́nea de Vulnerabilidad 76,2424 34,67905 Lı́nea de Extrema Vulnerabilidad 42,9797 24,08766 Tabla 2.4: Estadı́sticos Índice RSII [16] De lo anterior se establece tres estados de vulnerabilidad por Índice RSII, 1. Extrema Vulnerabilidad, núcleos familiares para los cuales Iv ∈ [0; 24, 08766] ⊂ R. 2. Vulnerabilidad, núcleos familiares para los cuales Iv ∈]24, 08766; 34, 67905] ⊂ R. 3. No Vulnerabilidad, núcleos familiares para los cuales Iv ∈]34, 67905; 100] ⊂ R. 36 del CAPÍTULO III RÉPLICA DEL ÍNDICE DEL REGISTRO SOCIAL (ÍNDICE RSII) Con el firme propósito de obtener una secuencia (de al menos 5 años consecutivos) de la probabilidad de encontrarse en cualquiera de los tres estados de vulnerabilidad definidos por el Registro Social según Índice RSII, y sabiendo que la actualización del Registro Social (MCDS) se realiza cada 5 años, se hace pertinente buscar un medio factible mediante el que se pueda efectivizar nuestro propósito. El Instituto Nacional de Estadı́stica y Censos (INEC) cuenta con una serie de datos anuales, de al menos 5 años seguidos a partir del año 2009, los cuales son levantados a través de la Encuesta Nacional de Empleo, Desempleo y Subempleo (ENEMDU) y se verifica que para nuestro propósito de réplica del Índice RSII cuenta con al menos el 85 % (29) de las variables que se usan para el cálculo. 37 3.1. Selección del instrumento El Índice del Registro Social 2013 como se menciona en la sección (2.2.1) del capı́tulo 2, utiliza para su cálculo 34 variables, con este insumo de las variables se busca un instrumento que presente las mencionadas variables y su periodicidad de levantamiento para la actualización de los datos sea al menos anual. 3.1.1. Encuesta Nacional de Empleo, Desempleo y Subempleo (ENEMDU) Antecedentes A partir de año 1985 el Instituto Nacional de Empleo (INEM), cuyo objetivo fue organizar y administrar un sistema permanente de información sobre el comportamiento de la fuerza de trabajo. Para cumplir con sus objetivos, el INEM estuvo a cargo de implementar el levantamiento de la Encuesta Permanente de Empleo y Desempleo en el área urbana del Ecuador. En 1993 se implementa la Encuesta Nacional de Empleo, Desempleo y Subempleo (ENEMDU), la cual desde ese entonces pasó a ser desarrollada por el Instituto Nacional de Estadı́stica y Censos (INEC) considerando la misma metodologı́a, periodicidad y representatividad que la antigua Encuesta Nacional Urbana sobre Empleo implementada por el INEM. El INEC, viene presentando trimestralmente (desde septiembre del 2003) datos de las variables más importantes del ámbito socioeconómico, en este caso las variables corresponden a información sobre Empleo, Desempleo y Subempleo, 38 además de aspectos demográficos como los ingresos de los hogares y caracterı́sticas de la vivienda. Marco conceptual La Encuesta Nacional de Empleo, Desempleo y Subempleo es una encuesta por muestreo a hogares integrado por personas de 5 años y más ejecutada por el Departamento de Estadı́stica de Hogares de la Dirección de Producción de Estadı́stica Sociodemográfica del INEC. La ENEMDU consta de información en las 23 provincias del Ecuador, de acuerdo a las siguientes regiones: Costa, Sierra y Amazonı́a; cada provincia con su división cantonal que la conforman las parroquias urbanas y rurales. Esta investigación se realiza con una muestra que representa a todos los hogares particulares dentro del territorio ecuatoriano. El objetivo principal es modelar el perfil social, demográfico y económico de la población total, en edad de trabajar, ocupada, desocupada, inactiva y del subempleo en el área urbana y rural del paı́s, a través de variables de carácter general como: sexo, edad, parentesco, nivel de instrucción, asistencia escolar, afiliación al seguro social, entre otros. También posibilita confeccionar secuencias anuales homogéneas de resultados. Adicionalmente, al ser las definiciones y criterios utilizados coherentes con los establecidos por los organismos internacionales que se ocupan de temas laborales, facilita la comparación con datos de otros paı́ses, y contribuye de manera permanente a la formación de una base de datos que facilite los estudios y seguimiento, para más información ver: [24]. 39 3.1.2. Identificación de variables en la ENEMDU Tomando los diccionarios de variables de las bases de datos disponibles en el Portal web del INEC, de tal manera que se toma como base de la réplica los datos anuales de la ENEMDU-2013 que es la base más actual con la que se cuenta al plantear este estudio, se verifica que de un total de 34 variables que participan en el modelo del Índice RSII, 29 se encuentran en la ENEMDU-2013. Se realiza este proceso de verificación en los datos de la ENEMDU de 5 años consecutivos ordenados de forma descendente y efectivamente se encuentran las 29 variables encontradas en el año base. De esta manera se plantea realizar la réplica del Índice RSII en las ENEMDU anuales a partir del año 2009 hasta el año 2013. En la tabla se muestra la cantidad de variables encontradas en las ENEMDU y agrupadas en 6 tipos, como en la figura (2.2) del capı́tulo 2: Tipo de variable N ◦ de variables en el N ◦ de variables Índice RSII encontradas en la ENEMDU Disponibilidad de bienes 9 8 Acceso a servicios 8 5 Educación 6 5 Vivienda 7 7 Composición familiar 2 2 Ubicación geográfica 2 2 Total 34 29 Tabla 3.1: Número de variables por tipo 40 los datos presentados en la tabla (3.1), muestran el número total de variables encontradas en los datos de la ENEMDU desde el año 2009 hasta el año 2013, las variables que no se encuentran son 5 y las cuales pertenecen al grupo de variables disponibilidad de bienes, acceso a servicios y educación, el aporte máximo al Índice RSII calculado para una determinada familia podrı́a ser de 16, 1 puntos y el aporte mı́nimo podrı́a ser 0 puntos. 3.2. Definición del modelo Para continuar se dá una definición matemática del Índice RSII, en efecto, sean V1 , V2 , . . . , V34 , las variables mediante las cuales se calcula el Índice RSII, note que cada Vk , k = 1, 2, . . . , 34, es una variable aleatoria, pues cada pregunta de una encuesta cualquiera es un experimento del cual no se sabe con certeza cual será su respuesta, aunque se sabe las posibles respuestas (en el caso de los planteamientos de preguntas de la ESSHO y del Registro Social), entonces se definen las variables de la siguiente manera: Vk :Ωk → R ωk → Vk (ωk ) = vk donde Ωk , k = 1, 2, . . . , 34, son espacios muestrales. Luego sean la funciones Pk , k = 1, 2, . . . , 34, que las llamaremos funciones ponderadoras tal que: Pk : R → R Vk (ωk ) → Pk (Vk (ωk )) = pk , la función anterior se puede interpretar como una función mediante la cual, una vez que se ha obtenido la respuesta a una pregunta cualquiera de la 41 encuesta (y se ha categorizado de ser necesario) se le asigna un valor numérico previamente estimado, datos que los llamamos anteriormente ponderadores o peso de la respuesta. Con las dos funciones Vk , Pk definidas previamente se puede ahora definir el Índice RSII Iv ası́: Iv : R34 → R (P1 (V1 (ω1 )), . . . , (P34 (V34 (ω34 ))) = m34 → Iv (m34 ) donde: Iv (m34 ) = 34 X (3.1) pk . k=1 Finalmente Iv :Ω1 × Ω1 × . . . × Ω34 → R (ω1 , ω2 , . . . , ω34 ) → Iv (ω1 , ω2 , . . . , ω34 ) El proceso precedente nos ha permitido presentar al Índice RSII como una función definida matemáticamente, note además que esta función Iv es una variable aleatoria. La siguiente ecuación es una descomposición del Índice RSII Iv , Iv (m34 ) = 29 X k=1 p̂k + 5 X p̃j . (3.2) j=1 Donde p̂k , k = 1, 2, . . . , 29, se refieren a las variables Vk que son parte del Índice RSII y se encuentran como tales en las ENEMDU en análisis y los p̃j , j = 1, 2, . . . , 5, se refieren a las variables Vj que son parte del Índice RSII y no se encuentran como tales en ninguna de las ENEMDU utilizadas. Usando la teorı́a de la regresión lineal múltiple buscaremos I˜v a partir de las Vk , k = 1, 2, . . . , 29, es decir se busca una aproximación del Índice RSII con 29 variables en lugar de las 34 que propiamente se usan para el cálculo: 42 3.2.1. Aplicación del modelo de regresión múltiple El modelo de regresión que liga nuestra variable que la llamaremos dependiente Iv con 29 variables independientes se expresa ası́: Iv (m34 ) = β0 + β1 p̂1 + β2 p̂2 + . . . + β29 p̂29 + e. (3.3) Estimación de los parámetros En la sección (2.2.1) se mencionó que sobre una muestra de 3,076 hogares representativos a nivel nacional se construyó el Índice RSII además cabe mencionar que la expansión representa 30 810,550 hogares del territorio nacional. Sobre estas mismas observaciones o registros de la población en las que además de las variables del Índice RSII se encuentra calculado el valor del Índice alcanzado con las valoraciones de las 34 variables completas, se realiza el análisis para hallar el modelo que se aproxime al Iv únicamente con 29 variables, en efecto utilizamos la herramienta STATA 12 para buscar el modelo por regresión lineal múltiple, utilizando el comando reg con la variable dependiente “puntaje trad” y las 29 variables que hallaremos posteriormente en las ENEMDU y a través de la cuales se réplica el Índice RSII para los años 2009-2013: I˜v (m34 ) = b0 + b1 p̂1 + b2 p̂2 + . . . + b29 p̂29 , (3.4) donde I˜v es la predicción del Índice Iv y bk , k = 0, 1, . . . , 29 son los estimadores de βk , k = 0, 1, . . . , 29, respectivamente. La figura siguiente muestra los resultados que se obtuvo directamente de STATA: 43 Linear regression puntaje_trad V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24 V25 V26 V27 V28 V29 _cons Number of obs = 3076 F( 29, 3046) = 6021.09 Prob > F = 0.0000 R-squared = 0.9838 Root MSE = 2.0367 Coef. Std. Err. t 1,304996 1,299357 1,081948 1,032786 0,939935 1,004641 1,038640 1,183836 1,093077 0,913590 1,223936 0,876375 1,324340 0,964765 1,313719 1,213165 1,103733 1,184971 1,135000 1,285151 1,228420 1,050953 0,854241 1,024585 1,170650 1,237582 1,136523 1,093989 1,144354 -0,138207 0,060105 0,040001 0,056080 0,044244 0,052332 0,052010 0,048682 0,052375 0,041016 0,071791 0,047861 0,058203 0,049436 0,060176 0,045816 0,042109 0,051203 0,039957 0,050777 0,049922 0,059046 0,065464 0,087433 0,037567 0,047663 0,040522 0,043479 0,041151 0,053927 0,174918 21,71 32,48 19,29 23,34 17,96 19,32 21,34 22,60 26,65 12,73 25,57 15,06 26,79 16,03 28,67 28,81 21,56 29,66 22,35 25,74 20,80 16,05 9,77 27,27 24,56 30,54 26,14 26,58 21,22 -0,79 P>t [95% Conf. Interval] 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,43 1,187145 1,220925 0,971990 0,946034 0,837325 0,902663 0,943188 1,081142 1,012656 0,772827 1,130094 0,762253 1,227410 0,846776 1,223885 1,130601 1,003338 1,106625 1,035441 1,187267 1,112646 0,922595 0,682808 0,950925 1,077196 1,158129 1,051272 1,013302 1,038618 -0,481177 1,422847 1,377788 1,191906 1,119538 1,042545 1,106619 1,134092 1,286530 1,173499 1,054353 1,317779 0,990496 1,421271 1,082754 1,403553 1,295730 1,204128 1,263317 1,234560 1,383034 1,344195 1,179311 1,025673 1,098244 1,264105 1,317035 1,221774 1,174676 1,250090 0,204762 Figura 3.1: Estimación de los parámetros Validez de modelo Se obtuvo una ecuación lineal para Iv , entre los datos de la tabla precedente se encuentran los estimadores de los parámetros, y algunos estadı́sticos que se utilizan para determinar la validez del modelo por regresión lineal múltiple. Se inicia por verificar la validez de cada coeficiente o parámetro estimado, para lo cual se debe analizar la información que STATA presenta. Las hipótesis para probar la significancia de cualquier coeficiente bk del modelo obtenido 44 por regresión lineal, son las siguientes: H0 :bk = 0, H1 :bk 6= 0, lo que hay que mostrar es si las estimaciones del modelo son significativas, de tal forma que cada variable p̂k , k = 1, 2, . . . , 29, es relevante para explicar la variable de respuesta Iv , en efecto se debe contrastar si R2 y cada uno de los bk , k = 1, 2, . . . , 29, de la recta de regresión son significativamente distintos de cero, de esto se obtiene que existe una relación R2 y una dependencia con cada bk , k = 1, 2, . . . , 29, significativa entre las variables, para detalles de este tipo de análisis ver [15]. STATA, presenta datos para realizar la prueba t-student y aceptar o rechazar la hipótesis nula. En la tabla (3.1 ) se puede ver que la probabilidad que t se encuentre en el intervalo de confianza es relativamente 0 pues STATA para la prueba t-student con 95 % de confianza a las probabilidades menores que 0, 05 les pone cero, con lo que la hipótesis nula H0 se rechaza es decir bk = 0, k = 1, 2, . . . , 29, no es probable. Para verificar la validez del modelo en general se utiliza el coeficiente de determinación R2 , el valor obtenido es 0, 9838 y lo interpretamos ası́: el 98, 38 % de la variabilidad de Iv se explica por el modelo obtenido. Con lo antes expuesto el modelo de regresión lineal múltiple obtenido es válido, lo que resta es realizar un análisis del error del modelo y verificar que las hipótesis planteadas sobre este se cumplen, los términos de error e, son asumidos como variables independientes idénticamente distribuidas normal, con media 0. Veamos si el modelo refleja estas propiedades asumidas. Creamos una variable RES, la misma que presenta la diferencia entre el Iv y 45 dat Tuesday February 10 21:04:01 2015 1.024585 1.17065 1.237582 1.136523 1.093989 1.144354 -.1382072 rec_analfa_v1_13 rec_seguro_v1_13 rec_p_tvdvd_13 rec_celular_or_13 rec_tenen_viv_13 rec_desa_infan_13 _cons Page 2 .037567 .0476628 .0405219 .043479 .0411512 .0539267 .1749181 27.27 24.56 30.54 26.14 26.58 21.22 -0.79 0.000 0.000 0.000 0.000 0.000 0.000 0.430 .9509254 1.077196 1.158129 1.051272 1.013302 1.038618 -.4811766 1.098244 1.264105 1.317035 1.221774 1.174676 1.25009 .2047622 el I˜v , y luego calculamos su media y los indicadores para verificar si sigue una distribución 6normal. . end of do-file 7 . predict RES, resid 8 . sktest RES Skewness/Kurtosis tests for Normality Variable Obs Pr(Skewness) Pr(Kurtosis) 0.0000 0.0000 3.1e+03 RES adj chi2(2) joint Prob>chi2 . 0.0000 9 . mean RES Mean estimation Number of obs Mean RES -.0008069 Std. Err. .0362239 = 3076 [95% Conf. Interval] -.0718325 .0702186 10 . Figura 3.2: Estadı́sticos del los residuos Figura 3.3: Distribución de los residuos La media de la variable denominada error es cero y su distribución es normal, con lo que se verifica que esta variable cumple lo planteado como hipótesis. Con lo explicado en esta sección se ha verificado que el modelo es válido bajo los conceptos estadı́sticos utilizados, por lo que se puede utilizar para realizar la réplica del Índice RSII en las ENEMDU, utilizando únicamente 29 variables de las 34 utilizadas para calcular el Índice RSII real. Tomando el modelo (3.4) y con los coeficientes presentados en la tabla (3.1) se realiza la réplica del Índice RSII siguiendo el procedimiento establecido en la sección (3.2) para cada año desde el 2009 hasta el 2013. 46 Los resultados se presentan en la siguiente tabla: ENEMDU-ANUAL Estado de vulnerabilidad 2009( %) 2010( %) 2011( %) 2012( %) 2013( %) Extrema Vulnerabilidad 14,94 16,46 13,55 11,74 12,13 Vulnerabilidad 20,21 18,18 16,13 15,77 17,19 No Vulnerabilidad 64,85 65,36 70,32 72,49 70,68 Tabla 3.2: Réplica del Índice RSII En la tabla 3.2 se puede ver que la probabilidad de encontrarse en el estado de extrema vulnerabilidad ha disminuido entre los años 2009 y 2013. 47 CAPÍTULO IV ESTIMACIÓN DE ÍNDICE DE MOVILIDAD SOCIAL En este capı́tulo se desarrolla la metodologı́a para estimar la matriz de probabilidades de transición, la misma que muestra que tan factible es para un individuo pasar de un estado de Vulnerabilidad a otro. El Registro Social 2013 del Ecuador, plantea una sociedad con tres estados de vulnerabilidad (proxy de consumo) disjuntos, (S1 , S2 , S3 ), para hallar la matriz de transición, se usan las cadenas de Markov. Tome un individuo cualquiera del Ecuador, el mismo que en un tiempo dado t se encuentra en uno de los estados Sr , r = 1, 2, 3; el objetivo es estimar la probabilidad con la que este individuo pasa al estado Sj , j = 1, 2, 3; h periodos después, estas probabilidades de transición son también un ı́ndice de movilidad social. 48 4.1. Estimación de las probabilidades de transición con datos agregados Para la estimación del ı́ndice de movilidad a lo largo del tiempo t = 0, 1, 2, 3, 4; ponga nr (t) al número de individuos en el estado r, N (t) el tamaño de la muestra y pr (t) la probabilidad de encontrarse en el estado r, al tiempo t. Se utilizará el estimador de las probabilidades no condicionadas suponiendo que las muestras anuales de las ENEMDU utilizadas son independientes, de 3 P nr (t) y el estimador de las probabilidades [7]: lo anterior se tiene: N (t) = r=1 p̂r (t) = nr (t) N (t) (4.1) = yr (t), luego, de la teorı́a de probabilidades y de las propiedades derivadas de un proceso de Markov se tiene lo siguiente, sea {Xt }, t ∈ {0, 1, 2, 3, 4}, una cadena de Markov, P (Xt = sj ) = pj (t) = 3 X r=1 3 X P (Xt−1 = sr )P (Xt = sj /Xt−1 = sr ) pr (t − 1)prj (4.2) r=1 donde pj (t) y pr (t − 1), son probabilidades no condicionadas y de las que se puede obtener estimaciones a partir de datos agregados utilizando (4.1), de donde se tiene una estimación de (4.2), ası́: p̂j (t) = ⇒yj (t) = 3 X r=1 3 X p̂r (t − 1)prj + uj (t) yr (t − 1)prj + uj (t), r=1 49 j = 1, 2, 3, t = 1, 2, 3, 4 (4.3) la ecuación (4.3 ) es un modelo de regresión lineal múltiple, en el que yj (t) y yr (t − 1) son conocidos para t = 1, 2, 3, 4 y r, j = 1, 2, 3 y las prj , r, j = 1, 2, 3, son los parámetros a estimar. De la tabla (3.2) se tiene yj (t) para t = 0, 1, . . . , 4 y j = 1, 2, 3, en lo que sigue se muestra como queda el sistema de ecuaciones lineales para j = 1 fijo. t=1⇒ y1 (1) = y1 (0)p11 + y2 (0)p21 + y3 (0)p31 + u1 (1), t=2⇒ y1 (2) = y1 (1)p11 + y2 (1)p21 + y3 (1)p31 + u1 (2), t=3⇒ y1 (3) = y1 (2)p11 + y2 (2)p21 + y3 (2)p31 + u1 (3), t=4⇒ y1 (4) = y1 (3)p11 + y2 (3)p21 + y3 (3)p31 + u1 (4), entonces,    0, 1646 = 0, 1494p11 + 0, 2021p21 + 0, 6485p31 + u1 (1)       0, 1355 = 0, 1646p11 + 0, 1818p21 + 0, 6536p31 + u1 (2)   0, 1174 = 0, 1355p11 + 0, 1613p21 + 0, 7032p31 + u1 (3)       0, 1213 = 0, 1174p11 + 0, 1577p21 + 0, 7249p31 + u1 (4) Note que yj (t) y yj (z), son independientes para t 6= z, pues se a supuesto que las muestras son independientes en el tiempo t y z. A continuación se muestra el sistema de ecuaciones anterior en forma matricial: Y1 = A1 P1 + U1 :    0, 1646 0, 1494    0, 1355 0, 1646     = 0, 1174 0, 1355       0, 1213 0, 1174 0, 2021 0, 1818 0, 1613 0, 1577    0, 6485   u1 (1)  p11     u1 (2) 0, 6536      p21  +     0, 7032   u1 (3)     p31 0, 7249 u1 (4) (4.4) Similarmente se obtiene Y2 = A2 P2 + U2 y Y3 = A3 P3 + U3 , de manera general el problema se plantea de manera compacta como: Yj = Aj Pj , j = 1, 2, 3. 50 (4.5) De las propiedades de la matriz de transición (ver proposición 2.1), se tiene 3 P prj = 1, de donde, por ejemplo pr3 se obtiene de la siguiente manera: j=1 pr3 = 1 − 2 X prj , (4.6) j=1 en nuestro caso basta estimar 2 parámetros (en otros casos estimar número de estados menos 1 parámetros) y el tercero se estima utilizando la ecuación (4.6). Dado el modelo (4.5), se puede utilizar el método de Householder expuesto en el capı́tulo 2 sección (2.1.8), para hallar los estimadores de las probabilidades de transición y para hallar el resultado buscado utilizar programación no lineal por medio de la cual se busca Pj tal que kYj − Aj Pj k se minimice bajo las restricciones que los elementos del Pj estén entre 0 y 1. Dada la matriz Aj ∈ M4×3 que tiene rango R(Aj ) = 3 y se verifica mediante el comando rank en MATLAB, por teorema (2.2); Aj puede factorarse de la   R forma A = QR̃, donde Q ∈ M4×4 [R] es una matriz ortogonal y R̃ =   con 0 R ∈ M3×3 [R] una matriz triangular superior invertible. Se utiliza “MATLAB” para la implementación del algoritmo ya desarrollado para el método de Householder el mismo que lleva inmerso la programación no lineal. Se calculan P2 y P3 y en función de estos resultados se obtiene P1 : MATLAB, genera:     0, 0913 0, 4991         P2 = 0, 4039 y P3 = 0, 3934     0, 1227 0, 8168 51 Luego:   0, 4097     P1 = 0, 2031   0, 0603 Finalmente la matriz de transición es:   0, 4097 0, 0913 0, 4991     P = 0, 2031 0, 4039 0, 3934   0, 0603 0, 1227 0, 8168 (4.7) La matriz de transición precedente es una matriz para un perı́odo de 5 años, que equivale a un perı́odo en el que se actualiza el Registro Social ecuatoriano para verificar los posibles cambios en las condiciones de vida de las familias, la matriz de transición es un resultado muy importante en este trabajo y para el objetivo planteado que es el Índice de movilidad social. Cabe mencionar que los cambios de estado entre los Sr , depende mucho de las acciones que tome el estado sobre el sector Social, pues el acceso a la educación, servicios dignos, salud, vivienda-urbanización es lo que hace que las condiciones de una familia cambie y más si se mide a una determinada familia con el Índice RSII, por lo tanto, las probabilidades de cambio de estado depende mucho de las condiciones de vida actuales de una determinada familia. Sin embargo, lo que se quiere mostrar es el Índice de movilidad social del Ecuador para lo cual se utiliza el Índice de movilidad que propone Shorrocks(1978) [8]: P [n − j λj ] , M [P ] = (n − 1) 52 (4.8) donde: 0 ≤ M [P ] ≤ 1; n es el número de estados λ son los valores propios de la matriz de transición El ı́ndice de movilidad social es cero cuando la población no ha cambiado de estado es decir pjj = 1, j = 1, 2, 3, en cambio M [P ] = 1 muestra movilidad perfecta, note que este resultado muestra que existe una probabilidad alta de moverse a cualquier estado independiente del estado original. La traza de la matriz de transición mide el grado de correlación entre los estados, cuando el ı́ndice de movilidad tiende a cero hay mayor inmovilidad, lo que muestra que mientras pasa el tiempo aún si la composición familiar ha cambiado el estado de vulnerabilidad es heredado. De la matriz (4.7) se puede destacar que más de la mitad de la población que el año 2009 se encontraban en el estado de extrema vulnerabilidad en el año 2014 han cambiado su estado de vulnerabilidad y más aún se estima que el 49 % incluso han dejado de ser vulnerables, este es un reflejo de las acciones tomadas sobre la población que se encuentra en extrema vulnerabilidad, y sabiendo que la distribución de la población por Índice RSII en los años 2009 al 2013 sigue una distribución normal se puede mostrar que para un individuo que se encontraba en extrema vulnerabilidad en el 2009 es factible encontrarse en el estado de no vulnerabilidad en el año 2013. Note además que el Índice RSII divide a la población en tres estados de vulnerabilidad pero la distancia entre el punto de corte para la población que se encuentra en extrema vulnerabilidad y la población en vulnerabilidad es de 10, 6 puntos, para una mejor comprensión ver la figura (2.2). 53 Se presenta entonces el resultado de este estudio: M [P ] = [3 − (0, 4097 + 0, 4039 + 0, 8168) ] (2 − 1) ⇒M [P ] = 0,69, (4.9) es decir se verifica la existencia de movilidad social ascendente, sustentada además en la matriz de transición (4.7) en la cual se puede notar que es más probable para los individuos pasar a un mejor estado de condiciones de vida que pasar a uno de extrema vulnerabilidad o vulnerabilidad. En el anexo (4.1) puede ver entre los mapas de extrema vulnerabilidad como la incidencia de la misma disminuye, entre los años 2008 y 2013. Por otra parte en el mismo anexo puede ver como la incidencia de la población en No Vulnerabilidad aumenta. 54 CONCLUSIONES Y RECOMENDACIONES Conclusiones De la matriz (4.7) se puede destacar que más de la mitad de la población que el año 2009 se encontraban en el estado de extrema vulnerabilidad en el año 2014 han cambiado su estado de vulnerabilidad y más aún se estima que el 49 % incluso han dejado de ser vulnerables, este es un reflejo de las acciones tomadas sobre la población que se encuentra en extrema vulnerabilidad. El ı́ndice de Movilidad Social es M [P ] = 0,69 lo que muestra la existencia de movilidad social ascendente, sustentada además en la matriz de transición (4.7), en la cual se puede notar que es más probable para los individuos pasar a un mejor estado de condiciones de vida que pasar a uno de extrema vulnerabilidad o vulnerabilidad. Se genera una medida de impacto de la inversión social en el Ecuador y una matriz de transición que también es una medida de movilidad social y es útil para focalizar a la población que puede ser beneficiaria de los programas sociales. 55 Recomendaciones Para los años posteriores la presente publicación se puede aplicar la misma metodologı́a, considerando las lı́neas de pobreza deflactadas al año en consideración. El ı́ndice calculado, es estacionario da una medida de movilidad social entre los años 2009 y 2013, si se quiere evaluar la movilidad social en otro periodo se debe recalcular. Tome en cuenta que para generar ı́ndices comparables se deben calcular bajo la misma metodologı́a. Se puede mejorar el Índice, si se obtienen datos de la ENEMDU de paneles completos de población de una secuencia de años, pues cabe indicar que la ENEMDU actualmente se trabaja sobre paneles de población pero no se utiliza el panel completo periodo tras periodo y la población en dos periodos diferentes puede coincidir aproximadamente en la mitad. 56 BIBLIOGRAFÍA [1] R INC ÓN , L., (2007), Introducción a los procesos Estocásticos, México México, Departamento de Matemáticas - Facultad de Ciencias UNAM, pp. 5-84. [2] R INC ÓN , L., (2007), Curso intermedio de Probabilidad, México - México, Departamento de Matemáticas - Facultad de Ciencias UNAM, pp. 1-80. [3] R INC ÓN , L., (2007), Curso Elemental de Probabilidad y Estadı́stica, México México, Departamento de Matemáticas - Facultad de Ciencias UNAM. [4] Z ITKOVI Ć , G., (2010), Introduction to Stochastic Processes, Austin - Estados Unidos, Departament of Mathmatics The Univetsity of Texas at Austin, pp. 4-33. [5] Z AMORA -G ARC ÍA , T., (2010), Métodos de Regresión no Paramétrica en Muestreo en Poblaciones Finitas, Granada - España, Departamento de estadı́stica e investigación operativa, pp. 8-18. [6] G ALINDO - DE LA T ORRE , E., (2006), Estadı́stica Métodos y Aplicaciones, Quito - Ecuador, Prociencia Editores, pp. 81-100, 304-344. [7] B ALTAZAR , E.,A STUDILLO , S. Y M ALAVER C., (2003), Economı́a y Desarrollo, Bogotá - Colombia, Universidad Autónoma de los Andes, Vol. 2, pp. 119-156. 57 [8] S HORROCKS , A., (Sep., 1978), The Measurement of Mobility, New York Estados Unidos, Econométrica, Vol. 46, No. 5. Vol. 2, pp. 1013-1024. [9] B ENALC ÁZAR , H., (1994), Modelización y Simulación Numérica, Quito Ecuador. [10] G ROSSMAN , S., (1996), Álgebra lineal, Naucalpan de Juárez - Mexico, Vol. 5, pp. 1-457. [11] C ARRANZA , C. y C ISNEROS , V., (2014), Hacia un sistema de protección más inclusivo en el ecuador, Santiago de Chile - Chile, Polı́ticas Sociales Publicación de las Naciones Unidas, N 205, ISSN 1564 - 4162, pp. 17 - 37. [12] B ARTLE , G., (1995), The Elements of Integration and Lebesgue Measure, New York - Estados Unidos, Eastern Michigan University and University of Illinois, Wiley Classic Library, Jhon Wiley & Sons, INC., pp. 6-13 y 19-23. [13] L IMA , E., (1997), Análisis Real, Chile, Intituto de Matemática y Ciencias Afines, Colección de libros UNI, Vol 1., pp. 1-22 y 83-95. [14] DE LA H ORRA , J., Modelo de Regresión Simple, México - México, Departamento de Matemática de la UNAM, Colección de libros UNAM, pp. 5-12. [15] VARGAS , A., (1995), Estadı́stica Descriptiva e Inferencial, Castilla - La Mancha - España, Universidad de Castilla La Mancha, Vol. 2., pp. 183-198, 451-472. [16] U NIDAD DE A N ÁLISIS E I NFORMACI ÓN , (2014), Metodologı́a del Índice del Registro Social II, Quito-Ecuador, Ministerio Coordinador de Desarrollo Social, pp. 3-32. 58 [17] D ECRETO E JECUTIVO, (Ago. 2009), Decreto N ◦ 1877, Quito-Ecuador, Estado Ecuatoriano. [18] A CUERDO M INISTERIAL, (Ago. 2009), Acuerdo N ◦ 0016, Quito-Ecuador, Ministerio Coordinador de Desarrollo Social. [19] M INISTERIO C OORDINADOR DE D ESARROLLO S OCIAL, (2009), Decreto N ◦ 1877, Quito-Ecuador, Estado Ecuatoriano. [20] S ISTEMA I NTEGRADO -C ONSULTAS DE I NDICADORES S OCIALES T EM ÁTICAS -I NVERSI ÓN DEL E CUADOR S OCIAL -S ECTOR S OCIAL, Disponible en: http://www.siise.gob.ec/siiseweb/siiseweb. html?sistema=1# [21] STATA - T TESTS , Disponible en: http://www.stata.com/ manuals13/rttest.pdf [22] STATA - TEST , Disponible en: http://www.stata.com/manuals13/ rtest.pdf [23] STATA - L INEAR REGRESSION , Disponible en: http://www.stata. com/manuals13/rregress.pdf [24] A RCHIVO N ACIONAL Disponible en: DE D ATOS Y M ETADATOS E STAD ÍSTICOS , http://anda.inec.gob.ec/anda/index.php/ catalog/269/sampling 59 ANEXOS 60 Anexo 1 Lı́neas de pobreza y extrema pobreza de consumo La lı́nea de pobreza es el valor monetario de una canasta básica de bienes y servicios para una persona para un perı́odo determinado (una quincena-MCDS). Aquellos hogares cuyo consumo por persona es inferior a esta lı́nea son considerados “pobre”. La lı́nea de extrema pobreza o indigencia es el valor monetario de una canasta básica de bienes alimenticios, que refleja el costo necesario para satisfacer los requerimientos nutricionales mı́nimos. La norma frecuentemente utilizada es de 2.141 kilo calorı́as/persona/dı́a. Aquellos hogares cuyo consumo no alcanza a cubrir ni siquiera los requerimientos nutricionales mı́nimos son considerados “indigentes”. Fundamento El método indirecto de medición de la pobreza (Desigualdad y pobreza) considera el nivel o magnitud de la capacidad adquisitiva (o de consumo) de una persona o de un hogar. Se trata de un método indirecto ya que el ingreso o el consumo permiten el acceso a las necesidades de vida pero en sı́ mismo no mide el nivel y calidad de vida alcanzados. El lı́mite de la pobreza extrema o la llamada “lı́nea de la indigencia”, constituye el consumo necesario para cubrir el costo de una canasta alimenticia que satisfaga los requerimientos nutricionales mı́nimos de una persona. Es decir, se considera que están en una situación de pobreza extrema o indigencia las personas cuyo consumo no les permite alcanzar esta canasta o que no pueden ni siquiera satisfacer sus necesidades alimenticias mı́nimas. Siguiendo la misma lógica, se determina un lı́mite de la pobreza o satisfacción de las necesidades básicas más allá de 61 los alimentos. A este lı́mite se lo denomina “lı́nea de la pobreza” y para determinarlo se multiplica el valor de la canasta alimenticia básica por el inverso de la participación del consumo de alimentos en el consumo total o el ´´coeficiente de Enge”. La lı́nea de pobreza, vale repetir, equivale al costo de los bienes y servicios necesarios para satisfacer las necesidades básicas, incluyendo alimentación, vestido, vivienda, educación y servicios básicos. En suma, según el método indirecto, una persona o un hogar es indigente, cuando su consumo está por debajo de la lı́nea de indigencia, es decir cuando no puede ni siquiera satisfacer sus necesidades alimenticias; en tanto que es pobre, cuando su consumo está por debajo de la lı́nea de pobreza, es decir cuando no puede satisfacer sus necesidades básicas (alimentación, educación, vivienda, vestido y servicios básicos). Fuente:MCDS, INEC 62 Anexo 2 REPLICA DEL ÍNDICE RSII-MCDS 2014 EN LAS ENEMDU-INEC 2009-2013 Vulnerabilidad según RS 2014 Freq. Percent Cum. 2013 Extremadamente Vulnerable Vulnerable No vulnerable 1,925,074 2,728,071 11219610.7 12.13 17.19 70.68 12.13 29.32 100.00 Total 15,872,755 100.00 0 .005 .01 Density .015 .02 .025 AÑO 0 40 puntaje_RS2014 60 80 Freq. Percent Cum. Extremadamente Vulnerable Vulnerable No vulnerable 1,723,267 2,315,485 10643804.2 11.74 15.77 72.49 11.74 27.51 100.00 Total 14682556.5 100.00 .005 .01 Density .015 .02 .025 Vulnerabilidad según RS 2014 0 2012 20 0 20 40 puntaje_RS2014 60 63 80 Freq. Percent Cum. Extremadamente Vulnerable Vulnerable No vulnerable 1,961,393.8 2,335,326 10181409.4 13.55 16.13 70.32 13.55 29.68 100.00 Total 14478129.3 100.00 0 .005 .01 Density .015 .02 .025 2011 Vulnerabilidad según RS 2014 0 20 40 puntaje_RS2014 60 80 2010 Freq. Percent Cum. Extremadamente Vulnerable Vulnerable No vulnerable 2,350,150 2,596,562 9,332,740 16.46 18.18 65.36 16.46 34.64 100.00 Total 14279452.3 100.00 0 .005 .01 Density .015 .02 .025 Vulnerabilidad según RS 2014 0 20 40 puntaje_RS2014 60 64 80 2009 Freq. Percent Cum. Extremadamente Vulnerable Vulnerable No vulnerable 2,102,030 2,845,047 9,126,248 14.94 20.22 64.85 14.94 35.15 100.00 Total 14073325.5 100.00 0 .005 .01 Density .015 .02 .025 Vulnerabilidad según RS 2014 0 20 40 60 puntaje_RS2014 Fuente: ENEMDU-INEC 2009-2013 RS-MCDS-2014 Elaborado por : La autora 65 80 100 Anexo 3 Resultados de transición entre los estados de vulnerabilidad Elaborados realizando cruce de datos por cédula de identidad entre las bases del Registro Social 2008 y 2014. Estados de Vulnerabilidad 2014 1,00 Extremadame nte vulnerable 2,00 Vulnerable 3,00 No Vulnerable % del N de fila % del N de fila % del N de fila Estados de 1,00 Vulnerabilidad Extremadame 2008 nte vulnerable 2,00 Vulnerable 3,00 No Vulnerable 44,6% 39,2% 16,2% 10,3% 41,5% 48,3% 2,1% 12,3% 85,6% Distribución de los núcleos familiares resgistrados en el Registro Social 2008 y encontrados en el Registro Social 2024 SEGÚN INDICE RSI(2008) 66 Distribución de los núcleos familiares resgistrados en el Registro Social 2008 y encontrados en el Registro Social 2024 SEGÚN INDICE RSII(2014) Fuente:RS 2008 y 2014 MCDS Elaborado por: La autora 67 Anexo 4 Anexo 5 68 69 Anexo 6 70 71 Memorando Nro. MCDS-SGI-2015-0158-M Quito, D.M., 06 de mayo de 2015 PARA: Srta. Viviana Pujos Asistente de Logística Para Operativos de Campo ASUNTO: Autorización De mi consideración: En referencia al Memorando MCDS-MCDS-2014-0524, en el que se autoriza a usted Srta. Viviana Isabel Pujos Culque CI.180448193-3 actual funcionaria del Ministerio Coordinador de Desarrollo Social, en el cual se menciona: "De acuerdo a su solicitud, en la que requiere acceso a la metodología del índice del Registro Social, es importante señalar que esta información ha sido considerada por ésta Cartera de Estado como confidencial, y se continuará clasificándola con este tratamiento en virtud de la sensibilidad de informar sobre los parámetros que califican la vulnerabilidad en el índice" y por otra parte indica que los resultados de la tesis de Pre-grado deben ser revisados previa su publicación "se sujeta a que los resultados sean validados primero al interno del Ministerio Coordinador de Desarrollo Social- MCDS". Debo indicar que los resultados presentados han sido validados y el trabajo escrito realizado para la publicación cumple con los lineamientos establecidos por el Ministerio Coordinador de Desarrollo Social. Por otra parte en virtud de la autorización recibida desde la máxima autoridad de esta cartera de estado, autorizo a usted Srta. Viviana Isabel Pujos Culque, autora intelectual del estudio para su tesis de pregrado "Índice de Movilidad Social en el Ecuador derivado del Índice Registro Social II", proseguir con los trámites para la defensa oral de su trabajo escrito y la publicación de los resultados según los lineamientos establecidos por la Universidad Central del Ecuador. Es importante mencionar que una vez concluya sus trámites para la defensa de su tesis, el Ministerio Coordinador de Desarrollo Social, utilizará esta información como aporte a las ivnestigaciones que realiza sobre esta temática. Con sentimientos de distinguida consideración. Atentamente, 1/2 * Documento generado por Quipux 72 Memorando Nro. MCDS-SGI-2015-0158-M Quito, D.M., 06 de mayo de 2015 Documento firmado electrónicamente Ing. Katy Lema DIRECTORA DE ANÁLISIS Y ESTADÍSTICAS 2/2 * Documento generado por Quipux 73

movilidad social en el ecuador. - Biblioteca UCE

Documentos relacionados

Productos

Apoyo

movilidad social en el ecuador. - Biblioteca UCE

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib