CALCULO DE FACTORES DE EXPANSIÓN ENCUESTA NACIONAL SOBRE NIVELES DE VIDA EN LOS HOGARES Índice Página 1. Factor de expansión 2002 1.1 Factor de expansión a nivel vivienda 1.1.1 Ajuste a los factores de expansión 1.2 Factor de expansión a nivel persona 1.2.1 Factor Proxy 1 1 3 5 5 2. Factor de expansión 2005 2.1 Factor de seguimiento longitudinal 2.1.1 Factor de seguimiento longitudinal a nivel vivienda 2.1.2 Factor de seguimiento longitudinal a nivel persona 2.1.3 Proxy de seguimiento longitudinal 2.2 Factor de expansión puntual 2.2.1 Factor de expansión puntual a nivel vivienda 2.2.2 Factor de expansión puntual a nivel persona 2.2.3 Factor de expansión puntual proxy 6 6 6 6 7 7 7 8 8 3. Factor de expansión 2010 8 CALCULO DE FACTORES DE EXPANSIÓN ENCUESTA NACIONAL SOBRE NIVELES DE VIDA EN LOS HOGARES 1. Factor de expansión 2002 La Encuesta Nacional sobre Niveles de Vida en los Hogares (ENNVH) emplea dos tipos de factores de expansión, el factor vivienda y el factor persona. El procedimiento del cálculo del factor vivienda, no es más que el inverso de la probabilidad conjunta de seleccionar la unidad ultima de muestreo que es la vivienda, el factor vivienda lleva implícito tres tipos de ajustes, uno es el ajuste por No respuesta debido a la negativa de los residentes de las viviendas de no contestar la encuesta, segundo se debe al ajuste a la proyección de población y el tercero se debe al ajuste por técnicas de calibración. Una vez realizado estos ajustes al factor vivienda se procedió a calcular los factores de expansión a nivel persona para cada uno de los libros, así como el factor del libro proxy a nivel persona. 1.1 Factor de expansión a nivel vivienda El marco de muestreo de la ENNVH empleo dos tipos de muestreo, el muestreo trietápico y muestreo bietápico, el muestreo trietápico se empleo en las 48 ciudades autorrepresentadas de ENEU y el muestreo bietápico se empleo en el resto urbano y en el rural, el procedimiento de selección de la muestra para cada tipo de muestreo y dominio se presenta a continuación. Ciudades autorrepresentadas En el dominio ciudades autorrepresentadas la selección de la muestra se realizó en forma independiente para cada región y estrato, el procedimiento es el siguiente: 1. 2. 3. 4. De las t r entidades de cada región se seleccionaron t r* entidades con igual probabilidad. Dentro de cada región y estrato se seleccionaron nrh UPM con igual probabilidad. En cada UPM seleccionada se seleccionaron 6 USM con probabilidad proporcional al tamaño. En cada USM seleccionada se seleccionaron „v‟ viviendas para la ENNVH, con igual probabilidad. La probabilidad de seleccionar una vivienda de la j-ésima USM, de la i-ésima UPM, del h-ésimo estrato, de la, de la r-ésima región, está dada por la siguiente expresión: P v rhij t r* nrh Vrhi 6 Vrhij v t r Vrh Vrhi Vrhij* 6 v t r* nrh Vrhij t r Vrh Vrhij* Su factor de expansión está dado por: Frhij * t r Vrh Vrhij 6v t r* nrh Vrhij 1 Donde: P v rhij nrh Vrhi v * Vrhij Vrh Vrhij tr t r* = es la probabilidad de seleccionar una vivienda de la j-ésima USM, de la i-ésima UPM, del h-ésimo estrato, de la r-ésima región. = es el número de UPM seleccionadas en el h-ésimo estrato, en la r-ésima región para la ENNVH. = es el número de viviendas en la i-ésima UPM, en el h-ésimo estrato, en la r-ésima región, según el Conteo de Población y Vivienda1995. = es el número de viviendas seleccionadas en cada USM para la ENNVH. = es el total de viviendas en la j-ésima USM, en la i-ésima UPM, en el h-ésimo estrato, en la r-ésima región, según el listado de viviendas. = es el número de viviendas en el h-ésimo estrato, en la r-ésima región, según el Conteo de Población y Vivienda 1995. = es el número de viviendas en la j-ésima USM, en la i-ésima UPM, en el h-ésimo estrato, en la r-ésima región, según el Conteo de Población y Vivienda 1995. = es el total de entidades por región. = es el número de entidades seleccionadas para la ENNVH. Resto urbano y rural 1. De las t r entidades por región se seleccionaron t r* con igual probabilidad. 2. Al interior de cada región y estrato se seleccionaron nrh UPM con igual probabilidad. 3. En cada UPM seleccionada se seleccionaron “v” viviendas con igual probabilidad. La probabilidad de seleccionar una vivienda está dada por la siguiente expresión: P v rhi t r* nrh Vrhi v t r Vrh v rhi v t r* nrh Vrhi t r Vrh Vrhi* Su factor de expansión está dado por: Frhi t r Vrh Vrhi v t r* nrh Vrhi Donde: nrh = es el número de UPM seleccionadas en el h-ésimo estrato, en la r-ésima región para la ENNVH. Vrhi = es el número de viviendas, en la i-ésima UPM, en el h-ésimo estrato, en la r-ésima región, según el Conteo de Población y Vivienda 1995. Vrh = es el número de viviendas en el h-ésimo estrato, en la r-ésima región, según el Conteo de Población y Vivienda 1995. = es el número de viviendas seleccionadas en cada UPM, para la ENNVH. v * Vrhi = es el número de viviendas, en la i-ésima UPM, en el h-ésimo estrato, en la r-ésima región, según listado de viviendas. = es el total de entidades por región. tr = es el número de entidades seleccionadas para la ENNVH. t r* 2 1.1.1 Ajuste a los factores de expansión Los factores de expansión elaborados conforme al procedimiento antes descrito, se ajustan para los siguientes conceptos: a) Ajuste por No respuesta El ajuste por No Respuesta atribuida al informante se realiza a nivel estrato tanto en áreas autorrepresentadas como en el resto urbano y rural, mediante la siguiente expresión: Frdh Frdh v rdh v rdh , v rdh d 1,2,3. Donde: Frdh = factor de expansión corregido por No respuesta en el h-ésimo estrato, en el d-ésimo dominio, Frdh = factor de expansión a nivel vivienda en el h-ésimo estrato, en el d-ésimo dominio, de la v rdh = número de viviendas seleccionadas habitadas con respuesta en el h-ésimo estrato, en el v rdh = número de viviendas seleccionadas habitadas sin respuesta en el h-ésimo estrato, en el de la r-ésima región. r-ésima región. d-ésimo dominio, en la r-ésima región. d-ésimo dominio, en la r-ésima región. = dominio (áreas autorrepresentadas=1, resto urbano=2,rural=3). d a) Ajuste por proyección Los factores ajustados por No respuesta se corrigen a fin de asegurar, que en cada dominio de interés de la encuesta se obtenga la población total; determinada por la proyección de población generada por el CONAPO e INEGI, referida al punto medio del levantamiento mediante la siguiente expresión: Fd Fd PROYd PEXPd Donde: Fd Fd PROYd PEXPd = factor de expansión corregido por proyección en el dominio d. = factor de expansión corregido por No respuesta en el dominio d. = población en el dominio d, según la proyección. = población total a la que expande la encuesta en el dominio d. b) Ajuste por calibración Al ser la encuesta un estudio estadístico de tipo longitudinal, con un levantamiento de arranque en el primer semestre de 2002, y con dos levantamientos de seguimiento en el tercer trimestre de 2005 y de 2010. Y considerando que la población objetivo presenta un dinamismo demográfico sobre todo en cuanto a movilidad territorial y de migración internacional. Con estas consideraciones, a pesar del ajuste 3 de factores de expansión con las proyecciones CONAPO-INEGI, no es posible conservar la estructura demográfica final, por lo que es necesario un ajuste adicional a nivel grupo de edad y sexo. Estas adecuaciones adicionales sólo son factibles con técnicas de calibración y la información auxiliar utilizada proveniente de fuentes externas como censos de población, registros administrativos u otras encuestas, la cual se le conoce como variables de calibración. Formalmente la técnica de calibración consiste en lo siguiente: Sean x1 ,..., x k variables auxiliares cuyos totales poblacionales X1 ,..., X k conocemos. Sean d1 ,..., d n los factores de expansión originales de los elementos de la muestra de k 1,..., n . Los w k son los factores calibrados y se espera que están muy cercanos a los originales. El problema general de calibración consiste en minimizar sujeta a p restricciones de calibración n k 1 w k x kj tj n k 1 dkF wk dk (1) j 1,..., p . wk y 1. dk Esta función debe cumplir las siguientes condiciones de regularidad: La función de distancia F mide la diferencia entre gk F es estrictamente convexa y con segunda derivadas continuas en el interior de su dominio. F yF 0. F 1 0. F es una función uno a uno, por tanto F es estrictamente creciente. La inversa de la función F es llamada función de calibración g F -1 Para este ajuste se consideró la función distancia F x propuesta por Deville y Sardnal (1992). xIn x x 1 conocida como Raking Ratio En la práctica lo que se hace es encontrar los g k factores lo más cercano posible a 1, y que minimicen la ecuación (1). La restricción para obtener los nuevos w k , es que cumplan con t j w k x kj , donde t j son los valores de los totales oficiales de la variable de interés. Finalmente, minimizan la función de distancia, con la restricción t j la cual se resuelve por medio de multiplicadores de lagrange: n wk n T L(w, ) d F ( w k x kj t j ) k 1 k dk k 1 con T ( 1,..., P )T En el caso de la ENNVH se tomaron como variables de calibración las siguientes: 1. 2. 3. 4. Población total Población de 15 y más años Población menor de 15 años Población de 5 a 12 años 4 5. 6. Población de 13 a 65 años Mujeres de 14 a 49 años Esta información se obtuvo de la ENE del primer semestre del 2002, y de la ENOE tercer trimestre del 2005 y 2010. La técnica de calibración está disponible en el Software SAS, macro CALMAR, la función Calib en R y la función g-calib en SPSS. 1.2 Factor de expansión a nivel persona El factor vivienda calibrado junto con la información del libro C se empleo para generar los factores de expansión a nivel persona de cada libro de la encuesta, el procedimiento de generación de los factores de expansión es el siguiente: m F k rd Frd rd* mrd Donde: = = = = k Frd mrd mrd* es el identificador del libro de interés, como se describe en el cuadro 1. factor de expansión del libro C a nivel vivienda calibrado en el d-ésimo dominio, de la r-ésima región. número de personas en el libro C por grupo de edad en el d-ésimo dominio, en la r-ésima región. número de personas que contestaron el libro k en el d-ésimo dominio, en la r-ésima región. k 1 2 3 4 5 6 d r Cuadro 1. Rango de edad 15 y más años 15 y mas años 14 a 49 años 0 a 14 años 13 a 65 años 5 a 12 años Libro 3a 3b 4 5 ea en se refiere a que puede ser uno de los siguientes tres dominios: áreas metropolitanas (1), complemento urbano (2) o rural (3). = se refiere que puede pertenecer a cualquiera de las cinco regiones. = 1.2.1 Factor Proxy El cálculo del factor de expansión del libro Proxy, se obtuvo considerando como base el factor vivienda calibrada y la información del libro C, el procedimiento es el siguiente: FP k rd Frd mrd mrd mrd Donde: k = es el identificador del libro de interés como se describe en el cuadro 1. 5 = factor de expansión calibrado del libro C a nivel vivienda en el d-ésimo dominio, de la r-ésima región. = número de personas en el libro C por grupo de edad en el d-ésimo dominio, en la r-ésima región. = número de personas que contestaron el libro k en el d-ésimo dominio, en la r-ésima región. = número de personas que contestaron el libro k como informantes indirectos en el d-ésimo dominio, en la r-ésima región. Frd mrd mrd mrd 2. Factor de Expansión 2005 La ENNVH en el 2005 dio seguimiento a la muestra seleccionada en el 2002, tanto a los hogares como a las personas, también incorpora a la nueva población que entró a la muestra, como nuevos nacimientos o porque se hayan unido como parejas a los seleccionados en el 2002, por esta razón es necesario elaborar factores de expansión de seguimiento longitudinales aplicables solo a la muestra seleccionada en el 2002, además de otro factor nuevo o puntual que estime la población total en el momento del levantamiento de la encuesta. 2.1 Factor de seguimiento longitudinal Los factores de seguimiento longitudinal solo se aplican a los hogares y las personas seleccionadas en el 2002 y que se encontraron en este segundo levantamiento de la encuesta. 2.1.1 Factor de seguimiento longitudinal a nivel vivienda Los factores de seguimiento longitudinal se generaron a partir de los factores vivienda del 2002 ajustados por No respuesta, la expresión para generar los factores de expansión es: Frd * Frd Vrd * Vrd Vrd ** * Donde: Frd * Frd Vrd * Vrd ** = factor expansión a nivel vivienda del 2005 ajustado por No respuesta en el d-ésimo dominio, de la r-ésima región. = factor de expansión a nivel vivienda del 2002 en el d-ésimo dominio, en la r-ésima región. = número de viviendas seleccionadas habitadas con respuesta en el 2005 en el d-ésimo dominio, en la r-ésima región. = número de viviendas seleccionadas habitadas sin respuesta en el 2005 en el d-ésimo dominio, de la r-ésima región. 2.1.2 Factor de seguimiento longitudinal a nivel persona El factor vivienda longitudinal ajustado por No repuesta y la información del libro C, son la base para generar los factores a nivel persona de cada libro. Fk rd Frd mrd m* rd 6 Donde: K Frd mrd m * rd = es el identificador del libro de interés, como se describe en el cuadro 1. = factor de expansión a nivel vivienda del libro C en el d-ésimo dominio, de la r-ésima región. = número de personas en el libro C por grupo de edad en el d-ésimo dominio, en la r-ésima región. = número de personas por grupo de edad en el libro C que contestaron el libro k en el d-ésimo dominio, en la r-ésima región. 2.1.3 Proxy de Seguimiento longitudinal El cálculo del factor Proxy se realizó tomando de base al factor vivienda longitudinal ajustado por No respuesta y la información del libro C. Fp k rd Frd mrd mrd mrd Donde: Frd mrd mrd mrd = factor de expansión a nivel vivienda del libro C en el d-ésimo dominio, de la r-ésima región. = número de personas del libro C por grupo de edad en el d-ésimo dominio, en la r-ésima región. = número de personas que contestaron el libro k en el d-ésimo dominio, en la r-ésima región. = número de personas que contestaron el libro k como informantes indirectos en el d-ésimo dominio, en la r-ésima región. 2.2 Factor de expansión puntual El factor de expansión puntual a nivel vivienda y el factor persona, se obtuvieron a partir del factor corregido por No respuesta descrito en el inciso 2.1.1, a continuación se describe el procedimiento del cálculo de cada uno de los factores de expansión. 2.2.1 Factor de expansión puntual a nivel vivienda Para obtener el factor puntual a nivel vivienda y que incorpore a la nueva población en el 2005, el inciso es necesario proyectar el factor corregido por No respuesta de acuerdo con el procedimiento descrito en el inciso 1.1.1. b). La proyección de la población se situó en el punto medio del tercer trimestre de 2005. Una vez generado el factor a nivel vivienda y ajustado por proyección de población, se realizó el ajuste por calibración siguiendo el procedimiento descrito en el inciso 1.1.1 c). 2.2.2 Factor de expansión puntual a nivel persona El factor de expansión a nivel persona se generó a partir del factor vivienda calibrado empleando el procedimiento descrito en el inciso 1.2. 7 2.2.3 Factor de expansión puntual proxy El factor de los libros proxy se generó aplicando el mismo procedimiento descrito en el inciso 1.2.1. 3. Factor de expansión 2010 Los factores de expansión longitudinales de seguimiento y puntuales, se obtuvieron empleando el mismo procedimiento que se utilizó para generar los factores de expansión del 2005, la única diferencia es la proyección de población empleada para los factores de expansión puntuales situada en el punto medio del tercer trimestre de 2010. 8 Bibliografía 1. J.C. Deville y C.E. Sarndal. “Calibration Estimators in Survey”, Junio 1992. 2. C.E. Sarndal “The Calibration approach in survey theory and practice”, December 2007. 3. Camille Venderhaeft “Generalised Calibration at Statistics Belgium”, Mayo 2001. 4. Mónica Tinajero Bravo y Guillermina Eslava Gómez. “Calibración en muestreo: Una aplicación a la Encuesta Nacional de Ingreso y Gastos en los Hogares 1992 y 1996. Series Monográficas. Junio del 2000. 9
Puede agregar este documento a su colección de estudio (s)
Iniciar sesión Disponible sólo para usuarios autorizadosPuede agregar este documento a su lista guardada
Iniciar sesión Disponible sólo para usuarios autorizados(Para quejas, use otra forma )