See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/326131783 La utilización de fuentes de datos secundarios Chapter · July 2018 CITATIONS READS 0 4,450 1 author: Livia Garcia-Faroldi University of Malaga 36 PUBLICATIONS 127 CITATIONS SEE PROFILE Some of the authors of this publication are also working on these related projects: Nuevas estructuras de sociabilidad: redes sociales presenciales y digitales (New Structures of Sociability: Online and Offline Social Networks) View project Uso de las erúbricas para la evaluación de competencias de los alumnos de Sociología View project All content following this page was uploaded by Livia Garcia-Faroldi on 18 November 2020. The user has requested enhancement of the downloaded file. García Faroldi, L. (2018): “La utilización de fuentes de datos secundarios”. En: F. Requena Santos y L. Ayuso Sánchez (Eds.) Estrategias de investigación en las ciencias sociales, Valencia: Tirant Lo Blanch, pp. 139-172. Índice 1. Introducción: definición de datos secundarios. 2. Cómo elegir los tipos de datos adecuados a nuestra investigación. 3. Tipos de datos secundarios: datos objetivos y datos subjetivos. 4. Los datos secundarios de carácter objetivo: principales fuentes de información a nivel nacional e internacional. 5. Los datos secundarios de carácter subjetivo: principales fuentes de información a nivel nacional e internacional. 6. Big data: definición, ventajas e inconvenientes. 7. Cómo evaluar la calidad de los datos secundarios. 8. Ventajas e inconvenientes de la utilización de datos secundarios. 1. Introducción: definición de datos secundarios. La generación de datos para realizar una investigación social es un proceso generalmente costoso en términos tanto económicos como de tiempo, de organización, de gestión y de recursos humanos. Por ello, es habitual que muchos investigadores sociales decidan utilizar datos proporcionados por fuentes especializadas en vez de generar sus propios datos, es decir, utilizan datos secundarios. Esta elección se convierte en casi obligatoria si se quiere realizar una investigación de carácter longitudinal (a lo largo de un extenso periodo de tiempo) o una comparación internacional. En el caso de los estudiantes universitarios que deben presentar su trabajo de fin de grado, de máster o su tesis doctoral, un trabajo de investigación basado en datos secundarios es una opción factible e incluso recomendable, siempre que el alumno pueda asegurar la calidad de los datos elegidos antes de utilizarlos. Afortunadamente, en la sociedad moderna actual abundan los datos secundarios, puesto que se registran todo tipo de acontecimientos sociales por diversas instituciones (desde organismos públicos y privados que elaboran estadísticas hasta los medios de comunicación de masas que recogen los hechos acaecidos más relevantes) con 1 diferentes fines. Dichos datos posteriormente se pueden analizar mediante las herramientas de la investigación científica. La distinción entre datos primarios y secundarios se basa en quién produce los datos: cuando el investigador es la fuente primaria de los datos, es decir, produce sus propios datos, se trata de datos primarios. Sería el caso, por ejemplo, de un investigador que realiza una entrevista a un experto sobre un tema y analiza posteriormente su contenido. Cuando el investigador utiliza datos que han sido recogidos y elaborados por otras personas y/o instituciones, se trataría de datos secundarios que se han extraído de una fuente secundaria. Por ejemplo, si un investigador analiza las estadísticas oficiales sobre el número de matriculados en enseñanza obligatoria en un determinado curso académico o las opiniones de la población sobre un tema recogidas en una encuesta de un instituto de opinión. La utilización de datos secundarios se relaciona también con el concepto de análisis secundario. Hakim (1982) define como análisis secundario de documentos o de datos documentales todo posterior análisis de un conjunto de datos primarios que ofrezca interpretaciones y conclusiones adicionales o en forma diferente a la presentada en el primer informe de investigación. Es muy habitual que la institución que genera ciertos datos realice un análisis de los mismos de carácter general y descriptivo, lo que permite posteriormente al investigador interesado en el tema profundizar en el análisis de dichos datos y obtener nueva información relevante. El análisis de datos secundarios, tal como señala Sierra Bravo (1995), puede aplicarse a varios ámbitos: para elaborar informes, para realizar análisis basados en un nuevo marco teórico o aplicando nuevas técnicas de análisis, así como para contrastar nuevas hipótesis de investigación. 2. Cómo elegir los tipos de datos adecuados a nuestra investigación. Como señala González (1994), el uso normal del término dato secundario otorga una connotación negativa a éste cuando se le compara con el dato primario, pero cuando se habla de investigación secundaria no existe dicho aspecto peyorativo, sino que nos referimos a los datos existentes. Estos datos cada vez adquieren más importancia. Ello se debe a la abundancia de datos secundarios que no han sido analizados en profundidad y de los que se pueden obtener conclusiones interesantes para el avance del conocimiento de la sociedad, así como al alto coste de generar los propios datos de carácter primario. En la misma idea incide Sierra Bravo (1995) cuando subraya que se 2 pueden realizar investigaciones importantes mediante la utilización de datos secundarios y que la originalidad de una investigación no depende de que en ella se utilicen datos primarios. Tal y como destaca Mezo (2015), los datos secundarios se emplean, como mínimo, en la fase inicial de la investigación al revisar la literatura, para familiarizarse con los estudios e informaciones ya existentes sobre el fenómeno que quiere analizar. La elección del tipo de datos secundarios más adecuados para una investigación viene determinada por cuál es la pregunta de investigación, la finalidad última de llevarla a cabo. Advierte Ander-Egg (1982) de que no se caiga ni en el "hábito coleccionista", es decir, acumular mucha información sin tener un propósito definido de qué hacer con ella, ni en la "búsqueda a ciegas", sin ningún marco teórico que oriente la interpretación de los datos. Es precisamente la facilidad con la que, desde finales de los noventa, se puede acceder a datos secundarios, la que lleva al efecto perverso de usar de manera poco meditada datos que no son adecuados para el propósito de la investigación (Mezo, 2015). Una vez se haya definido la pregunta de investigación, se debe delimitar espacial y temporalmente el tema de investigación. Por ejemplo, un investigador puede plantear como pregunta de investigación cuál ha sido el impacto en el sistema educativo de la reciente crisis económica. Posteriormente, deberá concretar qué ámbito espacial se quiere estudiar y qué periodo. El abanico de opciones es amplio: con respecto al ámbito espacial, se puede decidir estudiar España en su conjunto, o una sola Comunidad autónoma, o comparar diversas Comunidades, o comparar España con otros países europeos o de otras zonas del mundo; con respecto al ámbito temporal, se puede estar interesado solamente en el momento actual, o desear realizar un análisis de los últimos tres o cinco años, o bien comparar entre la situación hace diez años y la actual, por ejemplo. En función de cómo se definan estos extremos, se podrá buscar las fuentes de información de datos secundarios más adecuadas para alcanzar los objetivos planteados. Cómo se explicará con detalle en los apartados 4 y 5 de este capítulo, existen fuentes de información que facilitan la comparación internacional y/o temporal, mientras que otras se circunscriben a España o a una Comunidad autónoma en concreto. A su vez, si la investigación así lo requiere y la disponibilidad de recursos lo permite, estos datos secundarios podrán ser complementados con datos primarios generados por el propio investigador. 3 3. Tipos de datos secundarios: datos objetivos y datos subjetivos. Dada la abundancia de datos secundarios, resulta complejo hacer una enumeración exhaustiva de los tipos que existen. Ander-Egg (1982) propone distinguir entre cinco tipos: los documentos escritos (fuentes históricas, periódicos, documentos personales, archivos privados y oficiales, etc.), documentos estadísticos (los que provienen de los servicios oficiales de estadísticas y de organismos internacionales), los documentos cartográficos (diversos tipos de mapas), los documentos de imagen y sonido (fotografía, pintura, escultura, fotografía, cine, documentación oral) y, por último, los documentos objetos (es decir, los objetos construidos por el hombre que revelan información interesante de la sociedad que los fabrica, puesto que reflejan su naturaleza, organización y nivel de desarrollo). Esta propuesta coincide a grandes rasgos con la realizada por Sierra Bravo (1995), que distingue solamente cuatro categorías, omitiendo los documentos cartográficos como un tipo separado del resto. Podemos observar, por tanto, la gran variedad de fuentes de donde pueden provenir los datos, desde obras de arte hasta estadísticas y noticias en los medios de comunicación. Los datos más adecuados a la investigación dependerá de la disciplina a la que pertenece la investigación: los estudiosos de los medios de comunicación, como es lógico, utilizan de manera fundamental todos los datos producidos por éstos (no solamente noticias y otros tipos de programas, sino películas, publicidad, etc.), mientras que los investigadores del Derecho se decantan principalmente por analizar leyes, dictámenes y sentencias judiciales. Dada la gran variedad de datos secundarios disponibles, resulta imposible en un capítulo introductorio como el presente explicar de manera exhaustiva dónde obtener todos estos tipos de datos. Por ello, en los dos próximos apartados se centrará la atención en las fuentes de información estadística que con mayor frecuencia utilizan los sociólogos y que también resultan de suma utilidad para investigadores de otras disciplinas sociales, como economistas, trabajadores sociales, demógrafos, criminólogos, periodistas o educadores, por ejemplo. Se diferencia aquí entre datos secundarios de carácter objetivo y subjetivo. Se entiende por datos de carácter objetivo aquellos que se refieren a hechos objetivos tales como el número de matriculados en un centro educativo, el consumo de electricidad per cápita en un país o el número de fallecimientos por accidente de tráfico en un municipio. Por otro lado, los datos de carácter subjetivo se refieren a aquellas opiniones, actitudes, valores, deseos, etc. que manifiesta la población sobre un determinado tema. Por ejemplo, la opinión de la población sobre la calidad del sistema educativo, la 4 valoración de los precios de la electricidad o las medidas que se creen que serán más efectivas para reducir la mortalidad en accidentes de tráfico. Ambos tipos de datos, objetivos y subjetivos, son interesantes para el investigador social y se pueden utilizar de manera complementaria para analizar la realidad. 4. Los datos secundarios de carácter objetivo: principales fuentes de información a nivel nacional e internacional. En este apartado se van a enumerar algunas de las principales fuentes de información de datos secundarios de carácter objetivo. Cabe advertir que este listado no pretende ser, ni podría serlo, exhaustivo, ya que las fuentes son innumerables. En el caso de las fuentes internacionales, se han escogido aquellas que se caracterizan por poseer información de un amplio número de países, incluido España, y que cubren un amplio abanico de temas. Es el caso de, por ejemplo, el Banco Mundial, las Naciones Unidas o Eurostat, la Oficina estadística de la Unión Europea (UE). En el caso de las fuentes nacionales, resulta imposible incluir aquí todos los Ministerios, Institutos públicos (como el Instituto de la Mujer o el de la Juventud), los gobiernos autonómicos y sus respectivos Institutos de estadística, por lo que se ha decidido centrar la atención en el Consejo Económico y Social y el Instituto Nacional de Estadística (INE). Por otro lado, hay que tener en cuenta, si se quiere llevar a cabo una comparación internacional, que la información estadística disponible (y accesible online) es mucho más rica en los países más industrializados que en los que tienen un menor nivel de desarrollo, por lo que puede ocurrir que no todos los datos que se necesitan para la investigación estén disponibles para todos los países. Como señala Eurostat, las sociedades democráticas no funcionan de manera adecuada sin una sólida base de estadísticas de datos objetivos rigurosa y fiable, que permita, por un lado, a los legisladores de las diferentes administraciones tomar decisiones y, por otro lado, que la opinión pública y los medios conozcan la realidad social y evalúen cómo el desempeño de los políticos y otros actores sociales. Es por ello que las sociedades más avanzadas dedican una especial atención a recolectar y publicar dicha información. Será el propio investigador el que, dependiendo del tema objeto de estudio, deba reflexionar sobre cuál es la fuente más adecuada de datos secundarios. Por ejemplo, un estudiante de Criminología puede estar más interesado en buscar información en el Ministerio de Interior, en el de Justicia y en las bases de datos policiales; un estudiante de Relaciones Laborales se decantará por buscar información publicada por los 5 sindicatos o las asociaciones empresariales; uno de Trabajo social puede encontrar particularmente interesante los informes sobre inclusión social de diferentes ONGs; uno de Economía puede acudir a los informes socioeconómicos que publican entidades bancarias como BBVA o La Caixa; uno de Márketing estará más interesado por los informes que realizan las asociaciones de consumidores; un alumno de Turismo preferirá consultar las estadísticas de movimientos turísticos que publica el INE y a un estudiante de Comunicación le pueden ser útiles los datos de la Oficina de Justificación de la Difusión (OJD), que analiza la prensa escrita en papel y digital, y la Asociación para la Investigación de los Medios de Comunicación, que publica el Estudio General de Medios (EGM). Las posibilidades son casi infinitas y es importante reflexionar sobre cuáles son las fuentes más adecuadas para encontrar los datos que se necesitan para contrastar las hipótesis formuladas. A continuación se explican las fuentes de información, ordenadas alfabéticamente. Cabe mencionar que en muchos casos las instituciones ponen a disposición de los usuarios, además de informes ya elaborados, herramientas de análisis online, que permiten seleccionar los datos que se quieren consultar (países, años, indicadores), cruzar variables y/o elaborar gráficos para su descarga posterior. Se debe advertir que las fuentes de información internacionales están en inglés (a veces, también, en español, francés o alemán), por lo que es recomendable tener un diccionario de este idioma a mano. No es aconsejable utilizar las herramientas de traducción automática de los buscadores, que pueden llevar a equívocos y errores. Por último, hay que tener en cuenta que, aunque existen páginas muy visibles en los buscadores que recopilan la información estadística de varias fuentes, es siempre más riguroso en un trabajo académico acudir a la fuente de información original de donde se extrajo el dato1. 1) Banco Mundial (http://data.worldbank.org/): El Banco Mundial (World Bank) agrupa a cinco instituciones internacionales que financian actuaciones en los países en desarrollo, con el objetivo de incrementar la prosperidad en dichos países y promover el desarrollo sostenible. Acorde con dichos objetivos, la información que ofrece esta institución abarca desde indicadores relacionados con la agricultura sostenible, las infraestructuras y el cambio climático hasta indicadores sanitarios, educativos, laborales, financieros y económicos. El abanico 1 Todas las páginas web de este apartado y el siguiente han sido consultadas en agosto de 2017. 6 de temas de los que recopila información es muy amplio y también dedican especial atención al análisis de la posición de la mujer en cada país. Pinchando en la pestaña "Data" de su página web, se puede encontrar información no solamente de países menos desarrollados, sino de países industrializados. Además de estadísticas nacionales, se pueden seleccionar los valores medios de los indicadores para regiones del mundo (por ejemplo, Africa Subsahariana) o para países que pertenecen a uno de los seis grupos según su desarrollo económico. 2) Consejo Económico y Social (www.ces.es): El Consejo Económico y Social español es un alto órgano consultivo del Gobierno, en el que están presentes organizaciones empresariales, sindicales y otras representativas de los intereses de la ciudadanía. El Consejo emite dictamen preceptivo sobre los Anteproyectos de Leyes del Estado, Proyectos de Reales Decretos Legislativos que regulen las políticas socioeconómicas y laborales y Proyectos de Reales Decretos que se considere por el Gobierno que tienen una especial trascendencia en este ámbito. El Consejo publica una Memoria sobre la situación socioeconómica y laboral de España, de carácter anual, que resulta interesante para el estudiante universitario, puesto que la rica información estadística se ve acompañada de una interpretación de los datos. La Memoria se divide en varios apartados, estando presente habitualmente un análisis del panorama económico internacional y nacional, del mercado de trabajo, de las políticas de empleo y las relaciones laborales y de las condiciones de vida de la población (educación, vivienda, medio ambiente, consumo, salud, protección social e inclusión social). Por último, desde su página web también se puede acceder a los Consejos económicos y sociales de carácter autonómico así como realizar búsquedas en los Dictámenes e Informes, Boletines Oficiales y Diarios de Sesiones del Congreso de los Diputados y del Senado. 3) Eurostat (http://ec.europa.eu/eurostat): Eurostat es la Oficina estadística de la Unión Europea, localizada en Luxemburgo. Su misión es proveer de información estadística de alta calidad para los países miembros, permitiendo así la comparación de datos entre estos. Pinchando en la pestaña "Data" y posteriormente eligiendo en el desplegable "Database" desde su página de inicio, se puede acceder a estadísticas de economía y finanzas, población y condiciones de vida (sección que incluye migraciones, salud, educación, protección social, mercado de trabajo juventud, cultura y deporte, entre otros temas), industria, servicios y agricultura, transporte, comercio internacional, medio ambiente ciencia y tecnología (apartado que 7 incluye información sobre la sociedad digital). Navegando por cada uno de estos temas, despliegan tablas estadísticas con la información solicitada para todos los países miembros y, habitualmente, para diversos años. Antes de descargar la información en formato Excel, permite depurar la información y seleccionar solamente algunos países y/o algunos años que interesen al investigador. 4) Foro Económico Mundial (https://www.weforum.org): El Foro Económico Mundial (World Economic Forum), también conocido como Foro de Davos, es una fundación sin ánimo de lucro con sede en Ginebra y que reúne anualmente en su asamblea anual en Davos, Suiza, a dignatarios de todo el mundo. Pinchando en la pestaña "Reports" se puede acceder a informes que elaboran periódicamente sobre diversos asuntos de interés económico de diversas regiones del mundo (salud, empleo, turismo, etc.). De particular interés resulta estudiar el Global Gender Gap Index (índice global de la brecha de género) que propone esta institución. Anualmente se publica el informe Global Gender Gap Report, que publica desde 2006, iniciándose con 107 países y analizando en 2016 a 144. El Foro ha desarrollado un índice para cuantificar la desigualdad de género en cada país en cuatro ámbitos (salud, educación, economía y política) y analizar cómo evoluciona. Además de acceder al informe global, la página permite seleccionar perfiles de países para ver cómo puntúan en cada dimensión del indicador, cómo han progresado desde que se incluyen en el análisis y qué posición ocupan en el ránking mundial. 5) Instituto Nacional de Estadística (www.ine.es): El Instituto Nacional de Estadística (INE), es un organismo autónomo adscrito al Ministerio de Economía, Industria y Competitividad. La Ley le encomienda expresamente la realización de las operaciones estadísticas de gran envergadura (censos demográficos y económicos, cuentas nacionales, estadísticas demográficas y sociales, indicadores económicos y sociales, coordinación y mantenimiento de los directorios de empresas, formación del Censo Electoral...). El INE ofrece, de manera gratuita y fácilmente accesible a través de internet, una rica información tanto de datos estadísticos de carácter objetivo (por ejemplo, tasas de natalidad, mortalidad y nupcialidad, número de matriculados en la Universidad, número de fallecimientos por una determinada causa) como de carácter subjetivo (realiza encuestas a la población sobre diversos temas, desde salud hasta nuevas tecnologías), siendo la Encuesta de Población Activa una de las más importantes que realiza, con carácter trimestral. 8 Pinchando en la pestaña "INEbase" se puede encontrar un listado de las grandes áreas en que se clasifica la información publicada: agricultura y medio ambiente, ciencia y tecnología, demografía y población, economía, industria, energía y construcción, mercado laboral, nivel y condiciones de vida, servicios y sociedad. Cada área tiene, a su vez, subtemas que, si se seleccionan, muestran una enumeración detallada del tipo de datos que se pueden consultar. Para la mayoría de la información existen datos regionales además de nacionales, y para muchos de ellos también se puede desagregar a nivel provincial. Una vez seleccionada la información que interesa, se abre una herramienta con la que el investigador puede escoger qué datos quiere que se le ofrezcan. Por ejemplo, los nacimientos de solamente una provincia española, o el número de inmigrantes de solamente una Comunidad autónoma. Una vez se genera la tabla de datos con los parámetros especificados, se puede descargar la información en diversos formatos, entre ellos Excel. Por último, cabe mencionar que el INE publica un listado muy útil de los enlaces a todos los servicios estadísticos tanto de las comunidades autónomas españolas, como de los países de la UE y los de otras regiones del mundo (http://www.ine.es/htdocs/serv/estadist.htm). 6) Organización de las Naciones Unidas (http://www.un.org/es/index.html): La Organización de las Naciones Unidas (ONU), también conocida simplemente como Naciones Unidas (United Nations, UN por sus siglas en inglés) es la mayor organización internacional existente, creada tras la Segunda Guerra Mundial. En la actualidad, 193 Estados son miembros de esta organización. que están representados en el órgano deliberante, la Asamblea General. La ONU es una organización compleja con múltiples agencias dedicadas a diversas áreas, algunas tan conocidas como la UNESCO (United Nations Educational, Scientific and Cultural Organization), dedicada al ámbito de la educación y la cultura, la OMS/WHO (Organización Mundial de la Salud, World Health Organization), enfocada a asuntos sanitarios, o la FAO (Food and Agricultural Organization), centrada en temas alimentarios. La ONU posee una agencia estadística que es la responsable a nivel internacional de recolectar la información demográfica oficial de las agencias estadísticas nacionales. Desde 1948 publica el Anuario Demográfico (Demographic Yearbook), obra de referencia entre los demógrafos y otros científicos sociales para cualquier comparación internacional sobre temas relacionados con la población. Para consultar información estadística, se debe, desde la página de la portada (en español), 9 acceder a la pestaña "Documentos" y, posteriormente, a "Recursos y servicios" y "Base de datos". Allí se encontrará información no solamente demográfica, sino de temas sanitarios, educativos, económicos. etc. De particular interés para los investigadores sociales es el índice de desarrollo humano elaborado por la institución (Human Development Index, HDI, por sus siglas en inglés), dependiente del Programa de las Naciones Unidas para el Desarrollo (PNUD). El índice fue creado para medir los logros medios obtenidos en tres dimensiones fundamentales del desarrollo humano: tener una vida larga y saludable (salud), adquirir conocimientos (educación) y disfrutar de un nivel de vida digno (ingresos). El índice se elabora desde 1990 con carácter anual y en la actualidad cuenta con datos de 188 países. Cada año se publica el Informe sobre Desarrollo Humano, que se puede descargar de la web (http://hdr.undp.org/en). Además de este índice, la ONU en los últimos años ha elaborado otros índices más específicos, como los relacionados con la pobreza multidimensional o la desigualdad de género. 7) Organización para la Cooperación y el Desarrollo ( http://www.oecd.org): La Organización para la Cooperación y el Desarrollo (OCDE, o bien Organisation for Economic Co-operation and Development, OECD, en inglés), creada en los años sesenta, es una organización internacional que promueve políticas para aumentar el nivel de bienestar social y económico, ofreciendo un foro en el que los gobernantes comparten experiencias y buscan soluciones a problemas comunes. Se encarga de medir la productividad y los flujos globales de comercio e inversión y analizan y comparan datos para predecir tendencias futuras. Además de su foco en los aspectos económicos y de comercio, ponen a disposición del usuario una amplia gama de estadísticas de interés social. Aunque la OCDE tiene en la actualidad 35 miembros (entre ellos España) de diversos continentes y con diferentes niveles de desarrollo económico, es frecuente que en la información estadística aparezcan datos de otros países no miembros, como China. Desde su página de inicio, pinchando en la pestaña "Data" (en la parte superior), se puede seleccionar el tema del que se quieren buscar datos (para el conjunto de países que forman parte de la OCDE) o bien el país en el que se está interesado. Algunos de los temas son educación, salud, familia, protección social, desarrollo, nuevas tecnologías o empleo. De especial relevancia para los investigadores interesados en las familias y la infancia es la (http://www.oecd.org/els/family/database.html), OCDE que Family incluye 70 Database indicadores relacionados con cuatro dimensiones: estructuras de la familias, posición en el mercado 10 laboral de las familias, políticas públicas para familias y niños e indicadores relacionados con el bienestar infantil (salud, pobreza, educación y participación social). También son muy conocidos entre los interesados en el ámbito educativo -y entre los medios de comunicación y responsables políticos- los Informes PISA (Programme for International Student Assesment, Programa para la evaluación internacional de los estudiantes), un estudio internacional de carácter trianual que evalúa los conocimientos y habilidades de los estudiantes de 15 años (http://www.oecd.org/education/). 8) Organización Internacional del Trabajo (http://www.ilo.org/global/lang-es/index.htm): La Organización Internacional del Trabajo (OIT, International Labour Organization, ILO, en inglés), fundada en 1919, es la única agencia tripartita de la ONU, compuesta por representantes de gobiernos, empleadores y trabajadores de 187 países miembros. Esta organización se dedica a la elaboración de estándares laborales, así como a desarrollar políticas y concebir programas que promuevan un trabajo decente para hombres y mujeres. Desde la página de inicio (en español) se puede pinchar en la pestaña "Estadísticas y bases de datos", donde la información se agrupa en tres partes: ILOSTAT (que recoge las estadísticas de datos objetivos relacionados con el mercado de trabajo), Estadísticas sobre trabajo infantil y las Encuestas sobre la mano de obra. Seleccionando este último apartado, se accede a un listado de países por orden alfabético y, eligiendo el país del que se tenga interés, se abre un enlace a las encuestas oficiales sobre el tema en dicho Estado (por ejemplo, la Encuesta de Población Activa del INE para el caso español). 9) Base de Datos Mundial de Riqueza e Ingresos (http://wid.world): Esta base de datos (World Wealth & Income Database, WID, en inglés) se ha elaborado con la finalidad de facilitar y promover las comparaciones internacionales dedicadas a resultados socioeconómicos y los factores institucionales que moldean dichos resultados. Esta base es reciente, creándola un grupo internacional de académicos en 2011 inicialmente bajo el nombre de The World Top Incomes Database (WTID). Recoge información de más de una treintena de países sobre desigualdad económica cubriendo un amplio periodo que, según los países analizados, puede llegar hasta principios del siglo XX. La novedad de esta base de datos es que combina información de las cuentas nacionales e información fiscal con datos de encuesta de manera sistemática, por lo que resulta de interés para los investigadores que quieran analizar la desigualdad económica combinando diferentes indicadores. La página ofrece al usuario 11 crear, además de las tablas y gráficos habituales en otras bases de datos, mapas interactivos de países. 5. Los datos secundarios de carácter subjetivo: principales fuentes de información a nivel nacional e internacional. En los últimos años han proliferado las encuestas de opinión, coordinadas por equipos de investigadores a nivel internacional, para facilitar la comparación de las opiniones, prácticas sociales, valores y actitudes de poblaciones de diferentes partes del mundo. Estas encuestas abordan temas tan variados como la familia, la religión, la política, la desigualdad, la inmigración o el Estado de bienestar. Aunque comenzaron hace varias décadas con un reducido número de países principalmente occidentales, siendo la Encuesta Mundial de Valores una de las pioneras, progresivamente se han expandido a otras regiones del mundo e incluso se han coordinado estudios internacionales en zonas como África o Latinoamérica sobre aspectos que interesan especialmente a los estudiosos de la región. De todos ellos se habla en este apartado, así como de dos fuentes de información nacionales, una de carácter privado (el Banco de datos ASEP/JDS) y una público, el Centro de Investigaciones Sociológicas. Como ocurre en el caso de los datos de carácter objetivo, muchas de estas instituciones tienen disponibles herramientas de análisis online de sus datos, que permiten elaborar tablas y gráficos con aquellos que interesen al investigador. Asimismo, la mayoría de ellas están en inglés y es necesario disponer de un diccionario por si surgieran dudas. El orden que se ha seguido para explicarlas es el alfabético. 1) Afrobarómetro (http://www.afrobarometer.org): El Afrobarómetro (Afrobarometer en inglés) es una red de investigación pan-africana que realiza encuestas sobre democracia, gobernanza, condiciones económicas y temas relacionados con estos aspectos. Esta encuesta se realiza desde el año 1999 y en la actualidad participan 37 países que representan al 76% de la población africana. En su página web, se puede descargar directamente la base de datos (a través de la pestaña "Data", subsección "Merged data"), o bien realizar un análisis online a través de la pestaña "Online Data Analysis", seleccionando el país (o países) y los temas y preguntas que se quieren analizar. Es una encuesta de especial interés para los alumnos de Ciencias Políticas y de Sociología, dada la rica información disponible sobre las actitudes hacia el gobierno y la democracia, así como la ciudadanía y la identidad, pero no únicamente para ellos, ya que también se abordan temas como justicia, conflicto y 12 crimen, que pueden interesar a los estudiantes de Criminología; o sobre pobreza, tolerancia o capital social, asuntos más cercanos a los trabajadores sociales. Se incluye, por último, ítems relacionados con la igualdad de género, un aspecto muy relevante dado que estos países, en muchas ocasiones, figuran en los ránking mundiales entre los que tienen mayores brecha de género. 2) Banco de datos ASEP/JDS ( http://www.jdsurvey.net/jds/jdsurvey.jsp): El Banco de datos ASP/JDS es, probablemente, la base de datos española de carácter privado con más riqueza de información. Fue fundada en 1982 por el catedrático de Sociología Juan Díez Nicolás y su principal objetivo es la investigación social, económica y política. La peculiaridad de esta base de datos es que, además de la información que proviene de sondeos que han realizado los propios investigadores de ASEP, se puede acceder a bases de datos de carácter internacional, muchas de ellas analizadas en este mismo apartado. En cuanto a los datos producidos por ASEP, desde 1986 realiza mensualmente el sondeo "La opinión pública de los españoles" a una muestra representativa de la población española, que incluye un Sistema de Indicadores fijo sobre actitudes y comportamientos económicos y de consumo, políticos, y de exposición a medios de comunicación (lo que permite disponer de largas series temporales) además de opiniones sobre los temas de actualidad cada mes (lo que constituye un gran archivo histórico de las variaciones en los estados de opinión sobre un gran número de temas). También se puede acceder al proyecto CIRES (Centro de Investigaciones de la Realidad Social) que realizó entre 1990 y 1996, a la Colección Inmigrantes, con datos entre 1991 y 2007, y al Barómetro del Real Instituto Elcano (datos de 2002 y 2003). En cuanto a los datos que recopilan de estudios internacionales, desde esta página se puede acceder a datos del Afrobarómetro, el Barómetro de Asia, el Latinobarómetro y el Barómetro Global, así como a las Encuestas Mundial y Europea de Valores, el Programa Internacional de Estudios Sociales y al Estudio Comparado de Sistemas Electorales. La página pone a disposición de los usuarios, además de la descarga de los ficheros con las bases de datos originales para su posterior análisis con paquetes estadísticos, una herramienta online para estudiar frecuencias y realizar tablas de contingencia y gráficos que también pueden ser descargados. 3) Barómetro de Asia (http://www.asianbarometer.org): El Barómetro de Asia (Asian Barometer Survey en inglés) es un proyecto que se engloba en el Programa de investigación sobre estudios democráticos de Asia Oriental 13 de la Universidad Nacional de Taiwán. Tiene como objetivo generar en esta región del mundo datos fiables y comparables que permitan los análisis internacionales. Sus encuestas se centran en temas como los valores políticos, participación política y confianza en las instituciones, gobernanza, seguridad humana y la valoración de las reformas económicas. La primera oleada se realizó en 2001 con ocho países participantes y en la cuarta y última oleada, correspondiente a los años 2014 a 2016, han participado 14 países del Este asiático, tales como Japón, Corea del Sur, Taiwán, Tailandia y China. Mientras que en su página se pueden descargar informes con los resultados principales de cada oleada (pestaña "Publications"), así como las bases de datos originales (pestaña "Data"), en ella no existe una herramienta online de análisis de datos, se debe acudir a la página de ASEP/JDS para realizarlo. 4) Centro de Investigaciones Sociológicas (www.cis.es): De entre las instituciones españolas, ya sean públicas o privadas, que realizan sondeos a la opinión pública, sin duda el Centro de Investigaciones Sociológicas (CIS) es el más importante por la cantidad y calidad de datos que genera sobre nuestra sociedad. El CIS es un organismo autónomo dependiente del Ministerio de la Presidencia cuya función principal es la de contribuir al conocimiento científico de la sociedad española. Todos los datos del CIS son de dominio público. El Banco de Datos del CIS custodia y pone a disposición del público todas las investigaciones realizadas por el centro. A él se puede acceder a través de la propia web del CIS, como se explicará al final de este apartado con un ejemplo, o de forma presencial. Muchos de estos datos se recogen en la Colección Opiniones y Actitudes, que desde el año 2010 se edita en formato electrónico, cuya función es divulgar análisis empíricos de datos, poniendo especial énfasis en la presentación y descripción de los resultados, más que en la voluntad de teorizar o de establecer vínculos causales entre variables (http://www.cis.es/cis/opencm/ES/3_publicaciones/colecciones/opiniones.jsp). El CIS realiza encuestas con carácter mensual (los Barómetros del CIS), que incluyen un bloque de preguntas fijo sobre la situación económica y social del país, así como un bloque variable dedicado a diversos temas. Las encuestas se realizan a una muestra de 2.500 personas mediante entrevistas cara a cara, a diferencia de otros institutos de investigación, que encuestan a una muestra más reducida y de manera telefónica. El CIS también realiza estudios encargados por diversas administraciones públicas, tales como los diferentes Ministerios, para proporcionar diagnósticos precisos para orientar la labor de los poderes públicos. Los temas recogidos por el CIS son 14 variados. Se puede encontrar un índice temático en la pestaña "Estudios", opción "Catálogo de encuestas", con temas que van desde la política y la economía hasta la comunicación, la cultura, la educación o la sanidad, entre otros muchos. Por último, en esta web se pueden encontrar aquellos estudios que realiza el CIS como responsable en España de los trabajos de campo de estudios internacionales en los que participa nuestro país. Es el caso, por ejemplo, del estudio "Familia y género" del Programa Internacional de Estudios Sociales (ISSP por sus siglas en inglés). 5) Encuesta Europea de Valores (http://www.europeanvaluesstudy.eu) y Encuesta Mundial de Valores (http://www.worldvaluessurvey.org/wvs.jsp): Desde la década de los ochenta, a raíz de las grandes transformaciones y el cambio social cada vez más rápido en todas las sociedades, ha cobrado importancia en el mundo académico el estudio del cambio de los valores de la población. Fruto de este interés nacen en 1981 la Encuesta Europea de Valores (European Values Survey, EVS, por sus siglas en inglés) y la Encuesta Mundial de Valores (World Values Surveys, WVS). La Encuesta Europea realiza cada nueve años un sondeo en cada vez un mayor número de países europeos, siendo 2008 el último año, con datos disponibles para 47 países/regiones europeos y 70.000 entrevistados. Por su parte, la Encuesta Mundial ha realizado ya seis oleadas (la última con datos recogidos entre 2010 y 2014), y está preparando en la actualidad la séptima. En la sexta oleada se recolectó información de casi un centenar de países que representan a casi el 90% de la población mundial, entrevistando a casi 400.000 personas. Mediante estas encuestas los investigadores pueden estudiar cómo las personas valoran diferentes aspectos de la vida, como la familia, el trabajo, la religión, la política y el medio ambiente, comparar estos valores con los de otros países y ver cómo evolucionan a lo largo de las últimas décadas. Para ambas encuestas es posible descargar los ficheros con las bases de datos originales de las personas encuestadas, o bien realizar un análisis online. Sin embargo, mientras que en el caso de la Encuesta Mundial dicho análisis se realiza en la propia página web, seleccionando la oleada y el país del que se quiere obtener la información, la Encuesta Europea remite a la página web del instituto alemán de investigación GESIS (Leibniz Institute for Social Sciences) (https://www.gesis.org/home). Además de en esta web, recordemos que la página de ASEP/JDS también permite el análisis de estos datos. 6) Encuesta Social Europea (http://www.europeansocialsurvey.org): La Encuesta Social Europea (European Social Survey, ESS, por sus siglas en inglés), es un proyecto académico internacional nacido en 2001 en el que participan una treintena 15 de países europeos. Desde entonces, se han realizado siete oleadas (cada dos años), siendo los últimos datos disponibles los de 2014, aunque próximamente se publicarán los de la octava oleada, con datos de 2016. El principal objetivo de esta iniciativa es trazar la estabilidad y el cambio en la estructura social, las condiciones y las actitudes en Europa e interpretar cómo cambia su tejido social, político y económico. La ESS presta especial atención a los aspectos metodológicos, tanto en lo que se refiere al diseño de la muestra y el cuestionario como a la recogida de los datos, mediante entrevistas cara a cara. La encuesta incluye algunas preguntas de manera permanente, que se refieren a asuntos como la confianza social, la política y el bienestar subjetivo, y otras que se realizan de manera ocasional y que cubren un amplio espectro de temas: salud y cuidados, moralidad económica, trabajo, familia, inmigración, justicia, democracia o bienestar. 7) Estudio sobre ingresos y sobre riqueza del LIS ( http://www.lisdatacenter.org): El Luxembourg Income Study (LIS) es un centro de documentación de carácter internacional con sede en Luxemburgo. Este centro posee dos bases de datos accesibles para la comunidad investigadora: el Luxembourg Income Study Database (LIS) y el Luxembourg Wealth Study Database (LWS). El primero de ellos (LIS), es la mayor base de datos armonizada (es decir, con datos comparables entre países) sobre ingresos, con información para alrededor de medio centenar de países en los cinco continentes de los últimos cincuenta años. En esta base se recogen datos de los encuestados como la fuente de sus ingresos (trabajo, capital, transferencias sociales y privadas, etc.), los impuestos que se pagan, las características del empleo y los gastos de los encuestados. La segunda base (LWS) recoge información de quince países, principalmente europeos o anglosajones, y pregunta por diversos aspectos relacionados con las posesiones, deudas, ingresos del mercado y del gobierno, empleo, consumo y gasto de los encuestados. 8)Eurobarómetro (http://ec.europa.eu/commfrontoffice/publicopinion/index.cfm/General/index): Los Eurobarómetros (Eurobarometer, EB, en inglés) son sondeos de opinión encargados por la Comisión Europea que se empezaron a realizar en 1974 entre muestras representativas de las poblaciones de los países miembros de la UE. Existen tres tipos: el estándar, el especial y el flash. El Eurobarómetro estándar se publica dos veces al año e incluye una serie de ítems sobre la situación económica y política de la UE y del país del encuestado, así como la valoración de la UE. Por su parte, los EB 16 especiales realizan estudidos en profundidad encargados por la Comisión Europea u otras instituciones comunitarias, integrándose en los sondeos de los Eurobarómetros estándar como una sección independiente. Abarcan temas muy variados, desde medio ambiente hasta pobreza, inmigración, cooperación internacional, deporte o hábitos de consumo. Por último, los Eurobarómetros flash son encuestas telefónicas realizadas ad hoc sobre un tema de actualidad por requerimiento de algún servicio de la Comisión Europea. En la página web de los Eurobarómetros se pueden descargar los informes con los principales resultados globales para todos los Estados miembros, así como los informes individuales para cada país por separado. También es posible, tras seleccionar un determinado Eurobarómetro, pinchar en el enlace "Open Data Portal" y descargar en formato Excel todas las preguntas incluidas en el sondeo y todas las frecuencias para todos los países miembros. Sin embargo, si se quiere descargar la base de datos original para realizar análisis estadísticos más sofisticados, se deberá hacer desde la página web del ya mencionado instituto alemán de investigación GESIS (Leibniz Institute for Social Sciences). 9) Programa Internacional de Estudios Sociales (http://www.issp.org/menutop/home): El Programa Internacional de Estudios Sociales (International Social Survey Programme, ISSP, en inglés), es un programa de colaboración académica internacional que realiza anualmente encuestas sobre diversos temas relevantes para la investigación social. El programa nació en 1984 con cuatro países (Australia, Alemania, Gran Bretaña y Estados Unidos) y progresivamente ha aumentado el número de Estados participantes a varias decenas de todas las regiones del mundo. Los temas analizados se repiten periódicamente, para así permitir comparar la evolución de las actitudes y prácticas sociales. Algunos de los asuntos que se han abordado han sido: el papel de los gobiernos, las redes sociales, la desigualdad social, la religión, la familia y los roles de género o el medio ambiente. Los últimos datos disponibles, de 2015, se dedican a la orientación hacia el trabajo, y los próximos que se publicarán serán los módulos dedicados al papel del gobierno (datos recogidos en 2016), las redes sociales (en 2017) y la religión (en 2018). Esta página web no tiene disponible una herramienta online para analizar los datos. Para descargar la base de datos original, como ya ocurriera en el caso de la Encuesta Europea de Valores y el Eurobarómetro, se remite al instituto GESIS, 17 aunque también se puede disponer de algunos estudios (no todos), a partir de 1998, en la página web de ASEP/JDS. 10) Latinobarómetro (www.latinobarometro.org): El Latinobarómetro es un estudio de opinión pública que realiza anualmente alrededor de 20.000 entrevistas en 18 países de América Latina. Esta encuesta es realizada por Corporación Latinobarómetro, una ONG sin ánimo de lucro con sede en Santiago de Chile. Mediante este sondeo, se investiga el desarrollo de la democracia, la economía y la sociedad en su conjunto, usando indicadores de opinión pública que miden actitudes, valores y comportamientos. Las encuestas comenzaron a realizarse en 1995 y los últimos datos publicados son de 2015. Además de preguntas que pueden interesar a estudiantes de Ciencia Política o Sociología, como es el caso de ítems relacionados con la democracia, la confianza social, la valoración de las instituciones políticas o de las relaciones internacionales, se incluyen preguntas que pueden resultar útiles para estudiosos de otros ámbitos, como las relacionadas con la pobreza, con los medios de comunicación o con el uso de internet. La página web permite descargarse, además de los informes y los cuestionarios, las bases de datos originales. Asimismo, está disponible una herramienta de análisis online en la que se pueden seleccionar países y/o oleadas para consultar la distribución de frecuencias y realizar gráficos con las tablas de datos. 6. Big data: definición, ventajas e inconvenientes. En los últimos años se ha popularizado la expresión Big Data (grandes datos) y es común encontrar desde ofertas de empleo hasta propuestas formativas relacionadas con este concepto. En este apartado se pretende explicar qué es el Big Data y sus posibles ventajas e inconvenientes en un trabajo académico (trabajo de fin de grado, de máster o incluso tesis doctoral) como el que ocupa este manual. El término fue popularizado en la década de los 90 por el informático estadounidense John Mashley, quien publicó el artículo “Big Data and the Next Wave of Infrastress” (Datos masivos y la próxima ola de Infrastress), donde advertía de que el aumento en la cantidad de datos que se generaría en los sucesivos años provocarían un estrés en las infraestructuras humanas y físicas de la informática. Se denomina Big Data a la gestión y análisis de enormes volúmenes de datos que no pueden ser tratados de manera convencional, ya que superan los límites y capacidades de las herramientas de software habitualmente utilizadas para la captura, gestión y procesamiento de datos. 18 Además del volumen de información, los otros dos rasgos característicos del Big Data son la variedad (se incluyen nuevas de fuentes de datos diferentes a las que se utilizan de forma tradicional, como son los dispositivos móviles, audio, video, sistemas GPS, sensores digitales en equipos industriales, automóviles, medidores eléctricos, veletas, anemómetros, etc., los cuales pueden medir y comunicar el posicionamiento, movimiento, vibración, temperatura, humedad) y la velocidad (la rapidez con que los datos se reciben, se procesan y se toman decisiones a partir de ellos). Además de estas tres características principales, Kitchin (2014) les añade otras: muchos de estos datos tienen referencia espacial y temporal, son exhaustivos (datos de poblaciones completas o muestras amplísimas), tienen alta resolución (mucho detalle) y son flexibles (diseñados para ser ampliados fácilmente añadiendo nuevas variables y nuevos casos). Estos grandes datos han generado un enorme interés en las empresas, ya que pueden utilizarlos para entender el perfil, las necesidades y el sentir de sus clientes respecto a los productos y/o servicios vendidos. Por ejemplo, cuando una persona navega por Internet (bien sea utilizando las redes sociales o visitando páginas de instituciones y empresas de diverso tipo), deja un rastro sobre cuáles son sus intereses, con quién se relaciona, dónde compra, cuándo lo hace, etc. Como señalan Navarro y Ariño (2015:127), "si el incremento de datos digitales es ciertamente apabullante, todavía lo es más el crecimiento de esa clase especial de datos digitales que son los datos personales". Nuestras acciones en la red (búsquedas, compras, uso de las redes sociales, etc.) dejan huellas digitales que son más precisas cuanto más numerosas y diversas sean. Empresas como Google y Facebook elaboran estadísticas del número y perfil de los usuarios que buscan determinadas palabras en el buscador, o que visitan y/o son fans de páginas de la red social. Esta información es vendida posteriormente a terceras empresas, que con dicha información, denominada inteligencia empresarial, elabora perfiles de consumidores con gran precisión y toman decisiones sobre qué tipos de productos producir, cómo venderlos y a quiénes, por ejemplo. Pero no todas las aplicaciones son comerciales. Los grandes datos son utilizados por los gobiernos para estudiar el comportamiento de los ciudadanos, y mejorar así los servicios públicos, perseguir los incumplimientos de la ley, o vigilar masivamente las comunicaciones para luchar contra el terrorismo. Por su parte, los investigadores académicos han empleado estos grandes datos para estudiar el efecto contagio de los estados emocionales a través de las redes sociales, el contenido de las redes sociales como predictor de comportamientos de consumo o políticos, etc. (Mezo, 2015). 19 Los científicos e investigadores han analizado datos desde ya hace mucho tiempo, lo que hace a este período cualitativamente diferente es la gran de cantidad de datos que se generan diariamente. Esta abundancia de datos y la velocidad con la que se pueden analizar transforma la forma en que se investiga en ámbitos como la biomedicina, la salud, el consumo, el medio ambiente, la seguridad nacional, etc. Ello no significa que los datos y las herramientas para analizarlos más tradicionales dejen de tener importancia, pero se complementan con las nuevas fuentes de información. La naturaleza de la información hoy es diferente a la información en el pasado. Debido a la abundancia de sensores, micrófonos, cámaras, escáneres médicos, imágenes, etc. en nuestras vidas, los datos generados a partir de estos elementos serán dentro de poco el segmento más grande de toda la información disponible. Navarro y Ariño (2015:112) advierten de que internet no será solamente en un futuro cercano el objeto "por defecto" de la investigación social, sino que será la misma red la que aportará (lo hace ya) los instrumentos para estudiarla. Cada vez se aplican más técnicas de inteligencia artificial, conocidas como machine learning (aprendizaje automático), que son procesos de análisis en los que un programa de ordenador puede aprender de sí mismo, identificando errores y aciertos y reformulándose para identificar patrones y hacer predicciones (Mezo, 2015). En el caso de un estudiante universitario que está realizando un trabajo de investigación, el uso de Big Data puede resultar muy interesante para descubrir patrones de consumo y estilos de vida en ámbitos como la Publicidad, el Márketing, la Salud o la Sociología del Consumo. Sin embargo, debe tenerse presente que estos datos requieren una inversión costosa para las empresas que se dedican a recopilarlos, por lo que es improbable que el alumno pueda acceder a ellos de manera gratuita, como sí es el caso de las fuentes comentadas en los dos puntos anteriores. Sin embargo, podría ocurrir que algunas de las empresas elaboren informes de carácter divulgativo para darse a conocer entre potenciales consumidores, usuarios o inversores, que podrían ser utilizados para realizar un trabajo académico. En estos casos, lo más probable es que el estudiante se encuentre con un número limitado de información que, además, puede estar sesgada. Por ello, deberá evaluar de manera cuidadosa la calidad de dichos datos, utilizando una serie de criterios que se explican en el próximo apartado2. 2 Para una explicación más detallada de los problemas metodológicos propios de los grandes datos, ver Mezo (2015), pp. 508-510. 20 7. Cómo evaluar la calidad de los datos secundarios. Dada la abundancia de datos secundarios y su facilidad de acceso a través de internet, resulta necesario que el investigador dedique un tiempo a valorar la calidad de las fuentes de información y, por tanto, de los datos que ofrecen. Dicha evaluación es fundamental para llevar a buen término la investigación. El examen crítico de los datos secundarios es indispensable en Ciencias Sociales, como indica Ander-Egg (1982), dado que no permiten casi nunca que el investigador tenga contacto directo con los hechos y fenómenos a que se hace referencia en los documentos. Siguiendo a este autor, una valoración de datos estadísticos, tanto de carácter objetivo como subjetivo, requiere conocer las circunstancias en las que se desarrolló la investigación originaria, como cuáles fueron los procedimientos para obtener los datos o si el organismo que recopiló la información lo hizo de forma imparcial o tenía algún tipo de fin interesado. La evaluación pretende medir la fiabilidad y la validez de los datos. La fiabilidad se refiere a la exactitud de la medida, es decir, a que si se realizan diferentes pruebas los resultados que se obtienen son similares. La validez, por su parte, se refiere a que el procedimiento que se usa mide lo que realmente pretende medir. Para valorar la fiabilidad de una fuente de información, González (1994) sugiere que el investigador se pregunte por la accesibilidad de los datos, el objetivo de la investigación y quiénes fueron sus responsables, si los datos en sí son fiables, cuándo y cómo se recogieron, entre otros aspectos. Por su parte, para evaluar el grado de validez hay que interrogarse sobre si los indicadores miden lo que se suponen que miden, si coinciden los conceptos que va a utilizar el investigador con los indicadores propuestos en los datos, si ha habido cambios en la definición del concepto (en el caso de un estudio longitudinal) y si se cubren las dimensiones más relevantes del concepto con los datos disponibles. En conclusión, podríamos dividir en tres grandes bloques los aspectos que el investigador debe evaluar de la fuente de información secundaria y los datos que ofrece: 1) Con respecto al diseño de la investigación: cuáles eran los objetivos e hipótesis de la investigación, cómo se definieron los conceptos y las variables, cómo se diseñó la recogida de datos, si la muestra es representativa o deja fuera a segmentos de la población relevantes (en el caso de tratarse de una encuesta a una gran población), cuál es el margen de error, qué preguntas y categorías de respuesta se incluyeron en el cuestionario. Para valorar esta parte, resulta útil analizar los anexos metodológicos así como los cuestionarios que habitualmente la institución responsable publica junto a los 21 principales resultados. En el caso de los cuestionarios, se debe valorar si las preguntas se formularon correctamente, sin sesgos que pudieran influir en la respuesta del entrevistado. También se debe prestar atención a que las categorías de respuestas fueran exhaustivas (que ninguna persona encuestada diera una respuesta que no está recogida en el cuestionario y, por tanto, no pudiera responder) y excluyentes (que no resulte posible responder dos categorías de respuesta simultáneamente). Por último, se debe plantear si faltan preguntas (y/o categorías de respuesta) importantes para contrastar las hipótesis. 2) Con respecto a la recogida de datos: hay que valorar cómo fue el trabajo de campo y si se controló la labor de los encuestadores, si las entrevistas fueron personales, por correo postal o electrónico o por teléfono, las fechas en que se realizaron las encuestas y la tasa de respuesta a las preguntas más relevantes para nuestra investigación. Hay que prestar atención a si durante el periodo de recogida de los datos ocurrió algún hecho relevante que puedan influir en la manera de responder. Por ejemplo, si la encuesta trata de las actitudes hacia el medio ambiente y durante las dos semanas en que se recoge la información ocurre una catástrofe medioambiental, pudiera ocurrir que las respuestas estuvieran influidas por este hecho. También hay que analizar si existe alguna pregunta que tiene una tasa de respuesta baja, es decir, que muchas personas no contestan por diferentes motivos: por tratarse de un tema íntimo, polémico o poco conocido entre la población. 3) Con respecto a la presentación de los datos y su análisis: hay que valorar si se han publicado todos los datos relevantes, sin omitir algunos importantes, pues ello nos haría dudar de la imparcialidad de la fuente y de sus objetivos. Hay que prestar atención a si se comparan cantidades que son realmente comparables y a que las conclusiones no sean abusivas y se derivan directamente de los datos. Requiere comentario aparte el análisis crítico de los datos cuando se realizan comparaciones a lo largo del tiempo o cuando provienen de diferentes fuentes3. En el último caso, por ejemplo, cuando se trata de un estudio internacional que ha sido llevado a cabo por diversos institutos de investigación de varios países, es muy recomendable leer el cuestionario (ya sea en su idioma original o en su traducción al 3 Como señala Mezo (2015), hay que tener en cuenta que muchas estadísticas compiladas internacionalmente por organismos como la ONU o Eurostat, aparentemente tienen una fuente "única" pero, en realidad, fusionan informaciones de organismos nacionales, con criterios que son similares pero no idénticos, por lo que es necesario revisar las notas metodológicas que acompañan a dicha información. 22 inglés) puesto que en ocasiones la formulación de las preguntas o las categorías de respuesta pueden variar. Por ejemplo, en un país se puede haber dado al entrevistado la posibilidad de expresar su grado de acuerdo eligiendo entre cinco categorías: "muy de acuerdo/ de acuerdo/ ni de acuerdo ni en desacuerdo/ en desacuerdo/ muy en desacuerdo", mientras que en otro no se ha preguntado la categoría intermedia y solamente existen cuatro opciones. En estos casos, las comparaciones se deben realizar con suma cautela, puesto que la distribución de la población en diferentes categorías puede ser muy diferente debido en parte a la diversa codificación de las respuestas. También puede ocurrir que, en un estudio internacional, no todos los ítems se preguntan en todos los países, por lo que es recomendable realizar un primer análisis de los datos controlando si las preguntas con las que va a trabajar el investigador están presentes en todos los países que quiere estudiar. Por último, es muy importante comprobar que no ha cambiado la definición de los conceptos cuando se trata de un estudio longitudinal. Cambios legislativos o adaptaciones a metodologías de organismos internacionales, por ejemplo, pueden provocar que un fenómeno social cambie su definición y, por tanto, su manera de medirlo difiera a lo largo de los años. Un ejemplo de ello para el caso español ocurrió con la entrada en vigor del Reglamento 1897/2000, que modificó sustancialmente la manera de registrar el paro en España, como explica el Instituto Nacional de Estadística en su página web. La definición formal de parado no cambió con el nuevo reglamento, usándose la definición internacional de la OIT. Según esta definición, desempleada es la persona con más de cierta edad especificada que durante el periodo de referencia está sin trabajo, disponible para trabajar y que busca empleo. Sin embargo, el nuevo reglamento introdujo instrucciones sobre cómo interpretar la búsqueda activa de trabajo y esta modificación afectó mucho a las cifras de paro que registra la Encuesta de Población Activa (EPA), provocando una gran disminución en las cifras del desempleo tanto absolutas como relativas.4 Este Reglamento, que se aplicó para unificar la definición de parado en toda la Unión Europea, afectó especialmente a España. El INE modificó los cuestionarios de 2001 para poder registrar tanto la nueva como la antigua 4 Hasta la entrada en vigor del reglamento, se consideraba que estar inscrito en las oficinas públicas de desempleo era suficiente para considerar que estaba buscando empleo. Tras su entrada en vigor, no era suficiente con dicha inscripción, sino que la persona desempleada debía en las cuatro semanas anteriores a la entrevista haber estado en contacto con una oficina pública de empleo, o con una privada, o haber realizado entrevistas de empleo, haber enviado su candidatura a empleadores, entre otras actividades. 23 definición y así poder cuantificar el impacto del cambio, que se demostró fue importante. Los cuestionarios anteriores a 2001 no recogían este matiz sobre si la búsqueda de empleo es o no activa, por lo que no es posible determinar, para períodos anteriores a 2001 qué cifras de paro habría dado la EPA de utilizar la nueva definición. Por tanto, un investigador que quiera comparar las cifras de parados en España durante las últimas décadas deberá tener en cuenta esta modificación en el concepto y en la medición y saber que los datos no son directamente comparables antes y después del 2000. 8. Ventajas e inconvenientes de la utilización de datos secundarios. El uso de esta técnica tiene ventajas e inconvenientes a tener en cuenta. Siguiendo a González (1994:250 y ss.), entre el grupo de las ventajas, destacan: a) Los datos secundarios permiten disponer de información abundante, barata y de calidad. Este fue el primer argumento para usarlos, aunque ahora se acepta que tiene otras ventajas además de su coste. Además, su calidad puede ser mayor que la de los datos recogidos por el propio investigador, dado que los recopilan de organizaciones especializadas en el tema. Por ejemplo, una encuesta realizada por el Centro de Investigaciones Sociológicas a una muestra representativa de la población española muy probablemente contendrá datos de mayor calidad que una encuesta que realice un estudiante a algunas decenas de personas de su entorno cercano. En este caso, además, los datos recolectados por el CIS han sido revisados por especialistas y recogidos en una base que permite su utilización inmediata una vez se descargan de manera gratuita, mientras que el estudiante que recopila sus propios datos debe revisar los errores en su recogida y codificar todas las respuestas en una base que cree para tal fin, labor larga y compleja. b) Permite una gran variedad de diseños de investigación, como las comparaciones internacionales (cada vez más frecuentes) y las series temporales. El aumento de la colaboración entre organismos oficiales e instituciones de investigación de diversas partes del mundo y la facilidad para conseguir datos secundarios en internet ha hecho posible que, de manera gratuita, un estudiante universitario pueda realizar una comparación sobre un determinado tema (educación, empleo, pobreza, inmigración, etc.) entre todos los países miembros de la Unión Europea y en dos momentos diferentes del tiempo, algo impensable hace pocos años. Por otro lado, siempre que 24 queramos comprender un fenómeno del pasado necesitaremos recurrir a datos secundarios para conocerlo. c) Se pueden emplear estos datos, especialmente los que provienen de censos, para crear los marcos muestrales y para ver lo representativa que es una muestra que hemos empleado en nuestra investigación. Si el estudiante va a recoger datos primarios por sí mismo, los secundarios le pueden orientar sobre cómo se distribuye la población objeto de estudio por sexo, grupo de edad o nivel educativo, por ejemplo. d) Evita la reactividad, es decir, la distorsión que produce el que los sujetos sepan que están siendo investigados. Sin embargo, puede haber ocurrido dicho efecto en el momento de la investigación original, por lo que el investigador de datos secundarios debe examinar críticamente la información y valorar la posibilidad de que se produjera reactividad en el momento en que los datos se recogieron. e) Permite el reanálisis de los datos de encuestas, que normalmente se explotan muy poco. Se pueden reanalizar los datos desde marcos teóricos distintos y con técnicas distintas. f) Promueve el progreso científico (teórico, metodológico y técnico), gracias al desarrollo y utilización de grandes bases de datos. Entre los inconvenientes, que limitan su utilización, el mismo autor destaca: a) Accesibilidad: aunque en general los datos son accesibles, puede ocurrir que la información que necesita el investigado para cubrir los objetivos de su investigación no esté disponible. Por ejemplo, imaginemos que para nuestra investigación necesitamos distinguir a las personas que tienen unos ingresos mensuales menores de 450 euros del grupo que ingresa entre 451 y 750 euros pero, en la base de datos que queremos utilizar, se distingue entre los que tuvieron unos ingresos menores de 600 euros y los que obtuvieron una cifra superior. En este caso, debemos valorar diferentes opciones: buscar una fuente de datos que sí realice la distinción que nos interesa o, si se decide seguir utilizando esos datos, prescindir de la variable ingresos en el análisis o adaptarse a las categorías de respuesta disponible. Otro problema que puede encontrarse el investigador es que existan los datos a nivel agregado, pero no individual. Por ejemplo, el investigador puede haber obtenido el dato de cuántos minutos navegan por internet de media los españoles los días laborables, pero no tener dicha información para cada uno de los encuestados de su 25 base de datos, que es una muestra representativa de la población española, por lo que no puede analizar cómo se distribuye ese tiempo según diversas características. b) Empirismo burdo: los datos no hablan por sí mismos, por lo que las grandes bases de datos no van a generar por sí mismas ideas e interpretaciones. En ellas hay muchas variables interesantes pero es la teoría la que nos hará seleccionar unas y no otras. El estudiante, por tanto, no debe sentirse tentado de incluir un gran número de datos en el trabajo académico para demostrar que ha sabido buscar las fuentes de información más pertinentes para su investigación, ni tampoco cruzar todas las variables sin un sentido teórico que guíe dicha operación, sino que tendrá que seleccionar cuáles son los datos más interesantes y cómo cruzarlos para comprobar sus hipótesis, hipótesis que, a su vez, derivan de un marco teórico previamente elaborado. c) Calidad de los datos y de la fuente: es necesario valorar si cumplen con unos requisitos mínimos de validez y fiabilidad, tanto los datos como la fuente de la que provienen. Las recomendaciones sobre este aspecto han sido realizadas en el apartado anterior. Bibliografía: • Ander-Egg, E. 1982. Técnicas de Investigación Social. Buenos Aires: Humanitas. • Barranco Fragoso, R. 2012. ¿Qué es Big Data? [online]. Disponible en: https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/. Fecha de consulta: 14 de agosto de 2017. • Gázquez, Javier. 2017. Qué es el Big Data y usos en el Marketing de contenidos [online]. Disponible en: http://www.foromarketing.com/big-data-marketingcontenidos/. Fecha de consulta: 14 de agosto de 2017. • González, B. 1994. La utilización de los datos disponibles. En: M. García Ferrando, J. Ibáñez y F. Alvira (comp.): El análisis de la realidad social. Métodos y técnicas de investigación [2ªed. revisada y ampliada]. Madrid: Alianza, 245-273. • Hakim, C., 1982. Secondary analysis in social research. London: G. Allen. • Kitchin, R. 2014. The Data Revolution: Big Data, Open Data, Data Infrastructures & Their Consequences. Londres: Sage. 26 • López López, J.C. 2014. La moda del Big Data: ¿En qué consiste en realidad? [online]. Disponible en: htttp://www.eleconomista.es/tecnologia/noticias/5578707/02/14/La-moda-del-BigData-En-que-consiste-en-realidad.html. Fecha de consulta: 14 de agosto de 2017. • Mezo, J. 2015. Explotación de datos secundarios. En: M. García Ferrando, F. Alvira, Luis E. Alonso y M. Escobar (comp.): El análisis de la realidad social. Métodos y técnicas de investigación [4ª edición]. Madrid: Alianza Editorial, 485-521. • Navarro , P. y Ariño, A. 2015. La investigación social ante su segunda revolución digital. En: M. García Ferrando, F. Alvira, Luis E. Alonso y M. Escobar (comp.): El análisis de la realidad social. Métodos y técnicas de investigación [4ª edición]. Madrid: Alianza Editorial, 110-141. • Sierra Bravo, R. 1995. Técnicas de investigación social. Teoría y ejercicios [10ª edición]. Madrid: Paraninfo. 27 View publication stats