Subido por YOLANDA ENCARNACION AMBROCIO SOLIS

Captulo7-Lautilizacindefuentesdedatossecundarios

Anuncio
See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/326131783
La utilización de fuentes de datos secundarios
Chapter · July 2018
CITATIONS
READS
0
4,450
1 author:
Livia Garcia-Faroldi
University of Malaga
36 PUBLICATIONS 127 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Nuevas estructuras de sociabilidad: redes sociales presenciales y digitales (New Structures of Sociability: Online and Offline Social Networks) View project
Uso de las erúbricas para la evaluación de competencias de los alumnos de Sociología View project
All content following this page was uploaded by Livia Garcia-Faroldi on 18 November 2020.
The user has requested enhancement of the downloaded file.
García Faroldi, L. (2018): “La utilización de fuentes de datos secundarios”. En: F.
Requena Santos y L. Ayuso Sánchez (Eds.) Estrategias de investigación en las
ciencias sociales, Valencia: Tirant Lo Blanch, pp. 139-172.
Índice
1. Introducción: definición de datos secundarios.
2. Cómo elegir los tipos de datos adecuados a nuestra investigación.
3. Tipos de datos secundarios: datos objetivos y datos subjetivos.
4. Los datos secundarios de carácter objetivo: principales fuentes de información a nivel
nacional e internacional.
5. Los datos secundarios de carácter subjetivo: principales fuentes de información a
nivel nacional e internacional.
6. Big data: definición, ventajas e inconvenientes.
7. Cómo evaluar la calidad de los datos secundarios.
8. Ventajas e inconvenientes de la utilización de datos secundarios.
1. Introducción: definición de datos secundarios.
La generación de datos para realizar una investigación social es un proceso
generalmente costoso en términos tanto económicos como de tiempo, de organización,
de gestión y de recursos humanos. Por ello, es habitual que muchos investigadores
sociales decidan utilizar datos proporcionados por fuentes especializadas en vez de
generar sus propios datos, es decir, utilizan datos secundarios. Esta elección se convierte
en casi obligatoria si se quiere realizar una investigación de carácter longitudinal (a lo
largo de un extenso periodo de tiempo) o una comparación internacional. En el caso de
los estudiantes universitarios que deben presentar su trabajo de fin de grado, de máster o
su tesis doctoral, un trabajo de investigación basado en datos secundarios es una opción
factible e incluso recomendable, siempre que el alumno pueda asegurar la calidad de los
datos elegidos antes de utilizarlos.
Afortunadamente, en la sociedad moderna actual abundan los datos secundarios,
puesto que se registran todo tipo de acontecimientos sociales por diversas instituciones
(desde organismos públicos y privados que elaboran estadísticas hasta los medios de
comunicación de masas que recogen los hechos acaecidos más relevantes) con
1
diferentes fines. Dichos datos posteriormente se pueden analizar mediante las
herramientas de la investigación científica.
La distinción entre datos primarios y secundarios se basa en quién produce los
datos: cuando el investigador es la fuente primaria de los datos, es decir, produce sus
propios datos, se trata de datos primarios. Sería el caso, por ejemplo, de un investigador
que realiza una entrevista a un experto sobre un tema y analiza posteriormente su
contenido. Cuando el investigador utiliza datos que han sido recogidos y elaborados por
otras personas y/o instituciones, se trataría de datos secundarios que se han extraído de
una fuente secundaria. Por ejemplo, si un investigador analiza las estadísticas oficiales
sobre el número de matriculados en enseñanza obligatoria en un determinado curso
académico o las opiniones de la población sobre un tema recogidas en una encuesta de
un instituto de opinión.
La utilización de datos secundarios se relaciona también con el concepto de
análisis secundario. Hakim (1982) define como análisis secundario de documentos o de
datos documentales todo posterior análisis de un conjunto de datos primarios que
ofrezca interpretaciones y conclusiones adicionales o en forma diferente a la presentada
en el primer informe de investigación. Es muy habitual que la institución que genera
ciertos datos realice un análisis de los mismos de carácter general y descriptivo, lo que
permite posteriormente al investigador interesado en el tema profundizar en el análisis
de dichos datos y obtener nueva información relevante.
El análisis de datos secundarios, tal como señala Sierra Bravo (1995), puede
aplicarse a varios ámbitos: para elaborar informes, para realizar análisis basados en un
nuevo marco teórico o aplicando nuevas técnicas de análisis, así como para contrastar
nuevas hipótesis de investigación.
2. Cómo elegir los tipos de datos adecuados a nuestra investigación.
Como señala González (1994), el uso normal del término dato secundario otorga una
connotación negativa a éste cuando se le compara con el dato primario, pero cuando se
habla de investigación secundaria no existe dicho aspecto peyorativo, sino que nos
referimos a los datos existentes. Estos datos cada vez adquieren más importancia. Ello
se debe a la abundancia de datos secundarios que no han sido analizados en profundidad
y de los que se pueden obtener conclusiones interesantes para el avance del
conocimiento de la sociedad, así como al alto coste de generar los propios datos de
carácter primario. En la misma idea incide Sierra Bravo (1995) cuando subraya que se
2
pueden realizar investigaciones importantes mediante la utilización de datos secundarios
y que la originalidad de una investigación no depende de que en ella se utilicen datos
primarios. Tal y como destaca Mezo (2015), los datos secundarios se emplean, como
mínimo, en la fase inicial de la investigación al revisar la literatura, para familiarizarse
con los estudios e informaciones ya existentes sobre el fenómeno que quiere analizar.
La elección del tipo de datos secundarios más adecuados para una investigación
viene determinada por cuál es la pregunta de investigación, la finalidad última de
llevarla a cabo. Advierte Ander-Egg (1982) de que no se caiga ni en el "hábito
coleccionista", es decir, acumular mucha información sin tener un propósito definido de
qué hacer con ella, ni en la "búsqueda a ciegas", sin ningún marco teórico que oriente la
interpretación de los datos. Es precisamente la facilidad con la que, desde finales de los
noventa, se puede acceder a datos secundarios, la que lleva al efecto perverso de usar de
manera poco meditada datos que no son adecuados para el propósito de la investigación
(Mezo, 2015).
Una vez se haya definido la pregunta de investigación, se debe delimitar espacial
y temporalmente el tema de investigación. Por ejemplo, un investigador puede plantear
como pregunta de investigación cuál ha sido el impacto en el sistema educativo de la
reciente crisis económica. Posteriormente, deberá concretar qué ámbito espacial se
quiere estudiar y qué periodo. El abanico de opciones es amplio: con respecto al ámbito
espacial, se puede decidir estudiar España en su conjunto, o una sola Comunidad
autónoma, o comparar diversas Comunidades, o comparar España con otros países
europeos o de otras zonas del mundo; con respecto al ámbito temporal, se puede estar
interesado solamente en el momento actual, o desear realizar un análisis de los últimos
tres o cinco años, o bien comparar entre la situación hace diez años y la actual, por
ejemplo.
En función de cómo se definan estos extremos, se podrá buscar las fuentes de
información de datos secundarios más adecuadas para alcanzar los objetivos planteados.
Cómo se explicará con detalle en los apartados 4 y 5 de este capítulo, existen fuentes de
información que facilitan la comparación internacional y/o temporal, mientras que otras
se circunscriben a España o a una Comunidad autónoma en concreto. A su vez, si la
investigación así lo requiere y la disponibilidad de recursos lo permite, estos datos
secundarios podrán ser complementados con datos primarios generados por el propio
investigador.
3
3. Tipos de datos secundarios: datos objetivos y datos subjetivos.
Dada la abundancia de datos secundarios, resulta complejo hacer una enumeración
exhaustiva de los tipos que existen. Ander-Egg (1982) propone distinguir entre cinco
tipos: los documentos escritos (fuentes históricas, periódicos, documentos personales,
archivos privados y oficiales, etc.), documentos estadísticos (los que provienen de los
servicios oficiales de estadísticas y de organismos internacionales), los documentos
cartográficos (diversos tipos de mapas), los documentos de imagen y sonido (fotografía,
pintura, escultura, fotografía, cine, documentación oral) y, por último, los documentos
objetos (es decir, los objetos construidos por el hombre que revelan información
interesante de la sociedad que los fabrica, puesto que reflejan su naturaleza,
organización y nivel de desarrollo). Esta propuesta coincide a grandes rasgos con la
realizada por Sierra Bravo (1995), que distingue solamente cuatro categorías, omitiendo
los documentos cartográficos como un tipo separado del resto.
Podemos observar, por tanto, la gran variedad de fuentes de donde pueden
provenir los datos, desde obras de arte hasta estadísticas y noticias en los medios de
comunicación. Los datos más adecuados a la investigación dependerá de la disciplina a
la que pertenece la investigación: los estudiosos de los medios de comunicación, como
es lógico, utilizan de manera fundamental todos los datos producidos por éstos (no
solamente noticias y otros tipos de programas, sino películas, publicidad, etc.), mientras
que los investigadores del Derecho se decantan principalmente por analizar leyes,
dictámenes y sentencias judiciales. Dada la gran variedad de datos secundarios
disponibles, resulta imposible en un capítulo introductorio como el presente explicar de
manera exhaustiva dónde obtener todos estos tipos de datos. Por ello, en los dos
próximos apartados se centrará la atención en las fuentes de información estadística que
con mayor frecuencia utilizan los sociólogos y que también resultan de suma utilidad
para investigadores de otras disciplinas sociales, como economistas, trabajadores
sociales, demógrafos, criminólogos, periodistas o educadores, por ejemplo.
Se diferencia aquí entre datos secundarios de carácter objetivo y subjetivo. Se
entiende por datos de carácter objetivo aquellos que se refieren a hechos objetivos tales
como el número de matriculados en un centro educativo, el consumo de electricidad per
cápita en un país o el número de fallecimientos por accidente de tráfico en un
municipio. Por otro lado, los datos de carácter subjetivo se refieren a aquellas opiniones,
actitudes, valores, deseos, etc. que manifiesta la población sobre un determinado tema.
Por ejemplo, la opinión de la población sobre la calidad del sistema educativo, la
4
valoración de los precios de la electricidad o las medidas que se creen que serán más
efectivas para reducir la mortalidad en accidentes de tráfico. Ambos tipos de datos,
objetivos y subjetivos, son interesantes para el investigador social y se pueden utilizar
de manera complementaria para analizar la realidad.
4. Los datos secundarios de carácter objetivo: principales fuentes de información a
nivel nacional e internacional.
En este apartado se van a enumerar algunas de las principales fuentes de información de
datos secundarios de carácter objetivo. Cabe advertir que este listado no pretende ser, ni
podría serlo, exhaustivo, ya que las fuentes son innumerables. En el caso de las fuentes
internacionales, se han escogido aquellas que se caracterizan por poseer información de
un amplio número de países, incluido España, y que cubren un amplio abanico de
temas. Es el caso de, por ejemplo, el Banco Mundial, las Naciones Unidas o Eurostat, la
Oficina estadística de la Unión Europea (UE). En el caso de las fuentes nacionales,
resulta imposible incluir aquí todos los Ministerios, Institutos públicos (como el
Instituto de la Mujer o el de la Juventud), los gobiernos autonómicos y sus respectivos
Institutos de estadística, por lo que se ha decidido centrar la atención en el Consejo
Económico y Social y el Instituto Nacional de Estadística (INE).
Por otro lado, hay que tener en cuenta, si se quiere llevar a cabo una
comparación internacional, que la información estadística disponible (y accesible
online) es mucho más rica en los países más industrializados que en los que tienen un
menor nivel de desarrollo, por lo que puede ocurrir que no todos los datos que se
necesitan para la investigación estén disponibles para todos los países. Como señala
Eurostat, las sociedades democráticas no funcionan de manera adecuada sin una sólida
base de estadísticas de datos objetivos rigurosa y fiable, que permita, por un lado, a los
legisladores de las diferentes administraciones tomar decisiones y, por otro lado, que la
opinión pública y los medios conozcan la realidad social y evalúen cómo el desempeño
de los políticos y otros actores sociales. Es por ello que las sociedades más avanzadas
dedican una especial atención a recolectar y publicar dicha información.
Será el propio investigador el que, dependiendo del tema objeto de estudio, deba
reflexionar sobre cuál es la fuente más adecuada de datos secundarios. Por ejemplo, un
estudiante de Criminología puede estar más interesado en buscar información en el
Ministerio de Interior, en el de Justicia y en las bases de datos policiales; un estudiante
de Relaciones Laborales se decantará por buscar información publicada por los
5
sindicatos o las asociaciones empresariales; uno de Trabajo social puede encontrar
particularmente interesante los informes sobre inclusión social de diferentes ONGs; uno
de Economía puede acudir a los informes socioeconómicos que publican entidades
bancarias como BBVA o La Caixa; uno de Márketing estará más interesado por los
informes que realizan las asociaciones de consumidores; un alumno de Turismo
preferirá consultar las estadísticas de movimientos turísticos que publica el INE y a un
estudiante de Comunicación le pueden ser útiles los datos de la Oficina de Justificación
de la Difusión (OJD), que analiza la prensa escrita en papel y digital, y la Asociación
para la Investigación de los Medios de Comunicación, que publica el Estudio General
de Medios (EGM). Las posibilidades son casi infinitas y es importante reflexionar
sobre cuáles son las fuentes más adecuadas para encontrar los datos que se necesitan
para contrastar las hipótesis formuladas.
A
continuación
se
explican
las
fuentes
de
información,
ordenadas
alfabéticamente. Cabe mencionar que en muchos casos las instituciones ponen a
disposición de los usuarios, además de informes ya elaborados, herramientas de análisis
online, que permiten seleccionar los datos que se quieren consultar (países, años,
indicadores), cruzar variables y/o elaborar gráficos para su descarga posterior. Se debe
advertir que las fuentes de información internacionales están en inglés (a veces,
también, en español, francés o alemán), por lo que es recomendable tener un diccionario
de este idioma a mano. No es aconsejable utilizar las herramientas de traducción
automática de los buscadores, que pueden llevar a equívocos y errores. Por último, hay
que tener en cuenta que, aunque existen páginas muy visibles en los buscadores que
recopilan la información estadística de varias fuentes, es siempre más riguroso en un
trabajo académico acudir a la fuente de información original de donde se extrajo el
dato1.
1) Banco Mundial (http://data.worldbank.org/):
El Banco Mundial (World Bank) agrupa a cinco instituciones internacionales que
financian actuaciones en los países en desarrollo, con el objetivo de incrementar la
prosperidad en dichos países y promover el desarrollo sostenible. Acorde con dichos
objetivos, la información que ofrece esta institución abarca desde indicadores
relacionados con la agricultura sostenible, las infraestructuras y el cambio climático
hasta indicadores sanitarios, educativos, laborales, financieros y económicos. El abanico
1
Todas las páginas web de este apartado y el siguiente han sido consultadas en agosto de 2017.
6
de temas de los que recopila información es muy amplio y también dedican especial
atención al análisis de la posición de la mujer en cada país.
Pinchando en la pestaña "Data" de su página web, se puede encontrar
información no solamente de países menos desarrollados, sino de países
industrializados. Además de estadísticas nacionales, se pueden seleccionar los valores
medios de los indicadores para regiones del mundo (por ejemplo, Africa Subsahariana)
o para países que pertenecen a uno de los seis grupos según su desarrollo económico.
2) Consejo Económico y Social (www.ces.es):
El Consejo Económico y Social español es un alto órgano consultivo del Gobierno, en
el que están presentes organizaciones empresariales, sindicales y otras representativas
de los intereses de la ciudadanía. El Consejo emite dictamen preceptivo sobre los
Anteproyectos de Leyes del Estado, Proyectos de Reales Decretos Legislativos que
regulen las políticas socioeconómicas y laborales y Proyectos de Reales Decretos que se
considere por el Gobierno que tienen una especial trascendencia en este ámbito.
El Consejo publica una Memoria sobre la situación socioeconómica y laboral de
España, de carácter
anual, que resulta interesante para el estudiante universitario,
puesto que la rica información estadística se ve acompañada de una interpretación de los
datos. La Memoria se divide en varios apartados, estando presente habitualmente un
análisis del panorama económico internacional y nacional, del mercado de trabajo, de
las políticas de empleo y las relaciones laborales y de las condiciones de vida de la
población (educación, vivienda, medio ambiente, consumo, salud, protección social e
inclusión social). Por último, desde su página web también se puede acceder a los
Consejos económicos y sociales de carácter autonómico así como realizar búsquedas en
los Dictámenes e Informes, Boletines Oficiales y Diarios de Sesiones del Congreso de
los Diputados y del Senado.
3) Eurostat (http://ec.europa.eu/eurostat):
Eurostat es la Oficina estadística de la Unión Europea, localizada en Luxemburgo. Su
misión es proveer de información estadística de alta calidad para los países miembros,
permitiendo así la comparación de datos entre estos. Pinchando en la pestaña "Data" y
posteriormente eligiendo en el desplegable "Database" desde su página de inicio, se
puede acceder a estadísticas de economía y finanzas, población y condiciones de vida
(sección que incluye migraciones, salud, educación, protección social, mercado de
trabajo juventud, cultura y deporte, entre otros temas), industria, servicios y agricultura,
transporte, comercio internacional, medio ambiente ciencia y tecnología (apartado que
7
incluye información sobre la sociedad digital). Navegando por cada uno de estos temas,
despliegan tablas estadísticas con la información solicitada para todos los países
miembros y, habitualmente, para diversos años. Antes de descargar la información en
formato Excel, permite depurar la información y seleccionar solamente algunos países
y/o algunos años que interesen al investigador.
4) Foro Económico Mundial (https://www.weforum.org):
El Foro Económico Mundial (World Economic Forum), también conocido como Foro
de Davos, es una fundación sin ánimo de lucro con sede en Ginebra y que reúne
anualmente en su asamblea anual en Davos, Suiza, a dignatarios de todo el mundo.
Pinchando en la pestaña "Reports" se puede acceder a informes que elaboran
periódicamente sobre diversos asuntos de interés económico de diversas regiones del
mundo (salud, empleo, turismo, etc.).
De particular interés resulta estudiar el Global Gender Gap Index (índice global
de la brecha de género) que propone esta institución. Anualmente se publica el informe
Global Gender Gap Report, que publica desde 2006, iniciándose con 107 países y
analizando en 2016 a 144. El Foro ha desarrollado un índice para cuantificar la
desigualdad de género en cada país en cuatro ámbitos (salud, educación, economía y
política) y analizar cómo evoluciona. Además de acceder al informe global, la página
permite seleccionar perfiles de países para ver cómo puntúan en cada dimensión del
indicador, cómo han progresado desde que se incluyen en el análisis y qué posición
ocupan en el ránking mundial.
5) Instituto Nacional de Estadística (www.ine.es):
El Instituto Nacional de Estadística (INE), es un organismo autónomo adscrito al
Ministerio de Economía, Industria y Competitividad. La Ley le encomienda
expresamente la realización de las operaciones estadísticas de gran envergadura (censos
demográficos y económicos, cuentas nacionales, estadísticas demográficas y sociales,
indicadores económicos y sociales, coordinación y mantenimiento de los directorios de
empresas, formación del Censo Electoral...). El INE ofrece, de manera gratuita y
fácilmente accesible a través de internet, una rica información tanto de datos
estadísticos de carácter objetivo (por ejemplo, tasas de natalidad, mortalidad y
nupcialidad, número de matriculados en la Universidad, número de fallecimientos por
una determinada causa) como de carácter subjetivo (realiza encuestas a la población
sobre diversos temas, desde salud hasta nuevas tecnologías), siendo la Encuesta de
Población Activa una de las más importantes que realiza, con carácter trimestral.
8
Pinchando en la pestaña "INEbase" se puede encontrar un listado de las grandes
áreas en que se clasifica la información publicada: agricultura y medio ambiente,
ciencia y tecnología, demografía y población, economía, industria, energía y
construcción, mercado laboral, nivel y condiciones de vida, servicios y sociedad. Cada
área tiene, a su vez, subtemas que, si se seleccionan, muestran una enumeración
detallada del tipo de datos que se pueden consultar. Para la mayoría de la información
existen datos regionales además de nacionales, y para muchos de ellos también se puede
desagregar a nivel provincial. Una vez seleccionada la información que interesa, se abre
una herramienta con la que el investigador puede escoger qué datos quiere que se le
ofrezcan. Por ejemplo, los nacimientos de solamente una provincia española, o el
número de inmigrantes de solamente una Comunidad autónoma. Una vez se genera la
tabla de datos con los parámetros especificados, se puede descargar la información en
diversos formatos, entre ellos Excel.
Por último, cabe mencionar que el INE publica un listado muy útil de los enlaces
a todos los servicios estadísticos tanto de las comunidades autónomas españolas, como
de
los
países
de
la
UE
y
los
de
otras
regiones
del
mundo
(http://www.ine.es/htdocs/serv/estadist.htm).
6) Organización de las Naciones Unidas (http://www.un.org/es/index.html):
La Organización de las Naciones Unidas (ONU), también conocida simplemente como
Naciones Unidas (United Nations, UN por sus siglas en inglés) es la mayor
organización internacional existente, creada tras la Segunda Guerra Mundial. En la
actualidad, 193 Estados son miembros de esta organización. que están representados en
el órgano deliberante, la Asamblea General. La ONU es una organización compleja con
múltiples agencias dedicadas a diversas áreas, algunas tan conocidas como la UNESCO
(United Nations Educational, Scientific and Cultural Organization), dedicada al ámbito
de la educación y la cultura, la OMS/WHO (Organización Mundial de la Salud, World
Health Organization), enfocada a asuntos sanitarios, o la FAO (Food and Agricultural
Organization), centrada en temas alimentarios.
La ONU posee una agencia estadística que es la
responsable a nivel
internacional de recolectar la información demográfica oficial de las agencias
estadísticas nacionales. Desde 1948 publica el Anuario Demográfico (Demographic
Yearbook), obra de referencia entre los demógrafos y otros científicos sociales para
cualquier comparación internacional sobre temas relacionados con la población. Para
consultar información estadística, se debe, desde la página de la portada (en español),
9
acceder a la pestaña "Documentos" y, posteriormente, a "Recursos y servicios" y "Base
de datos". Allí se encontrará información no solamente demográfica, sino de temas
sanitarios, educativos, económicos. etc.
De particular interés para los investigadores sociales es el índice de desarrollo
humano elaborado por la institución (Human Development Index, HDI, por sus siglas en
inglés), dependiente del Programa de las Naciones Unidas para el Desarrollo (PNUD).
El
índice
fue
creado
para
medir
los
logros
medios
obtenidos
en
tres dimensiones fundamentales del desarrollo humano: tener una vida larga y saludable
(salud), adquirir conocimientos (educación) y disfrutar de un nivel de vida digno
(ingresos). El índice se elabora desde 1990 con carácter anual y en la actualidad cuenta
con datos de 188 países. Cada año se publica el Informe sobre Desarrollo Humano, que
se puede descargar de la web (http://hdr.undp.org/en). Además de este índice, la ONU
en los últimos años ha elaborado otros índices más específicos, como los relacionados
con la pobreza multidimensional o la desigualdad de género.
7) Organización para la Cooperación y el Desarrollo ( http://www.oecd.org):
La Organización para la Cooperación y el Desarrollo (OCDE, o bien Organisation for
Economic Co-operation and Development, OECD, en inglés), creada en los años
sesenta, es una organización internacional que promueve políticas para aumentar el
nivel de bienestar social y económico, ofreciendo un foro en el que los gobernantes
comparten experiencias y buscan soluciones a problemas comunes. Se encarga de medir
la productividad y los flujos globales de comercio e inversión y analizan y comparan
datos para predecir tendencias futuras. Además de su foco en los aspectos económicos y
de comercio, ponen a disposición del usuario una amplia gama de estadísticas de interés
social. Aunque la OCDE tiene en la actualidad 35 miembros (entre ellos España) de
diversos continentes y con diferentes niveles de desarrollo económico, es frecuente que
en la información estadística aparezcan datos de otros países no miembros, como China.
Desde su página de inicio, pinchando en la pestaña "Data" (en la parte superior),
se puede seleccionar el tema del que se quieren buscar datos (para el conjunto de países
que forman parte de la OCDE) o bien el país en el que se está interesado. Algunos de
los temas son educación, salud, familia, protección social, desarrollo, nuevas
tecnologías o empleo. De especial relevancia para los investigadores interesados en las
familias
y
la
infancia
es
la
(http://www.oecd.org/els/family/database.html),
OCDE
que
Family
incluye
70
Database
indicadores
relacionados con cuatro dimensiones: estructuras de la familias, posición en el mercado
10
laboral de las familias, políticas públicas para familias y niños e indicadores
relacionados con el bienestar infantil (salud, pobreza, educación y participación social).
También son muy conocidos entre los interesados en el ámbito educativo -y entre los
medios de comunicación y responsables políticos- los Informes PISA (Programme for
International Student Assesment, Programa para la evaluación internacional de los
estudiantes), un estudio internacional de carácter trianual que evalúa los conocimientos
y habilidades de los estudiantes de 15 años (http://www.oecd.org/education/).
8) Organización Internacional del Trabajo (http://www.ilo.org/global/lang-es/index.htm):
La Organización Internacional del Trabajo (OIT, International Labour Organization,
ILO, en inglés), fundada en 1919, es la única agencia tripartita de la ONU, compuesta
por representantes de gobiernos, empleadores y trabajadores de 187 países miembros.
Esta organización se dedica a la elaboración de estándares laborales, así como a
desarrollar políticas y concebir programas que promuevan un trabajo decente para
hombres y mujeres. Desde la página de inicio (en español) se puede pinchar en la
pestaña "Estadísticas y bases de datos", donde la información se agrupa en tres partes:
ILOSTAT (que recoge las estadísticas de datos objetivos relacionados con el mercado
de trabajo), Estadísticas sobre trabajo infantil y las Encuestas sobre la mano de obra.
Seleccionando este último apartado, se accede a un listado de países por orden
alfabético y, eligiendo el país del que se tenga interés, se abre un enlace a las encuestas
oficiales sobre el tema en dicho Estado (por ejemplo, la Encuesta de Población Activa
del INE para el caso español).
9) Base de Datos Mundial de Riqueza e Ingresos (http://wid.world):
Esta base de datos (World Wealth & Income Database, WID, en inglés) se ha elaborado
con la finalidad de facilitar y promover las comparaciones internacionales dedicadas a
resultados socioeconómicos y los factores institucionales que moldean dichos
resultados. Esta base es reciente, creándola un grupo internacional de académicos en
2011 inicialmente bajo el nombre de The World Top Incomes Database (WTID).
Recoge información de más de una treintena de países sobre desigualdad económica
cubriendo un amplio periodo que, según los países analizados, puede llegar hasta
principios del siglo XX. La novedad de esta base de datos es que combina información
de las cuentas nacionales e información fiscal con datos de encuesta de manera
sistemática, por lo que resulta de interés para los investigadores que quieran analizar la
desigualdad económica combinando diferentes indicadores. La página ofrece al usuario
11
crear, además de las tablas y gráficos habituales en otras bases de datos, mapas
interactivos de países.
5. Los datos secundarios de carácter subjetivo: principales fuentes de información
a nivel nacional e internacional.
En los últimos años han proliferado las encuestas de opinión, coordinadas por equipos
de investigadores a nivel internacional, para facilitar la comparación de las opiniones,
prácticas sociales, valores y actitudes de poblaciones de diferentes partes del mundo.
Estas encuestas abordan temas tan variados como la familia, la religión, la política, la
desigualdad, la inmigración o el Estado de bienestar. Aunque comenzaron hace varias
décadas con un reducido número de países principalmente occidentales, siendo la
Encuesta Mundial de Valores una de las pioneras, progresivamente se han expandido a
otras regiones del mundo e incluso se han coordinado estudios internacionales en zonas
como África o Latinoamérica sobre aspectos que interesan especialmente a los
estudiosos de la región. De todos ellos se habla en este apartado, así como de dos
fuentes de información nacionales, una de carácter privado (el Banco de datos
ASEP/JDS) y una público, el Centro de Investigaciones Sociológicas.
Como ocurre en el caso de los datos de carácter objetivo, muchas de estas
instituciones tienen disponibles herramientas de análisis online de sus datos, que
permiten elaborar tablas y gráficos con aquellos que interesen al investigador.
Asimismo, la mayoría de ellas están en inglés y es necesario disponer de un diccionario
por si surgieran dudas. El orden que se ha seguido para explicarlas es el alfabético.
1) Afrobarómetro (http://www.afrobarometer.org):
El Afrobarómetro (Afrobarometer en inglés) es una red de investigación pan-africana
que realiza encuestas sobre democracia, gobernanza, condiciones económicas y temas
relacionados con estos aspectos. Esta encuesta se realiza desde el año 1999 y en la
actualidad participan 37 países que representan al 76% de la población africana. En su
página web, se puede descargar directamente la base de datos (a través de la pestaña
"Data", subsección "Merged data"), o bien realizar un análisis online a través de la
pestaña "Online Data Analysis", seleccionando el país (o países) y los temas y preguntas
que se quieren analizar. Es una encuesta de especial interés para los alumnos de
Ciencias Políticas y de Sociología, dada la rica información disponible sobre las
actitudes hacia el gobierno y la democracia, así como la ciudadanía y la identidad, pero
no únicamente para ellos, ya que también se abordan temas como justicia, conflicto y
12
crimen, que pueden interesar a los estudiantes de Criminología; o sobre pobreza,
tolerancia o capital social, asuntos más cercanos a los trabajadores sociales. Se incluye,
por último, ítems relacionados con la igualdad de género, un aspecto muy relevante
dado que estos países, en muchas ocasiones, figuran en los ránking mundiales entre los
que tienen mayores brecha de género.
2) Banco de datos ASEP/JDS ( http://www.jdsurvey.net/jds/jdsurvey.jsp):
El Banco de datos ASP/JDS es, probablemente, la base de datos española de carácter
privado con más riqueza de información. Fue fundada en 1982 por el catedrático de
Sociología Juan Díez Nicolás y su principal objetivo es la investigación social,
económica y política. La peculiaridad de esta base de datos es que, además de la
información que proviene de sondeos que han realizado los propios investigadores de
ASEP, se puede acceder a bases de datos de carácter internacional, muchas de ellas
analizadas en este mismo apartado.
En cuanto a los datos producidos por ASEP, desde 1986 realiza mensualmente el
sondeo "La opinión pública de los españoles" a una muestra representativa de la
población española, que incluye un Sistema de Indicadores fijo sobre actitudes y
comportamientos económicos y de consumo, políticos, y de exposición a medios de
comunicación (lo que permite disponer de largas series temporales) además de
opiniones sobre los temas de actualidad cada mes (lo que constituye un gran archivo
histórico de las variaciones en los estados de opinión sobre un gran número de temas).
También se puede acceder al proyecto CIRES (Centro de Investigaciones de la Realidad
Social) que realizó entre 1990 y 1996, a la Colección Inmigrantes, con datos entre 1991
y 2007, y al Barómetro del Real Instituto Elcano (datos de 2002 y 2003). En cuanto a
los datos que recopilan de estudios internacionales, desde esta página se puede acceder a
datos del Afrobarómetro, el Barómetro de Asia, el Latinobarómetro y el Barómetro
Global, así como a las Encuestas Mundial y Europea de Valores, el Programa
Internacional de Estudios Sociales y al Estudio Comparado de Sistemas Electorales. La
página pone a disposición de los usuarios, además de la descarga de los ficheros con las
bases de datos originales para su posterior análisis con paquetes estadísticos, una
herramienta online para estudiar frecuencias y realizar tablas de contingencia y gráficos
que también pueden ser descargados.
3) Barómetro de Asia (http://www.asianbarometer.org):
El Barómetro de Asia (Asian Barometer Survey en inglés) es un proyecto que se
engloba en el Programa de investigación sobre estudios democráticos de Asia Oriental
13
de la Universidad Nacional de Taiwán. Tiene como objetivo generar en esta región del
mundo datos fiables y comparables que permitan los análisis internacionales. Sus
encuestas se centran en temas como los valores políticos, participación política y
confianza en las instituciones, gobernanza, seguridad humana y la valoración de las
reformas económicas. La primera oleada se realizó en 2001 con ocho países
participantes y en la cuarta y última oleada, correspondiente a los años 2014 a 2016, han
participado 14 países del Este asiático, tales como Japón, Corea del Sur, Taiwán,
Tailandia y China. Mientras que en su página se pueden descargar informes con los
resultados principales de cada oleada (pestaña "Publications"), así como las bases de
datos originales (pestaña "Data"), en ella no existe una herramienta online de análisis de
datos, se debe acudir a la página de ASEP/JDS para realizarlo.
4) Centro de Investigaciones Sociológicas (www.cis.es):
De entre las instituciones españolas, ya sean públicas o privadas, que realizan sondeos a
la opinión pública, sin duda el Centro de Investigaciones Sociológicas (CIS) es el más
importante por la cantidad y calidad de datos que genera sobre nuestra sociedad. El CIS
es un organismo autónomo dependiente del Ministerio de la Presidencia cuya función
principal es la de contribuir al conocimiento científico de la sociedad española.
Todos los datos del CIS son de dominio público. El Banco de Datos del CIS
custodia y pone a disposición del público todas las investigaciones realizadas por el
centro. A él se puede acceder a través de la propia web del CIS, como se explicará al
final de este apartado con un ejemplo, o de forma presencial. Muchos de estos datos se
recogen en la Colección Opiniones y Actitudes, que desde el año 2010 se edita en
formato electrónico, cuya función es divulgar análisis empíricos de datos, poniendo
especial énfasis en la presentación y descripción de los resultados, más que en la
voluntad
de
teorizar
o
de
establecer
vínculos
causales
entre
variables
(http://www.cis.es/cis/opencm/ES/3_publicaciones/colecciones/opiniones.jsp).
El CIS realiza encuestas con carácter mensual (los Barómetros del CIS), que
incluyen un bloque de preguntas fijo sobre la situación económica y social del país, así
como un bloque variable dedicado a diversos temas. Las encuestas se realizan a una
muestra de 2.500 personas mediante entrevistas cara a cara, a diferencia de otros
institutos de investigación, que encuestan a una muestra más reducida y de manera
telefónica. El CIS también realiza estudios encargados por diversas administraciones
públicas, tales como los diferentes Ministerios, para proporcionar diagnósticos precisos
para orientar la labor de los poderes públicos. Los temas recogidos por el CIS son
14
variados. Se puede encontrar un índice temático en la pestaña "Estudios", opción
"Catálogo de encuestas", con temas que van desde la política y la economía hasta la
comunicación, la cultura, la educación o la sanidad, entre otros muchos. Por último, en
esta web se pueden encontrar aquellos estudios que realiza el CIS como responsable en
España de los trabajos de campo de estudios internacionales en los que participa nuestro
país. Es el caso, por ejemplo, del estudio "Familia y género" del Programa Internacional
de Estudios Sociales (ISSP por sus siglas en inglés).
5) Encuesta Europea de Valores (http://www.europeanvaluesstudy.eu) y
Encuesta Mundial de Valores (http://www.worldvaluessurvey.org/wvs.jsp):
Desde la década de los ochenta, a raíz de las grandes transformaciones y el cambio
social cada vez más rápido en todas las sociedades, ha cobrado importancia en el mundo
académico el estudio del cambio de los valores de la población. Fruto de este interés
nacen en 1981 la Encuesta Europea de Valores (European Values Survey, EVS, por sus
siglas en inglés) y la Encuesta Mundial de Valores (World Values Surveys, WVS). La
Encuesta Europea realiza cada nueve años un sondeo en cada vez un mayor número de
países europeos, siendo 2008 el último año, con datos disponibles para 47
países/regiones europeos y 70.000 entrevistados. Por su parte, la Encuesta Mundial ha
realizado ya seis oleadas (la última con datos recogidos entre 2010 y 2014), y está
preparando en la actualidad la séptima. En la sexta oleada se recolectó información de
casi un centenar de países que representan a casi el 90% de la población mundial,
entrevistando a casi 400.000 personas. Mediante estas encuestas los investigadores
pueden estudiar cómo las personas valoran diferentes aspectos de la vida, como la
familia, el trabajo, la religión, la política y el medio ambiente, comparar estos valores
con los de otros países y ver cómo evolucionan a lo largo de las últimas décadas.
Para ambas encuestas es posible descargar los ficheros con las bases de datos
originales de las personas encuestadas, o bien realizar un análisis online. Sin embargo,
mientras que en el caso de la Encuesta Mundial dicho análisis se realiza en la propia
página web, seleccionando la oleada y el país del que se quiere obtener la información,
la Encuesta Europea remite a la página web del instituto alemán de investigación GESIS
(Leibniz Institute for Social Sciences) (https://www.gesis.org/home). Además de en esta
web, recordemos que la página de ASEP/JDS también permite el análisis de estos datos.
6) Encuesta Social Europea (http://www.europeansocialsurvey.org):
La Encuesta Social Europea (European Social Survey, ESS, por sus siglas en inglés), es
un proyecto académico internacional nacido en 2001 en el que participan una treintena
15
de países europeos. Desde entonces, se han realizado siete oleadas (cada dos años),
siendo los últimos datos disponibles los de 2014, aunque próximamente se publicarán
los de la octava oleada, con datos de 2016. El principal objetivo de esta iniciativa es
trazar la estabilidad y el cambio en la estructura social, las condiciones y las actitudes en
Europa e interpretar cómo cambia su tejido social, político y económico. La ESS presta
especial atención a los aspectos metodológicos, tanto en lo que se refiere al diseño de la
muestra y el cuestionario como a la recogida de los datos, mediante entrevistas cara a
cara. La encuesta incluye algunas preguntas de manera permanente, que se refieren a
asuntos como la confianza social, la política y el bienestar subjetivo, y otras que se
realizan de manera ocasional y que cubren un amplio espectro de temas: salud y
cuidados, moralidad económica, trabajo, familia, inmigración, justicia, democracia o
bienestar.
7)
Estudio
sobre
ingresos
y
sobre
riqueza
del
LIS
( http://www.lisdatacenter.org):
El Luxembourg Income Study (LIS) es un centro de documentación de carácter
internacional con sede en Luxemburgo. Este centro posee dos bases de datos accesibles
para la comunidad investigadora: el Luxembourg Income Study Database (LIS) y el
Luxembourg Wealth Study Database (LWS). El primero de ellos (LIS), es la mayor base
de datos armonizada (es decir, con datos comparables entre países) sobre ingresos, con
información para alrededor de medio centenar de países en los cinco continentes de los
últimos cincuenta años. En esta base se recogen datos de los encuestados como la fuente
de sus ingresos (trabajo, capital, transferencias sociales y privadas, etc.), los impuestos
que se pagan, las características del empleo y los gastos de los encuestados. La segunda
base (LWS) recoge información de quince países, principalmente europeos o
anglosajones, y pregunta por diversos aspectos relacionados con las posesiones, deudas,
ingresos del mercado y del gobierno, empleo, consumo y gasto de los encuestados.
8)Eurobarómetro
(http://ec.europa.eu/commfrontoffice/publicopinion/index.cfm/General/index):
Los Eurobarómetros (Eurobarometer, EB, en inglés) son sondeos de opinión
encargados por la Comisión Europea que se empezaron a realizar en 1974 entre
muestras representativas de las poblaciones de los países miembros de la UE. Existen
tres tipos: el estándar, el especial y el flash. El Eurobarómetro estándar se publica dos
veces al año e incluye una serie de ítems sobre la situación económica y política de la
UE y del país del encuestado, así como la valoración de la UE. Por su parte, los EB
16
especiales realizan estudidos en profundidad encargados por la Comisión Europea u
otras instituciones comunitarias, integrándose en los sondeos de los Eurobarómetros
estándar como una sección independiente. Abarcan temas muy variados, desde medio
ambiente hasta pobreza, inmigración, cooperación internacional, deporte o hábitos de
consumo. Por último, los Eurobarómetros flash son encuestas telefónicas realizadas ad
hoc sobre un tema de actualidad por requerimiento de algún servicio de la Comisión
Europea.
En la página web de los Eurobarómetros se pueden descargar los informes con
los principales resultados globales para todos los Estados miembros, así como los
informes individuales para cada país por separado. También es posible, tras seleccionar
un determinado Eurobarómetro, pinchar en el enlace "Open Data Portal" y descargar en
formato Excel todas las preguntas incluidas en el sondeo y todas las frecuencias para
todos los países miembros. Sin embargo, si se quiere descargar la base de datos original
para realizar análisis estadísticos más sofisticados, se deberá hacer desde la página web
del ya mencionado instituto alemán de investigación GESIS (Leibniz Institute for Social
Sciences).
9) Programa Internacional de Estudios Sociales (http://www.issp.org/menutop/home):
El Programa Internacional de Estudios Sociales (International Social Survey
Programme, ISSP, en inglés), es un programa de colaboración académica internacional
que realiza anualmente encuestas sobre diversos temas relevantes para la investigación
social. El programa nació en 1984 con cuatro países (Australia, Alemania, Gran Bretaña
y Estados Unidos) y progresivamente ha aumentado el número de Estados participantes
a varias decenas de todas las regiones del mundo. Los temas analizados se repiten
periódicamente, para así permitir comparar la evolución de las actitudes y prácticas
sociales. Algunos de los asuntos que se han abordado han sido: el papel de los
gobiernos, las redes sociales, la desigualdad social, la religión, la familia y los roles de
género o el medio ambiente. Los últimos datos disponibles, de 2015, se dedican a la
orientación hacia el trabajo, y los próximos que se publicarán serán los módulos
dedicados al papel del gobierno (datos recogidos en 2016), las redes sociales (en 2017)
y la religión (en 2018). Esta página web no tiene disponible una herramienta online para
analizar los datos. Para descargar la base de datos original, como ya ocurriera en el caso
de la Encuesta Europea de Valores y el Eurobarómetro, se remite al instituto GESIS,
17
aunque también se puede disponer de algunos estudios (no todos), a partir de 1998, en la
página web de ASEP/JDS.
10) Latinobarómetro (www.latinobarometro.org):
El Latinobarómetro es un estudio de opinión pública que realiza anualmente alrededor
de 20.000 entrevistas en 18 países de América Latina. Esta encuesta es realizada por
Corporación Latinobarómetro, una ONG sin ánimo de lucro con sede en Santiago de
Chile. Mediante este sondeo, se investiga el desarrollo de la democracia, la economía y
la sociedad en su conjunto, usando indicadores de opinión pública que miden actitudes,
valores y comportamientos. Las encuestas comenzaron a realizarse en 1995 y los
últimos datos publicados son de 2015. Además de preguntas que pueden interesar a
estudiantes de Ciencia Política o Sociología, como es el caso de ítems relacionados con
la democracia, la confianza social, la valoración de las instituciones políticas o de las
relaciones internacionales, se incluyen preguntas que pueden resultar útiles para
estudiosos de otros ámbitos, como las relacionadas con la pobreza, con los medios de
comunicación o con el uso de internet. La página web permite descargarse, además de
los informes y los cuestionarios, las bases de datos originales. Asimismo, está
disponible una herramienta de análisis online en la que se pueden seleccionar países y/o
oleadas para consultar la distribución de frecuencias y realizar gráficos con las tablas de
datos.
6. Big data: definición, ventajas e inconvenientes.
En los últimos años se ha popularizado la expresión Big Data (grandes datos) y es
común encontrar desde ofertas de empleo hasta propuestas formativas relacionadas con
este concepto. En este apartado se pretende explicar qué es el Big Data y sus posibles
ventajas e inconvenientes en un trabajo académico (trabajo de fin de grado, de máster o
incluso tesis doctoral) como el que ocupa este manual.
El término fue popularizado en la década de los 90 por el informático
estadounidense John Mashley, quien publicó el artículo “Big Data and the Next Wave
of Infrastress” (Datos masivos y la próxima ola de Infrastress), donde advertía de que el
aumento en la cantidad de datos que se generaría en los sucesivos años provocarían un
estrés en las infraestructuras humanas y físicas de la informática. Se denomina Big Data
a la gestión y análisis de enormes volúmenes de datos que no pueden ser tratados de
manera convencional, ya que superan los límites y capacidades de las herramientas de
software habitualmente utilizadas para la captura, gestión y procesamiento de datos.
18
Además del volumen de información, los otros dos rasgos característicos del Big Data
son la variedad (se incluyen nuevas de fuentes de datos diferentes a las que se utilizan
de forma tradicional, como son los dispositivos móviles, audio, video, sistemas GPS,
sensores digitales en equipos industriales, automóviles, medidores eléctricos, veletas,
anemómetros, etc., los cuales pueden medir y comunicar el posicionamiento,
movimiento, vibración, temperatura, humedad) y la velocidad (la rapidez con que los
datos se reciben, se procesan y se toman decisiones a partir de ellos). Además de estas
tres características principales, Kitchin (2014) les añade otras: muchos de estos datos
tienen referencia espacial y temporal, son exhaustivos (datos de poblaciones completas
o muestras amplísimas), tienen alta resolución (mucho detalle) y son flexibles
(diseñados para ser ampliados fácilmente añadiendo nuevas variables y nuevos casos).
Estos grandes datos han generado un enorme interés en las empresas, ya que
pueden utilizarlos para entender el perfil, las necesidades y el sentir de sus clientes
respecto a los productos y/o servicios vendidos. Por ejemplo, cuando una persona
navega por Internet (bien sea utilizando las redes sociales o visitando páginas de
instituciones y empresas de diverso tipo), deja un rastro sobre cuáles son sus intereses,
con quién se relaciona, dónde compra, cuándo lo hace, etc. Como señalan Navarro y
Ariño (2015:127), "si el incremento de datos digitales es ciertamente apabullante,
todavía lo es más el crecimiento de esa clase especial de datos digitales que son los
datos personales". Nuestras acciones en la red (búsquedas, compras, uso de las redes
sociales, etc.) dejan huellas digitales que son más precisas cuanto más numerosas y
diversas sean. Empresas como Google y Facebook elaboran estadísticas del número y
perfil de los usuarios que buscan determinadas palabras en el buscador, o que visitan y/o
son fans de páginas de la red social. Esta información es vendida posteriormente a
terceras empresas, que con dicha información, denominada inteligencia empresarial,
elabora perfiles de consumidores con gran precisión y toman decisiones sobre qué tipos
de productos producir, cómo venderlos y a quiénes, por ejemplo. Pero no todas las
aplicaciones son comerciales. Los grandes datos son utilizados por los gobiernos para
estudiar el comportamiento de los ciudadanos, y mejorar así los servicios públicos,
perseguir los incumplimientos de la ley, o vigilar masivamente las comunicaciones para
luchar contra el terrorismo. Por su parte, los investigadores académicos han empleado
estos grandes datos para estudiar el efecto contagio de los estados emocionales a través
de las redes sociales, el contenido de las redes sociales como predictor de
comportamientos de consumo o políticos, etc. (Mezo, 2015).
19
Los científicos e investigadores han analizado datos desde ya hace mucho
tiempo, lo que hace a este período cualitativamente diferente es la gran de cantidad de
datos que se generan diariamente. Esta abundancia de datos y la velocidad con la que se
pueden analizar transforma la forma en que se investiga en ámbitos como la
biomedicina, la salud, el consumo, el medio ambiente, la seguridad nacional, etc. Ello
no significa que los datos y las herramientas para analizarlos más tradicionales dejen de
tener importancia, pero se complementan con las nuevas fuentes de información. La
naturaleza de la información hoy es diferente a la información en el pasado. Debido a la
abundancia de sensores, micrófonos, cámaras, escáneres médicos, imágenes, etc. en
nuestras vidas, los datos generados a partir de estos elementos serán dentro de poco el
segmento más grande de toda la información disponible. Navarro y Ariño (2015:112)
advierten de que internet no será solamente en un futuro cercano el objeto "por defecto"
de la investigación social, sino que será la misma red la que aportará (lo hace ya) los
instrumentos para estudiarla. Cada vez se aplican más técnicas de inteligencia artificial,
conocidas como machine learning (aprendizaje automático), que son procesos de
análisis en los que un programa de ordenador puede aprender de sí mismo, identificando
errores y aciertos y reformulándose para identificar patrones y hacer predicciones
(Mezo, 2015).
En el caso de un estudiante universitario que está realizando un trabajo de
investigación, el uso de Big Data puede resultar muy interesante para descubrir patrones
de consumo y estilos de vida en ámbitos como la Publicidad, el Márketing, la Salud o la
Sociología del Consumo. Sin embargo, debe tenerse presente que estos datos requieren
una inversión costosa para las empresas que se dedican a recopilarlos, por lo que es
improbable que el alumno pueda acceder a ellos de manera gratuita, como sí es el caso
de las fuentes comentadas en los dos puntos anteriores. Sin embargo, podría ocurrir que
algunas de las empresas elaboren informes de carácter divulgativo para darse a conocer
entre potenciales consumidores, usuarios o inversores, que podrían ser utilizados para
realizar un trabajo académico. En estos casos, lo más probable es que el estudiante se
encuentre con un número limitado de información que, además, puede estar sesgada.
Por ello, deberá evaluar de manera cuidadosa la calidad de dichos datos, utilizando una
serie de criterios que se explican en el próximo apartado2.
2
Para una explicación más detallada de los problemas metodológicos propios de los grandes datos, ver
Mezo (2015), pp. 508-510.
20
7. Cómo evaluar la calidad de los datos secundarios.
Dada la abundancia de datos secundarios y su facilidad de acceso a través de internet,
resulta necesario que el investigador dedique un tiempo a valorar la calidad de las
fuentes de información y, por tanto, de los datos que ofrecen. Dicha evaluación es
fundamental para llevar a buen término la investigación. El examen crítico de los datos
secundarios es indispensable en Ciencias Sociales, como indica Ander-Egg (1982),
dado que no permiten casi nunca que el investigador tenga contacto directo con los
hechos y fenómenos a que se hace referencia en los documentos.
Siguiendo a este autor, una valoración de datos estadísticos, tanto de carácter
objetivo como subjetivo, requiere conocer las circunstancias en las que se desarrolló la
investigación originaria, como cuáles fueron los procedimientos para obtener los datos o
si el organismo que recopiló la información lo hizo de forma imparcial o tenía algún
tipo de fin interesado. La evaluación pretende medir la fiabilidad y la validez de los
datos. La fiabilidad se refiere a la exactitud de la medida, es decir, a que si se realizan
diferentes pruebas los resultados que se obtienen son similares. La validez, por su parte,
se refiere a que el procedimiento que se usa mide lo que realmente pretende medir. Para
valorar la fiabilidad de una fuente de información, González (1994) sugiere que el
investigador se pregunte por la accesibilidad de los datos, el objetivo de la investigación
y quiénes fueron sus responsables, si los datos en sí son fiables, cuándo y cómo se
recogieron, entre otros aspectos. Por su parte, para evaluar el grado de validez hay que
interrogarse sobre si los indicadores miden lo que se suponen que miden, si coinciden
los conceptos que va a utilizar el investigador con los indicadores propuestos en los
datos, si ha habido cambios en la definición del concepto (en el caso de un estudio
longitudinal) y si se cubren las dimensiones más relevantes del concepto con los datos
disponibles.
En conclusión, podríamos dividir en tres grandes bloques los aspectos que el
investigador debe evaluar de la fuente de información secundaria y los datos que ofrece:
1) Con respecto al diseño de la investigación: cuáles eran los objetivos e
hipótesis de la investigación, cómo se definieron los conceptos y las variables, cómo se
diseñó la recogida de datos, si la muestra es representativa o deja fuera a segmentos de
la población relevantes (en el caso de tratarse de una encuesta a una gran población),
cuál es el margen de error, qué preguntas y categorías de respuesta se incluyeron en el
cuestionario. Para valorar esta parte, resulta útil analizar los anexos metodológicos así
como los cuestionarios que habitualmente la institución responsable publica junto a los
21
principales resultados. En el caso de los cuestionarios, se debe valorar si las preguntas
se formularon correctamente, sin sesgos que pudieran influir en la respuesta del
entrevistado. También se debe prestar atención a que las categorías de respuestas fueran
exhaustivas (que ninguna persona encuestada diera una respuesta que no está recogida
en el cuestionario y, por tanto, no pudiera responder) y excluyentes (que no resulte
posible responder dos categorías de respuesta simultáneamente). Por último, se debe
plantear si faltan preguntas (y/o categorías de respuesta) importantes para contrastar las
hipótesis.
2) Con respecto a la recogida de datos: hay que valorar cómo fue el trabajo de
campo y si se controló la labor de los encuestadores, si las entrevistas fueron personales,
por correo postal o electrónico o por teléfono, las fechas en que se realizaron las
encuestas y la tasa de respuesta a las preguntas más relevantes para nuestra
investigación. Hay que prestar atención a si durante el periodo de recogida de los datos
ocurrió algún hecho relevante que puedan influir en la manera de responder. Por
ejemplo, si la encuesta trata de las actitudes hacia el medio ambiente y durante las dos
semanas en que se recoge la información ocurre una catástrofe medioambiental, pudiera
ocurrir que las respuestas estuvieran influidas por este hecho. También hay que analizar
si existe alguna pregunta que tiene una tasa de respuesta baja, es decir, que muchas
personas no contestan por diferentes motivos: por tratarse de un tema íntimo, polémico
o poco conocido entre la población.
3) Con respecto a la presentación de los datos y su análisis: hay que valorar si se
han publicado todos los datos relevantes, sin omitir algunos importantes, pues ello nos
haría dudar de la imparcialidad de la fuente y de sus objetivos. Hay que prestar atención
a si se comparan cantidades que son realmente comparables y a que las conclusiones no
sean abusivas y se derivan directamente de los datos.
Requiere comentario aparte el análisis crítico de los datos cuando se realizan
comparaciones a lo largo del tiempo o cuando provienen de diferentes fuentes3. En el
último caso, por ejemplo, cuando se trata de un estudio internacional que ha sido
llevado a cabo por diversos institutos de investigación de varios países, es muy
recomendable leer el cuestionario (ya sea en su idioma original o en su traducción al
3
Como señala Mezo (2015), hay que tener en cuenta que muchas estadísticas compiladas
internacionalmente por organismos como la ONU o Eurostat, aparentemente tienen una fuente "única"
pero, en realidad, fusionan informaciones de organismos nacionales, con criterios que son similares
pero no idénticos, por lo que es necesario revisar las notas metodológicas que acompañan a dicha
información.
22
inglés) puesto que en ocasiones la formulación de las preguntas o las categorías de
respuesta pueden variar. Por ejemplo, en un país se puede haber dado al entrevistado la
posibilidad de expresar su grado de acuerdo eligiendo entre cinco categorías: "muy de
acuerdo/ de acuerdo/ ni de acuerdo ni en desacuerdo/ en desacuerdo/ muy en
desacuerdo", mientras que en otro no se ha preguntado la categoría intermedia y
solamente existen cuatro opciones. En estos casos, las comparaciones se deben realizar
con suma cautela, puesto que la distribución de la población en diferentes categorías
puede ser muy diferente debido en parte a la diversa codificación de las respuestas.
También puede ocurrir que, en un estudio internacional, no todos los ítems se preguntan
en todos los países, por lo que es recomendable realizar un primer análisis de los datos
controlando si las preguntas con las que va a trabajar el investigador están presentes en
todos los países que quiere estudiar.
Por último, es muy importante comprobar que no ha cambiado la definición de
los conceptos cuando se trata de un estudio longitudinal. Cambios legislativos o
adaptaciones a metodologías de organismos internacionales, por ejemplo, pueden
provocar que un fenómeno social cambie su definición y, por tanto, su manera de
medirlo difiera a lo largo de los años. Un ejemplo de ello para el caso español ocurrió
con la entrada en vigor del Reglamento 1897/2000, que modificó sustancialmente la
manera de registrar el paro en España, como explica el Instituto Nacional de Estadística
en su página web. La definición formal de parado no cambió con el nuevo reglamento,
usándose la definición internacional de la OIT. Según esta definición, desempleada es la
persona con más de cierta edad especificada que durante el periodo de referencia está
sin trabajo, disponible para trabajar y que busca empleo. Sin embargo, el nuevo
reglamento introdujo instrucciones sobre cómo interpretar la búsqueda activa de trabajo
y esta modificación afectó mucho a las cifras de paro que registra la Encuesta de
Población Activa (EPA), provocando una gran disminución en las cifras del desempleo
tanto absolutas como relativas.4 Este Reglamento, que se aplicó para unificar la
definición de parado en toda la Unión Europea, afectó especialmente a España. El INE
modificó los cuestionarios de 2001 para poder registrar tanto la nueva como la antigua
4
Hasta la entrada en vigor del reglamento, se consideraba que estar inscrito en las oficinas públicas de
desempleo era suficiente para considerar que estaba buscando empleo. Tras su entrada en vigor, no era
suficiente con dicha inscripción, sino que la persona desempleada debía en las cuatro semanas
anteriores a la entrevista haber estado en contacto con una oficina pública de empleo, o con una
privada, o haber realizado entrevistas de empleo, haber enviado su candidatura a empleadores, entre
otras actividades.
23
definición y así poder cuantificar el impacto del cambio, que se demostró fue
importante. Los cuestionarios anteriores a 2001 no recogían este matiz sobre si la
búsqueda de empleo es o no activa, por lo que no es posible determinar, para períodos
anteriores a 2001 qué cifras de paro habría dado la EPA de utilizar la nueva definición.
Por tanto, un investigador que quiera comparar las cifras de parados en España durante
las últimas décadas deberá tener en cuenta esta modificación en el concepto y en la
medición y saber que los datos no son directamente comparables antes y después del
2000.
8. Ventajas e inconvenientes de la utilización de datos secundarios.
El uso de esta técnica tiene ventajas e inconvenientes a tener en cuenta. Siguiendo a
González (1994:250 y ss.), entre el grupo de las ventajas, destacan:
a) Los datos secundarios permiten disponer de información abundante, barata y de
calidad. Este fue el primer argumento para usarlos, aunque ahora se acepta que tiene
otras ventajas además de su coste. Además, su calidad puede ser mayor que la de los
datos recogidos por el propio investigador, dado que los recopilan de organizaciones
especializadas en el tema. Por ejemplo, una encuesta realizada por el Centro de
Investigaciones Sociológicas a una muestra representativa de la población española
muy probablemente contendrá datos de mayor calidad que una encuesta que realice
un estudiante a algunas decenas de personas de su entorno cercano. En este caso,
además, los datos recolectados por el CIS han sido revisados por especialistas y
recogidos en una base que permite su utilización inmediata una vez se descargan de
manera gratuita, mientras que el estudiante que recopila sus propios datos debe
revisar los errores en su recogida y codificar todas las respuestas en una base que
cree para tal fin, labor larga y compleja.
b) Permite una gran variedad de diseños de investigación, como las comparaciones
internacionales (cada vez más frecuentes) y las series temporales. El aumento de la
colaboración entre organismos oficiales e instituciones de investigación de diversas
partes del mundo y la facilidad para conseguir datos secundarios en internet ha
hecho posible que, de manera gratuita, un estudiante universitario pueda realizar una
comparación sobre un determinado tema (educación, empleo, pobreza, inmigración,
etc.) entre todos los países miembros de la Unión Europea y en dos momentos
diferentes del tiempo, algo impensable hace pocos años. Por otro lado, siempre que
24
queramos comprender un fenómeno del pasado necesitaremos recurrir a datos
secundarios para conocerlo.
c) Se pueden emplear estos datos, especialmente los que provienen de censos, para
crear los marcos muestrales y para ver lo representativa que es una muestra que
hemos empleado en nuestra investigación. Si el estudiante va a recoger datos
primarios por sí mismo, los secundarios le pueden orientar sobre cómo se distribuye
la población objeto de estudio por sexo, grupo de edad o nivel educativo, por
ejemplo.
d) Evita la reactividad, es decir, la distorsión que produce el que los sujetos sepan que
están siendo investigados. Sin embargo, puede haber ocurrido dicho efecto en el
momento de la investigación original, por lo que el investigador de datos
secundarios debe examinar críticamente la información y valorar la posibilidad de
que se produjera reactividad en el momento en que los datos se recogieron.
e) Permite el reanálisis de los datos de encuestas, que normalmente se explotan muy
poco. Se pueden reanalizar los datos desde marcos teóricos distintos y con técnicas
distintas.
f) Promueve el progreso científico (teórico, metodológico y técnico), gracias al
desarrollo y utilización de grandes bases de datos.
Entre los inconvenientes, que limitan su utilización, el mismo autor destaca:
a) Accesibilidad: aunque en general los datos son accesibles, puede ocurrir que la
información que necesita el investigado para cubrir los objetivos de su investigación
no esté disponible. Por ejemplo, imaginemos que para nuestra investigación
necesitamos distinguir a las personas que tienen unos ingresos mensuales menores
de 450 euros del grupo que ingresa entre 451 y 750 euros pero, en la base de datos
que queremos utilizar, se distingue entre los que tuvieron unos ingresos menores de
600 euros y los que obtuvieron una cifra superior. En este caso, debemos valorar
diferentes opciones: buscar una fuente de datos que sí realice la distinción que nos
interesa o, si se decide seguir utilizando esos datos, prescindir de la variable
ingresos en el análisis o adaptarse a las categorías de respuesta disponible. Otro
problema que puede encontrarse el investigador es que existan los datos a nivel
agregado, pero no individual. Por ejemplo, el investigador puede haber obtenido el
dato de cuántos minutos navegan por internet de media los españoles los días
laborables, pero no tener dicha información para cada uno de los encuestados de su
25
base de datos, que es una muestra representativa de la población española, por lo
que no puede analizar cómo se distribuye ese tiempo según diversas características.
b) Empirismo burdo: los datos no hablan por sí mismos, por lo que las grandes bases
de datos no van a generar por sí mismas ideas e interpretaciones. En ellas hay
muchas variables interesantes pero es la teoría la que nos hará seleccionar unas y no
otras. El estudiante, por tanto, no debe sentirse tentado de incluir un gran número de
datos en el trabajo académico para demostrar que ha sabido buscar las fuentes de
información más pertinentes para su investigación, ni tampoco cruzar todas las
variables sin un sentido teórico que guíe dicha operación, sino que tendrá que
seleccionar cuáles son los datos más interesantes y cómo cruzarlos para comprobar
sus hipótesis, hipótesis que, a su vez, derivan de un marco teórico previamente
elaborado.
c) Calidad de los datos y de la fuente: es necesario valorar si cumplen con unos
requisitos mínimos de validez y fiabilidad, tanto los datos como la fuente de la que
provienen. Las recomendaciones sobre este aspecto han sido realizadas en el
apartado anterior.
Bibliografía:
•
Ander-Egg, E. 1982. Técnicas de Investigación Social. Buenos Aires: Humanitas.
•
Barranco Fragoso, R. 2012. ¿Qué es Big Data? [online]. Disponible en:
https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/. Fecha de
consulta: 14 de agosto de 2017.
•
Gázquez, Javier. 2017. Qué es el Big Data y usos en el Marketing de contenidos
[online]. Disponible en: http://www.foromarketing.com/big-data-marketingcontenidos/. Fecha de consulta: 14 de agosto de 2017.
•
González, B. 1994. La utilización de los datos disponibles. En: M. García Ferrando,
J. Ibáñez y F. Alvira (comp.): El análisis de la realidad social. Métodos y técnicas
de investigación [2ªed. revisada y ampliada]. Madrid: Alianza, 245-273.
•
Hakim, C., 1982. Secondary analysis in social research. London: G. Allen.
•
Kitchin, R. 2014. The Data Revolution: Big Data, Open Data, Data Infrastructures
& Their Consequences. Londres: Sage.
26
•
López López, J.C. 2014. La moda del Big Data: ¿En qué consiste en realidad?
[online]. Disponible en:
htttp://www.eleconomista.es/tecnologia/noticias/5578707/02/14/La-moda-del-BigData-En-que-consiste-en-realidad.html. Fecha de consulta: 14 de agosto de 2017.
•
Mezo, J. 2015. Explotación de datos secundarios. En: M. García Ferrando, F. Alvira,
Luis E. Alonso y M. Escobar (comp.): El análisis de la realidad social. Métodos y
técnicas de investigación [4ª edición]. Madrid: Alianza Editorial, 485-521.
•
Navarro , P. y Ariño, A. 2015. La investigación social ante su segunda revolución
digital. En: M. García Ferrando, F. Alvira, Luis E. Alonso y M. Escobar (comp.): El
análisis de la realidad social. Métodos y técnicas de investigación [4ª edición].
Madrid: Alianza Editorial, 110-141.
•
Sierra Bravo, R. 1995. Técnicas de investigación social. Teoría y ejercicios [10ª
edición]. Madrid: Paraninfo.
27
View publication stats
Descargar