Subido por Carolina Alvarado

Procesamiento, analisis y presentación de la información

Anuncio
Procesamiento, analísis y presentación de la información.
Como vamos a ir procesando estos datos y cómo lo vamos a ir entregando a los
demás, cómo vamos a ir informando nuestro estudio, los temas de este vídeo clase
son los tipos de muestreo, el procesamiento de datos, como frecuencia y como
análisis de tablas de contingencia, la creación y el análisis de los gráficos, en
general diseño muestral de nuestro estudio, tenemos dos tipos de muestreo, el
probabilístico y el no probabilístico, el probabilistico es aquel donde todos los
elementos de la población tienen la probabilidad de ser escogidos y esa probabilidad
es conocida, solo este tipo de muestreo asegura representatividad, el muestreo no
probabilístico no asegura representatividad, porque en la elección de los elementos
no depende de la probabilidad, sino de causas relacionadas con la característica de
la investigación, la elección de los elementos no representa estadísticamente a la
población, entonces estos dos grandes grupos se desglosan varios tipos de
muestreo, desde el muestreo probabilístico tenemos el aleatorio simple, que es
simplemente tener todo la población, y aleatoriamente asignar una muestra, luego
tenemos el sistemático, que sólo el primer caso es al azar y luego los demás son
los consecutivos a él, la estraatificada, que son por grupos homogéneos, y los
conglomerados que son como varios grupos homogéneos, pero pero van siendo
como encapsulados, esto sirve por ejemplo para un área geográfica, donde vemos
primero la región, la provincia, la comuna, eso es como un conglomerado, que
vamos como con lupa hacia abajo, el nuestro no probabilístico está el intencionado,
bola de nieve y cuotas, entonces el intencionado yo incluyo ciertos grupos,
intencionadamente, la bola de nieve yo lo asignó, busco una persona, por ejemplo,
no sé si quiero entrevistar o encuestar a un inmigrante, o una colombiana, por
ejemplo, yo llego a una colombiana y ella como por esta bola de nieve me va dando
otros casos, y las cuotas, que yo genero ciertas cuotas como de alcance de mi
muestra, por ejemplo, yo quiero a 10 mujeres, quiero a 5 de ellos sean niños,
entonces cuando ya voy logrando esta muestra, lo dejo está ahí y luego continúo
con otro tipo de elementos que quiero buscar, entonces la recolección de datos
cuantitativos implica instrumentos de medición, que pueden ser cuestionarios,
encuestas o pueden ser tests, que se da por lo general en psicología, y estas
cuestionarios o encuestas que pueden ser preguntas abiertas o preguntas cerradas,
ya las preguntas abiertas qué quiere decir que la persona se puede explayar por así
decirlo puede dar sus comentarios, después tienen que ser recodificadas como a
ciertos códigos para poder analizarlos, y ahí las preguntas cerradas pasan a ser las
típicas preguntas del cuestionario, no poner género, femenino masculino, o edad y
no poner la edad, son preguntas cerradas que están establecidas ya, y se preguntan
ya desde esa forma, no quedan abiertas a lo que pueda poner la persona, entonces
estos instrumentos de medición tienen ciertos requisitos: confiabilidad, validez y
objetividad, el instrumento tiene que ser confiable, tiene que ser consistente y
coherente, la validez es que lo que estamos midiendo sea realmente lo que estamos
midiendo, y eso a veces es un poco difícil de llevar a cabo, por eso es importante
este requisito que sea válido, lo que estamos midiendo, de cómo lo estamos
midiendo, si con esa pregunta entonces vamos a poder medir esto que queremos
nosotros, y la objetividad, sin sesgos, sin prejuicios, el instrumento tiene que ser
súper claro, con perspectiva, súper objetivo, entonces ahora ya como presentamos
la información, tenemos diferentes formas de presentarla, las distribuciones de
frecuencias al menos, tienen por histogramas, polígonos o ojivas, el histograma es
un gráfico que bien lo vimos en la unidad anterior, donde tiene dos ejes, el eje
horizontal y el eje vertical, que a veces el eje vertical puede ser la frecuencia o el
porcentaje, y el eje horizontal es la variable que estamos estudiando, siempre para
datos univariados o sea una variable solamente, los polígonos que se presentan
como una curva, son como una montaña por así decirlo, que igual puede ser
frecuencias y porcentajes, y las ojivas que ya son curvas que van como en ascenso,
o sea que a mayor porcentaje mayor número, los gráficos por otro lado, tenemos
los dos principales que vamos a utilizar al menos en este curso, los que vamos a
estudiar, el de torta y el gráfico de barras, entonces el gráfico de torta nos entrega
información de una variable que tenga pocos indicadores, por ejemplo, masculino,
femenino o ciertos rangos de edad, etcétera, y que sean variables y ordinales o
nominales, el gráfico de barras, por otro lado, puede entregar la misma información
pero desde otra gráfica, y también se puede utilizar como por así decirlo con los
histogramas, en que se muestran diferentes barras en variables de intervalo razon,
es importante que el gráfico tenga un título claro, que tenga los indicadores bien
claro, los números y la etiqueta de cada variable o sea masculino o femenino y el
porcentaje y que siempre diga las fuentes de donde se sacó o si es que se elaboró
el gráfico, esto lo vemos igual en el recurso interactivo, entonces acá algunos
ejemplos, las tablas de frecuencias univariadas que lo vimos también en la vídeo
clase desde la unidad 2, que te entrega frecuencia, porcentaje, porcentaje válido y
porcentaje acumulado, esto es una forma de presentar la información que ustedes
generen a través de tablas, intentando como siempre lo vimos anteriormente, utilizar
el porcentaje válido o la frecuencia, sobre todo en este caso en que hay datos
perdidos por el sistema, entonces, el porcentaje este no es válido sino este, y luego
podemos analizar los datos con el porcentaje acumulado, entonces por ejemplo, en
este caso, la tabla nos muestra algunos datos que son significativos, por ejemplo,
que el 38,5 de la población es colombiana, de las nacionalidades de niños en
escuelas públicas de la provincia de Magallanes, este es un estudio que hicimos
hace dos años, y te muestra ciertos porcentajes de las nacionalidades más
comunes, el 23% de los niños son argentinos, el 21, 8% dominicanos, y la mayor
frecuencia que dijimos que eran los niños colombianos, entonces el análisis de
datos descriptivos vivariados, cuando ya tenemos relación de dos variables, en los
gráficos de barras son muy útiles para hacer estas comparaciones, entonces por
ejemplo, en este gráfico las nacionalidades de encuestados de la provincia de
magallanes según sexo, podemos ver por ejemplo, datos que aparecen muy
llamativos como que el 94% de los encuestados dominicanos son mujeres, y
podemos ver como la distribución de las diferentes nacionalidades según sexo,
entonces es un gráfico que también resume harta información, porque acá tenemos
dos variables y las presentamos todas, también es muy útil para poder compararlos,
otra forma de presentar la información de manera resumida o esto mismo, es a
través de tablas, ponemos por este lado la variable número uno y la variable número
dos, cierto esta sería la variable sociodemográfica, podemos ver por ejemplo, la
asistencia en mujeres y hombres, semanalmente hombres son 28% y menos a
menudo el 72%, mujeres hay un porcentaje más homogeneo entre 41% y 59%, en
en la tabla también muestra el N total, es decir, a cuántas personas se le aplicó la
encuesta, a cuántos hombres y a cuántas mujeres, eso también es muy ilustrativo
para poder dar y representar los datos que están analizando, y luego tenemos las
tablas de contingencias, tenemos los gráficos, las tablas y las tablas de
contingencia, que un poco es la tabla de este gráfico, este gráfico que asocia dos
variables, entonces lo hacemos gracias a las tablas de contingencia, entonces para
objetivos y hipotesis descriptivas tenemos las variables sociodemográficas y las
variables de interés solamente, no definimos variable independiente ni dependiente,
si no sólo una variable sociodemográfica y una variable de interés, y siempre leemos
el porcentaje de la variables sociodemográficas si la variables sociodemográficas
está la columna, entonces leemos el porcentaje de la columna, y si la variables
sociodemográficas está en la fila, leemos el porcentaje fila, eso lo vamos a ver
también en el apunte de clases de esta unidad, y como analizamos los datos en
SPSS, y cuando ya son hipotesis explicativa, asociamos dos variables, la variable
independiente y la variable dependiente, entonces estas tablas de contingencia,
también, al igual que la variables sociodemográficas se lee la variable
independiente, el porcentaje de columnas, si es que la variable independiente está
en columna, si es que la variable dependiente está en fila entonces leemos el
porcentaje fila, los valores de la variable dependiente, dependen de los valores de
la variable independiente, eso lo que quiere buscar estas hipótesis explicativas, si
dependen o no, cuánto dependen, y entonces acá vamos a ver las relaciones que
se pueden generar entre las variables, pueden ser simétrica, es decir, que las
variables no influyen sobre otras, ni la independiente de la dependiente, ni la
sociodemografica de la dependiente, o de la variable de interés, las recíprocas, es
que ambas se influencian, causalmente bidireccional, y las asimétricas sólo una
variable influye causalmente en otra, unidireccional, osea cuando yo aplico, yo tengo
esta variable cuando le aplico, cambia mi variable dependiente, en cambio la
reciproca, cambian las dos, las dos se ven influencias,aca podemos en generar
elTest de la independencia entre las variables, puede ser que mi hipótesis sea nula,
si es que no hay esta causa efecto entre, si es que no hay una relación recíproca o
asimétrica entre mis variables, es decir, que mi hipótesis puede ser nula,
dependiendo de la hipótesis que se plantee, máxima independencia que no
generan influencia y máxima dependencia que generan completa relación e influyen
entre si y una dependencia moderada, como que se influyen pero ni tanto por así
decirlo, entonces acá tenemos algunas tablas, donde ya juegan con tres variables,
tenemos la asistencia a la iglesia por sexo y por edad, entonces vemos la edad
como una variable sociodemográfica dentro de la variable sexo, que sería una
variable independiente, los hombres van a ser hombres y las mujeres van a ser
mujeres siempre, cierto, no varía según la asistencia a la iglesia, y acá podemos ver
la variable de asistencia a la iglesia, entonces podemos ver la distribución de los
datos, aquí algunos datos importantes, sería que los hombres asisten menos a la
iglesia que las mujeres, menos de 40 años y de 40 años a más asisten más, en
ambos casos, en hombres y mujeres asisten más, pero se ve que las mujeres
asisten mucho más un 50%, y abajo simplemente una simplificación de esa tabla,
como presentamos los datos, como lo mostramos de una manera un poco más
simple, es poner menos de 40 años o sea ponemos la variables sociodemográficas
de este lado, variable independiente y la variable dependiente arriba, entonces por
ejemplo, si es que nosotros sólo nos interesará ver los que acuden semanalmente
a la iglesia, porque al ver ese porcentaje, por sentado vamos a dar el otro, entonces
es necesario mostrar ambos porcentajes, entonces vemos sólo el porcentaje de los
que pueden semanalmente, en hombres 21% menos de 40 años y 40 años más
34% de los hombres, y en el caso las mujeres 30 y 50, aquí suponemos que el otro
50 menos a menudo asisten a la iglesia, suponemos que el 70 menos a menudo.
Descargar