Procesamiento, analísis y presentación de la información. Como vamos a ir procesando estos datos y cómo lo vamos a ir entregando a los demás, cómo vamos a ir informando nuestro estudio, los temas de este vídeo clase son los tipos de muestreo, el procesamiento de datos, como frecuencia y como análisis de tablas de contingencia, la creación y el análisis de los gráficos, en general diseño muestral de nuestro estudio, tenemos dos tipos de muestreo, el probabilístico y el no probabilístico, el probabilistico es aquel donde todos los elementos de la población tienen la probabilidad de ser escogidos y esa probabilidad es conocida, solo este tipo de muestreo asegura representatividad, el muestreo no probabilístico no asegura representatividad, porque en la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con la característica de la investigación, la elección de los elementos no representa estadísticamente a la población, entonces estos dos grandes grupos se desglosan varios tipos de muestreo, desde el muestreo probabilístico tenemos el aleatorio simple, que es simplemente tener todo la población, y aleatoriamente asignar una muestra, luego tenemos el sistemático, que sólo el primer caso es al azar y luego los demás son los consecutivos a él, la estraatificada, que son por grupos homogéneos, y los conglomerados que son como varios grupos homogéneos, pero pero van siendo como encapsulados, esto sirve por ejemplo para un área geográfica, donde vemos primero la región, la provincia, la comuna, eso es como un conglomerado, que vamos como con lupa hacia abajo, el nuestro no probabilístico está el intencionado, bola de nieve y cuotas, entonces el intencionado yo incluyo ciertos grupos, intencionadamente, la bola de nieve yo lo asignó, busco una persona, por ejemplo, no sé si quiero entrevistar o encuestar a un inmigrante, o una colombiana, por ejemplo, yo llego a una colombiana y ella como por esta bola de nieve me va dando otros casos, y las cuotas, que yo genero ciertas cuotas como de alcance de mi muestra, por ejemplo, yo quiero a 10 mujeres, quiero a 5 de ellos sean niños, entonces cuando ya voy logrando esta muestra, lo dejo está ahí y luego continúo con otro tipo de elementos que quiero buscar, entonces la recolección de datos cuantitativos implica instrumentos de medición, que pueden ser cuestionarios, encuestas o pueden ser tests, que se da por lo general en psicología, y estas cuestionarios o encuestas que pueden ser preguntas abiertas o preguntas cerradas, ya las preguntas abiertas qué quiere decir que la persona se puede explayar por así decirlo puede dar sus comentarios, después tienen que ser recodificadas como a ciertos códigos para poder analizarlos, y ahí las preguntas cerradas pasan a ser las típicas preguntas del cuestionario, no poner género, femenino masculino, o edad y no poner la edad, son preguntas cerradas que están establecidas ya, y se preguntan ya desde esa forma, no quedan abiertas a lo que pueda poner la persona, entonces estos instrumentos de medición tienen ciertos requisitos: confiabilidad, validez y objetividad, el instrumento tiene que ser confiable, tiene que ser consistente y coherente, la validez es que lo que estamos midiendo sea realmente lo que estamos midiendo, y eso a veces es un poco difícil de llevar a cabo, por eso es importante este requisito que sea válido, lo que estamos midiendo, de cómo lo estamos midiendo, si con esa pregunta entonces vamos a poder medir esto que queremos nosotros, y la objetividad, sin sesgos, sin prejuicios, el instrumento tiene que ser súper claro, con perspectiva, súper objetivo, entonces ahora ya como presentamos la información, tenemos diferentes formas de presentarla, las distribuciones de frecuencias al menos, tienen por histogramas, polígonos o ojivas, el histograma es un gráfico que bien lo vimos en la unidad anterior, donde tiene dos ejes, el eje horizontal y el eje vertical, que a veces el eje vertical puede ser la frecuencia o el porcentaje, y el eje horizontal es la variable que estamos estudiando, siempre para datos univariados o sea una variable solamente, los polígonos que se presentan como una curva, son como una montaña por así decirlo, que igual puede ser frecuencias y porcentajes, y las ojivas que ya son curvas que van como en ascenso, o sea que a mayor porcentaje mayor número, los gráficos por otro lado, tenemos los dos principales que vamos a utilizar al menos en este curso, los que vamos a estudiar, el de torta y el gráfico de barras, entonces el gráfico de torta nos entrega información de una variable que tenga pocos indicadores, por ejemplo, masculino, femenino o ciertos rangos de edad, etcétera, y que sean variables y ordinales o nominales, el gráfico de barras, por otro lado, puede entregar la misma información pero desde otra gráfica, y también se puede utilizar como por así decirlo con los histogramas, en que se muestran diferentes barras en variables de intervalo razon, es importante que el gráfico tenga un título claro, que tenga los indicadores bien claro, los números y la etiqueta de cada variable o sea masculino o femenino y el porcentaje y que siempre diga las fuentes de donde se sacó o si es que se elaboró el gráfico, esto lo vemos igual en el recurso interactivo, entonces acá algunos ejemplos, las tablas de frecuencias univariadas que lo vimos también en la vídeo clase desde la unidad 2, que te entrega frecuencia, porcentaje, porcentaje válido y porcentaje acumulado, esto es una forma de presentar la información que ustedes generen a través de tablas, intentando como siempre lo vimos anteriormente, utilizar el porcentaje válido o la frecuencia, sobre todo en este caso en que hay datos perdidos por el sistema, entonces, el porcentaje este no es válido sino este, y luego podemos analizar los datos con el porcentaje acumulado, entonces por ejemplo, en este caso, la tabla nos muestra algunos datos que son significativos, por ejemplo, que el 38,5 de la población es colombiana, de las nacionalidades de niños en escuelas públicas de la provincia de Magallanes, este es un estudio que hicimos hace dos años, y te muestra ciertos porcentajes de las nacionalidades más comunes, el 23% de los niños son argentinos, el 21, 8% dominicanos, y la mayor frecuencia que dijimos que eran los niños colombianos, entonces el análisis de datos descriptivos vivariados, cuando ya tenemos relación de dos variables, en los gráficos de barras son muy útiles para hacer estas comparaciones, entonces por ejemplo, en este gráfico las nacionalidades de encuestados de la provincia de magallanes según sexo, podemos ver por ejemplo, datos que aparecen muy llamativos como que el 94% de los encuestados dominicanos son mujeres, y podemos ver como la distribución de las diferentes nacionalidades según sexo, entonces es un gráfico que también resume harta información, porque acá tenemos dos variables y las presentamos todas, también es muy útil para poder compararlos, otra forma de presentar la información de manera resumida o esto mismo, es a través de tablas, ponemos por este lado la variable número uno y la variable número dos, cierto esta sería la variable sociodemográfica, podemos ver por ejemplo, la asistencia en mujeres y hombres, semanalmente hombres son 28% y menos a menudo el 72%, mujeres hay un porcentaje más homogeneo entre 41% y 59%, en en la tabla también muestra el N total, es decir, a cuántas personas se le aplicó la encuesta, a cuántos hombres y a cuántas mujeres, eso también es muy ilustrativo para poder dar y representar los datos que están analizando, y luego tenemos las tablas de contingencias, tenemos los gráficos, las tablas y las tablas de contingencia, que un poco es la tabla de este gráfico, este gráfico que asocia dos variables, entonces lo hacemos gracias a las tablas de contingencia, entonces para objetivos y hipotesis descriptivas tenemos las variables sociodemográficas y las variables de interés solamente, no definimos variable independiente ni dependiente, si no sólo una variable sociodemográfica y una variable de interés, y siempre leemos el porcentaje de la variables sociodemográficas si la variables sociodemográficas está la columna, entonces leemos el porcentaje de la columna, y si la variables sociodemográficas está en la fila, leemos el porcentaje fila, eso lo vamos a ver también en el apunte de clases de esta unidad, y como analizamos los datos en SPSS, y cuando ya son hipotesis explicativa, asociamos dos variables, la variable independiente y la variable dependiente, entonces estas tablas de contingencia, también, al igual que la variables sociodemográficas se lee la variable independiente, el porcentaje de columnas, si es que la variable independiente está en columna, si es que la variable dependiente está en fila entonces leemos el porcentaje fila, los valores de la variable dependiente, dependen de los valores de la variable independiente, eso lo que quiere buscar estas hipótesis explicativas, si dependen o no, cuánto dependen, y entonces acá vamos a ver las relaciones que se pueden generar entre las variables, pueden ser simétrica, es decir, que las variables no influyen sobre otras, ni la independiente de la dependiente, ni la sociodemografica de la dependiente, o de la variable de interés, las recíprocas, es que ambas se influencian, causalmente bidireccional, y las asimétricas sólo una variable influye causalmente en otra, unidireccional, osea cuando yo aplico, yo tengo esta variable cuando le aplico, cambia mi variable dependiente, en cambio la reciproca, cambian las dos, las dos se ven influencias,aca podemos en generar elTest de la independencia entre las variables, puede ser que mi hipótesis sea nula, si es que no hay esta causa efecto entre, si es que no hay una relación recíproca o asimétrica entre mis variables, es decir, que mi hipótesis puede ser nula, dependiendo de la hipótesis que se plantee, máxima independencia que no generan influencia y máxima dependencia que generan completa relación e influyen entre si y una dependencia moderada, como que se influyen pero ni tanto por así decirlo, entonces acá tenemos algunas tablas, donde ya juegan con tres variables, tenemos la asistencia a la iglesia por sexo y por edad, entonces vemos la edad como una variable sociodemográfica dentro de la variable sexo, que sería una variable independiente, los hombres van a ser hombres y las mujeres van a ser mujeres siempre, cierto, no varía según la asistencia a la iglesia, y acá podemos ver la variable de asistencia a la iglesia, entonces podemos ver la distribución de los datos, aquí algunos datos importantes, sería que los hombres asisten menos a la iglesia que las mujeres, menos de 40 años y de 40 años a más asisten más, en ambos casos, en hombres y mujeres asisten más, pero se ve que las mujeres asisten mucho más un 50%, y abajo simplemente una simplificación de esa tabla, como presentamos los datos, como lo mostramos de una manera un poco más simple, es poner menos de 40 años o sea ponemos la variables sociodemográficas de este lado, variable independiente y la variable dependiente arriba, entonces por ejemplo, si es que nosotros sólo nos interesará ver los que acuden semanalmente a la iglesia, porque al ver ese porcentaje, por sentado vamos a dar el otro, entonces es necesario mostrar ambos porcentajes, entonces vemos sólo el porcentaje de los que pueden semanalmente, en hombres 21% menos de 40 años y 40 años más 34% de los hombres, y en el caso las mujeres 30 y 50, aquí suponemos que el otro 50 menos a menudo asisten a la iglesia, suponemos que el 70 menos a menudo.