Muestra, dato y matriz de datos Muestra, dato y matriz de datos 1. Presentar sintéticamente las principales cuestiones a considerar en la elección de las muestras en un proceso de investigación. Vincular con metodología cualitativa y metodología cuantitativa. “La imposibilidad unas veces, y otras el engorro de investigar a todos los casos (personas, hechos, situaciones…) relacionados con el objeto de investigación, obliga a seleccionar un número reducido de ellos, una muestra representativa” (Olabuénaga, Aristegui y Melgosa, 1998: 49). La muestra es “…el material concreto de trabajo”… (Samaja, La ventaja principal de utilizar una muestra estriba en el ahorro de tiempo, dinero y personal para realizar la investigación. Debe cumplir con tres condiciones básicas: a) Representatividad: “La muestra debe ser un universo en ‘miniatura’” (Olabuénaga, Aristegui y Melgosa, 1998: 51); b) Confianza: “…debe garantizar la fiabilidad de los datos respecto del universo” (Ibíden: 51); c) Tamaño: la Teoría del Muestreo indica en cada caso cuántos elementos se precisan. La tendencia de análisis cuantitativo a generalizar y universalizar obliga a estudiar todos los casos y dado la imposibilidad de efectuarlo se seleccionan unos cuantos casos de muestra que representan al colectivo. En cambio los análisis cualitativos estudian normalmente un individuo, una situación, por lo que el tamaño de la muestra obedece a una selección por parte del investigador. El muestreo probabilístico – en que podemos saber a priori, mediante leyes estadísticas, la probabilidad que tiene cada uno de los miembros del universo de salir seleccionado- está ligado a la investigación cuantitativa, y el no probabilístico – en que los sujetos no son elegidos por azar sino de forma intencional o controlada- a la investigación cualitativa. El investigador puede fijar de antemano: a) su margen de error: “cuanto menor sea el margen de error, mayor será el tamaño de la muestra exigido” (Olabuénaga, Aristegui y Melgosa, 1998: 53); b) el nivel de confianza: “El tamaño de un [sic] muestra será tanto Juan, 2004: 267) mayor cuanto más alto sea el nivel de confianza con el que el investigador desee trabajar” (Ibíden: 53); c) la varianza del universo: cuanto más variada o heterogénea sea la población mayor será también, el tamaño de la muestra. 2. Presentar en una carilla la estructura cuatripartita del dato científico y el sistema de matrices de datos y su dialéctica. Estructura cuatripartita del dato La traducción de la experiencia espontánea a una descripción científica produce ese material básico de la experiencia científica llamada “dato”. Un dato es una construcción Muestra, dato y matriz de datos compleja que posee una estructura interna que es su contenido formal invariable (es decir, está presente en todo dato). La estructura del dato científico de Galtung es completada por Samaja con un cuarto lugar, por lo que pasa a ser cuatripartita, siendo los cuatro componentes los que siguen: 1. unidad de análisis (UA) 2. variables (V) 3. valores (R) 4. indicadores (I). Una unidad de análisis (o individuo de estudio) puede ser concebida como un “miembro” (de un sistema, es decir, como formando parte de un universal) o como un “colectivo” (como conteniendo “particularidades”). Así, podemos considerar a nuestro sistema como: a. un universo que tiene partes o como b.la parte de un universo. Una variable es un asunto de interés, relevante para la descripción de las unidades de análisis. Toda variable es un criterio de clasificación que se emplea para clasificar las UA. Las variables son artificios clasificadores o descriptores que emplea el científico, mediante los cuales resume y organiza una vasta gama de experiencias. Todas las variables resumen información y son analizables en dimensiones. Los valores son los estados posibles que pueden presentar las variables, pueden o no tener valores numéricos. Todo dato científico vincula un concepto con un “estado de cosas” del mundo externo, mediante la ejecución de un procedimiento aplicado a una o más dimensiones consideradas “observables”. Esta definición incluye como ingredientes esenciales del indicador dos elementos: a. la dimensión (“considerada como observable”), y b. el procedimiento para ejecutar la observación. Los procedimientos abarcan una muy amplia gama de técnicas de medición: desde la observación de un “conjunto de indicios” que lleva desde lo manifiesto a lo latente, hasta la construcción de escalas, tests multiitémicos, o diversos tipos de índices (sumatorios, acumulativos, comparativos, etc.). Indicador es algún tipo de procedimiento que se aplique a alguna dimensión de la variable, para establecer qué valor de ella le corresponde a una unidad de análisis determinada. “Dimensión de una variable” es un aspecto parcial de la variable (o predicado), que es relativamente independiente de otros aspectos. Muestra, dato y matriz de datos Agregamos estos conceptos a un esquema que permita ver el carácter jerárquico de algunas de las relaciones que se dan entre los cuatro elementos de la estructura. _R______V________UA_ D I = _________ P En este diagrama, debajo del símbolo del valor R, figura el símbolo del indicador (I), que está en relación de igualdad con la dimensión y el procedimiento, cuyos símbolos (D) y (P) están inmediatamente por debajo de la variable (V). Esta ubicación en el diagrama busca sugerir la relación de subordinación que existe entre las dimensiones y la variable de la cual son aspectos. El dato científico tiene dos atributos definitorios: a. la validez (pone en juego la selección de las dimensiones); y b. la confiabilidad (la construcción del procedimiento). 3. Sistema de matrices de datos La matriz de datos es un nombre posible para designar a los invariantes estructurales de los datos científicos de cualquier ciencia empírica, y puede ser sincrónica (el tiempo aparece como un dato variable) o diacrónica (el tiempo en transcurso). Además pueden combinarse ambos tipos de matrices. Cualquiera sea la investigación de que se trate, como mínimo se determinan tres matrices de datos: 1. una matriz central que llamaríamos “Nivel de anclaje” (N) para aludir a que la investigación dada ha decidido “anclar en ese nivel. 2. una matriz constituida por los componentes (o partes) de las unidades de análisis del nivel de anclaje (“Matriz de nivel (N) subunitario” N-1). 3. finalmente una matriz constituida por los contextos de las unidades del N (“Matriz supraunitaria N+1”). Es posible que una matríz de datos tenga relaciones con alguna otra matriz de datos sin estar ni subordinada (N-1) ni supraordinada (N+1) a ella, por lo tanto hablaremos de “matrices del mismo nivel de integración” o de “matrices coordinadas”. La DIALÉCTICA se refiere a que el conocimiento científico se desarrolla como una dinámica o movimiento de “ir y venir” entre la experiencia y la teoría. La explicación o comprensión científica es la operación que resulta de ese movimiento. Se trata de un movimiento de mediación. La matriz de datos se mueve en la constante intermediación Muestra, dato y matriz de datos por la cual se tornan observables ciertos conceptos teóricos, al mismo tiempo que se transforman en conceptos teóricos ciertos estados de cosas observables. Entre los dos extremos en que se mueve el acto científico: “deductivismo/inductivismo” o “Teoría/empiria”, se encuentra la formación social y la experiencia del propio investigador; de donde él extrae sus “analogías familiares”. Esto indica una superación de las dos corrientes. Es el sujeto científico quien aporta los modelos y los traduce tanto a pautas de observación cuanto a enunciados teóricos. Estos modelos son como “mapas topológicos“ aportados por el investigador. De no mediar ese modelo, la realidad sería invisible. En todo momento hay una matriz central (o focal), cuyo llenado presupone la resolución previa de ciertas matrices periféricas o auxiliares. En el momento en que las matrices periféricas son focalizadas para su resolución (es decir, dejan de ser periféricas para ser temporariamente focales), los elementos de la anterior matriz central aparecen ahora en otros lugares de la estructura de los datos. Este movimiento entre los distintos planos u ópticas que se superpone de múltiples maneras, también constituye la DIALÉCTICA y representa el proceso de construcción del objeto concreto de la investigación. La dialéctica interna se refiere a sistema/subsistema/suprasistema. 4. ¿Cuál es la utilidad que se puede atribuir a conocer la estructura del dato y las matrices? (Media carilla) Traer a clase impreso este material elaborado, con una copia para entregar a la docente. Se espera reconsideraciones, críticas, revisiones, del escrito del Práctico N° 2, especialmente para el punto 1. Al presentar así las relaciones que conforman un objeto de investigación, Juan Samaja nos muestra una realidad concebida como una totalidad conformada por sujetos y relaciones que se modifican recíprocamente; esto es bastante diferente que pensar en un conjunto cuyas partes se presentan estáticas y como incluidas en un conjunto mayor. La matriz de datos da cuenta de los múltiples niveles de integración de la realidad humana, y por lo tanto, de la complejidad que implica recortar nuestro objeto. La matriz será el insumo para comenzar a resumir nuestra información. Analizar un determinado cuerpo de datos es intentar alguna manera de compactarlos para poder sacar conclusiones de ellos, es decir que analizar datos es, en palabras de Juan Samaja, sintetizarlos. Muestra, dato y matriz de datos La realidad es concebida como una totalidad integrada de sujetos y relaciones que se modifican unos a otros dinámicamente. “La realidad (cualquier sector de la realidad) es siempre infinitamente compleja, y no se puede pasar directamente desde la percepción común y del comportamiento práctico espontáneo, a la descripción científica y a la ‘visión teórica’” (Samaja, Juan, 2004: 159). El proceso de investigación consiste en construir el sistema de matrices de datos, llenar esas matrices de datos (sean cuantitativas o cualitativas) y procesar, analizar e interpretar dichas matrices. … “el principal presupuesto de toda investigación científica es éste: que el objeto de estudio sea inteligible” (Samaja, Juan, 2004: 147), es decir que el objeto sea investigable. Siguiendo a este autor por un lado, debe ser posible describir el objeto de estudio, es decir, identificar sus elementos componentes y caracterizarlos; y por otro lado debe ser posible reelaborarlo conforme a algún patrón de asimilación a las evidencias de nuestra Razón. “Emerge la comprensión cuando se logra mostrar y fundamentar que lo dicho en una descripción puede hacerse corresponder (…) al esquema lógico matemático que hemos logrado construir con las leyes descubiertas” (Samaja, Juan, 2004: 147). … “la información que se obtenga (sea bajo la forma de registros fotográficos, de grabaciones, de narraciones de episodios humanos o de proposiciones que describen estados de cosas –de cualquier nivel de complejidad que se trate- deberá poder ser traducida a la estructura del lenguaje descriptivo; dicho de otra manera: ha de ser posible señalar las operaciones[I] mediante las que se podrán identificar (o construir) los sujetos de los cuales se informa [UA]; las variables implícitas en el informe [V] y las situaciones particulares (los valores particulares) que se informan [R]” (Samaja, Juan, 2004: 183). Resumiendo, en palabras de Samaja, la matriz de datos es un cartografiado de la realidad, una especie de fotografía que debe poder ser traducida a la estructura de un lenguaje descriptivo. 5. ¿Cuáles son las posibles direcciones del análisis de datos? Presentar sintéticamente cada una y vincularlas con los esquemas exploratorios, descriptivos y explicativos. Según Samaja, hay tres direcciones posibles por las que se puede realizar el proceso constructivo del diseño: a) la dirección que primero busca establecer las unidades de análisis, para luego escoger las variables relevantes y los respectivos valores; b) la Muestra, dato y matriz de datos dirección que identifica las variables centrales del estudio, con sus valores, y luego se pregunta por las unidades; c) la que a partir de los valores recorre el proceso constitutivo de las variables y las unidades. Las investigaciones exploratorias están destinadas a producir nuevas ideas. Al escoger deliberadamente los sujetos de estudio, la muestra es no probabilística. “… se puede decir que el tratamiento y análisis de datos en una investigación de carácter exploratorio está predominantemente centrada en el valor [R], puesto que desde el valor (…) se intentará averiguar qué variables o criterios de clasificación resultarán más convenientes para categorizar al objeto de estudio” (Samaja, Juan, 2004: 294). Las investigaciones descriptivas, centradas en la variable [V], buscan establecer las características generales de una población a partir de lo que se encuentra en una muestra, que ha sido elegida al azar, siguiendo las leyes estadísticas. “Esto es así porque el comportamiento de los valores de las variables de sucesivas muestras tomadas al azar se distribuyen según tendencias definidas, alrededor de los verdaderos valores del Universo (que los estadígrafos llaman ‘parámetros’)” (Samaja, Juan, 2004: 274). Las investigaciones experimentales o cuasi-experimentales, donde el análisis de datos pertenece a un esquema explicativo/comprensivo, pretenden verificar hipótesis causales, mediante el control de las principales variables del fenómeno. Se trata de poner bajo control la mayor cantidad de variables, escogiendo cuotas de unidades de análisis en donde haya cantidades semejantes que difieren solamente en la variable independiente. Está centrado predominantemente en las unidades de análisis [UA]. Análisis de datos en esquemas1: Centrado en la Variable Centrado en la unidad de Análisis Centrado en el Valor Exploratorios Examinar las distribuciones de frecuencias que se presentan en cada una de las primeras clasificaciones (analizar proporciones, medidas de posición y variabilidad) Revisar los distintos sujetos posibles e intentar conceptualizarlos. ¿Qué posibilidades de abordaje ofrecen? Examinar hechos o estado de cosas y averiguar formas de clasificarlos Descriptivos Caracterizar las distribuciones aplicando medidas descriptivas posibles; ejecutar gráficos de tendencias. Descubrir asociaciones que den lugar a hipótesis causales. Construcción de modelos mecánicos y procesuales que permitan plasmar globalmente las descripciones univariadas (variables ordenadas y preparadas por técnicas estadísticas básicas)2 y bivariadas (descubrir y describir las relaciones entre dos variables: covariacion, asociación y 3 causalidad) Elaboración de escalas más finas de medición . escalas e índices respectivos y de valores normalizados Explicativos Ejecutar análisis más complejos (análisis de varianza, factorial) para verificación de hipótesis causales Aplicación de técnicas Discutir valides de los de análisis funcional, indicadores comparativo, histórico – estructural. Exposición del modelo real de interpretación. 1 Juan Samaja. Epistemología y Metodología. Elementos para una teoría de la investigación científica. Parte IV “el análisis del proceso de investigación”. 2 Jose Yuni y Claudio Urbano, Técnicas para investigar. Análisis de datos y redacción científica. Editorial Brujas. Córdoba, 2006. Pág. 43 3 Jose Yuni y Claudio Urbano, Técnicas para investigar. Análisis de datos y redacción científica. Editorial Brujas. Córdoba, 2006. Pág. 61 Muestra, Datos y Matriz de Datos 6. Mostrar las diferencias del análisis de datos según se trate de metodología cualitativa o diseño cuantitativo. diseños con En la investigación cualitativa el análisis de datos es una de las actividades principales “… ya que se realiza a lo largo de todo el proceso” (Yuni, Urbano, 2006: 77). El mismo suele ser problemático porque no existen procedimientos estandarizados que puedan aplicarse a cualquiera de los datos, los cuales son de naturaleza disímil y están en constante dinamismo. La finalidad del análisis cualitativo es obtener una comprensión integral y compleja de las situaciones sociales. “Como todo material producido en la interacción social, éste es vehiculizado por algún tipo de lenguaje y por lo tanto puede ser abordado a través de un proceso semiótico” (Ibíden: 79). El investigador habrá de encontrar las tramas de sentido que sostienen los textos generados durante su trabajo. Existen distintas posturas sobre la codificación de los datos obtenidos: si debe hacerse mediante números o mediante etiquetas (palabras o conceptos). La investigación cuantitativa se basa en la estadística, de tal modo que la información obtenida se convierte en número. Los principales autores que representan esta posición señalan que ya en el proyecto de investigación se debe prever el modo en que se tratará los datos y el tamaño de la muestra. El punto inicial “...es el análisis univariado, sobre el cual se avanza hacia el análisis de relaciones o bivariado para concluir (…) en el análisis multivariado” (Ibíden: 42). El análisis univariado consiste en el examen de la información de cada una de las variables (se aconseja tomar primero las independientes, luego las intervinientes y finalmente las dependientes). Es una forma de chequear la calidad de la información y contribuye en la función correctiva de datos erróneos. Cuando las variables ofrecen gran variabilidad que dificulta el análisis, el investigador puede recurrir a la compactación de los valores. El análisis bivariado trata de descubrir y describir la relación entre dos variables. Con frecuencia se recurre a cuadros y tablas para ayudar a la comprensión del lector. Se debe evaluar su pertinencia y no descuidar los requisitos para su presentación.