COOK y CAMPBELL (1986) CAMPBELL y STANLEY (1966) Grado de confianza respecto a la veracidad de los resultados obtenidos. CAMPBELL y STANLEY (1966) la basan en la mejor aproximación posible a la veracidad de las hipótesis de investigación. Posteriormente: experimentos en función del grado en que representen al “experimento perfecto” (capaz de comprobar hipótesis sin errores). Grado de confianza con el que puede inferirse que las relaciones causa-efecto entre las variables de una investigación son interpretables en el sentido sugerido por el investigador. Es Validez interna necesario un mínimo de esta validez xa la interpretación. Se obtendrá con el control adecuado de las VVEE. Grado de confianza con que se puede generalizar la supuesta relación causa-efecto a otra Validez externa medidas y a diferentes personas y contextos temporales y lugares. Requiere elegir una muestra representativa. Validez de Grado de confianza con que podemos inferir o concluir que existe covariación entre variables, conclusión y en función de las varianzas obtenidas. estadística Relacionado con la precisión con que el diseño detecta los efectos de los tratamientos. Validez de Grado de confianza con que podemos establecer generalizaciones a constructos de orden constructo de superior. causas y efectos Muy relacionada con la validez externa. Clasificaciones CONCEPTO DE VALIDEZ Tema 6: La validez en la investigación 1 VALIDEZ DE CONCLUSIÓN ESTADÍSTICA Concepto Se refiere a la correcta inferencia de las hipótesis, considerando un nivel de confianza (probabilidad de acertar cuando no se rechaza la hip nula q es cierta) (99 %, 95 %) Tipo I: se concluye que existe relación entre las variables cuando de hecho no existe. Su probabilidad se llama alpha (). Su complementario es el nivel de confianza. Posibles errores Tipo II: no se detecta en la muestra la relación entre variables que en la realidad sí existe en la población. Su probabilidad se llama beta (). Potencia: capacidad de una prueba estadística xa detectar una relación entre vv. Se expresa en terminos de probabilidad (0 y 1). Se refiere a la potencia estadística (potencia del diseño, potencia de la prueba): probabilidad de obtener significación estadística en 1) ¿Es suficientemente sensible caso de que el tratamiento sea efectivo (LIPSEY, 1990). Su para llegar a conclusiones probabilidad es 1 - . acerca de la covariación entre Planificación: especificará tamaño muestral óptimo para detectar el variables? efecto de magnitud deseada dadas unas determinadas varianzas. Después de la investigación: varianzas y tamaños muestrales especifican la magnitud del efecto que pudiera existir en la Responde a 3 población. preguntas Elección de las pruebas estadísticas para decidirlo, según los sobre la criterios: investigación 2) Si es sensible, ¿existe Potencia estadística de la prueba: elegir la que razonable evidencia empírica reduzca el error tipo I y aumente posibilidad rechazo hip. para inferir la posible nula cuando sea falsa. covariación causa-efecto? Modelo estadístico: elección entre pruebas paramétricas o no paramétricas en función de los datos. Tamaño del efecto: es la magnitud de la diferencia entre dos o 3) Si existe evidencia, ¿cuál es más condiciones experimentales. Depende de la intensidad de la la magnitud o el grado de relación causa-efecto. covariación entre variables? Se expresa en una escala estandarizada. Supuestos del a) Los datos son una muestra representativa de la población. modelo b) El universo de valores (población) se ajusta a un determinado patrón o modelo matemático o estadístico. Violación de Supuestos o La VD debe haber sido medida, al menos, a nivel de intervalo. los supuestos condiciones Las poblaciones deben seguir una distribución normal (comprobación con la del modelo del diseño en prueba t de Student si son muestras iguales o mayores de 30 y tienen el estadístico comparación mismo número de observaciones – son muestras equilibradas). de muestras Las varianzas poblacionales se supone q son iguales (homocedasticidad). de distintas Las observaciones son aleatorias e independientes. poblaciones Posible prueba para comprobar la diferencia de medias: t de Student. Potencia est.: capacidad de una prueba para detectar una relación entre variables (COHEN, 1988) Amenazas a) Escasa potencia de la prueba estadística b) Factores de la potencia estadística c) Tamaño el efecto: magnitud de la diferencia entre condiciones o del impacto del tratamiento (KAZDIN, 1992). Es más fácil que una prueba est. detecte diferencias grandes que pequeñas. Nivel de significación: según dónde se fije la frontera a partir de la que se rechaza la no existencia de diferencias, la probabilidad de cometer un error tipo II aumentará o disminuirá. Tamaño de la muestra (influye en la representatividad, como el proceso de selección): 1. A mayor nº sujetos, puede fijarse menor nivel de significación. 2. A mayores tamaños muestras, más altos niveles de potencia. 3. Un nº observaciones elevado permite detectar tamaños de efecto pequeños. 2 V. CNSTRCT VALIDEZ INTERNA Concepto Verificada la covariación, hay que determinar si la relación es causal: eliminar posibles variables extrañas. Hay que tener en cuenta la dirección de la causalidad (VIVD). Un diseño válido será el que permita eliminar todas las hipótesis rivales o todas las posibles explicaciones alternativas del fenómeno estudiado. Según propuesta de CAMPBELL y STANLEY (1966). Se consideran en 2 dimensiones: en función del origen (externo o interno al organismo). en función del proceso (biofísico o psicosocial) Se produce un suceso diferente a la VI, dentro o fuera de la situación experimental, que podría ser una explicación de los resultados. Puede ser entre las medidas antes y después del tratamiento o entre la exposición a la VI y el Historia registro de la VD. Fuente potencial de error en diseños donde los mismos sujetos reciben todos los tratamientos y en situaciones en q hay mucho intervalo temporal entre pretest y el postest. Control en el laboratorio: aislamiento del sujeto. Cambios en las condiciones internas del organismo consecuencia de: tiempo, desarrollo biológico o Maduración psicológico... Es una amenaza cuando al realizar una prueba pretest, esta influye en la medida postest. Cuando los sujetos pasan varias veces por distintos tratamientos, pueden responder de forma diferente por práctica, fatiga o persistencia (efecto de arrastre). Control: formación de grupos de control (sin tratamiento), o contrabalanceo en diseños intrasujeto. Cambios en la variable dependiente debidos a los instrumentos de observación y/o medida o a los procedimientos de evaluación. Instrumentación Instrumentos será amenaza si no tiene la fiabilidad adecuada. Control: usar instrumentos estandarizados, entrenamiento de observadores, verificaciones fiabilidad... Pérdida de sujetos durante la realización de la investigación. Hace que los grupos no sean Mortalidad equivalentes no se puede distinguir si los resultados son a efectos del tratramiento o =/= experimental sistemática entre grupos. Control: Planificar la investigación de modo que sea la mínima posible. Es necesaria la equivalencia inicial (previa al tratamiento) de los grupos. Se consigue por aleatorización, equiparación o bloques. Selección Es una amenaza cuando no se cumple la equivalencia, como ocurre en los diseños cuasiexperimentales: equivalencia entre grupos no garantizada, las características individuales de los sujetos pueden afectar a los resultados. Interacción Es sólo un ejemplo de interacción entre amenazas y selección, afectan a los diseños selección y cuasiexperimentales. maduración Fenómeno que se produce cuando los sujetos son elegidos por puntuaciones extremas en alguna variable: estas puntuaciones tienden a regresar hacia la media en una nueva medición. Regresión COOK y CAMPBELL: posible causa la falta de fiabilidad de los instrumentos y las =/= entre la media estadística de un subgrupo seleccionado intenciona/ y la media de la población. Control: si el azar no es posible, realizar varias medidas antes de la intervención. Administración de pruebas Amenazas Los resultados de una investigación tienen que ser interpretados según la teoría con que se extrajeron las variables. COOK y CAMPBELL (1979): la validez del constructo es el grado de correspondencia entre la medida de la VD y la manipulación de la VI y el constructo teórico que se está midiendo o manipulando. Es conveniente: Reflexionar la forma de definir los constructos. Aislar los constructos de interés Determinar las medidas que pueden considerarse indicadoras Tomar múltiples medidas Registrarlas con múltiples métodos. Operativizar el constructo: definirlo como variable. 10 amenazas en función de 2 causas: 1. Indefinición o falta de operacionalización del constructo. Los constructos no definidos de forma correcta vv Amenazas no preparadas xa ser medidas y manipuladas. 2. Falta de examen empírico de las interrelaciones entre operacionalizaciones. 3 VALIDEZ EXTERNA Concepto Amenazas Problema de la generalización de los resultados. Si se trata de generalización a diferentes personas, contextos o tiempos, definir la población y seleccionar una muestra representativa. La generalización “entre” distintas poblaciones es más práctica según COOK y CAMPBELL. Interacción Poblaciones experimentales accesibles, o los sujetos, no son representativas de la población de selecciónreferencia. tratamiento. Validez Control: selección aleatoria, generalización entre diferentes poblaciones. poblacional Interacción Val. ecológica: Posibilidad de generalizar los resultados obtenidos en un experimento a las contextocondiciones naturales donde se desarrolla el comportamiento de los sujetos. tratamiento. Validez Amenaza: interacción contexto-tratamiento sujetos no se comportan igual en situación de ecológica laboratorio q en situación de normalidad. Control: replicación experimento en diferentes contextos, integrar elementos habituales. Interacción Val. histórica: Posibilidad generalizar a períodos de tiempo del pasado y del futuro. momentoAmenaza: acontecimientos durante el experimento que interactúan con el tratamiento tratamiento. V. (frecuente en Psi. Clínica). histórica Control: replicación en distintos períodos u ocasiones temporales. Factores que Interferencia entre Administración consecutivas de tratamientos a = sujetos resultados influyen en la validez tratamientos múltiples no sean representativos y no generalizables. externa Control: técnicas de equiponderación o contrabalanceo, y/o trabajar con sujetos q no hayan sido sujetos experimentales. Efectos de Administración del pretest puede sensibilizar a sujetos respecto al sensibilización pretest tratamiento y más difícil generalizar. Control: utilizar grupos de control y/o administrar pruebas paralelas del test. Reactividad a Los sujetos al sentirse evaluados pueden comportarse de forma situación distinta. experimental y Control: utilizar grupos de control, técnicas de ciego y/o realizar proceso de evaluación experimentos encubiertos. Efectos de carácter Cuando efectividad se debe a la novedad de la situación, no se puede novedoso de situación generalizar a otros contextos. experimental Control: prolongar el tratamiento de forma q desaparezca los efectos novedosos. Creciente importancia de experimentos aleatorios en detrimento de los cuasi-experimentos. CONCLUSIONES SOBRE LA VALIDEZ Los cuasiexperimentos han mejorado por reducción de la amenaza de selección diferencial. COOK y SHADISH (1994) Creciente importancia del proceso de generalización de inferencias causales. 4