Investigación Científica Clasificación de las Ciencias Ciencias físicas Ciencias fácticas Ciencias naturales •Física •Química •Astronomía Ciencias biológicas •Biología •Zoología •Botánica Ciencias formales •Matemáticas •Estadística •Lógica Ciencias sociales Ciencias de la tierra •Sociología •Psicología •Antropología •Economía •Geología •Meteorología •Paleontología ¿Qué es ciencia? • La ciencia es un enfoque metódico para estudiar el mundo natural. La ciencia hace preguntas básicas, como: • • • ¿Cómo funciona el mundo? ¿Cómo surgió el mundo? ¿Cómo era el mundo en el pasado, cómo es ahora y cómo será en el futuro? • Preguntas que se responden mediante observación, prueba e interpretación a través de la lógica. • La ciencia es una determinación de lo que es más probable sea correcto en el momento actual con la evidencia a nuestra disposición. Método Científico • Al ceñirse a ciertas “reglas de razonamiento” aceptadas, el método científico ayuda a minimizar la influencia en los resultados por influencias personales, sociales o irrazonables. • En consecuencia, la ciencia se ve como una vía para estudiar los fenómenos en el mundo, basada en evidencia reproducible y comprobable. • En realidad, el método científico no es una secuencia fija de procedimientos, es importante entender el método científico como una forma de pensamiento crítico que se somete a revisión y duplicación independiente para reducir el grado de incertidumbre. Método Científico • El método científico puede incluir algunos o todos los siguientes pasos: observación, definición de una pregunta o problema, investigación, formación de una hipótesis, predicción a partir de la hipótesis, experimentación (probar la hipótesis), evaluación y análisis, revisión y evaluación por pares, y publicación. Paradigmas, métodos y herramientas Paradigma Métodos (principalmente) Positivista / Pospositivista Cuantitativo. "Aunque los métodos cualitativos pueden usarse dentro de este paradigma, los métodos cuantitativos tienden a ser predominantes ..." Interpretivista / Constructivista Predominan los métodos cualitativos, aunque también pueden utilizarse métodos cuantitativos. Herramientas de recopilación de datos Experimentos Cuasi-experimentos Pruebas Escala de valoración Entrevistas Observaciones Revisiones de documentos Análisis de datos visuales Transformadora Pragmática Métodos cualitativos con métodos cuantitativos y mixtos. Factores contextuales e históricos descritos, especialmente en lo que se refiere a la opresión. Pueden emplearse métodos cualitativos y / o cuantitativos. Los métodos se adaptan a las preguntas específicas y al propósito de la investigación. Variedad de herramientas: especial necesidad de evitar la discriminación. Por ejemplo: sexismo, racismo y homofobia. Puede incluir herramientas de paradigmas tanto positivistas como interpretivistas. Ej. Entrevistas, observaciones y pruebas y experimentos. Cebolla de la investigación La cebolla de investigación como modelo de diseño de metodología de investigación Mecanismos de Objetividad Científica Aleatoriedad • El ensayo aleatorio implica probar el fármaco o el tratamiento en la mitad de los sujetos experimentales, pero la mitad a la que se asigna una persona se elige al azar. • Esto nuevamente tiene como objetivo evitar el sesgo tanto como sea posible. Imagínese si los propios científicos eligieran quién está asignado a qué grupo. Tal vez sin siquiera darse cuenta, podrían asignar a las personas de aspecto más saludable a un grupo y a las más enfermas al otro. Mecanismos de Objetividad Científica Ensayo controlado • Significa que el estudio utiliza un grupo control que recibe el placebo, lo que significa que no reciben ningún tratamiento, y así los científicos pueden determinar el efecto que realmente tuvo un fármaco en los participantes. • Sin el control no se podría eliminar la posibilidad de que el solo hecho de participar en el ensayo tenga efectos positivos o negativos en la salud del participante. • También permite cuantificar el efecto del fármaco porque mantiene iguales todas las demás variables. La única diferencia entre los dos grupos es que un grupo recibió el medicamento y el otro no. Mecanismos de Objetividad Científica Revisión de pares • Es otra forma de importancia central en la que la comunidad científica garantiza la objetividad. • Es el proceso mediante el cual los científicos critican el trabajo de los demás antes de su publicación. • Un grupo de científicos primero enviará un artículo, resumiendo el estudio que realizaron a una revista científica. Luego, otros investigadores en su campo, sus pares, considerarán si su estudio es digno de publicación o no. Mecanismos de Objetividad Científica Replicación • La replicación es otra forma en que la comunidad puede contribuir a la objetividad de la ciencia. • Cuando los científicos replican un estudio, significa que están realizando un estudio que ya se ha realizado para ver si obtienen los mismos resultados. • Los científicos estarán más convencidos de sus resultados cuando puedan realizar los mismos estudios una y otra vez y aún así obtener los mismos resultados. Mecanismos de Objetividad Científica Metanálisis • Un metanálisis es una técnica estadística que integra los resultados de muchos estudios en uno. • Así como los científicos son probablemente más objetivos cuando funcionan como un grupo, más estudios agrupados tienen una mayor probabilidad de dar a los científicos una imagen precisa del mundo. • Una razón clave es que los estudios agrupados tienen más observaciones que estudios por separado. • Esto les da lo que los científicos llaman un poder estadístico más alto, lo que significa una mayor probabilidad de que un estudio encuentre algún efecto. Tecnología 1. Aplicativo de producto o proceso para mejor capacidad de supervivencia de la especie humana. 2. El ser humano es una de las mas débiles de la escala zoológica 3. Investigación – Tecnología clave para la humanidad. • Bioquímica: medicamentos. • Física: estudio de hondas y emisiones, radiografías, tomografías. • Microbiología: infecciones. Contexto Externo 1. Cambio climático 2. Sociedad del conocimiento 1. Preindustrial 2. Industrial 3. Posindustrial 4. Del conocimiento (1950) • Países desarrollados de hoy • Apuesta por producción de servicios, generación de riqueza en torno a bien intangible… “Conocimiento”. Producción Científica (número de artículos publicados) Mundo, 2014 Algunos LA, 2014 Banco Mundial, 2016. Journal & Country Rank, SC, Imago, 2016. Universidad en LA • 4000 universidades. • 6000 instituciones no universitarias de educación superior. • 27 millones de matriculados. • 50% en universidades privadas. • Solo 4% de aporte al conocimiento a través de canales convencionales. • 4 a 5 países representativos. • Baja productividad de conocimiento. • Y la seguridad nacional? Introducción al Análisis Multivariado Félix Marza Introducción Era de la información • Era de la información y aumento de interés de empresas por generar datos para conocer mejor a su mercado. • Desarrollo de software y creación de un sistema de inteligencia de mercados dinámico y accesible a tomadores de decisiones. Introducción Computación • El gran desarrollo actual del Análisis de Datos se debe en gran parte al desarrollo de la computación. • Una computadora permite manipular grandes cantidades de datos rápidamente. • Permite programar un algoritmo, que se repite infinidad de veces (cambiando solamente los datos y/o parámetros del problema). Estadística Es la ciencia del dato. Comprende la: • • • • • Colección Clasificación Resumen Análisis Interpretación de los datos Tipos de Variables • Variables categóricas o cualitativas • Nominal • Ordinal • Variables numéricas o cuantitativas • Continua • Discreta Figura Figura Tabla Resumen en tablas Introducción Multivariado • Procesamiento de datos a través de técnicas que analizan de manera simultánea al conjunto de variables. • Tener la competencia y usar el análisis multivariado para una efectiva toma de decisiones es importante en el ámbito de investigación. Estadística multivariada Permite establecer a partir de numerosos datos y variables: • Ciertas relaciones entre ellos. • Investigar estructuras latentes. • Ensayar diversas maneras de organizar dichos datos. • Transformarlos y presentarlos bajo una forma nueva mas asequible, reduciéndolos hasta componer un resumen lo mas completo posible. Análisis Multivariado de Datos • Una serie de análisis estadísticos univariados realizados separadamente puede conducir a conclusiones parciales de los resultados, ya que se ignora la relación o interdependencia entre variables. • Las técnicas multivariadas constituyen una herramienta alternativa para analizar datos en términos de muchas variables y permiten extraer la máxima información posible del conjunto de datos. Métodos de Dependencia Vs. Interdependencia Dependencia: técnicas multivariadas apropiadas cuando una o más de las variables pueden identificarse como variables dependientes y el resto como variables independientes. Ejemplos: análisis de regresión múltiple, análisis discriminante, ANOVA y MANOVA Interdependencia: técnicas estadísticas multivariadas en las que se examina un conjunto de relaciones interdependientes. El objetivo es agrupar las variables de alguna manera. Ejemplos: análisis factorial, análisis de conglomerados y escalado multidimensional. Clasificación de las técnicas de análisis multivariado de datos • En el campo multivariado pueden utilizarse diferentes enfoques, tanto por los distintos tipos de situaciones que se presentan al obtener los datos, como por el objetivo específico del análisis. • Los más importantes se describen a continuación: Simplificación de la estructura o reducción de los datos • El objetivo es encontrar una manera simplificada de representar el universo de estudio. • Esto puede lograrse mediante la transformación de un conjunto de variables interdependientes en otro conjunto de variables independientes o en otro conjunto de menor dimensión. • Las técnicas que se utilizan con mayor frecuencia son: ACP (análisis de componentes principales) y el AF (análisis factorial) Métodos de ordenamiento y agrupación • Tratan de crear grupos de objetos o de variables que sean similares. • Alternativamente, tratan de generar reglas para clasificar objetos dentro de grupos bien definidos. • Las técnicas que se utilizan con mayor frecuencia son: métodos de clasificación jerárquica (Cluster) y no jerárquica, análisis discriminante. Métodos para investigar las relaciones de dependencia entre variables • Para ello se seleccionan del conjunto de datos, ciertas variables (una o más) y se estudia su dependencia de las restantes. • Entre los métodos para detectar dependencia comprenden el análisis de regresión múltiple, regresión multivariada, análisis de correlación canónica, análisis discriminante. Formulación y prueba de hipótesis • A partir de un conjunto de datos es posible encontrar modelos que permitan formular hipótesis en función de parámetros estimables. • Una de las técnicas empleadas es el MANOVA (Multivariate Analysis of Variance), prueba T de Hotelling y el Análisis de Varianza con medidas repetidas. Tablas de variables × variables • Se trata de tablas en que tanto las filas como las columnas describen a variables, o a modalidades de éstas, en el caso cualitativo. • Las tablas usadas en este caso son conocidas como: tablas de doble entrada, tablas de asociación, tablas de contingencia o distribuciones conjuntas de frecuencias. • Estas tablas presentan dos márgenes, cada cual con los totales referentes a una de las variables. Resumen: 1. Reducción de datos o simplificación estructural: El objeto de estudio se representa de la forma más sencilla posible sin sacrificar información valiosa. Esto facilita la interpretación. Ejemplo: Análisis de Componentes Principales (PCA). 2. Clasificación y agrupación: se crean grupos de objetos o variables "similares", en función de las características evaluadas. Ejemplo: Análisis Discriminante, Análisis de Conglomerados. 3. Investigación de la dependencia entre variables: el estudio de la estructura de covarianza ayudará a determinar la naturaleza de la relación entre variables. Ejemplo; Análisis de correlación canónica. 4. Predicción: la relación entre variables se puede determinar con el fin de predecir los valores de una o más variables sobre la base de las observaciones de las otras variables. Ejemplo: regresión lineal multivariante, análisis de varianza multivariante (MANOVA). Organización de datos multivariados La mayoría de los conjuntos de datos multivariados se pueden representar en un formato rectangular, en el que los elementos de cada fila corresponden a los valores de las variables de una unidad particular y los elementos de las columnas corresponden a los valores tomados por una variable particular. ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 age 18 17 15 15 16 16 16 17 15 15 15 15 15 15 15 16 16 16 17 16 15 15 16 16 15 16 15 15 16 16 15 15 15 15 Pstatus A T T T T T T A A T T T T T A T T T T T T T T T T T T T A T T T T T Medu 4 1 1 4 3 4 2 4 3 3 4 2 4 4 2 4 4 3 3 4 4 4 4 2 2 2 2 4 3 4 4 4 4 3 Fedu 4 1 1 2 3 3 2 4 2 4 4 1 4 3 2 4 4 3 2 3 3 4 2 2 4 2 2 2 4 4 4 4 3 3 failures famrel 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 4 5 4 3 4 5 4 4 4 5 3 5 4 5 4 4 3 5 5 3 4 5 4 5 4 1 4 2 5 4 5 4 4 5 freetime goout 3 3 3 2 3 4 4 1 2 5 3 2 3 4 5 4 2 3 5 1 4 4 5 4 3 2 2 2 3 4 4 3 5 3 Dalc 4 3 2 2 2 2 4 4 2 1 3 2 3 3 2 4 3 2 5 3 1 2 1 4 2 2 2 4 3 5 2 1 2 2 Walc 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 5 3 1 1 1 health 1 1 3 1 2 2 1 1 1 1 2 1 3 2 1 2 2 1 4 3 1 1 3 4 1 3 2 4 1 5 4 1 1 1 3 3 3 5 5 5 3 1 1 5 2 4 5 3 3 2 2 4 5 5 1 5 5 5 5 5 5 1 5 5 5 5 5 2 absences 6 4 10 2 4 10 0 6 0 0 0 4 2 2 0 4 6 4 16 4 0 0 2 0 2 14 2 4 4 16 0 0 0 0 Arreglos matriciales • Los datos anteriores se pueden organizar en forma de una matriz X de orden (n x p) de la siguiente manera: Media y varianza Univariado Multivariado X μ 𝜇1 𝜇 = 𝜇2 𝜇3 Media Varianza S2 σ2 𝜎12 Σ= 𝜎21 𝜎12 𝜎22 Gracias!