Subido por jaime.inca7

02- Introducción al Analisis Multivariado - 15feb2022

Anuncio
Investigación Científica
Clasificación de las Ciencias
Ciencias
físicas
Ciencias fácticas
Ciencias
naturales
•Física
•Química
•Astronomía
Ciencias
biológicas
•Biología
•Zoología
•Botánica
Ciencias formales
•Matemáticas
•Estadística
•Lógica
Ciencias
sociales
Ciencias
de la tierra
•Sociología
•Psicología
•Antropología
•Economía
•Geología
•Meteorología
•Paleontología
¿Qué es ciencia?
•
La ciencia es un enfoque metódico para estudiar el mundo natural.
La ciencia hace preguntas básicas, como:
•
•
•
¿Cómo funciona el mundo?
¿Cómo surgió el mundo?
¿Cómo era el mundo en el pasado, cómo es ahora y cómo será en el futuro?
•
Preguntas que se responden mediante observación, prueba e
interpretación a través de la lógica.
•
La ciencia es una determinación de lo que es más probable sea
correcto en el momento actual con la evidencia a nuestra
disposición.
Método Científico
•
Al ceñirse a ciertas “reglas de razonamiento” aceptadas, el método
científico ayuda a minimizar la influencia en los resultados por
influencias personales, sociales o irrazonables.
•
En consecuencia, la ciencia se ve como una vía para estudiar los
fenómenos en el mundo, basada en evidencia reproducible y
comprobable.
•
En realidad, el método científico no es una secuencia fija de
procedimientos, es importante entender el método científico como
una forma de pensamiento crítico que se somete a revisión y
duplicación independiente para reducir el grado de incertidumbre.
Método Científico
•
El método científico puede incluir algunos o todos los siguientes
pasos: observación, definición de una pregunta o problema,
investigación, formación de una hipótesis, predicción a partir de la
hipótesis, experimentación (probar la hipótesis), evaluación y
análisis, revisión y evaluación por pares, y publicación.
Paradigmas, métodos y herramientas
Paradigma
Métodos (principalmente)
Positivista /
Pospositivista
Cuantitativo. "Aunque los métodos cualitativos
pueden usarse dentro de este paradigma, los
métodos cuantitativos tienden a ser
predominantes ..."
Interpretivista /
Constructivista
Predominan los métodos cualitativos, aunque
también pueden utilizarse métodos cuantitativos.
Herramientas de recopilación de datos
Experimentos
Cuasi-experimentos
Pruebas
Escala de valoración
Entrevistas
Observaciones
Revisiones de documentos
Análisis de datos visuales
Transformadora
Pragmática
Métodos cualitativos con métodos cuantitativos y
mixtos. Factores contextuales e históricos
descritos, especialmente en lo que se refiere a la
opresión.
Pueden emplearse métodos cualitativos y / o
cuantitativos. Los métodos se adaptan a las
preguntas específicas y al propósito de la
investigación.
Variedad de herramientas: especial
necesidad de evitar la discriminación. Por
ejemplo: sexismo, racismo y homofobia.
Puede incluir herramientas de paradigmas
tanto positivistas como interpretivistas. Ej.
Entrevistas, observaciones y pruebas y
experimentos.
Cebolla de la
investigación
La cebolla de
investigación
como modelo de
diseño de
metodología de
investigación
Mecanismos de Objetividad Científica
Aleatoriedad
• El ensayo aleatorio implica probar el fármaco o el tratamiento en la
mitad de los sujetos experimentales, pero la mitad a la que se asigna
una persona se elige al azar.
• Esto nuevamente tiene como objetivo evitar el sesgo tanto como sea
posible. Imagínese si los propios científicos eligieran quién está
asignado a qué grupo. Tal vez sin siquiera darse cuenta, podrían
asignar a las personas de aspecto más saludable a un grupo y a las
más enfermas al otro.
Mecanismos de Objetividad Científica
Ensayo controlado
• Significa que el estudio utiliza un grupo control que recibe el placebo,
lo que significa que no reciben ningún tratamiento, y así los
científicos pueden determinar el efecto que realmente tuvo un
fármaco en los participantes.
• Sin el control no se podría eliminar la posibilidad de que el solo
hecho de participar en el ensayo tenga efectos positivos o negativos
en la salud del participante.
• También permite cuantificar el efecto del fármaco porque mantiene
iguales todas las demás variables. La única diferencia entre los dos
grupos es que un grupo recibió el medicamento y el otro no.
Mecanismos de Objetividad Científica
Revisión de pares
• Es otra forma de importancia central en la que la comunidad
científica garantiza la objetividad.
• Es el proceso mediante el cual los científicos critican el trabajo de los
demás antes de su publicación.
• Un grupo de científicos primero enviará un artículo, resumiendo el
estudio que realizaron a una revista científica. Luego, otros
investigadores en su campo, sus pares, considerarán si su estudio es
digno de publicación o no.
Mecanismos de Objetividad Científica
Replicación
• La replicación es otra forma en que la comunidad puede contribuir a
la objetividad de la ciencia.
• Cuando los científicos replican un estudio, significa que están
realizando un estudio que ya se ha realizado para ver si obtienen los
mismos resultados.
• Los científicos estarán más convencidos de sus resultados cuando
puedan realizar los mismos estudios una y otra vez y aún así obtener
los mismos resultados.
Mecanismos de Objetividad Científica
Metanálisis
• Un metanálisis es una técnica estadística que integra los resultados
de muchos estudios en uno.
• Así como los científicos son probablemente más objetivos cuando
funcionan como un grupo, más estudios agrupados tienen una mayor
probabilidad de dar a los científicos una imagen precisa del mundo.
• Una razón clave es que los estudios agrupados tienen más
observaciones que estudios por separado.
• Esto les da lo que los científicos llaman un poder estadístico más alto,
lo que significa una mayor probabilidad de que un estudio encuentre
algún efecto.
Tecnología
1. Aplicativo de producto o proceso para mejor capacidad de
supervivencia de la especie humana.
2. El ser humano es una de las mas débiles de la escala
zoológica
3. Investigación – Tecnología clave para la humanidad.
• Bioquímica: medicamentos.
• Física: estudio de hondas y emisiones, radiografías,
tomografías.
• Microbiología: infecciones.
Contexto Externo
1. Cambio climático
2. Sociedad del conocimiento
1. Preindustrial
2. Industrial
3. Posindustrial
4. Del conocimiento (1950)
• Países desarrollados de hoy
• Apuesta por producción de servicios, generación de
riqueza en torno a bien intangible… “Conocimiento”.
Producción Científica (número de artículos publicados)
Mundo, 2014
Algunos LA, 2014
Banco Mundial, 2016.
Journal & Country Rank, SC, Imago, 2016.
Universidad en LA
• 4000 universidades.
• 6000 instituciones no universitarias de educación superior.
• 27 millones de matriculados.
• 50% en universidades privadas.
• Solo 4% de aporte al conocimiento a través de canales
convencionales.
• 4 a 5 países representativos.
• Baja productividad de conocimiento.
• Y la seguridad nacional?
Introducción al Análisis
Multivariado
Félix Marza
Introducción
Era de la información
• Era de la información y aumento de interés de empresas
por generar datos para conocer mejor a su mercado.
• Desarrollo de software y creación de un sistema de
inteligencia de mercados dinámico y accesible a
tomadores de decisiones.
Introducción
Computación
• El gran desarrollo actual del Análisis de Datos se debe
en gran parte al desarrollo de la computación.
• Una computadora permite manipular grandes
cantidades de datos rápidamente.
• Permite programar un algoritmo, que se repite infinidad
de veces (cambiando solamente los datos y/o
parámetros del problema).
Estadística
Es la ciencia del dato.
Comprende la:
•
•
•
•
•
Colección
Clasificación
Resumen
Análisis
Interpretación de los datos
Tipos de Variables
• Variables categóricas o cualitativas
• Nominal
• Ordinal
• Variables numéricas o cuantitativas
• Continua
• Discreta
Figura
Figura
Tabla
Resumen en tablas
Introducción
Multivariado
• Procesamiento de datos a través de técnicas que
analizan de manera simultánea al conjunto de variables.
• Tener la competencia y usar el análisis multivariado
para una efectiva toma de decisiones es importante en
el ámbito de investigación.
Estadística multivariada
Permite establecer a partir de numerosos datos y
variables:
• Ciertas relaciones entre ellos.
• Investigar estructuras latentes.
• Ensayar diversas maneras de organizar dichos datos.
• Transformarlos y presentarlos bajo una forma nueva mas
asequible, reduciéndolos hasta componer un resumen lo
mas completo posible.
Análisis Multivariado de Datos
• Una serie de análisis estadísticos univariados realizados
separadamente puede conducir a conclusiones parciales
de los resultados, ya que se ignora la relación o
interdependencia entre variables.
• Las técnicas multivariadas constituyen una herramienta
alternativa para analizar datos en términos de muchas
variables y permiten extraer la máxima información
posible del conjunto de datos.
Métodos de Dependencia Vs. Interdependencia
Dependencia: técnicas
multivariadas apropiadas cuando
una o más de las variables pueden
identificarse como variables
dependientes y el resto como
variables independientes.
Ejemplos: análisis de
regresión múltiple, análisis
discriminante, ANOVA y
MANOVA
Interdependencia: técnicas
estadísticas multivariadas en las
que se examina un conjunto de
relaciones interdependientes. El
objetivo es agrupar las variables de
alguna manera.
Ejemplos: análisis factorial,
análisis de conglomerados y
escalado multidimensional.
Clasificación de las técnicas de análisis
multivariado de datos
• En el campo multivariado pueden utilizarse diferentes
enfoques, tanto por los distintos tipos de situaciones que
se presentan al obtener los datos, como por el objetivo
específico del análisis.
• Los más importantes se describen a continuación:
Simplificación de la estructura o reducción de
los datos
• El objetivo es encontrar una manera simplificada de
representar el universo de estudio.
• Esto puede lograrse mediante la transformación de un
conjunto de variables interdependientes en otro conjunto
de variables independientes o en otro conjunto de menor
dimensión.
• Las técnicas que se utilizan con mayor frecuencia son: ACP
(análisis de componentes principales) y el AF (análisis
factorial)
Métodos de ordenamiento y agrupación
• Tratan de crear grupos de objetos o de variables que sean
similares.
• Alternativamente, tratan de generar reglas para clasificar
objetos dentro de grupos bien definidos.
• Las técnicas que se utilizan con mayor frecuencia son:
métodos de clasificación jerárquica (Cluster) y no
jerárquica, análisis discriminante.
Métodos para investigar las relaciones de
dependencia entre variables
• Para ello se seleccionan del conjunto de datos, ciertas
variables (una o más) y se estudia su dependencia de las
restantes.
• Entre los métodos para detectar dependencia
comprenden el análisis de regresión múltiple, regresión
multivariada, análisis de correlación canónica, análisis
discriminante.
Formulación y prueba de hipótesis
• A partir de un conjunto de datos es posible encontrar
modelos que permitan formular hipótesis en función de
parámetros estimables.
• Una de las técnicas empleadas es el MANOVA
(Multivariate Analysis of Variance), prueba T de Hotelling y
el Análisis de Varianza con medidas repetidas.
Tablas de variables × variables
• Se trata de tablas en que tanto las filas como las
columnas describen a variables, o a modalidades de
éstas, en el caso cualitativo.
• Las tablas usadas en este caso son conocidas como:
tablas de doble entrada, tablas de asociación, tablas de
contingencia o distribuciones conjuntas de frecuencias.
• Estas tablas presentan dos márgenes, cada cual con los
totales referentes a una de las variables.
Resumen:
1. Reducción de datos o simplificación estructural: El objeto de estudio se
representa de la forma más sencilla posible sin sacrificar información valiosa.
Esto facilita la interpretación. Ejemplo: Análisis de Componentes Principales
(PCA).
2. Clasificación y agrupación: se crean grupos de objetos o variables "similares",
en función de las características evaluadas. Ejemplo: Análisis Discriminante,
Análisis de Conglomerados.
3. Investigación de la dependencia entre variables: el estudio de la estructura de
covarianza ayudará a determinar la naturaleza de la relación entre variables.
Ejemplo; Análisis de correlación canónica.
4. Predicción: la relación entre variables se puede determinar con el fin de
predecir los valores de una o más variables sobre la base de las observaciones
de las otras variables. Ejemplo: regresión lineal multivariante, análisis de
varianza multivariante (MANOVA).
Organización de datos multivariados
La mayoría de los conjuntos de
datos multivariados se pueden
representar en un formato
rectangular, en el que los elementos
de cada fila corresponden a los
valores de las variables de una
unidad particular y los elementos de
las columnas corresponden a los
valores tomados por una variable
particular.
ID
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
age
18
17
15
15
16
16
16
17
15
15
15
15
15
15
15
16
16
16
17
16
15
15
16
16
15
16
15
15
16
16
15
15
15
15
Pstatus
A
T
T
T
T
T
T
A
A
T
T
T
T
T
A
T
T
T
T
T
T
T
T
T
T
T
T
T
A
T
T
T
T
T
Medu
4
1
1
4
3
4
2
4
3
3
4
2
4
4
2
4
4
3
3
4
4
4
4
2
2
2
2
4
3
4
4
4
4
3
Fedu
4
1
1
2
3
3
2
4
2
4
4
1
4
3
2
4
4
3
2
3
3
4
2
2
4
2
2
2
4
4
4
4
3
3
failures famrel
0
0
3
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
3
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
4
5
4
3
4
5
4
4
4
5
3
5
4
5
4
4
3
5
5
3
4
5
4
5
4
1
4
2
5
4
5
4
4
5
freetime goout
3
3
3
2
3
4
4
1
2
5
3
2
3
4
5
4
2
3
5
1
4
4
5
4
3
2
2
2
3
4
4
3
5
3
Dalc
4
3
2
2
2
2
4
4
2
1
3
2
3
3
2
4
3
2
5
3
1
2
1
4
2
2
2
4
3
5
2
1
2
2
Walc
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
2
1
1
1
2
1
5
3
1
1
1
health
1
1
3
1
2
2
1
1
1
1
2
1
3
2
1
2
2
1
4
3
1
1
3
4
1
3
2
4
1
5
4
1
1
1
3
3
3
5
5
5
3
1
1
5
2
4
5
3
3
2
2
4
5
5
1
5
5
5
5
5
5
1
5
5
5
5
5
2
absences
6
4
10
2
4
10
0
6
0
0
0
4
2
2
0
4
6
4
16
4
0
0
2
0
2
14
2
4
4
16
0
0
0
0
Arreglos matriciales
• Los datos anteriores se pueden organizar en forma de
una matriz X de orden (n x p) de la siguiente manera:
Media y varianza
Univariado
Multivariado
X
μ
𝜇1
𝜇 = 𝜇2
𝜇3
Media
Varianza
S2
σ2
𝜎12
Σ=
𝜎21
𝜎12
𝜎22
Gracias!
Descargar