MI Medicion Estadistica2016

Anuncio
METODOLOGÍA DE LA INVESTIGACIÓN
Individuo y Población
Selección de la muestra, delimitación de la población
Muestras probabilísticas y no probabilísticas
Recolección de los datos
Tipos de variables: continuas, discretas, atributos
La medición, confiabilidad y validez
Codificación y generación de archivos de datos
Estadística Descriptiva y Estadística Inferencial
2016
INDIVIDUO y POBLACIÓN
Población Conjunto de todos los casos que concuerdan con las especificaciones
Muestra
Subconjunto de casos representativos
Delimitación de la Población Lo más precisa posible
Ejemplos:
Pautas para el manejo de plagas de roedores
Conjunto de todos los individuos de una determinada especie que viven en el Departamento Calamuchita
POR QUÉ UTILIZAR MUESTRAS

Ahorro de tiempo y costos

Imposibilidad de estudiar todos los individuos

Aumentar la calidad del estudio

Selección de muestras específicas
Trabajar con observaciones más exactas y generalizables
Reducción de heterogeneidad ‐ Criterios de inclusión / exclusión
Metodología de la Investigación ‐ 2016
1
SELECCIÓN DE LA MUESTRA
 Muestra probabilística
Todos los individuos de la población tienen la misma probabilidad de ser elegidos
‐ Muestreo Aleatoria Simple de tamaño n
Todas las muestras tienen igual probabilidad de ser elegidas
CON reemplazo ‐ SIN reemplazo
‐ Muestreo Estratificado (homogéneos internamente)
Los subgrupos de la población deben estar representados
‐ Muestreo por Conglomerados (heterogéneos internamente)
Los subgrupos de la población deben estar representados
 Muestra no probabilística
La posibilidad de ser elegidos depende del tema y tipo de estudio a realizar
‐ No se puede calcular el error de medición
‐ NO generalizable a la población
‐ Muestreo Intencional (selección de casos característicos)
‐ Muestreo Accidental (hasta completar el tamaño muestral)
Metodología de la Investigación ‐ 2016
TAMAÑO DE LA MUESTRA
 Muy grande
Desperdicio de recursos
 Muy pequeño
Errores por resultados aleatorios, incapacidad de detectar diferencias
 Adecuado
Depende de:
‐ lo que se quiere comprobar
‐ el nivel de confianza deseado para trabajar
Metodología de la Investigación ‐ 2016
2
RECOLECCIÓN DE LOS DATOS
 DATO
Observaciones o medidas tomadas sobre la más pequeña unidad muestral
Ejemplo: Individuos, colonias de hormigas, cantidad DNA/célula espermática
 MUESTRA
Colección de observaciones individuales seleccionadas por un procedimiento determinado
Ejemplo: 100 pesos de ratas ; el peso de un individuo en el tiempo ; etc.
 NATURALEZA DE LOS DATOS
Morfológicos, fisiológicos, crecimiento y desarrollo, genéticos taxonómicos, ecológicos, paleontológicos, etc.
Ejemplo: Longitud, peso, anchura, altura, tenor de glucosa en sangre, presión arterial, tamaño población, grupos sanguíneos, etc.
 INSTRUMENTO DE RECOLECCIÓN
Formularios, libretas de campo o cuadernos de protocolo y planillas
 ALMACENAMIENTO DE INFORMACIÓN
Archivos electrónicos, programas Excel, Access, OpenOffice, LibreOffice
Metodología de la Investigación ‐ 2016
VARIABLE
Propiedad con respecto a la cual los individuos de una muestra se diferencian en algo verificable
Ejemplo: concentración de productos químicos, tasas procesos biológicos, frecuencias génicas, lecturas de óptica o electrónica, etc.
 Mensurables
Diferentes estados expresados en forma numérica
‐ CONTINUAS
Infinitos valores en un intervalo dado
Longitudes, áreas pesos,ángulos, temperatura, tiempo son ejemplos de …
‐ DISCONTINUAS O DISCRETAS
Número fijo de valores
# segmentos, cerdas, glándulas, prole, colonias son ejemplos de …
 Ordinales
Ordenadas o clasificadas por su magnitud
Orden de emergencia de embriones de pollo (1 a 10) es ejemplo de …
 Atributos
Presencia/Ausencia, 2‐3 estados, % datos de enumeración
Color  longitud de onda es ejemplo de …
Metodología de la Investigación ‐ 2016
3
MAGNITUD DE LA VARIACIÓN BIOLÓGICA
 BAJA
 ALTA
‐ Temperatura del cuerpo
‐ Variaciones morfológicas
‐ Crecimiento lento
‐ Estructura Corporal
‐ Estatura
‐ Longitud de la cabeza
MENOR dependencia ambiental
‐ Caracteres bioquímicos
‐ Variaciones fisiológicas
‐ Ritmo cardíaco
‐ Peso
‐ Glucemia
‐ Colesterol
MAYOR dependencia ambiental
Metodología de la Investigación ‐ 2016
VARIABLES
Variables independientes:
NO dependen del fenómeno estudiado
Variables dependientes:
Temperatura
(T)
Dependen del fenómeno estudiado (son efecto, NO causa)
30
t= Variable independiente
T= Variable dependiente
20
10
Hora del día
(t)
0
0
24
Metodología de la Investigación ‐ 2016
4
LA MEDICIÓN, CONFIABILIDAD Y VALIDEZ
Metodología de la Investigación ‐ 2016
LA MEDICIÓN, CONFIABILIDAD Y VALIDEZ
 MEDICIÓN
Producción de varios resultados diferentes
¿VERDADERO valor de la medida?
¿Cómo expresar el resultado de una medición?
Procedimiento numérico
Valor más realista, que represente una información
intercambiable entre distintos observadores
Promedio de las lecturas y error medio cuadrático
¿Cuándo aceptar el resultado de una medición?
Evaluación de coincidencias y discrepancias
Comparación con valores de la misma magnitud
obtenidos por otros observadores
Metodología de la Investigación ‐ 2016
5
LA MEDICIÓN, CONFIABILIDAD Y VALIDEZ
Promedio de las lecturas (u observaciones)
(Valor más probable de la cantidad medida)
Error medio cuadrático
Varianza (cuadrado medio de las observaciones con respecto a la media)
Error medio cuadrático
de las observaciones
(amplitud de la dispersión de las medidas)
Para varias series de mediciones del mismo observador existe el:
Error medio cuadrático
de las medias de las lecturas Metodología de la Investigación ‐ 2016
ERROR DE MEDICIÓN Y APRECIACIÓN DEL INSTRUMENTO
(intervalo de incerteza)
‐E
¿Cómo obtener un intervalo pequeño?
E
Aumentando n
X : límite de apreciación del instrumento
Recomendación: El intervalo de incerteza debe ser del orden de 0,1X
Ejemplo: Medición con calibre sobre la longitud de un cuerpo determinado
Lecturas realizadas (mediciones) :
X = 0,1mm
s  0,07mm
E  0,02mm
12,6 ; 12,5 ; 12,5 ; 12,6 ; 12,4 ; 12,5 ; 12,6 ; 12,5
X = 12,53 ± 0,02 mm
X > s > E
Metodología de la Investigación ‐ 2016
6
ORIGEN DE LA INCERTIDUMBRE

Problemas técnicos
‐ Definición de la unidad de medida,
‐ Construcción del patrón que las materializa,
‐ Determinación o definición de la unidad a medir,
‐ Apreciación del aparato de medición y
‐ Errores del observador

Naturaleza del fenómeno
Fenómenos biológicos: variación en las componentes genética y ambiental de un rasgo cuantitativo

Errores sistemáticos
Aparato y observador
Metodología de la Investigación ‐ 2016
EXACTITUD y PRECISIÓN
Exactitud: cercanía de un dato medido o computado a su verdadero valor
Precisión: proximidad entre las medidas repetidas de un mismo objeto o fenómeno
Valor Verdadero
Inexactos ‐ precisos
Inexactos ‐ imprecisos
Exactos ‐ precisos
Exactos ‐ imprecisos
Una balanza parcial pero sensible puede dar pesos muy precisos pero inexactos
Una balanza insensible puede dar una lectura exacta pero será imprecisa
La PRECISIÓN es más importante que la EXACTITUD
Metodología de la Investigación ‐ 2016
7
EXPRESIÓN DE LAS MEDICIONES
 VARIABLES CONTINUAS
Son aproximaciones
 VERDADERO VALOR DE UNA MEDICIÓN
Permanece desconocido
 RECOMENDACIONES
El último dígito de una medición debe denotar precisión
El intervalo dentro del cual consideramos que se encuentra el verdadero valor
debe tener una cifra más que la última cifra registrada
Ejemplo: 12,3 mm significa que el verdadero valor se encuentra en el intervalo
[12,25 – 12,35]
Si la medición fuese 12,32 mm, el verdadero valor estaría en el intervalo
[12,315 – 12,325]
Metodología de la Investigación ‐ 2016
CODIFICACIÓN Y GENERACIÓN DE ARCHIVOS DE DATOS
EJEMPLOS:
SEXO Masculino 1
LOCALIDADES
Femenino 2
1
Juvenil 2
Adulto
3
Maduro 4
Senil
5
Río Cuarto 1
Sampacho 2
AlpaCorral 3
EDAD Infantil
VARIABLES
Longitud cabeza
LC
Largo brazo
LB
Glucosa
Glu
Grupo Sanguíneo ABO
Rh
Metodología de la Investigación ‐ 2016
8
CODIFICACIÓN Y GENERACIÓN DE ARCHIVOS DE DATOS
EJEMPLOS:
SEXO Masculino 1
LOCALIDADES
Femenino 2
EDAD Infantil
Juvenil
Adulto
Maduro
Senil
Río Cuarto 1
Sampacho 2
AlpaCorral 3
1
2
3
4
5
Metodología de la Investigación ‐ 2016
RESUMEN Y PRESENTACIÓN DE LA INFORMACIÓN
 RECOLECCIÓN DE LOS DATOS
Graboverificación
 CRÍTICA Y CORRECCIÓN
Errores gruesos
 RESUMEN Y COMPILACIÓN
Tabla de doble entrada, cuadros o gráficos
 VARIABLES DISCRETAS
Gráfico de distribución de barras
 VARIABLES CONTINUAS
Histograma de frecuencias Cuando N  : curvas de frecuencia
Metodología de la Investigación ‐ 2016
9
REPRESENTACIONES GRÁFICAS
 VARIABLES CONTINUAS
HISTOGRAMA
DIAGRAMA DE DISPERSIÓN
Metodología de la Investigación ‐ 2016
REPRESENTACIONES GRÁFICAS
 VARIABLES CONTINUAS
POLÍGONO DE FRECUENCIAS
RECTA DE REGRESIÓN
DIAGRAMA DE DISPERSIÓN
Metodología de la Investigación ‐ 2016
10
REPRESENTACIONES GRÁFICAS
 VARIABLES DISCRETAS
GRÁFICOS DE BARRAS
GRÁFICOS DE BARRAS AGRUPADAS
 VARIABLES CUALITATIVAS
Metodología de la Investigación ‐ 2016
REPRESENTACIONES GRÁFICAS
 VARIABLES DISCRETAS
GRÁFICOS DE TORTA O SECTORES CIRCULARES
 VARIABLES CUALITATIVAS
Metodología de la Investigación ‐ 2016
11
REPRESENTACIONES GRÁFICAS
 VARIABLES DISCRETAS
GRÁFICOS DE TORTA O SECTORES CIRCULARES
 VARIABLES CUALITATIVAS
Metodología de la Investigación ‐ 2016
REPRESENTACIONES GRÁFICAS
Metodología de la Investigación ‐ 2016
12
ANÁLISIS ESTADÍSTICO
ESTADÍSTICA DESCRIPTIVA
 Reducción de datos
 Análisis de la distribución
 Medidas de posición, dispersión y forma
 Gráficos
ESTADÍSTICA INFERENCIAL
 Obtener a partir de una muestra conclusiones válidas para la totalidad de la población
Metodología de la Investigación ‐ 2016
DESCRIPCIÓN DE LOS DATOS
 Reducción de datos
 Análisis de la distribución
 Medidas de posición, dispersión y forma
 Gráficos
 VARIABLES (continuas – discretas)
 DISTRIBUCIÓN DE FRECUENCIAS
 CARACTERIZACIÓN ‐ PROPIEDADES
ESTADÍSTICOS CENTRALES Medidas de posición
ESTADÍSTICOS DE DISPERSIÓN Medidas de amplitud
‐ Media ‐ Mediana
‐ Modo
‐ Amplitud o Rango
‐ Varianza , desvío estándar
‐ Coeficiente de variación
Metodología de la Investigación ‐ 2016
13
DESCRIPCIÓN DE LOS DATOS
 Reducción de datos
 Análisis de la distribución
 Medidas de posición, dispersión y forma
 Gráficos
ESTADÍSTICOS CENTRALES Medidas de posición
‐ Media ‐ Mediana
‐ Modo
‐ La media es sensible a valores extremos
‐ La mediana es apropiada para distribuciones simétricas (pruebas no paramétricas)
‐ La moda o modo indica la clase de mayor frecuencia (distribuciones bimodales y multimodales)
ESTADÍSTICOS DE DISPERSIÓN Medidas de amplitud
‐ Amplitud o Rango
‐ Varianza , desvío estándar
‐ Coeficiente de variación
Metodología de la Investigación ‐ 2016
DESCRIPCIÓN DE LOS DATOS
MEDIDAS DE FORMA DE LA DISTRIBUCIÓN
Asimetría
Estadístico g1
g1 = 0 (distribución simétrica) igual concentración de valores a la derecha y a la izquierda de la media
g1 > 0 (distribución asimétrica positiva) mayor concentración de valores a la izquierda de la media que a su derecha
g1 < 0 (distribución asimétrica negativa)
mayor concentración de valores a la derecha de la media que a su izquierda
Curtosis
Estadístico g2
g2 = 0 (distribución mesocúrtica) Grado medio de concentración alrededor de los valores centrales de la variable
g2 > 0 (distribución leptocúrtica) Elevado grado de concentración alrededor de los valores centrales de la variable
g2 < 0 (distribución platicúrtica)
Reducido grado de concentración alrededor de los valores centrales de la variable
Metodología de la Investigación ‐ 2016
14
LA DECISIÓN ESTADÍSTICA
PRUEBAS DE HIPÓTESIS SOBRE UN PARÁMETRO POBLACIONAL
a)
b)
c)
d)
e)
f)
Hipótesis nula Ho
La que contrastamos Los datos pueden refutarla
No debería ser rechazada sin una buena razón
Elección de H0
Elección de H1 o Ha
Criterio de la dócima o prueba
Muestras y estadísticos
Comprobación de H0
Conclusiones
Hipótesis alternativa H1
Niega a H0 (y creemos que es ‘mejor’)
Los datos pueden mostrar evidencia a favor
No debería ser aceptada sin una gran evidencia a favor
H0 cierta
No Rechazo H0
Rechazo H0
Acepto H1
H0 Falsa
Correcto
Error de tipo II
El tratamiento no tiene efecto y así se decide
El tratamiento sí tiene efecto pero no lo percibimos
Probabilidad 1‐α
Probabilidad β
Error de tipo I
Correcto
El tratamiento no tiene efecto pero se decide que sí
El tratamiento tiene efecto y el experimento lo confirma
Probabilidad α
Probabilidad 1‐β
Metodología de la Investigación ‐ 2016
ALGORITMOS, PROCEDIMIENTOS Y PROGRAMAS DE COMPUTACIÓN
Investigación en Ciencias Biológicas
Problema: Gran cantidad de datos
Garantizar: confiabilidad, eficiencia, rapidez, seguridad, precisión y comodidad
Proceso electrónico de datos
Computadoras
Metodología de la Investigación ‐ 2016
15
Sistemas operativos: DOS , WINDOWS , LINUX
Editor de textos
Microsoft Office
Word , PowerPoint 
OpenOffice,
LibreOffice,
Google Drive, etc
Planilla de cálculo
EXCEL,
OpenOffice,
LibreOffice,
Google Drive, etc
Programas estadísticos
SAS, SPAD‐N, SPSS, STATA, STATISTICA, SYSTAT, y el argentino INFOSTAT
SIMULACIÓN
Metodología de la Investigación ‐ 2016
FIN
INDIVIDUO y POBLACIÓN SELECCIÓN DE LA MUESTRA MUESTRAS PROBABILÍSTICAS
TIPOS DE VARIABLES
MEDICIÓN Y CONFIABILIDAD
CODIFICACIÓN DE DATOS
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA INFERENCIAL
Metodología de la Investigación ‐ 2016
16
Descargar