Subido por Dana

CAPÍTULO 1 DIAPOSITIVAS ESTADÍSTICA ONLINE.pptx f13b14673fea66e4d094af33500c6905

Anuncio
Asignatura:
Estadística
E-Learning
Profesor: Ing. David Hidalgo D. Mgs
Conoce a tu maestro
David Hidalgo D.
Graduado de Ingeniero en Estadística en la Escuela Superior
Politécnica del Litoral y Magister en Investigación de Mercados.
David Hidalgo Delgado
Posee 12 años de experiencia como profesor en la Educación
Superior y 21 años de experiencia en el Campo Empresarial como
Jefe Nacional de Distribución en Editorial Vistazo.
Es especialista en Administración Operacional de Procesos y
Estudios de Mercados.
Tutor de Trabajos de titulación de tercer nivel de los alumnos del
Tecnológico Universitario Espíritu Santo.
@TWITTER
@hidalgodavid77
01
Conceptos elementales de
estadística
Resumen de datos: distribución de frecuencias y representaciones
gráficas.
02
Descripción de los datos
Medidas de tendencia central para datos no agrupados y
agrupados.
UNIDADES
APRENDIZAJE
03
Medidas de dispersión y
asimetría
Medidas para datos no agrupados y agrupados..
Estudio de conceptos
probabilísticos.
Toma de decisiones empresariales.
04
Análisis de correlación y
regresión simple.
relaciones de las variables creando una función.
05
Conceptos elementales de estadística.
Resumen de datos - distribución de
frecuencias y representaciones gráficas.
Describe la naturaleza, conceptos, importancia, aplicación de la estadística y la
recopilación de datos para su clasificación, agrupación e interpretación.
Unidad No. 1
01
Generalidades de la Estadística
y sus tipos de variables.
02
Tablas de Distribución de
Frecuencias.
03
Representación gráfica de una
distribución de frecuencias.
04
Ley de Pareto.
05
Gráficos complementarios para
el análisis de datos.
CONTENIDO
UNIDAD
Objetivos
Reconoce e identifica las diferentes
actividades del proceso estadístico.
Reconoce e identifica las diferentes
variables estadísticas y su respectiva
clasificación de escalas.
Resuelve problemas de análisis de
información basado en la construcción y
aplicación de tablas de frecuencia.
Bibliografía
(Lind / Marchal / Wathen) (2009).
Estadística aplicada a los negocios y la
economía.
Walpole /Myers. (2010). Probabilidad y
Estadística para ingenierías y Ciencias.
SUBTEMA 1: Generalidades de la Estadística y sus tipos de
variables
¿Qué es la estadística?
Métodos y procedimientos destinados a recoger, clasificar, resumir,
hallar regularidades, analizar los datos y realizar inferencias con el fin
de ayudar a la toma de decisiones y en su caso formular predicciones.
Estadística
Introducción
Etapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico
cuyas etapas son:
1)
Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o
población.
2)
Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de
investigación.
3)
Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en
el estudio.
4)
Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos
analizados para obtener conclusiones generales.
5)
Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido
interpretar los datos y llegar a conclusiones sobre la población
Estadística
Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes
comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y
vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna
relación con su edad u otras características.
10
Objetivo de la estadística
El objetivo de la estadística es mejorar la comprensión de
hechos a partir de datos. (Moore, p.267)
El principal objetivo de la estadística es hacer inferencias acerca
de una población, con base en la información contenida en una
muestra. (Pérez, p.172)
Importancia de la estadística
La estadística resulta fundamental para conocer el comportamiento de ciertos eventos,
por lo que ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar
y en los diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje
que permite comunicar información basada en datos cuantitativos.
Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida se toman con base en la
aplicación de la Estadística. Pongamos algunos ejemplos.
La estadística es de gran importancia en la investigación científica debido a que:
Permite una descripción más exacta.
Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar.
Permite resumir los resultados de manera significativa y cómoda.
Nos permite deducir conclusiones generales.
La evolución de la estadística ha llegado al punto en que su proyección se percibe en casi todas las
áreas de trabajo. También abarca la recolección, presentación y caracterización de información para
ayudar tanto en el análisis e interpretación de datos como en el proceso de la toma de decisiones. La
estadística es parte esencial de la forma profesional, es hasta cierto punto una parte necesaria para
toda profesión.
Clasificación de la Estadística
El estudio de la estadística se divide en dos categorías: la estadística
descriptiva y la estadística inferencial.
La estadística descriptiva es la que se encarga de recolectar, describir, organizar y
presentar los datos. Utiliza encuestas, tablas, gráficas, y desarrolla cálculos que
nos explican que está sucediendo en lo que estamos estudiando.
La estadística descriptiva resume en forma numérica o gráfica el conjunto de datos
que se están analizando. Si utilizamos las herramientas y fórmulas de la estadística
descriptiva lograremos describir lo que está sucediendo en la muestra, NO SE
PUEDE GENERALIZAR A LA POBLACIÓN.
La estadística inferencial, va más allá, es la encargada de generalizar los datos.
Permite hacer conclusiones por lo que tiene características inductivas, es decir,
que del estudio que se hace con una muestra, se puede saber que va a suceder
con toda la población.
La estadística inferencial permite realizar conclusiones o inferencias basándose
en los resultados obtenidos de una muestra. Por ejemplo, a partir de una muestra
representativa tomada de los habitantes de una ciudad, es posible inferir la
votación de todos los ciudadanos considerando un error de aproximación.
Definiciones:
Población: Colección o conjunto de personas, objetos o eventos que poseen
características comunes, cuyas propiedades serán analizadas.
Muestra: Subconjunto de la población que comparte una determinada característica.
Variable estadística: Información a recopilar, en ella se describen las características
de la muestra. Existen dos tipos: Cualitativas y Cuantitativas. Serán cualitativas
aquellas que expresen características o cualidades diferentes; y serán cuantitativas
cuando expresen argumentos numéricos.
Estadística
Variable: corresponde a la característica de la Unidad de Análisis
TIPOS DE VARIABLES
Variables Cualitativas
Variables Cuantitativas
CONTINUA
DISCRETA
ORDINAL
NOMINAL
Intervalo
Toma valores enteros
Ejemplos: Número de Hijos, Número de empleados de una
empresa, Número de asignaturas aprobadas en un semestre,
etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc.
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
Característica o cualidad cuyas
categorías no tienen un orden
preestablecido.
Ejemplos: Sexo, Deporte Favorito,
etc.
Característica o cualidad cuyas categorías tienen
un orden preestablecido.
Ejemplos: Calificación (S, N, A); Grado de
Interés por un tema, etc.
18
SUBTEMA 2:
Tablas de Distribución de Frecuencias.
Distribución de frecuencias
Las distribuciones de frecuencias son tablas en que se dispone las
modalidades de la variable por filas. En las columnas se dispone el número
de ocurrencias por cada valor, porcentajes, etc. La finalidad de las
agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos.
Ejemplo: Se quiere conocer si los alumnos de estadística del TES está a
favor o en contra de la exhibición de imágenes violentas por televisión, para
lo cual se pueden recoger datos y tabularlos.
La inspección de los datos originales no permite responder fácilmente a cuestiones
como cuál es la actitud mayoritaria del grupo, y resulta bastante más difícil
determinar la magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañados del número de veces (la frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como fi).
Generalmente las tablas incluyen varías columnas con las frecuencias relativas y
acumuladas.
SUBTEMA 3: Representación gráfica de una distribución de frecuencias .
* Existen dos tipos de distribución de frecuencias, con datos no agrupados y con
datos agrupados.
Distribución en datos NO agrupados
Se utiliza preferentemente cuando las opciones de la variable son pocas.
Ejemplo: Al lanzar un dado 10 veces, se obtuvo la siguiente información: 1 – 6 –
4–3–1–2–6–5–1–3
Frecuencia: Corresponde a la cantidad de veces
que se encuentra un dato en una muestra.
Rango: Es la diferencia entre el dato mayor y el menor.
Rango: 6 – 1 =5
1–6–4–3–1–2–6–5–1–3
Al construir la tabla de frecuencias, se obtiene:
Número
Frecuencia
1
3
2
1
3
2
4
1
5
1
6
2
Total datos:
10.
Al sumar la columna frecuencia, se obtiene el total de datos
(n).
Distribución en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de posibilidades, si es cuantitativa continua, debemos agrupar los datos en intervalos
semiabiertos, excepto el último, que es cerrado. Al agrupar los datos en intervalos, se debe calcular la
“marca de clase” que Corresponde al promedio entre los extremos del intervalo.
Ejemplo:
Peso (Kg.)
Frecuencia
Marca de clase
[55,59[
2
57
[59,63[
5
61
[63,67[
3
65
[67,71[
7
69
[71,75]
4
73
R
A= NC
A: Amplitud=Longitud del Intervalo
R: Rango
NC: Número de Clases
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS
PARA DATOS AGRUPADOS EN INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los
cálculos es necesario agruparlos, a estos grupos se los llama intervalos o
clases. Un intervalo es una serie de números incluidos entre dos extremos,
así por ejemplo, el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45,
siendo 40 el límite inferior, 45 el límite superior, 39,5 límite real inferior (límite
inferior disminuido en 5 décimas) y 40,5 el límite real superior (límite superior
aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos
agrupados en intervalos son:
1)
Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la diferencia entre el
valor mayor y el menor de los datos.
2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y
mayor de 12, ya que un número mayor o menor de clases podría oscurecer
el comportamiento de los datos. Para calcular el número de intervalos se aplica la
regla de Sturges:
Siendo n el tamaño de la muestra.
3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el
número de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior más
cercano. Esto altera el valor de rango por lo que es necesario efectuar un ajuste
así:
El exceso de 3 que se tiene en este caso se distribuye entre xmáx y xmín. Por lo general se agrega al mayor y se quita al menor. Como
por ejemplo, se podría agregar 2 al valor mayor y quitar 1 al valor menor, obteniéndose los siguientes nuevos valores:
O también se podría agregar 1 al valor mayor y quitar 2 al valor menor, obteniéndose los siguientes nuevos valores:
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase, comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene sumando los límites superior (Ls) e inferior (Li)
del intervalo y dividiendo ésta suma entre 2
EJEMPLO ILUSTRATIVO
A 40 estudiantes se les pidió que estimen el número de horas que habrían dedicado a estudiar la semana pasada (tanto en clase como fuera
de ella), obteniéndose los siguientes resultados:
36
30
47
60
32
35
40
50
54
35
45
52
48
58
60
38
32
35
56
48
30
55
49
39
58
50
65
35
56
47
37
56
58
50
47
58
55
39
58
45
SUBTEMA 4: Ley de Pareto.
Ley de Pareto
La ley de Pareto es un principio que establece que el 20% del esfuerzo destinado a una tarea genera un 80% de los resultados. Esto es
aplicable a distintas áreas, como la actividad empresarial o el ámbito personal.
Otra forma de entender la ley de Pareto es que el 20% de las causas origina el 80% de las consecuencias. También se le conoce como la
regla 80/20.
Utilidad de la ley Pareto
El objetivo de recurrir a la ley de Pareto no es definir una ley de cumplimiento obligatorio, sino intentar optimizar el desarrollo de
determinadas actividades o procesos. Por ejemplo, le permite a una compañía descubrir cuál es el segmento de clientes que le genera más
valor, el cual se sospecha que podría representar un 20%. Es decir, una quinta parte de su cartera. Dicho grupo quizás deba recibir mayor
atención por parte de la firma, con despliegue de publicidad u ofertas.
De igual modo, una persona puede intentar identificar cuál es el 20% de las actividades que realiza que le genera un mayor bienestar. De ese
modo, puede priorizarlas.
En suma, la ley de Pareto nos insta a centrarnos en lo que realmente es importante para alcanzar un determinado objetivo.
Origen de la ley de Pareto
La ley de Pareto fue enunciada por primera vez por el economista y sociólogo Vilfredo Pareto en el libro «Cours d’économie politique» de
1896.
Posterior a Pareto fue Joseph Jurán quien aplicó y popularizó este principio a otros ámbitos de la economía, particularmente, en la gestión de
calidad. En esta materia, se puede sospechar, por ejemplo, que el 80% de los defectos se genera en un 20% de los procesos.
SUBTEMA 5: Gráficos complementarios para el análisis de datos.
Esos datos, dependiendo de sus
características, se pueden representar en
forma gráfica.
i
f
rá
s
o
c
G
es
í
d
ta
s
o
c
i
t
s
Diagrama de
sectores
Diagrama de
barras
Polígono de
frecuencias
Histograma
Un diagrama de sectores se puede
Diagrama de sectores
utilizar para todo tipo de variables, pero
se usa frecuentemente para las variables
cualitativas.
Los datos se representan en un
círculo, de modo que el ángulo de
cada sector es proporcional a la
frecuencia absoluta
correspondiente.
Ejemplo
En una clase de 30
alumnos, 12 juegan a
baloncesto, 3 practican la
natación, 4 juegan al fútbol
y el resto no practica
ningún deporte.
Un diagrama de barras se utiliza para representar datos cualitativos o datos
cuantitativos de tipo discreto.
Diagrama de barras
Se representan sobre unos ejes de coordenadas.
En el eje de abscisas se colocan los valores de la variable, y sobre el eje de
ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia, en forma vertical u horizontal.
Ejemplo 1
Un estudio hecho al conjunto de los 20 alumnos de una clase para
determinar su grupo sanguíneo ha dado el siguiente resultado:
Ejemplo 2
Polígono de frecuencias
Un polígono de frecuencias se forma uniendo los extremos de las
barras de un diagrama de barras mediante segmentos.
También se puede realizar trazando los puntos que representan
las frecuencias y uniéndolos mediante segmentos.
Ejemplo 1
Ejemplo 2
Las temperaturas en un día invernal de una ciudad han sufrido las
siguientes variaciones:
Temperatura (ºC)
Hora
Histograma
Un histograma es una representación gráfica de una variable en
forma de barras.
Se utilizan para variables continuas o para variables discretas, con
un gran número de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por
base la amplitud del intervalo, y por altura, la frecuencia absoluta de
cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los
valores representados.
Ejemplo
El peso de 65 personas adultas viene dado
por la siguiente tabla:
En el histograma adjunto se graficaron dichos datos.
Este capítulo ya estamos en
condiciones de reconocer la
naturaleza, conceptos, importancia,
aplicación de la estadística y la
recopilación de datos para su
clasificación, agrupación e
interpretación.
Conclusiones
MUCHAS GRACIAS
Descargar