File - Portafolio stat 555 estadística para la toma de

Anuncio
Taller 1
1
Preguntas
Universidad Metropolitana en Bayamón
Escuela de Estudios Profesionales
STAT 555
Jennifer Vélez Claudio
S00153158
Prof. Sylvia Y Cosme Montalvo
18 de junio de 2015
Taller 1
2
Preguntas:
1. ¿Cuál es la diferencia entre muestra y población?
La población es una gran grupo o parte infinita en cambio la muestra es
una parte de esa población donde se destacan ciertas características.
2. ¿Cuál es la diferencia entre estadístico y parámetro?
Estadístico es una cantidad en números calculado sobre la muestra que
resume información sobre algún aspecto. Parámetro es una cantidad numérica
calculada sobre una población y resume los valores que esta toma en algún
atributo.
3. ¿Cuál es la diferencia entre estadística descriptiva e inferencia estadística?
La estadística descriptiva organiza, recopila y presenta datos de una
muestra de una población. La estadística inferencial, en cambio, trabaja con
muestras formadas por algunos individuos de la población.
4. Contraste variable aleatoria categórica con variable aleatoria numérica.
La variable categórica se presenta en información no numérica y la
numérica o cuantitativa son aquellos que resultan de mediciones o conteo.
5. Compare datos discretos de datos continuos.
Los datos discretos solo pueden tener ciertos valores como por ejemplo la
cantidad de estudiantes en un salón. Los datos continuos pueden tomar
cualquier valor como por ejemplo la cantidad de temperatura o la altura de una
persona.
6. Detalle la diferencia entre escala nominal y ordinal.
Los datos nominales se utilizan para identificar y clasificar en categorías.
Los datos ordinales describen el orden de los mismos a través de una escala.
En la escala, no hay manera de distinguir la diferencia relativa entre los grupos.
7. Detalle la diferencia entre escala de intervalo y de razón.
La escala de intervalo contiene variables numéricas cuyos valores
representan magnitudes y la distancia entre los números de su escala es igual.
Con este tipo de variables se pueden realizar comparaciones de igualdad y
desigualdad, establecer un orden dentro de sus valores y medir la distancia
existente entre cada valor de la escala. Las variables de razón poseen las
Taller 1
3
mismas características de las variables de intervalo, con la diferencia que
cuentan con un cero: El valor cero (0) representa la ausencia total de medida.
8. Explique las razones principales para obtener datos.
Para obtener información que será útil para alguna investigación, ayuda
en la toma de decisiones y a transmitir una información a otros.
9. ¿Cuál es la diferencia entre muestreo probabilístico y no probabilístico?
Los métodos de muestreo probabilísticos son en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de una
muestra. En los no probabilísticos no se tiene certeza de que la muestra extraída
sea representativa, ya que se seleccionan a los sujetos siguiendo determinados
criterios procurando, en la medida de lo posible, que la muestra sea
representativa.
10. ¿Cuáles son algunos riesgos potenciales al utilizar métodos de pecera para
seleccionar una muestra aleatoria simple?
Si se utiliza una muestra que no es pequeña el muestreo no será muy
eficaz.
11. Mencione la diferencia entre muestreo con reemplazo y muestreo sin reemplazo
El muestreo con remplazo es aquel en que un elemento puede ser
seleccionado más de una vez en la muestra para ello se extrae un elemento de
la población se observa y se devuelve a la población. En el muestreo sin
reemplazo no se devuelve los elementos extraídos a la población hasta que no
se hallan extraídos todos los elementos de la población que conforman la
muestra.
12. Contraste muestreo aleatorio simple con muestreo sistemático.
El contraste seria que el muestreo aleatorio simple se da un número a
cada persona de la población y se utiliza una tabla de dígitos aleatorios, para
elegir tantos sujetos como sea necesario para completar el tamaño de la
muestra requerida, mientras que en el muestreo sistemático se elige a la primera
persona al azar y el restante viene asociado a el mismo.
13. Compare muestreo estratificado y muestreo sistemático.
El muestreo estratificado y el muestreo sistemático se asemejan en que
los dos se aseguran que todos las partes de interés estarán debidamente
representados en la muestra solicitada.
Taller 1
4
14. Determine la diferencia entre muestreo estratificado y muestreo por
conglomerados (“cluster”)
En el muestreo estratificado se divide la población en grupos en función
de una característica determinada y después se muestrea cada grupo
aleatoriamente, para obtener la parte proporcional de la muestra, mientras que
en el muestreo por conglomerados, la muestra es un grupo de elementos de la
población que forman una unidad, a la que se llama conglomerado.
15. ¿Qué distingue a las cuatro fuentes potenciales de error cuando se manejan
encuestas diseñadas utilizando muestreo probabilístico?
Los errores de cobertura ocurren cuando se excluyen ciertos grupos de
elementos, de manera que no pueden ser incluidos en la muestra. El error por
falta de repuesta ocurre cuando no se reúnen datos sobre todos los elementos
de la muestra. El error de muestreo expresa la variación o diferencias al azar
que suceden de una muestra a otra con base en la probabilidad de que ciertos
individuos en particular sean elegidos en las muestras específicas y el error por
medición puede proceder de la ambigüedad en la redacción de las preguntas,
del efecto Hawthorne y el error del encuestado.
16. ¿Por qué es necesario organizar un conjunto de datos numéricos recopilados?
Es necesario porque facilita la lectura de los datos, se puede observar
mejor las relaciones entre ellos y realizar graficas estadísticas.
17. Detalle y explique los principios de excelencia gráfica.
Edward Tufte indica que la excelencia en las gráficas estadísticas consiste de:



Comunicar ideas complejas con claridad
Precisión
Eficiencia
18. Menciones las diferencias principales entre un arreglo ordenado y un diagrama
de tallo y hoja.
Las diferencias entre ellos es que el arreglo ordenado se acomodan los
datos de una variable numérica del más pequeño al más grande, sirve para
conocer mejor el rango de los valores delos datos y es útil cuando hay muchos
valores, y en el diagrama detallo y hoja permite ver como se distribuyen los
datos y donde hay concentraciones de los mismos.
19. ¿Cómo difieren el histograma y el polígono de frecuencias en cuanto a su
construcción, desarrollo y utilización?
El histograma es una gráfica de barras para datos numéricos agrupados
en la que se utilizan barras verticales para representar las frecuencias o
Taller 1
5
porcentajes de cada grupo. En el histograma no existen huecos entre las
barreras adyacentes. La variable de interés se coloca sobre el eje horizontal (x).
El eje vertical (y) representa la frecuencia o el porcentaje de los datos por cada
intervalo de clase. En el polígono de frecuencia se utilizan las marcas de clase
de cada intervalo para representar los datos de cada clase y luego graficar las
marcas de cada clase en frecuencias en su respectiva clase, como puntos sobre
una línea.
20. ¿Para qué es útil el polígono de frecuencias acumuladas?
Es útil ya que ayuda a representar distribuciones de frecuencias de
variables cuantitativas continuas, pero sólo para frecuencias acumuladas.
21. Detalle la importancia de construir una tabla resumen de frecuencias y por
cientos.
Su importancia es que nos indica la cantidad de datos que están
comprendidos en un intervalo de clase. Es el número de datos o elementos de la
muestra, que caen en un mismo intervalo de clase.
22. Mencione las ventajas y desventajas de utilizar un diagrama de barras, diagrama
circular (“pie chart”) o diagrama Pareto?
Las ventajas de utilizar una gráfica de barra es que se logra comparar
diferentes categorías utilizando barras individuales para representar los conteos
por categorías. El diagrama circular utiliza las partes de un círculo para
representar los valores de cada categoría. El tamaño de cada parte o porción del
circulo varía de acuerdo con el porcentaje en cada categoría, mientras que en la
gráfica de Pareto los valores de cada categoría se grafican como barras
verticales en orden descendente, de acuerdo con sus frecuencias, y se
combinan con una línea porcentual acumulada en la misma gráfica.
23. Contraste el diagrama de barras para datos categóricos con el histograma para
datos numéricos.
En una gráfica de barras de datos categóricos se comparan diferentes
categorías utilizando barras individuales para identificar los conteos, mientras
que en el histograma para datos numéricos se utiliza una gráfica con datos
numéricos agrupados en las que se utilizan barras verticales para representar
frecuencias y no existe espacio entre las barras adyacentes.
24. Explique por qué uno de los atributos sobresalientes del diagrama Pareto es su
habilidad de separar los pocos datos esenciales de los muchos datos triviales.
El principio de Pareto se presenta cuando la mayoría de los elementos en
un conjunto de datos ocurre en un número pequeño de categorías, mientras que
Taller 1
6
los pocos elementos restantes se distribuyen en una gran cantidad de
categorías. A estos dos grupos a menudo se les denomina los pocos vitales y
los muchos triviales.
25. ¿Qué tipos de por cientos pueden ayudar a interpretar los resultados obtenidos
en una tabla de contingencias a base de 2 variables categóricas?
Los tipos de por cientos que ayudan a interpretar estos resultados son los
porcentajes de cuotas, riesgo y media de las tasas de rendimiento.
26. ¿Cuáles son algunos aspectos éticos que deben estar presentes al presentar
datos en tablas y gráficas?
a. La escala en el eje principal debe comenzar en cero.
b. La gráfica bidimensional debe contener una escala parea cada eje.
c. Una gráfica no debe distorsionar los datos y debe incluir un título.
d. No debe tener información innecesaria que no transmita información útil.
e. Los ejes deben estar correctamente rotulados.
f. Se debe utilizar la gráfica más sencilla posible para un conjunto de datos.
Obtenga y presente una gráfica de un periódico o revista, que a su entender contenga
una representación gráfica inadecuada de alguna variable (puede ser numérica o
categórica). Explique por qué entiende que no es apropiada.
Es una gráfica de datos la cual está muy cargada y se dificulta el analizar la misma
MAPA CONCEPTUAL
MUESTRA
PLOBLACIÓN
Parte de la población
utilizada para la
investigación
ESTADISCIA DESCRIPTIVA
MUESTRA
Estudios, métodos o
información que
brindan datos.
OBTENCION DE DATOS
Resultado final útil para una
investigación o la ayuda de
toma de decisiones.
Jennifer Vélez Claudio
S00153158
Taller 1
Es utilizada para
métodos investigativos
VARIABLES ALEATORIAS
CATEGÓRICAS O
NUMÉRICAS
Escuela de Estudios Profesionales
Programa Ahora
Universidad Metropolitana
Anejo H
Diario Reflexivo
Nombre Jennifer Vélez Claudio
Taller 1
Fecha 18 de junio de 2015
Firma Facilitador___________________
Los conceptos que más entendí fueron… (Elabore las razones)
En el comienzo del repaso de términos estadísticos realizado en el día de hoy los
conceptos más entendidos fueron los de población, muestra, variable aleatoria
categórica, variable aleatoria numérica, escala de intervalo y de razón.
Pienso que necesito repasar o reforzar los siguientes conceptos… (Elabore las razones)
Cada uno de los conceptos relacionados a la estadística en mi caso es meritorio
repasarlos y reforzarlos, ya que nunca he tomado un curso relacionado ni similar.
Jennifer Vélez Claudio
S00153158
Taller 1
Descargar