Tema II. Estadistica Aplicada

Anuncio
Universidad Católica del Trópico Seco
Pbro. Francisco Luis Espinoza Pineda
Facultad de Ciencias Agropecuarias
Unidad I: Muestreo y cálculo muestral
Contenido:
1.3 Cálculo de la muestra de poblaciones finitas e infinitas
Unidad II: Diseños experimentales
Contenidos
2.1 Conceptos Básicos de la Inferencia Estadística
Unidad I: Muestreo y cálculo muestral
Contenido:
1.3 Cálculo de la muestra de poblaciones finitas e infinitas
Distribución normal: La distribución normal es una de las distribuciones de
probabilidades de variables continuas, que sirve para la creación de modelos
basados en fenómenos naturales, sociales e incluso psicológicos.
La gráfica tiene forma de campana, también conocida como la Campana de Gauss,
en alusión a su creador Carl Gauss.
Glosario
Error Maestral de estimación o standard: Es la diferencia entre un estadístico y
su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones
de muestras repetidas en torno al valor de la población, nos da una noción clara de
hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja
del valor que se hubiera obtenido por medio de un censo completo.
Estadístico: Los datos o medidas que se obtienen sobre una muestra y por lo tanto
una estimación de los parámetros.
Muestra: Es un subconjunto de casos o individuos de una población estadística.
Nivel de Confianza: Probabilidad de que la estimación efectuada se ajuste a la
realidad. Cualquier información que queremos recoger está distribuida según una
ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la
probabilidad de que el intervalo construido en torno a un estadístico capte el
verdadero valor del parámetro.
La tabla siguiente da los valores de Za que corresponden a distintos niveles de
confianza utilizados en la práctica.
Nivel de
99.73%
99%
confianza
Za
98
96%
95.45%
95%
90%
80%
68.27%
50%
2.05
2.00
1.96
1.645
1.28
1.00
0.6745
%
3.00
2.58
2.33
Parámetro: Son las medidas o datos que se obtienen sobre la distribución de
probabilidades de la población, tales como la media, la varianza, la proporción, etc.
Población: También llamada universo o colectivo, es el conjunto de elementos de
referencia sobre el que se realizan las observaciones.
Varianza Poblacional: Cuando una población es más homogénea la varianza es
menor y el número de entrevistas necesarias para construir un modelo reducido del
universo, o de la población, será más pequeño. Generalmente es un valor
desconocido y hay que estimarlo a partir de datos de estudios previos.
Tamaño de la Muestra: DEFINICION
El tamaño de la muestra es el número de elementos extraídos de una población,
que obtiene información representativa, valida y confiable al mismo costo.
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar
en cuenta varios factores:




El tipo de muestreo
El parámetro a estimar
El error maestral admisible
La varianza poblacional y
 El nivel de confianza.
TAMAÑO DE LA MUESTRA PARA MEDIA Y PROPORCIÓN
Existen diferentes factores que determinan la fórmula que se utilizará para saber el
tamaño de la muestra, uno de ellos son la media y la proporción.
Para estimar una proporción debemos conocer:
Z = nivel de confianza,
p = probabilidad de éxito, o proporción esperada
q = probabilidad de fracaso 𝑞 = 1 − 𝑝
e = precisión (error máximo admisible en términos de proporción)
𝑧𝑎2 × 𝑝 × 𝑞
𝑛=
𝑒2
Para estimar la media, utilizamos los siguientes datos:
Z = nivel de confianza
σ2 : Varianza poblacional
e = precisión (error máximo admisible en términos de proporción)
𝑧𝑎2 × 𝜎2
𝑛=
𝑒2
TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS E
INFINITAS
Los datos que utilizaremos son los siguientes:
: Z correspondiente al nivel de confianza elegido
: Varianza poblacional
℮: error máximo
N: Población
p: probabilidad de éxito, o proporción esperada
q: probabilidad de fracaso
POBLACIONES FINITAS:
Se conoce el tamaño de la población de donde se obtendrá la muestra a estudiar.
La población es representada por la letra N y se aplica de la siguiente manera.
Para la media:
𝑁 ∗ 𝑍𝑎2 ∗ 𝜎 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝑍𝑎2 ∗ 𝜎 2
Para la proporción:
𝑁 ∗ 𝑍𝑎2 ∗ 𝑝 ∗ 𝑞
𝑛=
(𝑁 − 1)𝑒 2 + 𝑍𝑎2 ∗ 𝑝 ∗ 𝑞
Donde:
Za : Intervalo de confianza
P: Proporción Verdadera
e: error de muestreo aceptable
N: Tamaño de la población
POBLACIÓN INFINITA:
Si por el contrario el tamaño de la población es desconocido o infinito usaremos
otra alternativa.
Para la media:
𝑍𝑎2 ∗ 𝜎 2
𝑛=
𝑒2
Para la proporción:
𝑍𝑎2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑒2
Ejemplos:
1. Se desea realizar una investigación para estimar el peso medio de terneros
recién nacidos de madres con peso bajo. Se admite un error máximo de 50 grs,
con una confianza del 95%. Si por estudios anteriores se sabe que la
desviación típica del peso medio de tales recién nacidos es de 400 gr ¿Qué
tamaño mínimo de la muestra se necesita en la investigación?
Datos:
e: 50 gramos
α: 1.96
σ: 400 gramos
𝑛=
1.962 ∗ 400
= 545.86
50
2. La desviación típica de la altura de plantas de tomates antes del trasplante es
de 8 cm. Calcular el tamaño mínimo de la muestra de plantas de tomate para
que el error cometido al estimar la altura media sea inferior a 1 cm con un nivel
de confianza del 90%
Datos:
e: 1 cm
α: 1.645
σ: 8 cm
1.6452 ∗ 82
𝑛=
= 173
12
3. Una agencia de mercadotecnia desea encuestar a los residentes de su municipio
para conocer qué proporción de la población conoce cierto producto para control
de malezas respecto de su efectividad. Que tamaño de la muestra se necesita
si requiere de confianza de 95% un error máximo de estimación de 0.15.
Datos:
e: 0.15
α: 1.96
p: 0.5
q: 0.95
𝑛=
1.962 ∗0.5∗0.95
= 81
0.152
4. ¿Cuál es el promedio de horas semanales trabajadas en una finca en los registro
de inspección?, si existe una población de 20000 trabajadores donde se sabe
que su varianza es de 8.35. Trabajando con un nivel de confianza de 90% y
estando dispuestos a admitir un error máximo de 0.20. ¿Cuál es el tamaño de la
muestra?
Datos:
e: 0.20
α: 1.64
σ: 8.35
N: 20000
𝑛=
2
20000∗ 1.64 ∗ 8.352
= 67.01
(20000−1)0.22 +1.64 2 ∗8.352
ACTIVIDAD PRÁCTICA N° 1
Resuelva
a) Un productor de semillas desea saber con un error de estimación del 5% el
porcentaje de semillas que germinarán en la granja de su competidor. ¿Qué
tamaño de muestra debe tomarse para obtener un nivel de confianza del 95%
si se sabe que germinan el 50%.
b) Una marca de nueces afirma que como máximo, el 6% de las nueces están
vacías. De un lote de 300 nueces. ¿Qué tamaño muestral se necesitaría para
estimar la proporción de nueces con un error menor del 1% con una
confiabilidad del 95%.
c) Se desea conocer las proporciones de artículos defectuosos en una
población de 25000. Para un estudio con nivel de confianza del 95% y un
error de 0.2, suponiendo que un estudio anterior produjo 18 artículos
defectuosos de cada 100. ¿De qué tamaño debe ser la muestra?
d) Para un trabajo de investigación de mercado en Nicaragua (población finita
10,000 habitantes) entre otras cosas, queremos saber cuántas personas
viajarán a trabajar al extranjero con la decisión de radicar definitivamente en
el país de destino. ¿Cuál debe ser el tamaño de la muestra para un nivel de
confianza del 96% y un margen posible de error de 4%?.
e) Se planea llevar a cabo una investigación para determinar la proporción de
hogares que tiene refrigerador, por lo que es necesario calcular el tamaño de
la muestra requerida con un nivel de confianza del 95% y una precisión del
5%. La investigación se llevará a cabo en una población de 1500 familias.
f) Un grupo de estudiantes de la Facultad de Agropecuaria, realizará un estudio
sobre las condiciones socioeconómicas de los 400 habitantes de la Laguna
y desean determinar cuál será la cantidad de cuestionarios que tendrán que
elaborar, si fijan un nivel de confianza del 95% y una precisión del 15%.
Unidad II: Diseños experimentales
Contenidos
2.1 Conceptos Básicos de la Inferencia Estadística
INFERENCIA ESTADÍSTICA
La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir,
a partir de la información empírica proporcionada por una muestra, cual es el
comportamiento de una determinada población con un riesgo de error medible en
términos de probabilidad.
Los métodos paramétricos de la inferencia estadística se pueden dividir,
básicamente, en dos: métodos de estimación de parámetros y métodos de contraste
de hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución
de probabilidad del estadístico muestral que se utiliza como estimador de un
parámetro.
El conjunto de métodos estadísticos que permiten deducir (inferir) como se distribuye la
población en estudio o las relaciones estocásticas entre varias variables de interés a partir
de la información que proporciona una muestra”.
Conceptos Básicos

Población: es un conjunto homogéneo de individuos sobre los que se
estudia una o varias características que son, de alguna forma, observables.

Muestra: es un subconjunto de la población. El número de elementos de la
muestra se denomina tamaño muestral.

Muestreo aleatorio simple: es aquel en el que todos los individuos de la
población tienen la misma probabilidad de ser elegidos.

Muestra aleatoria simple, de una variable aleatoria X, con distribución F,
de tamaño n, es un conjunto de n variables aleatorias X 1,X2,...,Xn,
independientes e igualmente distribuidas con distribución F.

Espacio muestral: es el conjunto de muestras posibles que pueden
obtenerse al seleccionar una muestra aleatoria, de tamaño n, de una cierta
población.

Parámetro: es cualquier característica medible de la función de
distribución de la variable en estudio (media, varianza,..).

Estadístico: es una función de la muestra T
. Por tanto, es
una variable aleatoria que tiene una función de distribución que se
denomina distribución en el muestreo de T. Los estadísticos independientes
del parámetro a estimar se denominan estimadores.
BIBLIOGRAFÍA
http://es.slideshare.net/LuisAngelVanegas/tamao-de-la-muestra
http://www.udc.gal/dep/mate/estadistica2/sec1_2.html
http://issuu.com/byrong/docs/curso_de_muestreo_estadistico
Descargar
Colecciones de estudio