Disseny de Mostres

Anuncio
Obtenció de dades
(capit. 3 – secció 3.2 – de Moore)
1. Estadística descriptiva
Anàlisis de distribucions (capit. 1 de Moore)
Anàlisi de relacions (capit. 2 de Moore)
2. Obtenció de dades
mostres
experiments
censos
capit. 3 – secció 3.2 – de Moore
3. Inferència estadística
Estadística descriptiva:
Conjunt de mètodes que s’empren per descriure o resumir un
conjunt de dades
Las afirmacions descriptives es poden comprovar amb la
informació que tenim a l’abast
Inferència estadística:
Conjunt de mètodes que permeten extrapolar o generalitzar a la
població, més enllà del conjunt de dades disponibles (estimació,
predicció)
Les afirmacions no es poden verificar amb la informació que
tenim a mà.
Mostra aleatoria simple
Una mostra aleatòria simple de mida n consisteix en
n individu de la població escollits amb un procediment tal que
tot subconjunt de la població de mida n tingui la mateixa probabilitat
de ser triat.
To create a labeled population (in our case lotto balls),
enter a value for the last label and click the Reset button.
To sample n individuals from the population enter the
desired sample size and click Sample.
http://www.whfreeman.com/scc/con_index.htm?99spt
Mostra i població
La població es un grup d’ individus sobre el que volem obtenir
informació.
Una mostra es una part de la població que realment examinem
amb l’objectiu d’aconseguir informació sobre la població.
Un paràmetre es un número que descriu la població.
Un estadístic es un número que es pot calcular a partir de los
dades de la mostra sense fer servir el paràmetre desconegut
Emprem un estadístic per estimar un paràmetre desconegut.
El paràmetre es per la població el que l’estadístic es per la
mostra.
Diseny de mostres
Disseny d’una mostra
= mètode emprat per escollir la mostra d’una població
Mal disseny de mostra:
- Mostra de voluntaris
- Mostra de conveniència
La mostra no representa el conjunt de la població
! provoca biaixos (el mètode de mostratge
afavoreix a algunes parts de la població en
detriment d’altres)
Mostra aleatòria simple
Mostra escollida a l’ atzar amb un procediment pel qual
qualsevol mostra de mida n té la mateixa probabilitat de
ser escollida. (Noteu que no són els individus escollits,
és el procediment, mètode, d’escollir).
! assigna a cada individu de la població la mateixa
probabilitat de ser escollit.
! assigna a cada subgrup de mida n la mateixa
probabilitat de ser escollit.
Per obtenir una mostra aleatòria simple podem emprar
dígits aleatoris.
Mostra probabilística :
La mostra és escollida a l’atzar ! cada individu de
la població té una probabilitat no nul.la de
pertanyer a la mostra
Mostra aleatòria estratificada:
Dividim la població en grups (estrats) o sub-poblacions;
en cada un d’ells extraiem una mostra aleatòria simple.
La mostra estratificada es el resultat d’ajuntar aquestes
sub-mostres.
Exemple: Una empresa té 1000 treballadors, 900 homes,
100 dones. Volem una mostra de n = 100. Triem 90
homes i 10 dones`. Això seria una mostra estratificada
proporcional.
Mostra per conglomerats
Dividim la població en segments, i fem una mostra aleatòria de segments. La
Mostra resultant d’ajuntar tots els individus dels segments escollits es una
Mostra per conglomerats.
Exemple:
1Dividim el barri en escales. Triem a l’atzar 10 escales. La mostra
Son tots els individus o llars de les 10 escales.
2.
Dividim la classe en bancs, triem dos bancs a l’atzar, la mostra són tots els
Individus dels dos bancs escollits.
Mostra d’etapes múltiples:
La mostra la triem en etapes
Exemple:
1. Mostra de partits judicials
2. Mostra de municipis dintre cada partit judicial
3. Mostra de barris dintre de cada municipi
4. Mostra de llars dintre de cada barri
An Introduction to Survey
Sampling
Alternatives to Simple Random Sampling
Stratified Random Sampling
Simple random samples from non-overlapping
subpopulations or strata.
Cluster Sampling
Random samples of “clusters” of units.
Systematic Sampling
1-in-L samples
Diseño Encuesta Población Activa - INE
http://www.ine.es/docutrab/epa05_disenc/epa05_disenc.pdf
4. Diseño de la muestra
4.1 TIPO DE MUESTREO. UNIDADES MUESTRALES
Se utiliza un muestreo bietápico con estratificación de las
unidades de primera etapa.
Las unidades de primera etapa están constituidas por las
secciones censales.
4.2 ESTRATIFICACIÓN DE LAS UNIDADES DE
MUESTREO
Las unidades de primera etapa se estratifican atendiendo a
un doble criterio:
A. Criterio geográfico (de estratificación)
Las secciones se agrupan en estratos dentro de cada
provincia, de acuerdo con la importancia demográfica
del municipio al que pertenecen.
B. Criterio socioeconómico (de subestratificación)
Las secciones censales se agrupan en subestratos dentro
de cada uno de los estratos, según las características
socioeconómicas de las mismas.
4.2.1 Estratos
Para llegar a la formación de los estratos se consideran los
siguientes tipos de municipios:
1. Municipios autorrepresentados: Son aquellos que
dada su categoría dentro de la provincia deben tener
siempre secciones en la muestra.
Son municipios autorrepresentados:
- La capital de la provincia.
- Municipios que tienen un número de habitantes tal,
que en la afijación proporcional dentro de la provincia le
corresponden al menos 12 secciones en la muestra.
- Municipios que teniendo una situación demográfica
destacada dentro de la provincia no hay otros similares
con que agruparlos, aunque proporcionalmente le
correspondan menos de 12 secciones en la muestra.
2. Municipios correpresentados: Son aquellos que dentro de
la misma provincia forman parte de un grupo de municipios
demográficamente similares y que son representados en
común.
De acuerdo con esta clasificación, en líneas generales, los
estratos teóricos considerados responden a los siguientes
conceptos:
Estrato 1: Municipio capital de provincia.
Estrato 2: Municipios autorrepresentados, importantes en
relación con la capital.
Estrato 3: Otros municipios autorrepresentados, importantes en
relación con la capital o municipios mayores de 100.000
habitantes.
Estrato 4: Municipios entre 50.000 y 100.000 habitantes.
Estrato 5: Municipios entre 20.000 y 50.000 habitantes.
Estrato 6: Municipios entre 10.000 y 20.000 habitantes.
Estrato 7: Municipios entre 5.000 y 10.000 habitantes.
Estrato 8: Municipios entre 2.000 y 5.000 habitantes.
Estrato 9: Municipios menores de 2.000 habitantes.
Inferència Estadística
• Determinar el paràmetre
poblacional, per medi de la Població
informació mostral
paràmetre, θ
– conèixer amb exactitud?: NO!
– Mesura de precisió ?
...
Mostra
2500
2000
1500
1000
500
0
-4
-3
Repetició de
extracció de mostra´i càlcul de t
-2
-1
0
1
2
3
4
t=f(mostra)
Distribució Mostral
(varia amb n)
Distribució mostral
•
•
!
!
!
!
Població X
( X1, X2, ...., XN )
Paràmetre poblacional θ
"#$%&'())*!+),,,+)*" +))-./')0)
1$%'/2$%.3)))%)4)56-#$%&'7
1$%.-'3.8)/9))θ
:.$%&.;<3.8)-#$%&'= /9)=>9$%'/2$%.3)
! "#$%&'()*$+,(-(*
! "#$%&'()*$.)*#$
Descargar