Obtenció de dades (capit. 3 – secció 3.2 – de Moore) 1. Estadística descriptiva Anàlisis de distribucions (capit. 1 de Moore) Anàlisi de relacions (capit. 2 de Moore) 2. Obtenció de dades mostres experiments censos capit. 3 – secció 3.2 – de Moore 3. Inferència estadística Estadística descriptiva: Conjunt de mètodes que s’empren per descriure o resumir un conjunt de dades Las afirmacions descriptives es poden comprovar amb la informació que tenim a l’abast Inferència estadística: Conjunt de mètodes que permeten extrapolar o generalitzar a la població, més enllà del conjunt de dades disponibles (estimació, predicció) Les afirmacions no es poden verificar amb la informació que tenim a mà. Mostra aleatoria simple Una mostra aleatòria simple de mida n consisteix en n individu de la població escollits amb un procediment tal que tot subconjunt de la població de mida n tingui la mateixa probabilitat de ser triat. To create a labeled population (in our case lotto balls), enter a value for the last label and click the Reset button. To sample n individuals from the population enter the desired sample size and click Sample. http://www.whfreeman.com/scc/con_index.htm?99spt Mostra i població La població es un grup d’ individus sobre el que volem obtenir informació. Una mostra es una part de la població que realment examinem amb l’objectiu d’aconseguir informació sobre la població. Un paràmetre es un número que descriu la població. Un estadístic es un número que es pot calcular a partir de los dades de la mostra sense fer servir el paràmetre desconegut Emprem un estadístic per estimar un paràmetre desconegut. El paràmetre es per la població el que l’estadístic es per la mostra. Diseny de mostres Disseny d’una mostra = mètode emprat per escollir la mostra d’una població Mal disseny de mostra: - Mostra de voluntaris - Mostra de conveniència La mostra no representa el conjunt de la població ! provoca biaixos (el mètode de mostratge afavoreix a algunes parts de la població en detriment d’altres) Mostra aleatòria simple Mostra escollida a l’ atzar amb un procediment pel qual qualsevol mostra de mida n té la mateixa probabilitat de ser escollida. (Noteu que no són els individus escollits, és el procediment, mètode, d’escollir). ! assigna a cada individu de la població la mateixa probabilitat de ser escollit. ! assigna a cada subgrup de mida n la mateixa probabilitat de ser escollit. Per obtenir una mostra aleatòria simple podem emprar dígits aleatoris. Mostra probabilística : La mostra és escollida a l’atzar ! cada individu de la població té una probabilitat no nul.la de pertanyer a la mostra Mostra aleatòria estratificada: Dividim la població en grups (estrats) o sub-poblacions; en cada un d’ells extraiem una mostra aleatòria simple. La mostra estratificada es el resultat d’ajuntar aquestes sub-mostres. Exemple: Una empresa té 1000 treballadors, 900 homes, 100 dones. Volem una mostra de n = 100. Triem 90 homes i 10 dones`. Això seria una mostra estratificada proporcional. Mostra per conglomerats Dividim la població en segments, i fem una mostra aleatòria de segments. La Mostra resultant d’ajuntar tots els individus dels segments escollits es una Mostra per conglomerats. Exemple: 1Dividim el barri en escales. Triem a l’atzar 10 escales. La mostra Son tots els individus o llars de les 10 escales. 2. Dividim la classe en bancs, triem dos bancs a l’atzar, la mostra són tots els Individus dels dos bancs escollits. Mostra d’etapes múltiples: La mostra la triem en etapes Exemple: 1. Mostra de partits judicials 2. Mostra de municipis dintre cada partit judicial 3. Mostra de barris dintre de cada municipi 4. Mostra de llars dintre de cada barri An Introduction to Survey Sampling Alternatives to Simple Random Sampling Stratified Random Sampling Simple random samples from non-overlapping subpopulations or strata. Cluster Sampling Random samples of “clusters” of units. Systematic Sampling 1-in-L samples Diseño Encuesta Población Activa - INE http://www.ine.es/docutrab/epa05_disenc/epa05_disenc.pdf 4. Diseño de la muestra 4.1 TIPO DE MUESTREO. UNIDADES MUESTRALES Se utiliza un muestreo bietápico con estratificación de las unidades de primera etapa. Las unidades de primera etapa están constituidas por las secciones censales. 4.2 ESTRATIFICACIÓN DE LAS UNIDADES DE MUESTREO Las unidades de primera etapa se estratifican atendiendo a un doble criterio: A. Criterio geográfico (de estratificación) Las secciones se agrupan en estratos dentro de cada provincia, de acuerdo con la importancia demográfica del municipio al que pertenecen. B. Criterio socioeconómico (de subestratificación) Las secciones censales se agrupan en subestratos dentro de cada uno de los estratos, según las características socioeconómicas de las mismas. 4.2.1 Estratos Para llegar a la formación de los estratos se consideran los siguientes tipos de municipios: 1. Municipios autorrepresentados: Son aquellos que dada su categoría dentro de la provincia deben tener siempre secciones en la muestra. Son municipios autorrepresentados: - La capital de la provincia. - Municipios que tienen un número de habitantes tal, que en la afijación proporcional dentro de la provincia le corresponden al menos 12 secciones en la muestra. - Municipios que teniendo una situación demográfica destacada dentro de la provincia no hay otros similares con que agruparlos, aunque proporcionalmente le correspondan menos de 12 secciones en la muestra. 2. Municipios correpresentados: Son aquellos que dentro de la misma provincia forman parte de un grupo de municipios demográficamente similares y que son representados en común. De acuerdo con esta clasificación, en líneas generales, los estratos teóricos considerados responden a los siguientes conceptos: Estrato 1: Municipio capital de provincia. Estrato 2: Municipios autorrepresentados, importantes en relación con la capital. Estrato 3: Otros municipios autorrepresentados, importantes en relación con la capital o municipios mayores de 100.000 habitantes. Estrato 4: Municipios entre 50.000 y 100.000 habitantes. Estrato 5: Municipios entre 20.000 y 50.000 habitantes. Estrato 6: Municipios entre 10.000 y 20.000 habitantes. Estrato 7: Municipios entre 5.000 y 10.000 habitantes. Estrato 8: Municipios entre 2.000 y 5.000 habitantes. Estrato 9: Municipios menores de 2.000 habitantes. Inferència Estadística • Determinar el paràmetre poblacional, per medi de la Població informació mostral paràmetre, θ – conèixer amb exactitud?: NO! – Mesura de precisió ? ... Mostra 2500 2000 1500 1000 500 0 -4 -3 Repetició de extracció de mostra´i càlcul de t -2 -1 0 1 2 3 4 t=f(mostra) Distribució Mostral (varia amb n) Distribució mostral • • ! ! ! ! Població X ( X1, X2, ...., XN ) Paràmetre poblacional θ "#$%&'())*!+),,,+)*" +))-./')0) 1$%'/2$%.3)))%)4)56-#$%&'7 1$%.-'3.8)/9))θ :.$%&.;<3.8)-#$%&'= /9)=>9$%'/2$%.3) ! "#$%&'()*$+,(-(* ! "#$%&'()*$.)*#$