¿Cuántos peces hay en un lago? ¿Cuántos taxis en una ciudad? Ideas para actividades y proyectos utilizando la estadística Pere Grima [email protected] 2º Encuentro Iberoamericano de Biometría Contenido. Objetivo Peces (estimación del tamaño de una población por el método de la captura, marcaje y recaptura) Taxis (estimación del tamaño de una población con sus elementos numerados) “Estadística en acción” (más ejemplos) Objetivo: Dar ideas sobre posibles actividades o t b j relacionados trabajos l i d con la l estadística t dí ti 2. Peces, taxis, y más El lago ¿Cuántos peces hay? 3. Peces, taxis, y más Si pudiéramos ver lo que hay dentro... 4. Peces, taxis, y más Pescamos, marcamos y los soltamos 15 peces 5. Peces, taxis, y más Los peces marcados se dispersan... Volvemos a pescar 6. Peces, taxis, y más Hipótesis. Cálculos Primera Muestra Segunda Muestra N: Número total de peces C: Capturados M: Marcados M R = N C 7. Peces, taxis, y más M·C N̂ = R R: Aparecen marcados 15·15 N̂ = = 75 3 Si pudiéramos ver lo que hay dentro... La realidad: 2 1 5 14 12 3 4 16 8 11 32 41 42 24 9 18 25 43 30 44 37 26 47 55 54 66 62 65 58 63 59 48 19 20 57 64 61 56 52 46 53 36 17 10 35 23 67 60 51 34 29 13 7 50 40 28 22 15 6 39 33 27 21 31 38 45 49 Hay 67 peces. Error del 12% sobre el valor real 8. Peces, taxis, y más Calidad de la estimación ¿Qué significa que N está “alrededor de” 75? ¿Tenemos un buen estimador? Cuál es la calidad de la estimación si: N = 1000 M = 100 C = 100 9. Peces, taxis, y más Simulación con Excel Podemos simular con Excel 10. Peces, taxis, y más Applet 11. Peces, taxis, y más Simulando 10.000 veces con Minitab: Peces que se Peces que se Frecuencia i hallan marcados absoluta en la repesca 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 23 12. Peces, taxis, y más 3 14 35 141 279 533 860 1183 1378 1454 1202 1066 744 494 296 170 75 46 16 10 1 Porcentaje Porcentaje j acumulado Estimación Estimación tamaño población 0,03 0,14 0,35 1,41 2,79 5,33 86 8,6 11,83 13,78 14,54 12,02 10,66 7,44 4,94 2,96 17 1,7 0,75 0,46 0,16 0,1 0,01 0,03 0,17 0,52 1,93 4,72 10,05 18 65 18,65 30,48 44,26 58,8 70,82 81,48 88,92 93,86 96,82 98 52 98,52 99,27 99,73 99,89 99,99 100 10000 5000 3333 2500 2000 1667 1429 1250 1111 1000 909 833 769 714 667 625 588 556 526 500 435 ≅ 80 % + 429 - 231 Haciendo gráficos 80% 1400 1400 1200 1200 1000 1000 800 600 800 600 400 400 200 200 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Peces que se hallan marcados en la repesca 7 80% 1600 Frecuencia F Frecuencia F 1600 13 0 500 769 1000 1500 2000 Tamaño estimado 2500 3000 1429 M·C Es un estimador N̂ = R sesgado 13. Peces, taxis, y más ¿Se puede mejorar? ¿Se puede calcular un estimador que no tenga sesgo? ¿Cómo varía la calidad del estimador al aumentar M y/o C ? ¿Y si se hacen varias repescas? ¿Y si...? 14. Peces, taxis, y más Con bolas.... 15. Peces, taxis, y más ¿Cuantos garbanzos hay en 1 kg? • Contarlos • Pesar 100 y hacer la proporción • Pesca i repesca 16. Peces, taxis, y más ¿Cuántos taxis hay en Barcelona? ¡Fácil! http://www.taxibarcelona.cat/tabid/308/Default.aspx 18. Peces, taxis, y más Sin repesca.... ¡Los taxis están numerados! 19. Peces, taxis, y más Sólo con la intuición... Muestra de valores de una población numerada: 16 28 45 48 68 72 81 ¿Cuántos elementos tiene la población? 20. Peces, taxis, y más Posibilidades Si tenemos t toda t d la l población bl ió numerada d se verifica ifi que: población: N Tamaño de la p Media: X N = 2X − 1 % −1 N = 2X % Mediana: X Ejemplo: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 Media = Mediana = 5,5 21. Peces, taxis, y más Posibilidades E nuestra En t muestra: t 16 28 45 48 68 72 81 Mediana: 48 Media: 51,14 Estimaciones: Nˆ 1 : 2 X − 1 = 2 ⋅ 51,14 − 1 ≅ 101 % − 1 = 2 ⋅ 48 − 1 ≅ 95 Nˆ 2 : 2 X ¿Inconveniente de este método? 22. Peces, taxis, y más El inconveniente Puede dar una estimación evidentemente falsa... Ejemplo: 3, 4, 6, 15 M di Media: 7 Mediana: 5 23. Peces, taxis, y más N̂ 1 : 2 X − 1 = 2 ⋅ 7 − 1 = 13 N % −1 = 2⋅5 −1 ≅ 9 N̂ 2 : 2 X Solucionando el inconveniente Supongamos que los valores son: 8, 14, 22, 27, 35 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 7 + 5 + 7 5 + 4 + 7 = ¡Este es un estimador excelente! (UMVUE) 24. Peces, taxis, y más 6 ¡ La fórmula ! El promedio de les diferencias es: {⎣⎡ X ( ) − 1⎦⎤ + ⎣⎡ X ( ) − X ( ) − 1⎦⎤ + ⎣⎡ X ( ) − X ( ) − 1⎦⎤ +L + ⎣⎡ X ( ) − X ( 1 2 1 3 2 n n −1) n − 1⎦⎤ } = ⎡⎢ X ( ) ⎤⎥ − 1 ⎣ n ⎦ X ( 1) : Primer valor, ordenados de menor a mayor X ( n ) : Último valor valor, ordenados de menor a mayor Por tanto: 25. Peces, taxis, y más N̂ = X ( n ) + n X( n ) n −1 Comprobemos que funciona 20 veces El mayor valor : Mejor estimación: 1101 + 26. Peces, taxis, y más 1101 − 1 = 1155 20 Caso práctico 10.467 + 27. Peces, taxis, y más 10.467 − 1 = 10.989 20 Otras situaciones similares Roger W. Johnson: “Estimating the Size of a Population. Teaching Statistics http://www.rsscse.org.uk/ts/gtb/contents.html 28. Peces, taxis, y más Iceberg y estadística • Calidad y costos C t d Costos de la l calidad lid d Costos de la no calidad Costos totales de la calidad • El tratamiento de los costes en los proyectos Seis Sigma 29. Peces, taxis, y más Hay mucho más de lo que se ve Porcentages Sondeos electorales Medias Control de Calidad: ¿Qué podemos hacer para mejorar? Previsiones: ¿Cuánta electricidad ¿ se gastará mañana? Estudios sociològicos: ¿Qué quieren los jovenes? 30. Peces, taxis, y más Investigación médica: ¿Es mejor una nueva medicina? Estudios de mercado: ¿Qué quieren los consumidores? Economía: ¿Cuánto ¿ aumentan los precios? Biologia: Animales en extinción Fiabilidad: Cada cuando se deben revisar las piezas de un avión? Cuantificación del estilo literario: longitud de las frases, frecuencia de uso de determinadas palabras (palabras herramienta), selección d t posibles dntre ibl alternativas,... lt ti Autor A 31. Peces, taxis, y más Autor B Autor disputado AoB Estilometría. Software Ejercicios 32. Peces, taxis, y más 33. Peces, taxis, y más Cuantificación de una imagen 34. Peces, taxis, y más 35. Peces, taxis, y más 36. Peces, taxis, y más 37. Peces, taxis, y más Hombres 38. Peces, taxis, y más Mujeres Chipre - Grecia Chipre - Turquía 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Posición de salida del ganador 39. Peces, taxis, y más Fuente: www.malaprensa.com 40. Peces, taxis, y más Bonus track (más información sobre peces, taxis, bolas, palas para sacarlas… ) http://www-eio.upc.es/~grima/