Materia: Matemática de Séptimo Tema: Recolección y Método de Recolección de Datos En éste concepto usted aprenderá conceptos para empezar hablar en términos estadísticos. Vamos a demostrar por qué se utiliza una muestra para aprender acerca de una población. Marco Teórico Con el fin de aprender algo de vocabulario básico de estadísticas y aprender a distinguir entre los diferentes tipos de variables utilizaremos el ejemplo de la tortuga gigante de Galápagos. Ejemplo A Las Islas Galápagos, frente a la costa de Ecuador en América del Sur, son famosos por su increíble diversidad y la singularidad de la vida que poseen. Uno de los residentes más famosos de Galápagos es la tortuga gigante de Galápagos que no se encuentra en ninguna otra parte del mundo. La visita de Charles Darwin a las islas en el siglo XIX y sus observaciones de las tortugas fueron muy importantes en el desarrollo de su teoría de la evolución. Las tortugas vivían en nueve de las Islas Galápagos y en cada isla desarrollaron sus propias características especiales. De hecho, en la isla más grande, hay cuatro volcanes y cada volcán tiene su propia especie. Cuando se descubrió por primera vez se estimó que la población de tortugas de las islas era alrededor de 250.000. Por desgracia una vez que los barcos europeos y colonos comenzaron a llegar los números comenzaron a caer en picada. Debido a que las tortugas pueden sobrevivir durante largos periodos de tiempo sin comida ni agua, las expediciones se detenían en las islas y se llevaban tortugas para mantener suministros para las largas travesías. Además los colonos trajeron animales domésticos como cabras y cerdos que destruyeron el hábitat de las tortugas. Hoy en día dos de las islas han perdido sus especies. Una tercera isla carece de tortugas en su hábitat natural y la población total de las tortugas se estima en alrededor de 15.000. La buena noticia es que se han hecho esfuerzos enormes para proteger a las tortugas. Amplios programas para eliminar las amenazas a su hábitat y la raza además de lograr la reintroducción de poblaciones en su medio natural. Distribución aproximada de las tortugas gigantes de las Islas Galápagos en 2004, Estado Actual De Las Poblaciones de Tortugas Terrestres Gigantes en las Islas Galápagos, Márquez, Wiedenfeld, Snell, Fritts, MacFarland, Tapia, y Nanjoa, Scologia Aplicada, vol. 3, Num. 1,2, pp 98 11. Isla o Volcán Especies Tipo Clima Shell forma Densidad Estimación Número de de de la tortugas población población repatriadas (por total ) Densidad Estimación Número de de de la tortugas población población repatriadas (por total ) Isla o Volcán Especies Tipo Clima Shell forma Lobo Becki semiáridas intermedio 1139 228 40 Darwin microphyes semiáridas cúpula 818 205 0 Alcedo vandenBurghi húmedo cúpula 6320 799 0 Sierra Negra guntheri húmedo piso 694 122 286 Cerro Azul vicina húmedo cúpula 2.574 155 357 Santa Cruz nigrita húmedo cúpula 3391 730 210 silla de montar 869 200 1293 cúpula 1824 559 55 Santiago darwini húmedo intermedio 1165 124 498 Pinzón ephippium árido silla de montar 532 134 552 Pinta abingdoni árido silla de montar 1 No se aplica 0 Española hoodensis árido San chathamen- semiCristóbal sis áridas La repatriación es el proceso de criar tortugas para luego liberarlas en su medio natural cuando estén grandes para evitar que los depredadores locales se alimenten de las crías. Variables de clasificación Los estadísticos se refieren a todo un grupo que se está estudiando como una población . Cada miembro de la población recibe el nombre de unidad . En éste ejemplo la población es de todas las tortugas Galápagos y las unidades son las tortugas individuales. No es necesario que la población o las unidades sean seres vivos como las tortugas o personas. Por ejemplo, un empleado de la compañía podría estar estudiando la población de los aviones en su empresa mediante el estudio de los distintos aeroplanos individuales. Un investigador que estudia tortugas Galápagos estaría interesado en recoger información sobre las diferentes características de las tortugas. Éstas características se llaman las variables . Cada columna de la figura anterior contiene una variable. En la primera columna las tortugas están etiquetadas de acuerdo a la isla (o volcán) en el que viven y en la segunda columna el nombre científico de las especies. Cuando una característica se puede colocar perfectamente en grupos bien definidos o categorías, que no dependan de un orden, se le llama variable categórica o variable cualitativa . Las tres últimas columnas informan si el número o la cantidad de la característica es más importante. Estamos interesados en la cantidad total de cada especie de tortuga o cuántas personas hay por cada kilómetro cuadrado. Éste tipo de variable se llama una variable numérica o variable cuantitativa . Ejemplo B Determinar si cada una de las variables de tipo climático, Shell forma, número de ejemplares marcados y número de las individuos repatriados son variables numéricas o categoriales. Variable Explicación Tipo Tipo Climático Muchas de las islas y hábitats volcánicas tienen tres tipos de clima diferentes. Categórico Shell forma Durante muchos años las diferentes especies de tortugas han desarrollado diferentes conchas como forma de adaptación para Categórico ayudarles a comer vegetación que varía en altura . Número de ejemplares marcados Las tortugas fueron capturadas e identificadas por los científicos para estudiar su salud y ayudar en la estimación de la población total. Numérico Número de individuos repatriados Hay dos centros de cría de tortugas en las islas. Muchas tortugas han surgido a través de estos programas y luego han sido reintroducidas a su hábitat natural. Numérico Población vs muestra Ya hemos definido una población. Es extremadamente difícil o muy costoso para recoger toda la información acerca de una población entera. En las Islas Galápagos, que sería muy difícil y tal vez incluso destructiva buscar en cada metro cuadrado del hábitat para asegurarse de que cada tortuga esté contada. En otro ejemplo: es muy caro obtener información precisa y completa sobre todos los residentes de los Estados Unidos para ayudar a abordar eficazmente las necesidades de una población cambiante. Por eso un recuento completo o censo sólo se intenta cada diez años. Debido a estos problemas es común el uso de un grupo representativo de la población o una muestra . Puedes ver que los datos de las tortugas incluyen una variable para la estimación del tamaño de la población. Se encontró éste número con una muestra y en realidad es sólo una aproximación del número real de tortugas. Si un investigador quería encontrar una estimación de la población de una especie de tortugas se iba al campo a ubicar y marcar un número de tortugas. Ella entonces usaría las técnicas de estadísticas que discutiremos más adelante en éste texto para obtener una estimación del número total de tortugas en la población. En estadística llamamos el número real de tortugas un parámetro . Cualquier número que describe los individuos en una muestra (longitud, peso, edad) se llama una estadística . Cada dato es una estimación de un parámetro cuyo valor puede o no puede ser conocido. Los errores de muestreo Las estimaciones derivadas del uso de una muestra tienen la oportunidad de ser inexactos. Esto no puede evitarse a menos que medimos toda la población. El investigador tiene que aceptar que puede haber variaciones en la muestra. Un estadístico informará de la estimación del parámetro de dos maneras: como una estimación puntual (por ejemplo, 915) o como una estimación de intervalo . Por ejemplo, un estadístico informa: "Estoy bastante seguro de que el verdadero número de tortugas es en realidad entre 561 y 1075." Éste rango de valores es resultado de la utilización de una muestra y no es debido a un error que se hizo en el proceso de recolección y análisis de la muestra. La diferencia entre el verdadero parámetro y la estadística obtenida por muestreo se denomina error de muestreo . También es posible que el investigador se equivocó en sus métodos de muestreo que de alguna manera la muestra no representa con exactitud la verdadera población. Ejemplo C ¿Cuáles son los posibles errores que podrían estar involucrados en el estudio de las tortugas Galápagos? Solución: El investigador podría haber elegido un área donde un gran número de tortugas tiende a congregarse (cerca de una fuente de alimento o de agua tal vez). Si se utiliza ésta muestra para estimar el número de tortugas en todas las ubicaciones puede conducir a una estimación de la población que es demasiado alto. Éste tipo de error sistemático en el muestreo se denomina sesgo .Estadísticos hacen todo lo posible para evitar las fuentes potenciales de sesgo. Palabras Claves En estadística el total del grupo de estudio se llama la población . Los individuos (personas, animales o cosas) en la población se llaman unidades .Las características de las personas que nos interesan se llaman las variables. Las variables pueden ser de dos tipos: numéricas o cuantitativas y categóricas o cualitativas . Debido a las dificultades de obtener información sobre todas las unidades en una población es común el uso de un pequeño subconjunto representativo de la población llamado muestra . Un valor real de una variable de la población (por ejemplo, número de tortugas, el peso promedio de todas las tortugas, etc) se llama un parámetro . Una estimación de un parámetro derivado de una muestra se denomina estadística . Siempre que una muestra se utiliza en lugar de toda una población tenemos que aceptar que nuestros resultados no son más que estimaciones. Esto se conoce como error de muestreo . Ejercicios Resueltos Para cada una de las siguientes variables indique si la variable es categórica o cuantitativa (numérica). a. Importancia de la afiliación política de las personas (mucho, algo, o no muy importante). b. Las horas dedicadas a la lectura de ayer. c. Los pesos de los hombres adultos en libras. d. Género favorito del libro (ficción, no ficción). Soluciones: a. Ésta es categórica porque los datos recogidos caerán en una de las tres categorías: muy, algo, o no muy importante. b. Esto se mide por el número de horas por lo que los datos son cuantitativos. c. Esto se mide en libras por lo que los datos son cuantitativos. d. Se trata de datos categóricos porque la información recopilada caerá en una de las categorías: ficción, no ficción, etcétera. Ejercicios Para las preguntas 1, 2 y 3: identificar la población, las unidades, cada variable y saber si la variable es categórica o cuantitativa. 1. Un trabajador de control de calidad pesa cada barra número 100 de chocolate para asegurarse de que está muy cerca del peso publicado. 2. Doris decide limpiar su cajón de cetines y ordena sus calcetines en pilas de color. 3. Un investigador está estudiando el efecto de un nuevo tratamiento farmacológico para los pacientes con diabetes. Ella lleva a cabo un experimento en 200 individuos elegidos al azar con diabetes de tipo II. Ella cree que los hombres y las mujeres pueden responder de manera diferente. Se registra el sexo de cada persona así como el cambio de la persona en el nivel de azúcar en la sangre después de tomar el medicamento por un mes. Para 4-6: indique para cada una de las siguientes características si la variable es categórica o cuantitativa (numérica): 4. Longitud del brazo desde el codo hasta el hombro (en pulgadas) 5. Número de DVD de la persona propietaria. 6. Opinión sobre su propia altura (demasiado alto, demasiado corto, sobre la derecha) 7. En la clase de Educación Física el profesor cuenta a los estudiantes de dos en dos para dividirlos en grupos. ¿Es ésta una variable categórica o cuantitativa? 8. Una escuela está estudiando puntajes de sus alumnos por grado. Explique cómo la característica "grado" puede considerarse o una categórica o una variable numérica. 9. ¿Cuáles son las mejores maneras de mostrar los datos categóricos y numéricos? 10. ¿Es posible que una variable sea tanto categóricas y numéricas? 11. ¿Cómo se puede comparar el efecto de una variable categórica en otra o una variable cuantitativa en otro?