Estadística Inferencial CONCEPTOS ELEMENTALES 21 de septiembre de 2021 Población • Es un conjunto de personas, objetos o eventos, de los cuales nos interesa estudiar algunas de sus características. En un estudio estadístico, la población debe especificarse lo más completamente posible. Esto depende de lo que se desee o se pueda estudiar u observar, y de la forma en la que sea posible medir las características de nuestro interés. Ejemplos • Los siguientes conjuntos pueden ser considerados como poblaciones para algún estudio estadístico. El conjunto de personas afectadas por una cierta enfermedad. El conjunto de personas extranjeras que llegan al país en un día. El conjunto de artículos defectuosos producidos en una fabrica. El conjunto de infracciones de transito que se cometen en una ciudad. El conjunto de goles que anota un equipo de futbol. El conjunto de boletas invalidas en un proceso de electoral. El alcance del concepto de población es muy amplio. Para un estudio estadístico, además de tener definida una población, a veces es conveniente establecer también una unidad de observación. Unidad de Observación • Una UNIDAD DE OBSERVACIÓN es un grupo de elementos de una población del cual se tiene, o es posible obtener, su información de manera conjunta.. • La determinación de una unidad de observación depende del problema a estudiar y de la manera en la que la información pueda ser obtenida o que este disponible. • Por ejemplo, en un análisis cuantitativo sobre los resultados de un proceso electoral, la información puede estar disponible por casillas electorales, y en este caso las casillas electorales (grupos de votantes) pueden ser consideradas como unidades de observación. Muestra • Una MUESTRA es cualquier subconjunto de una población. • Al numero de elementos de la muestra, que denotaremos por la letra n, se le llama tamaño de la muestra. En un estudio estadístico, la población debe especificarse lo más completamente posible. Esto depende de lo que se desee o se pueda estudiar u observar, y de la forma en la que sea posible medir las características de nuestro interés. Ejercicios Proponga una posible población en el caso de que se desee llevar a cabo un estudio estadístico sobre los siguientes temas. • a) La eficacia de un nuevo medicamento. • b) El nivel de consumo de un determinado producto. • c) La situación económica de las personas de edad avanzada. • d) Las fallas de un programa de computo. • e) Los defectos en artículos producidos por una maquinaria. Variables y Datos A lo que nos interesa medir y registrar en cada elemento de una población le llamaremos variable. Esto es así pues supondremos que una variable es una característica que varia de un elemento a otro de la población. Una VARIABLE es una característica de interés que posee cada elemento de una población y que podemos medir. Variables y Datos Mediante el término DATOS se entiende al conjunto de observaciones de una o varias variables de interés para todos los elementos de una muestra. Generalmente, un conjunto de datos se organiza y almacena en una computadora en la forma de un arreglo como el que se muestra en la Tabla 1.1. En esta tabla cada renglón representa una observación. En este caso tenemos a 5 personas para quienes se han registrado cuatro variables: edad, sexo, peso en kilogramos y estatura en centímetros. Ejercicios Proponga una posible población en el caso de que se desee llevar a cabo un estudio estadístico sobre los siguientes temas. 1. Defina una posible variable o pregunta que podría ser de interés para cada una de las poblaciones propuestas en el ejercicio anterior. 2. Determine una posible variable o pregunta que tenga como uno de sus valores el indicado en cada inciso. a) 10 años. b) 1, 265 veces. c) Pequeño. d) Blanco. e) 23˝C. f ) María. g) Aprobado. h) 1, 200 hrs. Clasificación de Variables Una primera clasificación de variables establece que ´estas pueden ser CUANTITATIVAS O CUALITATIVAS. Como estos nombres lo indican, la primera se refiere a una cantidad, mientras que la segunda se refiere a una cualidad. Veamos las definiciones. Una variable es CUANTITATIVA si sus valores son números y representan una cantidad. Por ejemplo, el numero de hijos en una familia, la longitud de un tornillo, la cantidad de desperfectos de un articulo o el numero de anos cumplidos de una persona son variables cuantitativas. Una VARIABLE ES CUALITATIVA si sus valores representan una cualidad, un atributo o una categoría. Se les llama también variables categóricas. Por ejemplo, la religión de una persona, su sexo, o su preferencia por algún candidato en un proceso de elección son variables cualitativas pues sus valores son atributos de las personas. El lugar de nacimiento de una persona es otro ejemplo de variable cualitativa o categórica. Estadística Inferencial CONCEPTOS ELEMENTALES 2DA PARTE 21 de septiembre de 2021 Parte 2 Clasificación de Variables Cuantitativas Variables Cuantitativas Regresemos a las variables cuantitativas, estas pueden clasificarse, además, en dos categorías de acuerdo al tipo de valores que toman: pueden ser discretas o continuas.. Variable Cuantitativa Discreta Una variable cuantitativa es discreta si el conjunto de todos sus posibles valores tiene un número finito de elementos, o bien es infinito, pero se pueden numerar uno por uno de acuerdo al conjunto de números naturales. Por ejemplo, la colección {0,1, 2,..., 120} puede ser el conjunto de valores de una variable cuantitativa discreta, pues este conjunto tiene un número finito de elementos. Puede corresponder al numero de hijos de una persona o el número de años promedio que le quedan por vivir a una persona. Como otro ejemplo tenemos el conjunto {0, 1, 2,...}, que aunque es infinito, es discreto, ya que sus elementos se pueden numerar uno por uno de acuerdo al conjunto de números naturales. Variable Cuantitativa Contínua Una variable cuantitativa es continua si puede tomar todos los valores dentro de un intervalo (a,b) de números reales y no toma valores aislados. Por ejemplo, sin considerar la precisión limitada de los aparatos de medición, el tiempo que le toma a una persona llegar a su lugar de trabajo o escuela puede tomar valores continuos en el intervalo (0, ∞). Más generalmente, el tiempo que le toma a una persona completar una cierta actividad puede tomar este conjunto de valores. Ejercicio • Clasifique las siguientes variables en cualitativas o cuantitativas. En caso de ser cuantitativas, diga si son discretas o continuas. • a) El nivel de producción de una empresa en un año. • b) La demanda de taxis en un determinado sitio de una ciudad. • c) El nivel de felicidad de una persona. • d) El tiempo de vida útil de un foco. • e) El número de hijos en las familias Niveles de Medición • De acuerdo al tipo de valores que pueden tomar las variables, se pueden clasificar ´estas de la siguiente manera. Para las variables cualitativas, las escalas de medición pueden ser de dos tipos: 1. Nominal 2. Ordinal Mientras que las variables cuantitativas pueden medirse usando dos tipos de escalas: 1. Intervalo 2. De razón. Escala Nominal Se dice que una variable cualitativa se mide mediante una escala nominal, o que es de tipo nominal, si sus valores son etiquetas o atributos y no existe un orden entre ellos • Por ejemplo, si nos interesa estudiar la variable cualitativa “sexo” en una población humana, sus dos posibles valores son: masculino y femenino. • Estos dos valores son etiquetas, no existe un orden entre ellos y por lo tanto se trata de una variable de tipo nominal Escala Ordinal Se dice que una variable cualitativa se mide mediante una escala ordinal, o que es de tipo ordinal, si sus valores son etiquetas o atributos pero existe un cierto orden entre ellos. • Por ejemplo, podemos considerar que la variable cualitativa “estado en el que se encuentra un articulo” tiene como posibles valores: • Malo, Regular y Bueno. Es claro que estos valores son atributos de un articulo y que existe un cierto orden entre estos valores, por lo tanto, se trata de una variable de tipo ordinal. Escala de Intervalo Una variable cuantitativa se mide mediante una escala de intervalo si existe una noción de distancia entre los valores de la variable, aunque no se pueden realizar operaciones numéricas y no existe necesariamente el valor natural cero. • De esta manera no solo tenemos la relación de orden entre los valores de una variable cuantitativa, sino que dados cualesquiera dos de sus valores podemos saber la distancia entre ellos. • Por ejemplo, la escala Celsius (o Fahrenheit) para medir la temperatura es de tipo intervalo, pues existe una noción de distancia entre dos temperaturas, pero claramente no existe el valor cero natural o absoluto (el cero depende de la escala que se use, la temperatura 0˝C no es la misma que 0˝F). Escala de razón Una variable cuantitativa se mide mediante una escala de razón si sus valores tienen un sentido físico y existe el cero absoluto. • Por ejemplo, la variable cuantitativa discreta “edad en años cumplidos de una persona” tiene como posibles valores: 0,1,. . . ,150. Por cuestiones de finitud hemos considerado una edad máxima posible de 150 años. • Es claro que puede considerarse que esta variable puede medirse mediante una escala de razón pues la variable puede tomar el valor cero absoluto y existe la noción física del lapso de 1 año entre un valor y el siguiente en esta escala de medición. Ejercicios • Los siguientes son ejemplos de variables cualitativas. Diga si su escala de medición puede ser nominal u ordinal. • a) Día de la semana con mayor trafico en una ciudad. • b) Estado de uso de un articulo. • c) Preferencia sexual de una persona. • d) Calificación crediticia de un país. • e) Nivel de actividad (bajo, medio, alto) en una bolsa de valores durante una jornada. • f ) Opinión de una persona sobre una decisión del gobierno. Resumen Tipo de variable Cualitativa Cuantitativa Nivel de Medición Descripción Tipo de Operación Nominal Nombran Igualdad Ordinal Ordena = , <, >, Intervalo Igual magnitud +, - De Razón Hay cero absoluto X,/ Parte 3 Muestreo Muestreo Proceso de medición de la información en solo una parte de la población estadística. Se define como el proceso de seleccionar un número de observaciones. Se utiliza cuando no es posible contar o medir todos los elementos de la población objeto de estudio. Tipos de Muestreo Existen dos métodos para seleccionar muestras de poblaciones. Muestreo no aleatorio: es práctica común seleccionar una muestra en forma intencional, de acuerdo a opiniones o criterios personales, fundamentalmente con el objeto de obtener información sin mucho costo. Son ejemplos de muestreos no probabilísticos: a. La muestra es restringida a la parte de la población que es fácilmente accesible. b. La muestra consiste de los elementos que estén más a la mano. c. Se selecciona un grupo de unidades tipo. d. La muestra está compuesta por voluntarios. Muestreo aleatorio o probabilístico: en el cual todos los elementos de la población tienen la oportunidad de ser escogidos para la muestra. Este procedimiento da a cada elemento de la población una probabilidad de ser seleccionado. Dentro de este tipo de muestreo se encuentran: Muestreo aleatorio simple: el cual es un método de selección de muestras que permite que cada muestra posible pueda ser elegida con la misma probabilidad. Por su parte cada elemento de la población tiene la misma oportunidad de ser incluido en la muestra. Muestreo sistemático: método en el cual los elementos que se seleccionan de la población en un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio. Muestreo estratificado: método en el que la población se divide en grupos homogéneos, o estratos, y después se toma una muestra aleatoria simple de cada estrato. Aquí la variabilidad dentro de cada grupo es pequeña y entre los grupos es grande. Muestreo por conglomerados: método en el que la población se divide en grupos o racimos de elementos, y luego se selecciona una muestra aleatoria de estos racimos. La variabilidad dentro de cada grupo es grande y entre los grupos es pequeña; es como si cada conglomerado fuese una pequeña representación de la población en sí misma. Métodos para seleccionar una muestra aleatoria Al seleccionar una muestra aleatoria se debe tomar en cuenta si la extracción se va realizar con reemplazo o sin reemplazo, en el primer caso, una vez extraída el elemento de la población este puede ser devuelto a la misma, en el segundo caso esto no es posible. Existen varios métodos para seleccionar una muestra, entre los cuales se pueden mencionar: • Método del bingo, • Tabla de Números aleatorios • Generación de números pseudoaletorios. Método del Bingo Existen dos métodos para seleccionar muestras de poblaciones. Consiste en etiquetar N papeles, bolas o cualquier otro objeto del 1 al N e introducirlas en una urna o bolsa y agitarla hasta que queden bien mezcladas, luego extraer una a la vez hasta que se hayan seleccionado n artículos donde n es el tamaño deseado de la muestra. Las características de estas unidades se miden u observan Si la población es bastante grande, este método mecánico de selección aleatoria puede ser difícil o prácticamente imposible de implementar. Tabla de números aleatorios Las tablas de números aleatorios contienen los dígitos 0; 1; 2; :::; 7; 8; 9. Tales dígitos se pueden leer individualmente o en grupos y en cualquier orden, en columnas hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible considerarlos como aleatorios Generación de Números Pseudoaleatorios Existen métodos más eficaces para generar números aleatorios, en muchos de los cuales se utilizan calculadoras o computadoras. La mayoría de los paquetes estadísticos generan números pseudoaleatorios y en Excel usando la función aleatoria se pueden generar dichos números. Error de Muestreo Es el error que se comete debido al hecho de dar conclusiones sobre cierta realidad, a partir de la observación de sólo una parte de ella, es decir, es la diferencia entre el parámetro de la población y el estadístico de la muestra utilizado para estimar el parámetro. Ejemplo • En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D. Denotemos como al tamaño de la población y al tamaño de la muestra. Similarmente, denotamos como al tamaño del estrato y al tamaño de muestra que tomamos de cuando tenemos asignación proporcional, se cumple . De este modo, El problema se trata únicamente de encontrar los valores para cada estrato. Observemos que ya conocemos el tamaño de la población ; los tamaños de cada estrato , . , y Además, sabemos que , por lo que ya tenemos todos los datos para calcular el tamaño de muestra para cada estrato. Primero despejamos : Así, para la sección A debemos tomar: Para la sección B: Para la sección C: Por último, para la sección D: Por último, verificamos que Parte 4 Muestreo ALEATORIO ESTRATIFICADO Ejercicio 1 • En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en el departamento de atención al cliente. • Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. 1- ¿Qué tipo de muestreo deberíamos utilizar para la selección de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados? 2- ¿Qué número de trabajadores tendríamos que seleccionar en cada departamento si utilizamos asignación proporcional? • ¿Cual es el tamaño de nuestra Población? • Fórmula para obtener la muestra del estrato. nh – Muestra del Estrato (Depto)? 150 Nh1 – Población del estrato (Personal Dpto. ) 450 Nh2200 Nh3100 Nh4180 n – Muestra 900 N - Población Ejercicio 2 • En una comunidad viven 140 adultos, 91 jóvenes y 84 niños. Se quiere entrevistar a 45 personas de la aldea mediante muestreo estratificado. ¿De Cuántos adultos, jóvenes y niños estaría compuesta la muestra? Ejercicio 3 • En un pueblo habitan 700 hombres adultos, 800 mujeres adultas y 500 menores. De él se quiere seleccionar una muestra de 80 personas, utilizando, para ello, muestreo estratificado con afijación proporcional. ¿Cuál será la composición que debe tener dicha muestra?