TRABAJO DE ESTADISTICA PRESENTADO POR: PAULA ANDREA ESPINOSA ALBERT GÓMEZ FIERRO MIGUEL SOLANO JUAN CARLOS MUÑETON JENNY GÓMEZ SÁNCHEZ PROFESORES: JOSE JOAQUIN PAEZ PATRICIA LEURO SENA DOLCA BOGOTA, AGOSTO 2010 TRABAJO DE ESTADISTICA Defina Variables, atributos y de ejemplos de cada uno. 1. Variables: Son atributos, cualidades, características observables que poseen las personas, objetos, instituciones que expresan magnitudes que varían discretamente o en forma continua. Ejemplo: la edad, sexo, talla, peso, contextura, color del cabello, color de ojos, grado de atención, conocimientos previos, confesión religiosa, procedencia, clase social, etc. Son variables de las cosas, objetos: forma, color, tamaño, peso, conservación, antigüedad, etc. Las instituciones también poseen variables como: antigüedad, organización, eficiencia, magnitud, productividad, etc. 2. 2.1. Clasificación: Existen diversas clasificaciones de variables. Por su Grado de abstracción o concreción. a. Variables Teóricas: Son aquellas que son abstractas. Ejemplos: estatus socioeconómico, rendimiento académico, imperialismo, dependencia, dominación, infraestructura, etc. b. Variables Intermedias: Son aquellas que permiten comprender a las variables teóricas. Ejemplo El rendimiento académico no se entiende sino está referida a los calificativos, a la asistencia, a la dedicación al estudio, puntualidad del estudiante. c. Variables empíricas: Indicadores, son aquellas que permiten entender mejor a las variables intermedias y por tanto a las variables teóricas. Ejemplos: la variable calificativa puede ser muy buena, buena, regular, mala y pésima. Las variables empíricas pueden expresarse cuantitativamente. 2.2. Por su posición en la investigación: a. Variable Dependiente: Es aquella que dentro de una hipótesis representa la consecuencia, el efecto, el fenómeno que se estudia. Se simboliza con la letra Y. Ejemplo: entre las variables de rendimiento académico y aplicación de métodos, la variable dependiente es rendimiento académico. En una función matemática como la típica: Y= (f) X (Se lee Y está en función de X; ó Y depende de X) b. Variable Independiente: Es aquella que influye en la variable dependiente y no de depende de otra variable, dentro de una hipótesis. Se simboliza con la letra X. Ejemplo: entre las variables hiperactividad y falta de autoestima, la variable autoestima es independiente, ya que explica o influye en la hiperactividad del niño. c. Variable Extrañas: Externas son aquellas que provienen del exterior al campo de investigación y por ello se denominan también intervinientes. Son de varias clases pero lo que ahora nos interesa son las variables conexas, o variables sujeto y orgánicas, como son las cualidades del sujeto que se investiga por ejemplo: edad, sexo, inteligencia, conocimientos previos, procedencia, etc. y que pueden influir en la variable dependiente, por ejemplo rendimiento académico. En otras hipótesis las variables extrañas pueden provenir de fuera del sujeto de estudio. Se simbolizan con la letra Z. 2.2. Por su Naturaleza: Pueden ser cualitativas, ordinales y cuantitativas. a. Variables Cualitativas: son aquellas que nominan o señalan cualidades. Ejemplo: La variable talla puede expresarse: muy alto, alto, mediano, bajo, muy bajo. b. Variables Ordinales: son las que expresan una clasificación jerarquizada, en orden de importancia. Ejemplo: la variable nivel de instrucción comprende: iletrado, primaria, secundaria, superior. c. Variables Cuantitativas: pueden ser discretas y continuas c.1. Variables Discretas: son las que expresan números enteros, por tanto pueden ser contados. Ejemplo población escolar, producción de petróleo, nacimientos, muerto, etc. c.2. Variables Continuas: son las que expresan en números decimales, por tanto pueden ser medidos con mayor exactitud. Ejemplo: el peso, edad ó talla de una persona. 2. Atributos: Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número. "Reciben el nombre de variables cualitativas o atributos, aquellas características que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Ejemplo: El estado civil de cada uno de los estudiantes del curso de estadísticas, no se presenta en la misma modalidad en todos. Variables cualitativas Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: o Variable cualitativa ordinal: También llamada variable cuasicuantitativa. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. o Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia. 2. 3. CUADRO SINOPTICO DE MÉTODOS DE RECOLECCIÓN DE LA INFORMACIÓN. 4. Población y muestra Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población. No debe confundirse la población en sentido demográfico y la población en sentido estadístico. La población en sentido demográfico es un conjunto de individuos (todos los habitantes de un país, todas las ratas de una ciudad), mientras que una población en sentido estadístico es un conjunto de datos referidos a determinada característica o atributo de los individuos (las edades de todos los individuos de un país, el color de todas las ratas de una ciudad). Incluso una población en sentido estadístico no tiene porqué referirse a muchos individuos. Una población estadística puede ser también el conjunto de calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios. Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin embargo, en la mayoría de los casos no es posible obtenerlos por razones de esfuerzo, tiempo y dinero, razón por la cual se extrae, de la población, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma. ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la provincia de Buenos Aires, una muestra será conjunto de edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar. Universo: El Universo es generalmente definido como todo lo que existe físicamente: la totalidad del espacio y del tiempo, de todas las formas de la materia, la energía y el impulso, las leyes y constantes físicas que las gobiernan. 5. FORMULA Estudios para contraste de hipótesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes. Tabla 1. Elementos de la Inferencia Estadística A. Estudios para determinar parámetros Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra. A.1. Estimar una proporción: Si deseamos estimar una proporción, debemos saber: a. El nivel de confianza o seguridad (1lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58. b. La precisión que deseamos para nuestro estudio. c. Una idea del valor aproximado del parámetro que queremos medir (en este caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%). Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral: donde: Z 2 = 1.962 (ya que la seguridad es del 95%) p = proporción esperada (en este caso 5% = 0.05) q = 1 – p (en este caso 1 – 0.05 = 0.95) d = precisión (en este caso deseamos un 3%) Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria: donde: N = Total de la población Z 2 = 1.962 (si la seguridad es del 95%) p = proporción esperada (en este caso 5% = 0.05) q = 1 – p (en este caso 1-0.05 = 0.95) d = precisión (en este caso deseamos un 3%). ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral. Según diferentes seguridades el coeficiente de Z varía, así: Si la seguridad Z Si la seguridad Z Si la seguridad Z Si la seguridad Z fuese del 90% el coeficiente sería 1.645 fuese del 95% el coeficiente sería 1.96 fuese del 97.5% el coeficiente sería 2.24 fuese del 99% el coeficiente sería 2.576 Bibliografía: www.monografias.com › Educacion http://www.monografias.com/trabajos15/estadistica/estadistica.shtml .http://es.wikipedia.org/wiki/Fuente_primaria