República Bolivariana de Venezuela Universidad Bicentenaria de Aragua Vicerrectorado Académico Facultad De Ciencias Sociales y Administrativas Escuela de Psicología San Cristóbal - Estado Táchira PROCESAMIENTO ESTADÍSTICO DE DATOS Estudiante: Andrea Paola Roa Profesora: Ramona Molina San Cristóbal, marzo 2023 EJERCICIOS 1. Definir las fases o etapas del proceso estadístico. A través de un ejemplo realizar cada una de las respectivas fases o etapas. Proceso estadístico Formulación del problema: La formulación del problema estadístico es una etapa importante en cualquier investigación estadística. Se trata de expresar de manera clara y precisa el problema que se pretende investigar. Para formular el problema estadístico, es necesario establecer las preguntas de investigación que se quieren responder y la justificación de por qué se debe realizar la investigación. Por ejemplo, en una investigación estadística sobre el analfabetismo en niños de 6 a 14 años, el problema estadístico podría ser: "¿Cuál es el estado que presenta mayor índice de analfabetismo en niños de 6 a 14 años? Es importante que la formulación del problema sea clara y específica, para que se puedan obtener resultados precisos y relevantes. Diseño del estudio: Es un factor esencial para la evaluación de impacto y permite definir el esquema de prueba, el diseño de la muestra , entre otros aspectos, existen diferentes tipos de diseño estadístico, como la encuesta por pantalla , el diseño experimental y los estudios observacionales, antes de definir la forma y la cantidad de recoger los sujetos de estudio, es importante considerar qué es lo que la estadística busca medir, el diseño de estudios incluye métodos de encuestas y sondeos , estudios observacionales y el diseño básico de experimentos. Recopilación de datos: La recopilación de datos estadísticos es una fase previa necesaria a la realización de un estudio estadístico, la elección del método de recopilación de datos depende de la estrategia de recopilación de datos, el tipo de variable , la precisión necesaria , el punto de recopilación y la cantidad de datos que se necesitan. Para realizar una recopilación de datos estadísticos, se deben seguir ciertos pasos, como la definición de la población y la muestra, la selección de la técnica de prueba, la elaboración del cuestionario o instrumento de medición, la aplicación del cuestionario o instrumento de medición, la verificación de la calidad de los datos y la tabulación y análisis de los datos. Análisis de datos: El análisis de datos estadísticos es el proceso de recopilar, interpretar y validar datos numéricos con el objetivo de tomar decisiones informadas, este proceso implica la exploración, transformación y examen de datos para identificar patrones y tendencias que puedan revelar. Para realizar un análisis estadístico, es necesario tener una comprensión sólida de los tipos de datos y medidas estadísticas, también es importante diseñar un modelo que se ajuste a los datos y utilizar herramientas estadísticas para analizar los datos. Interpretación de resultados: Es un proceso importante que puede incluir la comprensión de conceptos estadísticos como la significancia estadística, la distribución de los datos, la desviación estándar y la varianza, así como la comprensión de los índices, las tablas y los gráficos del análisis estadístico. 2. Realizar el procesamiento descriptivo de los siguientes datos: Ejercicio 1: Las siguientes son las alturas, en centímetros de sesenta alumnos universitarios. 150 160 161 160 160 172 162 160 172 151 161 172 160 169 169 176 160 173 184 172 160 170 153 167 167 175 166 173 169 178 170 179 175 174 174 174 149 162 161 168 170 178 156 159 159 156 160 166 170 169 163 168 171 178 178 164 176 163 182 162 Variable: Estaturas de estudiantes universitarios, indicar el tipo de variable. Los datos recogidos en la tabla son numéricos con datos muestrales en centímetros, Teniendo en cuenta que la variable estudiada fue la talla de los universitarios, el tipo de variable elegida por el conjunto de datos es del tipo variable cuantitativa continua. Organización: Intervalo 149 154 154 159 159 164 164 169 169 174 174 179 179 184 Marca de Xi 151.5 156.5 161.5 166.5 171.5 176.5 181.5 Gráficos: a. Histograma. fi 4 3 18 7 16 8 4 60 fri 0.0667 0.05 0.3 0.1166 0.2667 0.1333 0.0667 1 fri% 6.67% 5.00% 30.00% 11.66% 26.67% 13.33% 6.67% 100% Fa 4 7 25 32 48 56 60 fra 0.667 0.1167 0.4167 0.5333 0.8 0.9333 1 Fra (%) 6.67% 11.67% 41.67% 53.33% 80.00% 93.33% 100% Alturasde los sesenta alumnos 20 18 16 14 12 10 8 6 4 2 0 151,5 156,5 161,5 166,5 171,5 176,5 181,5 Ряд1 b. Polígono de Frecuencias Alturas de los sesenta alumnos 20 18 16 14 12 10 8 6 4 2 0 18 16 8 7 4 151,5 4 3 156,5 161,5 166,5 171,5 176,5 181,5 Descripción: Realizar el análisis e Interpretación de los resultados obtenidos de cada estadístico. I. Medidas De Tendencia Central 1. Media Aritmética: Altura Marca de Xi fi Fi Xi.Fi 149 154 151,5 4 4 606 154 159 156,5 3 7 469,5 159 164 161,5 18 25 2907 164 169 166,5 7 32 1165,5 169 174 171,5 16 48 2744 174 179 176,5 8 56 1412 179 184 181,5 4 60 726 60 𝐱̅ = 10030,00 ∑ Xi Fi 10030 = = 167,17 ∑ fi 60 La media aritmética estudia el promedio de las alturas y es de 167,17cm 2. Mediana: Altura Marca de Xi fi Fi 149 154 151,5 4 4 154 159 156,5 3 7 159 164 161,5 18 25 164 169 166,5 7 32 169 174 171,5 16 48 174 179 176,5 8 56 179 184 181,5 4 60 60 x~ = n +1 / 2 = 30,5 Li= 164 N= 60 Faa= 24 Fmd= 7 ic= 5. 60 − 25 Md = 164 + ( 2 ) . 5 = 167,57 7 La mediana estudia que El 50% de estudiantes tienen alturas bajo 167,17cm. 3. Moda: Altura Marca de Xi fi Fi 149 154 151,5 4 4 154 159 156,5 3 7 159 164 161,5 18 25 164 169 166,5 7 32 169 174 171,5 16 48 174 179 176,5 8 56 179 184 181,5 4 60 60 Li= 159 F2= 18-7=11 F1= 18-3=15 Ic= 5. Mo=Li+ f2/(f1+f2). ic Mo=159+ 15/ (15+11) .5; Mo=159+ 15/26 .5; Mo=159+ 75/26 Mo=159+ 2,88=161,88 La moda estudia la frecuencia de la media y es de 161,88cm II. Medidas De Dispersión 4. Desviación Estándar Altura Marca de Xi fi Xi. Fi (XI - X )̃ (XI - X )̃2 (XI - X) ̃2. Fi 149 154 151,5 4 606 -15,5 256 1024 154 159 156,5 3 469,5 -10,5 121 363 159 164 161,5 18 2907 -5,5 36 648 164 169 166,5 7 1165,5 -0,5 1 7 169 174 171,5 16 2744 4,5 16 256 174 179 176,5 8 1412 9,5 81 648 179 184 181,5 4 726 14,5 196 784 60 10030 3730 s= √ 60 − 1 = 59 𝑠 = √63,11 = 7,94cm La dispersión de los datos de la media aritmética es de 7,94cm2 5. La Varianza s2=〖7,94〗^2=63,11cm La varianza estudia que en la medida de dispersión fue de 63,11cm2 en su promedio de datos de altura. 6. El Coeficiente De Variación Desviación Estándar: S= 7,94 Media Aritmética: x ̅= 167,17 3730 CV= Sx / x ̅ = 7,78 / 167 = 0,0475 El coeficiente de Variación estudia la dispersión con un 4,75%. III. Medidas De Posición No Centrada 7. Cuartil 3: Altura Marca de Xi fi Fi 149 154 151,5 4 4 154 159 156,5 3 7 159 164 161,5 18 25 164 169 166,5 7 32 169 174 171,5 16 48 174 179 176,5 8 56 179 184 181,5 4 60 60 Posición De Q: 3. (n+1) / 4= 60+1= 61; 3. (61) / 4= 45,75 Q1= 169 +(45-32) /16. 5=169+13/16.5 =169+ 65/18=169+4,06=173,06 El cuartil 3 dice que el 50% los estudiantes tienen una altura de 173,06. 8. Decil 3: Altura fi Fa 149 153 4 4 154 158 2 6 159 163 18 24 164 168 7 31 169 173 15 46 174 178 11 57 179 183 3 60 60 Posición De D3: 3. (n+1) / 10= 60+1=61; 3. (61) / 10= 18,3 D3= 159+(18-6) /18 .5=159+12 /18.5=159+ 60/18=159+3,33=162,33 El Decil 3 dice que bajo las terceras decimas los estudiantes tienen altura de 162,33. 9. Percentil 79: Altura fi Fa 149 153 4 4 154 158 2 6 159 163 18 24 164 168 7 31 169 173 15 46 174 178 11 57 179 183 3 60 60 Posición De P79: 79. (n+1) / 100= 60+1=61; 79. (61) / 100= 48,19 P79= 169+ (48-31) /15 .5= 169+17 / 15 .5=169+85 / 15=169+1,66=174,66 El Percentil 79 muestra que el 79% de los estudiantes tienen altura de 174,66 Ejercicio 2: En el hospital Universitario se ha registrado, durante el mes de enero, el número de metros que cada niño recorre, seguido y sin caerse, el primer día que comienza a caminar, obteniéndose la tabla de información adjunta. Número de Niños 3 7 2 8 10 3 5 2 Número de Metros 1 2 3 4 5 6 7 8 Variable: La variable del ejercicio 2 es de tipo cuantitativa continua. Organización: Clase fi Xi fa fi Fi% fr (%) Fra (%) 1 3 2 3 0,075 7,50% 0,08 7,50% 2 7 4,5 10 0,175 17,50% 0,25 25,00% 3 2 2,5 12 0,05 5,00% 0,30 30,00% 4 8 6 20 0,2 20,00% 0,50 50,00% 5 10 7,5 30 0,25 25,00% 0,75 75,00% 6 3 4,5 33 0,075 7,50% 0,825 82,50% 7 5 6 38 0,125 12,50% 0,95 95,00% 8 2 5 40 0,05 5,00% 1,00 100,00% 1 100,00% Suma 40 Gráficos: 1. Histograma Histograma de los metros que recorrieron los niños 12 10 10 8 8 7 6 4 5 3 3 2 2 2 0 1 2 3 2. Polígono de Frecuencias 4 5 6 7 8 Poligono de Frecuencias de los metros que pudieron recorrer los niños 12 10 10 8 7 8 5 6 3 4 3 2 2 2 0 1 2 3 4 5 6 7 8 Descripción: Realizar el análisis e Interpretación de los resultados obtenidos de cada estadístico I. Medidas De Tendencia Central 1. Media Aritmética Clase fi Xi.Fi 1 3 3 2 7 14 3 2 6 4 8 32 5 10 50 6 3 18 7 5 35 8 2 16 Suma 40 𝐱 ̅ = (∑▒〖Xi Fi〗)/(∑▒fi) = (3 + 14 + 6 + 32 + 50 + 18 + 35 + 16)/40 = 4,35 La media aritmética estudia el promedio de los datos y es de 4,35 metros. 2. Mediana fi= n / 2 = 20; fi=21 Md=4+5 / 2=4,5 metros La mediana estudia la mitad de los datos y es de 4,5metros 3. Moda Clase fi 1 3 2 7 3 2 4 8 5 10 6 3 7 5 8 2 Suma 40 Moda= 5 La moda es de 5 metros, es la frecuencia más alta II. Medidas De Dispersión 4. Desviación Estándar s= √ (σ2=1,02 metros.) La desviación estándar muestra una dispersión de 1,02. 5. La Varianza: Clase fi Xi (XI - X )̃ (XI - X )̃2 1 3 2 -3 11 2 7 4,5 -2 6 3 2 2,5 -1 2 4 8 6 0 0 5 10 7,5 1 0 6 3 4,5 2 3 7 5 6 3 7 8 2 5 4 13 Suma 40 σ^2=42/40=1,05 La varianza estudia que la dispersión fue de 1,05 metros 6. El Coeficiente De Variación De Pearson Desviación Estándar: Sx= 2,28 Media Aritmética: x ̅= 4,75 CV= S / x ̅ = 1,02 / 4,35 = 0,23 El coeficiente de Variación determina que los datos se asocian con un 23%. III. Medidas De Posición No Centrada 7. Cuartil 1: Clase fi Xi fa 1 3 2 3 2 7 4,5 10 3 2 2,5 12 4 8 6 20 5 10 7,5 30 6 3 4,5 33 7 5 6 38 8 2 5 40 Suma 40 Posición De Q1: 1. (n) / 4= 40; 1. (40) / 4= 10 Q2= 2 El cuartil 1 muestra su posición de la primera cuarta partes de la muestra con un dato de 2 metros. 8. Decil 7: Clase fi Xi fa 1 3 2 3 2 7 4,5 10 3 2 2,5 12 4 8 6 20 5 10 7,5 30 6 3 4,5 33 7 5 6 38 8 2 5 40 Suma 40 Posición De D8: 8. (n) / 10= 40; 8. (40) / 10= 32 D8= 6 El Decil 8 estudia que el 80% de niños recorrieron 6 metros. 9. Percentil 45: Clase fi Xi fa 1 3 2 3 2 7 4,5 10 3 2 2,5 12 4 8 6 20 5 10 7,5 30 6 3 4,5 33 7 5 6 38 8 2 5 40 Suma 40 Posición De P45: 45. (n) / 100= 40; 45. (40) / 100= 18 P45= 4 El Percentil 45 dice que el 45% de los niños recorrió 4 metros y el 55% restante pudo recorrer más. Ejercicio 3: Plantear un ejercicio relacionado con algún aspecto de la psicología y realizar su respectivo análisis estadístico de datos. (Muestra no mayor a 50 datos). En lo que se refiere a la determinación de las pruebas de depresión que realizo una psicóloga para los estudiantes de la Universidad Bicentenaria de Aragua, tomo resultados de 24 alumnos, se realizó mediante una encuesta que contiene un a escala de 5 a 9 y cada paciente dependiendo de sus respuestas tomaría valor dentro de la escala. En la siguiente tabla se muestran los datos obtenidos por la escala de depresión en los 24 estudiantes. 5-5,5 5,5-6 5,5-6 6-6,5 6-6,5 6-6,5 6,5-7 6,5-7 6,5-7 6,5-7 7-7,5 7-7,5 7-7,5 7-7,5 7-7,5 7-7,5 7-7,5 7-7,5 7,5-8 8-8,5 8-8,5 8-8,5 8-8,5 8-8,5 Tabla de frecuencias para datos agrupados Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 fi 1 2 3 4 8 1 5 24 fri 0.04 0.08 0.13 0.17 0.33 0.04 0.21 1 fri% 4.00% 8.00% 13.00% 17.00% 33.00% 4.00% 21.00% 100% Fa 1 3 6 10 18 19 24 fra 0.04 0.13 0.25 0.42 0.75 0.79 1 Fra (%) 4.00% 13.00% 25.00% 42.00% 75.00% 79.00% 100% Histograma Histograma 9 8 8 7 6 5 5 4 4 3 3 2 2 1 1 1 0 5,25 5,75 Polígono de Frecuencias 6,25 6,75 7,25 7,75 8,25 Poligono de Frecuencias 9 8 8 7 6 5 5 4 4 3 3 2 2 1 1 1 0 5,25 5,75 6,25 6,75 7,25 7,75 8,25 1. Media Aritmética Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 𝐱̅ = fi 1 2 3 4 8 1 5 24 Xi . Fi 5.25 11.5 18.75 27 58 7.75 41.25 169.5 ∑ Xi Fi 169,5 = = 7,0625 ∑ fi 24 La media aritmética marca el promedio de la encuesta de depresión en los estudiantes universitarios contando con 7,06 en la escala que va del 5 al 9. 2. Mediana Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 fi 1 2 3 4 8 1 5 24 Fa 1 3 6 10 18 19 24 x~ = n +1 / 2 = 12,5 Li= 7; N= 24; Faa= 10; Fmd= 8; ic= 0,5. Md=7+ ((24/2-10) /8).0,5=7,15625 El 50% de los estudiantes universitarios tuvieron en la escala de depresión un intervalo de 7,15 puntos. 3. Moda Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 fi 1 2 3 4 8 1 5 24 Fa 1 3 6 10 18 19 24 Li= 7; F2= 8-1=7; F1= 8-4=4; Ic= 0.5 Mo=159+ 4/ (7+4) .0,5= 7,18 La frecuencia que más se ve en el intervalo obtenido de los estudiantes universitarios referido a la escala de depresión es de 7,18 puntos. 4. Desviación Típica Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 fi 1 2 3 4 8 1 5 24 Xi . Fi 5.25 11.5 18.75 27 58 7.75 41.25 169.5 (XI - X )̃ -1.8125 -1.3125 -0.8125 -0.3125 0.1875 0.6875 1.1875 (XI - X )̃2 3.2851 1.7226 0.6601 0.0976 0.0351 0.4726 1.4101 (XI - X )̃2 . Fi 3.2851 3.4452 1.9803 0.3904 0.2808 0.4726 7.0505 16.9049 s= √ ((16,9049) / (24-1=23) = √ (0,7349)) =0,8572 Los datos tienen una dispersión que se aproxima a 0,85 en los datos que se pudieron tomar de acuerdo a la escala de depresión. 5. La Varianza s2=〖0,8572〗^2=0,7347 La varianza estudio que los datos fueron dispersos en unos 0,73 puntos, por lo que aun así no salen del intervalo de 1. 6. El Coeficiente De Variación Desviación Estándar: Sx= 0,8572 Media Aritmética: x ̅= 7,0625 CV= Sx / x ̅ = 0,8572 / 7,0625 = 0,1213 La variación obtenida de la desviación y la media es de 0,12%. 7. Cuartil 2 Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 fi 1 2 3 4 8 1 5 24 Fa 1 3 6 10 18 19 24 Q2: 2. (n+1) / 4= 24+1= 25; 2. (25) / 4= 12.5 𝐐𝟐 = 7 + (12 − 10)/8 . 0,5 = 7 + 2/8. 0,5 = 7 + 1/8 = 7 + 0,125 = 𝟕, 𝟏𝟐𝟓 El cuartil 2 dice que en su 50% son de 7,12 en escala de depresión por lo que las personas tendrían un alto puntaje. 8. Decil 7 Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 fi 1 2 3 4 8 1 5 24 Fa 1 3 6 10 18 19 24 D7: 7. (n+1) / 10= 24+1=61; 7. (25) / 10= 17,5 𝐃𝟕 = 7 + (17 − 10 )/8 . 0,5 = 7 + 7/8 . 0,5 = 7 + 3,5/8 = 7 + 0,4375 = 𝟕, 𝟒𝟑𝟕𝟓 El Decil 7 obtiene que, los datos arrojaron en una séptima décima parte con 7,43 puntos de acuerdo a la escala de depresión que respondió los 24 estudiantes. 9. Percentil 90 Intervalo 5 5.5 5.5 6 6 6.5 6.5 7 7 7.5 7.5 8 8 8.5 Marca de Xi 5.25 5.75 6.25 6.75 7.25 7.75 8.25 fi 1 2 3 4 8 1 5 24 Fa 1 3 6 10 18 19 24 P90: 90. (n+1) / 100= 24+1=25; 90. (25) / 100= 22,5 𝐏𝟕𝟓 = 8 + (22 − 19)/5 . 0,5 = 8 + 3/5 . 0,5 = 8 + 1,5/5 = 8 + 0,3 = 𝟖, 𝟑 El Percentil 90 saca son un 90% que el 8,3 es la escala más alta respondida por los estudiantes y el otro 10% tiene un rango menor. Análisis: En la Universidad Bicentenaria de Aragua tuvo la oportunidad un psicólogo de hacer una encuesta con la escala de depresión que mide desde el intervalo 5 hasta el intervalo 9, y mediante ello se pudo obtener que los 24 estudiantes que respondieron dicha trivia, contaron con rangos muy altos ya que la media se ubicó en el intervalo de 7 a 7,5 puntos, esto quiere decir que la institución universitaria debe crearse un plan específico para ayudar a aquellos estudiantes con esta gran problemática que puede ser causada por una distinción de factores.