Respuestas C ONTRASTES EN A SOCIACIÓN Y P REDICCIÓN Contrastes en Asociación y Predicción 1. Actividades Utilizaremos correlaciones de Spearman porque las variables son de tipo ordinal. Los resultados se muestran a continuación. Todas las correlaciones son significativas pero el gusto por la música clásica y la ópera están muy asociados. el Jazz en cambio tiene correlaciones algo inferiores. Correlaciones Rho de Spearman Coeficiente de correlación Sig. (bilateral) N Jazz Coeficiente de correlación Sig. (bilateral) N Ópera Coeficiente de correlación Sig. (bilateral) N **. La correlación es significativa en el nivel 0,01 (2 colas). 2. Música clásica Música clásica 1.000 . 1425 .275** .000 1406 .575** .000 1377 Jazz .275** .000 1406 1.000 . 1451 .233** .000 1388 Ópera .575** .000 1377 .233** .000 1388 1.000 . 1410 El Jazz sobre todo está correlacionado con el Blues pero no tanto con los otros tipos de música Correlaciones Jazz Pedro Valero [email protected] Blues o Rhythm & Blues Música Rap Country western Country bluegrass 112 Contrastes en Asociación y Predicción Rho de Spearman Jazz Coeficiente de correlación Sig. (bilateral) N Blues o Rhythm & Blues Coeficiente de correlación Sig. (bilateral) N Música Rap Coeficiente de correlación Sig. (bilateral) N Country western Coeficiente de correlación Sig. (bilateral) N Country bluegrass Coeficiente de correlación Sig. (bilateral) N **. La correlación es significativa en el nivel 0,01 (2 colas). Pedro Valero [email protected] Actividades 1.000 . 1451 .551** .000 1416 .184** .000 1405 -.138** .000 1436 .051 .066 1311 .551** .000 1416 1.000 . 1434 .182** .000 1391 .007 .801 1421 .177** .000 1307 .184** .000 1405 .182** .000 1391 1.000 . 1431 -.035 .187 1417 -.008 .778 1298 -.138** .000 1436 .007 .801 1421 -.035 .187 1417 1.000 . 1468 .413** .000 1331 .051 .066 1311 .177** .000 1307 -.008 .778 1298 .413** .000 1331 1.000 . 1335 113 Contrastes en Asociación y Predicción 3. Actividades En los resultados vemos que la relación es moderada aunque significativa entre las variables relacionadas con el sexo y el Heavy metal, pero negativamente. No hay que olvidar que esa variable está codificada al revés, por lo que valores altos significa me disgusta ese tipo de música. Por tanto, la relación es moderada pero significativa e indica que cuanto más interés por este tipo de música practican más el sexo y tienen más compañeros sexuales. Algo similar ocurre con la legalización de la marihuana ya que valores altos significa estar en contra por lo que una correlación positiva como la de la tabla significa a más disgusto por el Heavy, más en contra están de la legalización Correlaciones Número de Rho de Spearman Heavy Metal Coeficiente de correlación Sig. (bilateral) N Relaciones sexuales en el Coeficiente de correlación Sig. (bilateral) último año N Número de compañeros Coeficiente de correlación Sig. (bilateral) sexuales en el último año N Legalización de la Marihuana Coeficiente de correlación Sig. (bilateral) N **. La correlación es significativa en el nivel 0,01 (2 colas). Pedro Valero [email protected] Heavy Metal 1.000 . 1423 -.163** .000 1279 -.207** .000 1315 .160** .000 883 Relaciones compañeros sexuales en el sexuales en el último año -.163** .000 1279 1.000 . 1330 .605** .000 1323 -.099** .004 827 último año -.207** .000 1315 .605** .000 1323 1.000 . 1367 -.145** .000 847 Legalización de la Marihuana .160** .000 883 -.099** .004 827 -.145** .000 847 1.000 . 930 114 Contrastes en Asociación y Predicción 4. Actividades La tabla es muy grande así que he optado por no ponerla pero la correlación más alta de la frecuencia de las relaciones sexuales es la del bigband con un valor positivo de 0.183 y asímismo el valor con el número de amantes es de las más altas con 0.194. Tener en cuenta que los valores son positivos por lo que significan que cuanto más gusta ese tipo de música, menos relaciones y menos amantes se tienen. ¿A alguien se le ocurre la explicación? Por otro lado, el Heavy Metal vemos que tiene las correlaciones negativas más altas, sugiriendo que efectivamente algo hay en ese tipo de música, ¿qué será? Pedro Valero [email protected] 115 Contrastes en Asociación y Predicción 5. Actividades En este caso utilizaremos la correlación de Pearson ya que no parece que haya curvilinealidad entre las variables. La tabla de correlaciones muestra que la puntuación de calidad de la pizza no tiene correlaciones significativas con ninguna de las variables de calorías, Pedro Valero [email protected] 116 Contrastes en Asociación y Predicción Actividades puntuación Grasa Calorias Precio grasa o precio Precio Pedro Valero [email protected] Calorias Grasa puntuación 117 Contrastes en Asociación y Predicción Actividades Correlaciones puntuación puntuación Correlación de Pearson 1 Sig. (bilateral) N 29 Precio Correlación de Pearson -.014 Sig. (bilateral) .944 N 29 Calorias Correlación de Pearson .227 Sig. (bilateral) .237 N 29 Grasa Correlación de Pearson .098 Sig. (bilateral) .614 N 29 **. La correlación es significativa en el nivel 0,01 (2 colas). Pedro Valero [email protected] Precio -.014 .944 29 1 29 -.144 .455 29 -.238 .213 29 Calorias .227 .237 29 -.144 .455 29 1 29 .946** .000 29 Grasa .098 .614 29 -.238 .213 29 .946** .000 29 1 29 118 Contrastes en Asociación y Predicción 6. Actividades En este caso las variables pueden considerarse se relacionan de una manera linea Las correlaciones son todas significativas, lo que indica que estos tres indicadores están todos Pedro Valero [email protected] 119 Contrastes en Asociación y Predicción Actividades Prestigio Educación Salario muy relacionadosl Salario Pedro Valero [email protected] Educación Prestigio 120 Contrastes en Asociación y Predicción Actividades Correlaciones Salario Educación Salario Correlación de Pearson 1 .725** Sig. (bilateral) .000 N 45 45 Educación Correlación de Pearson 1 .725** Sig. (bilateral) .000 N 45 45 Prestigio Correlación de Pearson .838** .852** Sig. (bilateral) .000 .000 N 45 45 **. La correlación es significativa en el nivel 0,01 (2 colas). 7. Prestigio .838** .000 45 .852** .000 45 1 45 Los resultados muestran que algunas de las correlaciones son significativas. Esto no es lo esperado e indica que sí que hay ciertas relaciones entre los factores de personalidad Correlaciones Neuroticismo Correlación de Pearson Sig. (bilateral) N Extraversión Correlación de Pearson Sig. (bilateral) N Abertura a la experiencia Correlación de Pearson Sig. (bilateral) N Simpatía Correlación de Pearson Sig. (bilateral) N Laboriosidad Correlación de Pearson Sig. (bilateral) N *. La correlación es significativa en el nivel 0,05 (2 colas). Pedro Valero [email protected] Neuroticismo 1 50 -.326* .021 50 -.030 .836 50 .040 .785 50 -.336* .017 50 Abertura a la Extraversión -.326* .021 50 1 50 .258 .070 50 .197 .169 50 .222 .121 50 experiencia -.030 .836 50 .258 .070 50 1 50 .297* .036 50 .015 .917 50 Simpatía .040 .785 50 .197 .169 50 .297* .036 50 1 50 .262 .066 50 Laboriosidad -.336* .017 50 .222 .121 50 .015 .917 50 .262 .066 50 1 50 121 Contrastes en Asociación y Predicción 8. Actividades El gráfico que muestra la predicción se muestra abajo. El valor máximo de grasa es un R2 Linea 420.00 Calorias 390.00 360.00 y=2.5E2+6.52*x 330.00 300.00 .0 5.0 10.0 15.0 20.0 25.0 30.0 Grasa poco más que 25 ( en el gráfico es difícil decirlo con exactitud) y el valor predicho está Pedro Valero [email protected] 122 Contrastes en Asociación y Predicción Actividades cerca de 420 calorías. El intervalo de confianza iría aproximadamente entre 410 y 430. Utilizando la tabla de datos podemos conseguir valores más exactos. La pizza con más grasa tiene 26 y tiene un valor predicho de 420,064 calorías. El intervalo de confianza para la media de calorías de las pizzas con esa cantidad de grasa iría desde 409,53 hasta 430, 59 Pedro Valero [email protected] 123 Contrastes en Asociación y Predicción 9. Actividades El gráfico se muestra abajo. El valor máximo de grasa es aproximadamente 26 y el valor R2 Line 420.00 Calorias 390.00 360.00 330.00 300.00 .0 5.0 10.0 15.0 20.0 25.0 30.0 Grasa predicho es aproximadamente 420. El intervalo para pizzas iría de 390 a 450 (este Pedro Valero [email protected] 124 Contrastes en Asociación y Predicción Actividades segundo valor no se ve pero se puede deducir a partir del valor del intervalo inferior. En la tabla de datos se pueden ver los resultados con más exactitud. El valor predicho para una pizza con grasa máxima es 420,06 (como antes) y el intervalo para pizzas individuales iría entre 392,48 y 447,64. Pedro Valero [email protected] 125 Contrastes en Asociación y Predicción 10. Actividades Vemos que el intervalo es muy amplio. Esto se produce porque la correlación entre Precio y calorías es muy baja. Para un precio de aproximadamente .59, la media de calorías Pedro Valero [email protected] 126 Contrastes en Asociación y Predicción Actividades podría ir desde 330 hasta 390 con un valor predicho de cerca de 360. R2 Line 420.00 Calorias 390.00 360.00 330.00 300.00 .60 .80 1.00 1.20 1.40 1.60 1.80 2.00 Precio Pedro Valero [email protected] 127 Contrastes en Asociación y Predicción Actividades 11. La pizza con menos precio tiene un valor predicho de calorías de 359,19 y el intervalo de confianza para las pizzas individuales iría desde 276,62 hasta 441,75. Este intervalo es tan amplio que realmente tiene poca utilidad ya que engloba cualquier pizza. Cuando la correlación entre las variables es baja, las predicciones realizadas con ellas no sirven de mucho. 12. Los resultados se muestran abajo. La pendiente de la regresión es positiva (a más educación más salario) y es significativa. La R al cuadrado 0,525. Resumen del modelo R cuadrado Modelo R R cuadrado 1 .525 .725a a. Predictores: (Constante), Educación Error estándar ajustado de la estimación .514 17.03688 Coeficientesa Coeficientes Coeficientes no estandarizados Modelo B Error estándar 1 (Constante) 10.603 5.198 Educación .595 .086 a. Variable dependiente: Salario Pedro Valero [email protected] estandarizados Beta .725 t 2.040 6.893 Sig. .048 .000 128 Contrastes en Asociación y Predicción 13. Actividades Los resultados para el Prestigio se muestran a continuación. La correlación es mayor y la pendiente también es significativamente diferente de cero. Resumen del modelo R cuadrado Modelo R R cuadrado 1 .702 .838a a. Predictores: (Constante), Prestigio Coeficientesa Coeficientes no estandarizados Modelo B Error estándar 1 (Constante) 10.884 3.678 Prestigio .650 .065 a. Variable dependiente: Salario Pedro Valero [email protected] Error estándar ajustado de la estimación .695 13.49518 Coeficientes estandarizados Beta .838 t 2.959 10.062 Sig. .005 .000 129 Contrastes en Asociación y Predicción 14. Actividades Se aprecia que el intervalo de confianza para la Educación es más ancho que para el de Prestigio en general. Esto se explica porque la R al cuadrado de Prestigio es mayor que el de Educación, lo que hace que la predicción sea mejor. R2 Lineal = 0.525 100.00 80.00 60.00 60.00 Salario 80.00 Salario R2 Lineal = 0.702 100.00 40.00 40.00 20.00 20.00 .00 .00 .00 20.00 40.00 60.00 Educación Pedro Valero [email protected] 80.00 100.00 .00 20.00 40.00 60.00 80.00 100.00 Prestigio 130 Contrastes en Asociación y Predicción 15. Actividades Los resultados muestran que las relaciones extramatrimoniales están asociados con mayores tasas de divorcio. La prueba de chi cuadrado es significativa y yn 81% de los que tuvieron relaciones extramatrimoniales están divorciados y esa diferencia es significativa respecto los que no las tuvieron Pruebas de chi-cuadrado Sig. asintótica (2 Chi-cuadrado de Pearson Valor 60.929a 59.426 64.407 gl caras) Significación Significación exacta (2 caras) exacta (1 cara) 1 .000 1 .000 Corrección de continuidadb Razón de verosimilitud 1 .000 Prueba exacta de Fisher .000 N de casos válidos 1036 a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 57.70. b. Sólo se ha calculado para una tabla 2x2 .000 Married*Extramarital tabulación cruzada Extramarital N Y Total Married Divorced Recuento 396a 98b 494 % dentro de Extramarital 43.3% 81.0% 47.7% Married Recuento 519a 23b 542 % dentro de Extramarital 56.7% 19.0% 52.3% Total Recuento 915 121 1036 % dentro de Extramarital 100.0% 100.0% 100.0% Cada letra del subíndice denota un subconjunto de Extramarital categorías cuyas proporciones de columna no difieren de forma significativa entre sí en el nivel .05. Pedro Valero [email protected] 131 Contrastes en Asociación y Predicción 16. Actividades De nuevo, las diferencias son significativas, tener relaciones prematrimoniales está asociado con tasas más altas de divorcio. La prueba chi cuadrado indica que las diferencias globales son significativas. Married*Premarital tabulación cruzada Premarital N Y Total Married Divorced Recuento 335a 159b 494 % dentro de Premarital 42.1% 66.0% 47.7% Married Recuento 460a 82b 542 % dentro de Premarital 57.9% 34.0% 52.3% Total Recuento 795 241 1036 % dentro de Premarital 100.0% 100.0% 100.0% Cada letra del subíndice denota un subconjunto de Premarital categorías cuyas proporciones de columna no difieren de forma significativa entre sí en el nivel .05. Pruebas de chi-cuadrado Sig. asintótica (2 Chi-cuadrado de Pearson Valor 42.122a 41.172 42.549 gl caras) 1 1 1 Significación Significación exacta (2 caras) exacta (1 cara) .000 .000 .000 Corrección de continuidadb Razón de verosimilitud Prueba exacta de Fisher .000 N de casos válidos 1036 a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 114.92. b. Sólo se ha calculado para una tabla 2x2 Pedro Valero [email protected] .000 132 Contrastes en Asociación y Predicción 17. Actividades La respuesta es negativa. El valor de Chi cuadrado indica que las diferencias no son significativas y ninguna de las comparaciones entre proporciones produce diferencias significativas Pruebas de chi-cuadrado Sig. asintótica (2 caras) Valor gl Chi-cuadrado de Pearson 44 .602 40.985a Razón de verosimilitud 40.965 44 .602 Asociación lineal por lineal .028 1 .868 N de casos válidos 1484 a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 5.94. Título escolar*Signo del zodíaco del encuestado tabulación cruzada Signo del zodíaco del encuestado Aries Tauro Géminis Cáncer Leo Virgo Libra Escorpio Sagitario Capricornio Acuario Piscis Total Título escolar Elemental 29a 20a 25a 27a 28a 27a 18a 16a 17a 23a 26a 20a 276 22.5% 20.2% 18.8% 18.9% 19.2% 23.9% 16.5% 14.3% 14.3% 20.2% 21.8% 13.5% 18.6% Medio 68a 47a 63a 74a 73a 53a 58a 60a 73a 59a 62a 83a 773 52.7% 47.5% 47.4% 51.7% 50.0% 46.9% 53.2% 53.6% 61.3% 51.8% 52.1% 56.1% 52.1% Bachillerato 6a 2a 14a 6a 10a 8a 9a 4a 9a 6a 8a 7a 89 4.7% 2.0% 10.5% 4.2% 6.8% 7.1% 8.3% 3.6% 7.6% 5.3% 6.7% 4.7% 6.0% Diploma 17a 23a 18a 23a 25a 18a 19a 22a 13a 20a 15a 21a 234 13.2% 23.2% 13.5% 16.1% 17.1% 15.9% 17.4% 19.6% 10.9% 17.5% 12.6% 14.2% 15.8% universitario Licenciado 9a 7a 13a 13a 10a 7a 5a 10a 7a 6a 8a 17a 112 7.0% 7.1% 9.8% 9.1% 6.8% 6.2% 4.6% 8.9% 5.9% 5.3% 6.7% 11.5% 7.5% Total 129 99 133 143 146 113 109 112 119 114 119 148 1484 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% Cada letra del subíndice denota un subconjunto de Signo del zodíaco del encuestado categorías cuyas proporciones de columna no difieren de forma significativa entre sí en el nivel .05. Pedro Valero [email protected] 133 Contrastes en Asociación y Predicción 18. Actividades La prueba de Chi cuadrado muestra que no Pruebas de chi-cuadrado Sig. asintótica (2 caras) Valor gl Chi-cuadrado de Pearson 77 .170 88.725a Razón de verosimilitud 91.454 77 .125 Asociación lineal por lineal 1.928 1 .165 N de casos válidos 1478 a. 12 casillas (12.5%) han esperado un recuento menor que 5. El recuento mínimo esperado es 1.14. 19. Tampoco. Pruebas de chi-cuadrado Sig. asintótica (2 Valor gl caras) Chi-cuadrado de Pearson 44 .602 40.985a Razón de verosimilitud 40.965 44 .602 Asociación lineal por lineal .028 1 .868 N de casos válidos 1484 a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 5.94. 20. Los resultados muestran que hay diferencias significativas globalmente. Mirando los residuales estandarizados vemos que la categoría más destacada es viudo con un residual de 16,6 en ninguna. Una comparación interesante es entre solteros y casados (se dan en Ninguna y una vez a la semana, siempre a favor de los casados). Pruebas de chi-cuadrado Sig. asintótica (2 caras) Valor gl Chi-cuadrado de Pearson 24 .000 505.081a Razón de verosimilitud 466.908 24 .000 Asociación lineal por lineal 21.647 1 .000 N de casos válidos 1330 a. 3 casillas (8.6%) han esperado un recuento menor que 5. El recuento mínimo esperado es 2.13. Pedro Valero [email protected] 134 Contrastes en Asociación y Predicción Relaciones sexuales en el último año*Estado civil tabulación cruzada Estado civil Casado Viudo Divorciado Separado Soltero Relaciones sexuales en el Ninguna Recuento 47a 122b 61c 3a, c 60c % dentro de Estado civil 6.7% 88.4% 31.4% 8.6% 22.9% último año Residuo estándar -8.6 16.6 2.8 -1.7 .3 Una o dos veces Recuento 35a, b 2b 17a 5a 22a, b % dentro de Estado civil 5.0% 1.4% 8.8% 14.3% 8.4% Residuo estándar -1.2 -2.2 1.5 2.0 1.5 Una vez al mes Recuento 89a 3b 22a 2a, b 35a % dentro de Estado civil 12.7% 2.2% 11.3% 5.7% 13.4% Residuo estándar 1.1 -3.2 .0 -1.0 1.0 2-3 veces al mes Recuento 136a 7b 24a, b 8a 31a, b % dentro de Estado civil 19.4% 5.1% 12.4% 22.9% 11.8% Residuo estándar 2.6 -3.1 -1.1 1.1 -1.5 Una vez a la semana Recuento 185a 0b 28c 3a, c 37c % dentro de Estado civil 26.4% 0.0% 14.4% 8.6% 14.1% Residuo estándar 4.5 -5.1 -1.5 -1.4 -1.8 2-3 veces a la semana Recuento 160a 4b 28a 10a 53a % dentro de Estado civil 22.8% 2.9% 14.4% 28.6% 20.2% Residuo estándar 2.2 -4.4 -1.5 1.3 .4 4+ veces a la semana Recuento 49a 0b 14a 4a 24a % dentro de Estado civil 7.0% 0.0% 7.2% 11.4% 9.2% Residuo estándar .1 -3.1 .2 1.0 1.4 Total Recuento 701 138 194 35 262 % dentro de Estado civil 100.0% 100.0% 100.0% 100.0% 100.0% Cada letra del subíndice denota un subconjunto de Estado civil categorías cuyas proporciones de columna no difieren de forma significativa entre sí en el nivel .05. Pedro Valero [email protected] Actividades Total 293 22.0% 81 6.1% 151 11.4% 206 15.5% 253 19.0% 255 19.2% 91 6.8% 1330 100.0% 135 Contrastes en Asociación y Predicción 21. Actividades Las diferencias son significativas pero el valor de chi cuadrado no es muy alto. Las diferencias parecen darse sobre todo en 1 vez a la semana (más habitual entre la raza blanca) y más de cuatro veces a la semana (raza negra) Pruebas de chi-cuadrado Sig. asintótica (2 caras) Valor gl Chi-cuadrado de Pearson 12 .036 22.184a Razón de verosimilitud 21.334 12 .046 Asociación lineal por lineal 1.659 1 .198 N de casos válidos 1330 a. 2 casillas (9.5%) han esperado un recuento menor que 5. El recuento mínimo esperado es 4.14. Relaciones sexuales en el último año*Raza del encuestado tabulación cruzada Raza del encuestado Blanca Negra Otra Pedro Valero [email protected] Total 136 Contrastes en Asociación y Predicción Relaciones sexuales en el último año Actividades Ninguna Una o dos veces Una vez al mes 2-3 veces al mes Una vez a la semana 2-3 veces a la semana 4+ veces a la semana Total Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del encuestado Residuo estándar Recuento % dentro de Raza del 252a 28a 13a 293 22.6% 19.0% 19.1% 22.0% .4 68a -.8 10a -.5 3a 81 6.1% 6.8% 4.4% 6.1% .0 128a .4 14a -.6 9a 151 11.5% 9.5% 13.2% 11.4% .1 170a -.7 24a .5 12a 206 15.2% 16.3% 17.6% 15.5% -.2 219a .3 16b .5 18a 253 19.6% 10.9% 26.5% 19.0% .5 210a -2.3 36a 1.4 9a 255 18.8% 24.5% 13.2% 19.2% -.3 68a 1.5 19b -1.1 4a, b 91 6.1% 12.9% 5.9% 6.8% -.9 1115 2.8 147 -.3 68 1330 100.0% 100.0% 100.0% 100.0% encuestado Cada letra del subíndice denota un subconjunto de Raza del encuestado categorías cuyas proporciones de columna no difieren de forma significativa entre sí en el nivel .05. Pedro Valero [email protected] 137 Respuestas