Universidad Autónoma de Madrid Probabilidad y Estadı́stica Para medir dicha influencia, lo primero que se nos podrı́a ocurrir es hacer preguntas A y B a todos los estudiantes. Pero eso podrı́a distorsinar las respuestas, ya que podrı́a hacer que respondieran 1. Objetivos igual a ambas preguntas. Por eso, decidı́ que iba a dividir a la clase en dos Mi intención con esta investigación era medir la grupos de estudiantes de manera aleatoria: a un diferencia en la respuesta de la gente ante dos situa- grupo le harı́a la pregunta A y al otro la pregunta ciones económicamente idénticas pero “psicológica- B. mente” diferentes. Con esos datos, mi intención era ver si habı́a Para ser más precisos, querı́a medir dicha dife- evidencia (con significación 5 %) para decir que la rencia en la población de alumnos de la asignatura proporcion de alumnos que responderı́a ((Sı́)) a la ((Probabilidad y Estadı́stica)) del Grado en Inge- pregunta B (en caso de habérsela hecho a todos) nierı́a de Tecnolgı́as y Servicios de Telecomunica- serı́a mayor que la proporción de alumnos que resción en la UAM, de la cual soy profesor. ponderı́a ((Sı́)) a la pregunta A (en caso de habérsela Por razones prácticas, restringı́ dicha población hecho a todos). a los alumnos que vinieran a clase el dı́a miércoles 5 de diciembre. Un experimento psicológico (Ejemplo de experimento) 3. 2. Realización Diseño Pensé en hacer el experimento al comienzo de la clase del miércoles 5 de diciembre. El problema Las dos preguntas que querı́a hacer a los alumnos que tenı́a para dividir a la clase en dos grupos era de mi clase eran* que no sabı́a cuántos alumnos vendrı́an ese dı́a. Al A: Imagina que has decidido asistir a una obra de final, decidı́ hacer un grupo de 25 estudiantes para teatro y has pagado el precio de 20 euros por la pregunta A y un grupo de 28 para la pregunta boleto. Cuando entras al teatro, descubres que B. En la clase hay 82 alumnos, pero a las últimas has perdido el boleto; no estaba numerado y clases sólo estaban viniendo unas 50. La división aleatoria la hice usando R, con una no hay posibilidad de recuperarlo. ¿Pagarı́as sacada aleatoria de una caja con 25 As y 28 Bs. 20 euros para comprar de nuevo un boleto? El orden de dicha división quedó B: Imagina que has decidido asistir a una obra de BABABBABAABBAAAABBABBBABBAABBAAAABBBABB teatro cuyo precio es de 20 euros por boleto. AABABBABAAABBB. Justo antes de llegar a la taquilla del teatro, descubres que acabas de perder 20 euros, y Después hice las copias de las preguntas y las no hay ninguna posibilidad de recuperarlos. ordené de acuerdo a lo que habı́a salido en R. En ¿Pagarı́as 20 euros aún ası́ para comprar un clase intenté repartirlas en orden por columnas. boleto? Les di un tiempo de unos 2 minutos para responder. Después recogı́ las preguntas. La respuesta a cada una de esas preguntas sólo Al final resultó que sólo habı́a 50 alumnos en la podrı́a ser ((Sı́)) o ((No)). Desde un punto de visclase, luego 3 preguntas se quedaron sin repartir. ta económico, ambas preguntas son esencialmente idénticas; pero la diferencia de que en una has perdido 20 euros y en la otra el boleto (que costaba 20 euros) podrı́a influir en las respuestas. * Dichas preguntas son una modificación de un problema del libro Satitistics de Freedman, Pisani, etc. 4. Muestras Las respuestas, en orden en que fuero recogidas son (con 1=((Sı́)), 0=((No)), n=Nulo) 1 de 2 Universidad Autónoma de Madrid Probabilidad y Estadı́stica A 7→ 1001010000010110000001n. B 7→ 110100111111100110111001001. Deberı́a haber puesto el orden completo, con las respuestas A y B mezcladas, pero al contarlas en clase las separé en dos montones sin darme cuenta. Si no, podrı́a haber usado esos datos para ver en qué medida cumplı́ con el orden prescrito por R. Los datos obtenidos quedan resumidos en las siguiente tabla A B Sı́ 7 17 No 15 10 Nulo 1 0 Se suponı́a que sólo podı́an responder ((Sı́)) o ((No)), pero un estudiante no respondió ninguna de las opciones. Como sólo fue una persona, vamos a dejar ese dato fuera del análisis. Vemos que hay 50 respuestas, luego vemos que 3 se quedaron sin repartir. Además, por las prisas no conseguı́ repartirlas del todo en el orden que me habı́a marcado R. la proporción de alumnos que responderı́a ((Sı́)) a la pregunta A serı́a mayor que la proporción de alumnos que responderı́a ((Sı́)) a la pregunta B. Debemos recordar que dicha conclusión en realidad no es sobre la clase completa de 82 alumnos, sino sólo sobre los 50 que vinieron a clase. Por otra parte, es difı́cil saber hasta qué punto dichas respuestas reflejan lo que realmente piensan los estudiantes, ya que han podido ser influidos por lo que pensaban que debı́an responder o por otro tipo de factores psicológicos. 7. Puntos débiles Aparte de las deficiencias ya descritas, vamos a comentar otras ocurridas durante el experimento. Por una parte, la división que hice no fue sobre los 50 estudiantes que vinieron a clase, sino sobre 53. Parece razonable asumir que esto no puede haber tenido mucha influencia. Por otra, sabı́a que si les daba las preguntas directamente, las comentarı́an entre ellos y eso afectarı́a mucho a sus respuestas. En particular, debı́a 5. Inferencia estadı́stica evitar que se dieran cuenta de que habı́a dos modelos distintos de preguntas, para evitar distorsiones Queremos ver si hay evidencia para decir que en sus respuestas. la diferencia de medias es mayor que 0, al 5 % de Para ello, les dije que se separasen como para significación. Como hemos aplicado aleatorización, hacer un examen, y de hecho les dije que ı́bamos podemos aplicar el test para diferencia de medias a hacer un test. Luego les repartı́ las copias dide dos cajas de 01s. Ası́, como a = 7/22 y b = ciéndoles que las mantuvieran boca abajo. Otra de 17/27, calculamos las precauciones que tomé fue escribir las preguntas de forma que pareciesen la misma a primera 17 7 27 − 22 − 0 vista. q ≈ 2.29. (17/27)(10/27) (7/22)(15/22) Algunos estudiantes dieron la vuelta a la hoja + 27 22 antes de empezar. Por otra parte, al repartir las hojas no seguı́ del todo el orden que me habı́a marPor otra parte P(Z > 1.64) ≈ 5 %. Como cado R, debido a las prisas. Pero creo que estos dos 2.29 > 1.64 problemas no estuvieron lo suficientemente extendidos como para afectar a los resultados. la respuesta al test es que ((Sı́ hay evidencia)). Probablemente, un mejor diseño del experimento hubiera sido repartir las preguntas junto con el examen final del curso. Eso hubiera hecho que 6. Conclusiones seguramente más alumnos de la clase vinieran, y además no habrı́a tenido problemas al repartir. La conclusión de este experimento es que tenemos evidencia (5 % de significación) para decir que 2 de 2