ALGUNOS APUNTES SOBRE LOS TESTS PSICOLÓGICOS Y SU

I1 AZTERLANAK ESTUDIOS ALGUNOS APUNTES SOBRE LOS TESTS PSICOLÓGICOS Y SU USO PARA LA SELECCIÓN DE PERSONAL EN LA ADMINISTRACIÓN PÚBLICA SOME NOTES ABOUT PSYCHOLOGICAL TESTS AND TESTING FOR PERSONNEL SELECTION PURPOSES IN THE SPANISH PUBLIC SERVICE David Arribas Águila Departamento de I+D+i de TEA Ediciones [email protected] Recibido: 23/9/2014 Aceptado: 4/11/2014 Laburpena: Ikuspegi orokorra ematen da langileen hautaketan test psikologikoak erabiltzearekin lotutako hainbat alderdiei buruz. Lehenengo eta behin, gaia ikuspegi historiko batetik aztertzen da. Ondoren, Administrazio Publikoko langileen hautaketan kontuan hartu beharreko kontzeptu psikometriko nagusien glosario bat eskaintzen da. Gainera, kritika et akats ohikoenak berraztertzen dira, baita baremoak erabiltzearekin eta puntuazioak interpretatzearekin lotutako kontu zehatz batzuk ere. Gako-hitzak: Testa, ebaluazio psikologikoa, psikometria, psikoteknikoak, sarrera-probak. Resumen: Se ofrece una panorámica general sobre diferentes aspectos relacionados con el uso de los tests psicológicos para la selección de personal. En primer lugar se analiza la temática desde una breve perspectiva histórica. A continuación se ofrece un glosario con los conceptos psicométricos más esenciales a tener en cuenta al abordar una selección de personal en el ámbito de la Administración Pública. Además, se repasan las críticas y errores más comunes y algunas cuestiones específicas relacionadas con el uso de baremos y la interpretación de puntuaciones. Palabras clave: Test, evaluación psicológica, psicometría, psicotécnicos, pruebas de admisión. Abstract: An overview about different features of the use of psychological tests for personnel selection purposes is provided. First, psychological testing is briefly analyzed under a historical perspective. Next, it offers a glossary with the most essential psychometrics concepts to keep in mind when addressing a personnel selection process in the field of Public Service. In addition, the most common mistakes and complaints concerning psychological assessment, as well as some specific issues related to the use of norms and the interpretation of the test scores are reviewed. Keywords: Test, psychological testing, psychometrics, psychometric tests, admissions tests. 24 Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública Sumario 1. Introducción.—2. Haciendo un poco de historia.—3. Conceptos psicométricos básicos: glosario.—4. Críticas comunes a los tests psicométricos.—5. Errores frecuentes.—6. Baremo general frente a baremo interno.—7. El problema de la sinceridad en las medidas de autoinforme. 1. Introducción Hoy en día resulta difícil encontrar a alguien que no haya tenido que enfrentarse a uno en algún momento de su vida, bien sea en la escuela, en la universidad, al buscar ayuda profesional o al optar a un puesto de trabajo. Venerados por algunos, los evaluadores, y temidos por otros, los evaluados, los tests psicológicos cumplen una función irremplazable en muchos ámbitos de la sociedad y poseen una gran influencia sobre la vida y la carrera de las personas. El uso de pruebas psicológicas en el ámbito de la selección de personal para la Administración Pública es un hecho igualmente conocido y extendido, así como comentado y en ocasiones fuertemente criticado. Así, muchas de las cuestiones generales que sobre este modo de evaluar se debaten en la sociedad o en los foros científicos son plenamente válidas y aplicables al sector público, desde las que ponen en duda la fiabilidad y validez del sistema a otras más específicas en lo que al propio procedimiento o incluso a la interpretación de las puntuaciones se refiere. En los siguientes párrafos se presentan algunos datos e informaciones que pretenden proporcionar al lector una visión general sobre la evaluación psicológica mediante tests, así como algunas pautas y prácticas recomendadas que pueden servir de ayuda a las personas responsables de algún proceso de selección en el ámbito de la Administración Pública. 2. Haciendo un poco de historia La Psicometría es la rama de la Psicología encargada de fundamentar la construcción y el uso de los tests psicológicos. Con más de un siglo de tradición como disciplina, constituye hoy en día un extenso cuerpo de conocimientos teóricos y técnicos al servicio de la medición de atributos psicológicos. Esta es la razón, entre otras, por la que los profesionales expertos en la materia denominan «tests psicométricos» a las pruebas para la evaluación de rasgos psicológicos, una denominación mucho más precisa que la comúnmente extendida de «tests psicotécnicos». El uso de procedimientos psicométricos para el estudio de las diferencias individuales nace entre finales del siglo XIX y principios del siglo XX, aunque existen antecedentes de pruebas utilizadas para el ingreso a los servicios civiles que datan de varios milenios atrás. Así, en la China Imperial, en fechas tan tempranas como en el año 2200 a.C., se empleaba un sistema de exámenes para valorar y decidir si los funcionarios del gobierno eran aptos para el desempeño de sus funciones. Dicho sistema era trienal y se servía de «pruebas» para evaluar las habilidades en música, tiro con arco, equitación y escritura o los conocimientos sobre los principios de Confucio, los ritos y las ceremonias, las leyes civiles, la agricultura, la geografía o la poesía. Se trataba de exámenes orales, más que escritos, que evaluaban no solamente lo que los candidatos decían, sino también cómo lo decían. Aunque durante los siglos XVIII y XIX el sistema chino influyó de forma determinante en la concepción de los exámenes del servicio civil de países como Francia, Inglaterra, Alemania o incluso EE.UU., no fue hasta principios del siglo XX cuando la evaluación psicológica tomó el rigor del método científico, comenzándose a labrar los cimientos de la auténtica cultura de tests que conocemos hoy en día. De hecho, la evaluación psicométrica ha sido uno de los terrenos más productivos, prolíficos y dinamizadores de la Psicología a lo largo de su historia como ciencia social, con infinidad de propuestas ligadas en un primer momento al estudio de la inteligencia y de las aptitudes y posteriormente de otras variables como la personalidad, las actitudes o los intereses personales. Los primeros tests para la evaluación sistemática de un atributo psicológico, la inteligencia, fueron de aplicación Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 25 AZTERLANAK ESTUDIOS David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública individual (Binet y Simon, 1905; Terman, 1916) y sembraron las bases para un cambio de paradigma que afectó de forma determinante a la Psicología y al modo en que era percibida por la sociedad. Su repercusión fue muy notoria en aquella época, ya que supuso abordar por primera vez de un modo riguroso alguno de los problemas importantes presentes en aquellos días, como el de la escolarización o el de la clasificación de los niños con deficiencias. Sin embargo, el sistema de evaluación individual resultaba poco práctico cuando se deseaba recabar información de grupos numerosos, necesidad que surgió por primera vez en Estados Unidos durante la IGuerra Mundial y que llevó a la construcción de las primeras baterías colectivas para la evaluación psicométrica de varias aptitudes bajo las denominaciones de Army Alpha y Army Beta Test. Recopilando algunas tareas clásicas, como las de series numéricas, antónimos o frases incompletas, y diseñando nuevos ejercicios apropiados para su aplicación colectiva, se pudo evaluar, clasificar y seleccionar rápidamente a miles de militares. Tras el éxito de la operación, el modelo de evaluaciones masivas mediante tests fue extendiéndose con celeridad hasta el comienzo de la II Guerra Mundial. Una vez más, las necesidades bélicas llevan al estudio de las aptitudes especiales que se requiere de los soldados. Sin embargo, a diferencia de lo ocurrido durante la I Guerra Mundial, no se trataba únicamente de descartar potenciales soldados debido a su bajo nivel intelectual, sino de seleccionar a los más capaces en el dominio de ciertas habilidades. Todo ello supone un enorme impulso para el desarrollo de tests de aptitudes generales y de otros más enfocados a aptitudes específicas, como fueron los de aptitud mecánica, coordinación, cálculo, fluidez, etc. En décadas sucesivas, la producción de nuevos tests psicométricos se multiplica exponencialmente, no sólo en el ámbito de las aptitudes intelectuales sino también de la personalidad, de las actitudes y del rendimiento, dando lugar a una auténtica industria de los tests. Los esfuerzos se centran no solo en producir nuevos instrumentos que den respuesta a las demandas de la sociedad, sino también en dotar de mayor rigor a la metodología psicométrica subyacente y en acompañarlos de sólidas bases estadísticas, apareciendo nuevas y novedosas teorías de tests y de medición a finales de 1960 y principios de 1970. Por aquellos años los tests están ya plenamente presentes en la sociedad, la cual recoge y hace suyas algunas de las críticas vertidas por los teóricos y académicos de la época. Como consecuencia, en la década de 1980 se comienza a apreciar una actitud contradictoria hacia el uso de los tests psicométricos: mientras que el profesional continúa usándolos cada vez más, ya que ello le reporta claros beneficios para su 26 Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 labor, el ámbito académico adopta una postura crítica, lo que lleva a la instauración de fuertes dosis de escepticismo en la sociedad. Aunque esta contradicción pueda seguir apreciándose incluso hoy día, afortunadamente comienza a decaer de forma mayoritaria a principios de 1990, década en la que se evidencia un claro uso no estigmatizador de los tests y se reconoce que las pruebas psicológicas presentan limitaciones sin que por ello se deba renunciar a su empleo. En la actualidad, los tests psicológicos gozan de una excelente salud, fiel reflejo del desarrollo de la Psicología y su asentamiento en la sociedad. Hoy en día los esfuerzos de la vanguardia se centran en incorporar plenamente los avances de la era digital a la evaluación psicométrica, con sistemas de corrección y aplicación por Internet que liberan de labores burocráticas y administrativas y dotan de mayor flexibilidad al proceso, o en maximizar la eficiencia de la evaluación mediante sistemas adaptativos informatizados. Esta buena salud no refleja más que la evolución realmente vertiginosa de esta joven tecnología desde los primeros acercamientos de principios del siglo XX hasta la actualidad. En resumen, los tests psicológicos han sido y continúan siendo una pieza clave para la toma de decisiones fundamentada en muchas de las esferas de la sociedad, desde el ámbito educativo al laboral, sanitario o clínico, incluido, claro está, el de los procesos de selección propios de la Administración Pública. 3. Conceptos psicométricos básicos: glosario En ocasiones puede resultar realmente útil que las personas a cargo de los procesos de selección bajo el sistema de oposición se encuentren familiarizadas con algunos conceptos psicométricos, en caso de utilizar como criterios selectivos uno o más tests. En este punto se presenta a modo de glosario algunos términos frecuentes y otros algo específicos que pueden servir de guía o ayuda durante el proceso. • Ajuste a perfil: Índice estadístico usualmente comprendido entre 0 y 100 (de menor a mayor ajuste) que determina hasta qué punto el perfil de puntuaciones del candidato se corresponde con el requerido por el puesto o plaza a cubrir. • Banco de ítems: Conjunto de tareas, enunciados, ejercicios o problemas, habitualmente de aptitudes (verbal, numérica, razonamiento, etc.), que han sido probados empíricamente y de los que se David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública • • • • • • • • conoce su grado de idoneidad y sus propiedades psicométricas (dificultad, discriminación…). Baremo: Tabla con la que comparar las puntuaciones obtenidas en un test psicométrico respecto de una muestra normativa. El resultado se suele expresar en términos de una puntuación transformada que expresa similitud o diferencia con el grupo de referencia. Baremo interno: Referencia que compara la puntuación obtenida por el opositor con la del resto de candidatos presentados a examen. Indica la posición y el nivel de rasgo psicológico de la persona en relación con el mismo proceso de oposición. Baremo general: Referencia que compara la puntuación obtenida por el candidato con la de otras personas de la población, examinadas con la misma finalidad (proceso de oposición) o finalidades afines (selección de personal). Indica la posición y el nivel de rasgo de la persona en relación con la población. Corrección por azar: Fórmula que permite corregir la adivinación por azar en los tests con un número determinado y finito de alternativas de respuesta. La fórmula más comúnmente usada implica penalizar a la puntuación total con la cantidad de «1/(n.º alternativas-1)» puntos por cada error cometido (p. ej., en los test con 4 alternativas de respuesta, cada error penalizaría 0,33 puntos de acuerdo a esta formulación; en los tests de 2 alternativas de respuesta, la penalización sería de 1 punto). Grupo normativo o grupo de referencia: Muestra de personas representativa de una población o colectivo a partir de la cual se construye un baremo. Ítem: Cada uno de los ejercicios de que consta un test. Puntuación directa (PD): Número procedente de la suma del valor otorgado a cada ítem de un test. En los tests de aptitudes, la puntuación directa suele ser la cantidad de aciertos tras aplicar, si corresponde, la corrección por azar de las respuestas. También se puede encontrar en algunos textos con la denominación de puntuación bruta. Puntuación transformada (PT): Valor numérico resultado de transformar estadísticamente una puntuación directa. La mayoría de las veces indica la posición relativa del candidato en relación con un grupo normativo o de referencia (interno o general). Algunas de las puntuaciones transformadas más comunes son los percentiles (Pc), los cuales indican el porcentaje de personas del grupo normativo que deja por debajo de sí la puntuación directa del candidato, las puntuaciones S (media = 100; Dt = 20) o los decatipos (media = 5,5; Dt = 2), que expresan la posición estadística del opositor en relación con el grupo de referencia, • • • • • • • o las transformaciones en base 10 (de 0 a 10 puntos), indicativas del porcentaje del examen o de los contenidos que el candidato demuestra dominar o superar a partir de su rendimiento. Punto de corte: Umbral expresado en puntuaciones transformadas que determina si un candidato ha resultado apto o no apto para la plaza a cubrir o fases posteriores dentro del proceso. Fiabilidad: Propiedad psicométrica que determina el grado de precisión del test utilizado como instrumento de medida para una finalidad concreta. Suele expresarse mediante un coeficiente situado entre 0 y 1 (de menor a mayor fiabilidad), el cual indica hasta qué punto las puntuaciones del test se encuentran libres de error de medida. Test de aptitudes: Prueba que evalúa una o más habilidades o destrezas mediante ítems que plantean problemas a resolver. Los tests de aptitudes se caracterizan por incluir tareas del tipo acierto/ error. Entre los tests de aptitudes más usados estarían los tests de razonamiento, los de factor g o inteligencia general, los que evalúan la aptitud verbal o los tests para medir el grado de atención y concentración del candidato. Test de conocimientos: Prueba que evalúa los conocimientos adquiridos del candidato mediante preguntas abiertas o cerradas sobre uno o varios temas. Los tests de conocimientos se caracterizan igualmente por incluir ítems del tipo acierto/error. Entre los tests de conocimientos más comúnmente utilizados estarían los tests sobre leyes, sobre una temática específica o sobre la Constitución Española. Test de personalidad (autoinforme): Cuestionario que evalúa algunas competencias, actitudes o características de la personalidad de los candidatos. Los tests de personalidad incluyen ítems que plantean situaciones sobre las que el candidato debe opinar o indicar la frecuencia con la que se comporta de una determinada forma, por lo que no existen respuestas correctas o incorrectas. Suelen incluir una o varias escalas o medidas para detectar la falta de sinceridad, lo que puede incluso invalidar los resultados. Algunos de los rasgos de personalidad y competencias más comúnmente evaluados son la responsabilidad, la estabilidad emocional, la tolerancia al estrés, la disposición a trabajar en equipo, etc. Test psicotécnico: Término comúnmente utilizado para referirse a los tests psicométricos de aptitudes. Validez: Tradicionalmente indicaba el grado en el que el test medía lo que realmente pretendía medir. Actualmente se suele matizar esta definición, entendiéndose como el grado en el que existen evidencias o datos empíricos que apoyan la interpretación de las puntuaciones en un sentido determinado. Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 27 AZTERLANAK ESTUDIOS David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública 4. Críticas comunes a los tests psicométricos Posiblemente derivado de la imposibilidad de desvincularse de su objeto de conocimiento, esto es, del ser humano, los tests psicométricos han recibido históricamente, y reciben actualmente, intentos de descrédito, tanto por parte de la sociedad como incluso de los propios profesionales de la Psicología. La siguiente pregunta puede resultar ilustrativa de la falta de fundamento de una de las críticas más comunes que sobre los tests psicométricos se vierten: ¿Qué pensaría Ud. si en un análisis médico rutinario le detectan un nivel alto de colesterol en sangre o hipertensión arterial? Las respuestas que surgen ante esta pregunta suelen ser del tipo «Pensaría en ponerme a dieta», «en comer más sano», «en hacer más deporte», «en tomar medicación»... Ahora bien, a nadie se le ocurriría cualquier respuesta, más habitual de lo deseable en referencia a los tests psicológicos, del tipo «Pensaría que esa prueba no mide bien», «ese test no sirve para nada» o el ya famoso «es que yo no creo en ese tipo de tests» (véase Pereña, 2002, para un excelente tratamiento sobre este tema). Tomando como referencia una de las propiedades métricas más conocidas, conviene apuntar aquí que la fiabilidad con la que se mide algunos atributos físicos, como la presión sanguínea o el nivel de colesterol, suele estar entre 0,50 y 0,60. En el terreno de la Psicometría, la fiabilidad de los tests de aptitudes sobrepasa habitualmente el valor de 0,80, el de las pruebas de inteligencia el 0,90 y en las pruebas de personalidad nos solemos mover entre 0,70 y 0,85. Sirva como ejemplo uno de los últimos tests publicados para la evaluación de aptitudes, el BAT-7 (Arribas et al., 2013), con una fiabilidad que alcanza el 0,97 en alguno de sus índices para la estimación de la inteligencia general. No obstante, seguimos sin contar con un elevado índice de fiabilidad a ojos de parte de la sociedad, uno de los criterios más importantes para la aceptación de nuestra metodología, algo que, como hemos visto, no experimentan otras disciplinas como la bioestadística. Por otro lado, en lo que a la validez de los tests psicométricos se refiere, en la actualidad existe una contundente y abundante evidencia empírica, acumulada durante más de un siglo de investigación, sobre cómo se relacionan los resultados de los tests con infinidad de criterios externos de tipo social, demográfico, biológico y psicológico (p. ej., Burks et al., 2009; Colom, 2002; Deary, 2012; Deary et al., 2007; Gottfredson, 1997, 2000; Lubinski, 2000; Ree y Caretta, 2002; 28 Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 Schmidt, 2002; Strenze, 2007). A modo de ejemplo, entre los años 2000 y 2010 se publicaron 24.087 investigaciones en revistas científicas que trataban sobre este tema, un volumen que lejos de parar se incrementa cada año. Entre los criterios que se tienen en cuenta en las investigaciones, la relación con el rendimiento profesional es uno de los aspectos más estudiados y sobre los que se ha acumulado una mayor cantidad de evidencia empírica. Según la American Psychological Association (Neisser et al, 1996), los tests estandarizados de inteligencia correlacionan 0,54 con el rendimiento laboral, una relación que se puede considerar media-alta. Independientemente de la fuente que se analice, parece claro que las puntuaciones en los tests son una fuente de información relevante y valiosa a tener en cuenta a la hora de tomar decisiones sobre una persona. En este sentido, distintos estudios han puesto de manifiesto la relevancia de la capacidad mental general (GMA; General Mental Ability) sobre el rendimiento laboral. Esta capacidad se define operativamente como el rendimiento en cualquier instrumento que combine dos o más aptitudes específicas o que incluya ítems que evalúen diferentes habilidades (verbal, numérica, espacial...; Schmidt, 2002). Los resultados de estos estudios son concluyentes: los tests de inteligencia y aptitudes son uno de los mejores (y más eficientes) predictores del rendimiento laboral (p. ej., Ghiselli, 1973; Hunter, 1986; Hunter y Hunter, 1984; McHenry et al., 1990; Salgado et al., 2003; Schimdt y Hunter, 1998). Así, por ejemplo, Hunter y Hunter (1984) analizaron más de 425 investigaciones previas y encontraron que la correlación media entre el nivel aptitudinal y las valoraciones de los superiores respecto del rendimiento laboral era de 0,53. Del mismo modo, McHenry et al. (1990) analizaron la validez predictiva de diferentes medidas aptitudinales, encontrando una relación de 0,65 entre el rendimiento y la capacidad GMA y de 0,68 si a dicha capacidad se le añadía la aptitud espacial. Uno de los estudios más influyentes y clásicos en el área es el de Schmidt y Hunter (1998), el cual resume los resultados de 85 años de investigación sobre la validez y la utilidad de 19 métodos de selección de personal en relación con el rendimiento laboral. Además, estos autores calcularon las ganancias sobre la predicción global del rendimiento si a los resultados de los tests de inteligencia general se añadiera cualquiera de los otros métodos (tabla 1). Al comparar la validez de los diferentes métodos de selección, los tests psicométricos ocupan un lugar prominente por las siguientes razones: • Son aplicables a todo tipo de trabajos (independientemente del grado de cualificación que exi- David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública Tabla 1 Relación con el rendimiento laboral de diferentes métodos de selección Tipo de evaluación Relación con el rendimiento general en el puesto Incremento de la validez respecto de los tests de inteligencia Test de inteligencia 0,51 — Muestra de trabajo 0,54 24% Test de integridad u honestidad 0,41 27% Test de personalidad 0,31 18% Entrevista estructurada 0,51 24% Entrevista (no estructurada) 0,38 8% Test de conocimientos 0,48 14% Simulaciones de trabajo 0,44 14% Evaluación de los compañeros 0,49 14% Consistencia comportamental de formación y experiencia 0,45 14% Referencias 0,26 12% Experiencia en el puesto 0,18 6% Datos biográficos 0,35 2% Assessment center 0,37 4% Años de educación 0,10 2% Intereses 0,10 2% 0,02 0% –0,01 0% Grafología Edad Fuente: Schmidt y Hunter (1998). jan) y tienen el mayor índice de validez y el menor coste económico. Los procedimientos que utilizan muestras de trabajo tienen resultados ligeramente mejores, pero son mucho más costosos y solo pueden realizarse con candidatos que ya conozcan el trabajo o hayan sido formados previamente1. Del mismo modo, las entrevistas, por ejemplo de competencias o incidentes críticos, pueden requerir algún grado de conocimiento del trabajo a realizar y por lo tanto no ser adecuadas para candidatos aprendices de un nuevo puesto. • La investigación empírica sobre la validez de los tests para predecir el rendimiento laboral es más sólida que la de cualquier otro método. Así, por ejemplo, existen miles de estudios sobre la capacidad predictiva de los tests de inteligencia, en contraste, por ejemplo, con los estudios sobre la validez de la entrevista estructurada. • Los fundamentos teóricos de los tests son más sólidos que los de cualquier otra medida usada en los procesos de selección. Así, por ejemplo, las teorías de la inteligencia han sido objeto de estudio durante más de un siglo y, como tal, los tests que la evalúan arrojan resultados más claros y contextualizados que cuando se utiliza, por ejemplo, la técnica del assessment center o la entrevista. Por estas razones, estos autores consideraron que los tests que evalúan la capacidad general deberían ser el principal instrumento a utilizar en los procesos de selección de personal (de hecho, se ha demostrado que su omisión disminuye sistemáticamente la validez predictiva del proceso; Wilhelm y Engle, 2005). Además, su uso conjunto con otros tests, como los de integridad u honestidad, personalidad o conocimientos, hace que se incremente entre un 14% y un 27% la validez de la predicción, en la línea de lo apuntado por otros autores, como Salgado y MosPertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 29 AZTERLANAK ESTUDIOS David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública coso (2008), en relación con la entrevista conductual estructurada. Sin embargo, esta relación con el rendimiento laboral parece que se encuentra modulada por el tipo de ocupación (Salgado et al., 2003). Los estudios realizados con diferentes familias de ocupaciones (p. ej., Hartigan y Wigdor, 1989; Hunter y Hunter, 1984) o con determinas profesiones específicas (p. ej., Hirsch, Northrop y Schmidt, 1986; Levine et al., 1996; Pearlman, Schmidt y Hunter, 1980; Vinchur et al., 1998) revelan que la capacidad predictiva puede depender de la complejidad del puesto laboral, llegando incluso a alcanzar valores de validez operativa por encima de 0,70 (Schmidt, Gast-Rosenberg y Hunter, 1980). En definitiva, los tests psicométricos son una de las opciones más eficaces y menos costosas para reducir la incertidumbre de cara a la toma de decisiones en los procesos de selección. Colom y Andrés-Pueyo (1999) resumen de la siguiente forma las implicaciones operativas que tiene la relación entre los tests de inteligencia y el rendimiento laboral en el ámbito de la selección de personal: «Para hacerse una idea del significado de estos valores veamos la siguiente argumentación: consideremos una situación en la que tienen éxito el 60% de los individuos. Para ser más específicos, alrededor del 60% de la población laboral se sitúa por encima del nivel de inteligencia (CI=100) necesario para rendir adecuadamente en un banco (por ejemplo). Si ese banco contratase a sus empleados aleatoriamente, la probabilidad de éxito sería de 1,5:1 (60:40). Si el banco seleccionase a sus empleados según un test con una validez predictiva de 0,30 (y contratase a la mitad de los candidatos), la probabilidad de éxito aumentará a 2:1 (69:31). Si la validez del test fuese de 0,45 (algo bastante habitual) la probabilidad pasará a 3:1 (74:26), lo que duplicará las probabilidades iniciales. Por supuesto, cuanto mayor sea el número de candidatos y menores los puestos disponibles, mayores beneficios se obtendrán al emplear un test incluso con índices de validez por debajo de 0,30». (Colom et al, 1999, p. 465-466) 5. Errores frecuentes En las evaluaciones que se llevan a cabo para la provisión de plazas públicas pueden aparecer algunos errores que no son exclusivos de este ámbito, pero que conviene tener presentes puesto que de aparecer podrían acarrear consecuencias poco deseables o difícilmente solventables. Estos errores pueden tener su origen incluso en las mismas bases de la con30 Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 vocatoria, por lo que una primera recomendación sería no tomar como buenas sin más las prácticas de otros procesos que aparentemente puedan parecer formalmente similares. Una de las primeras decisiones relacionadas con el uso de pruebas psicométricas para la selección de personal se refiere a la dificultad media de los tests a utilizar. En este sentido, un error frecuente consiste en seleccionar tests que incluyen tareas cuya dificultad está ajustada al nivel educativo mínimo exigido por las bases de la convocatoria, aun a sabiendas de que la mayoría de los presentados a examen probablemente serán de un nivel superior o muy superior. Lo importante de cara a la selección de los tests es que estos garanticen la equidad y homogeneidad de la evaluación, que sean máximamente discriminativos e informativos y que aseguren una buena medición. Al igual que un test podría ver mermada su capacidad de medición por ser extremadamente difícil y acumular un elevado porcentaje de puntuaciones muy bajas, un test extremadamente fácil para el perfil aptitudinal medio de los opositores puede provocar un efecto «techo», esto es, una acumulación de casos con puntuaciones muy altas, lo que llevaría a una poco recomendable toma de decisiones final basada en pocas décimas de diferencia. Por tanto, lo ideal desde el punto de vista métrico será encontrar un nivel de dificultad de las tareas que maximice la capacidad de discriminar entre los aptos y no aptos y se ajuste lo máximo posible a una distribución en forma de campana de gauss o curva normal, esto es, con pocos casos en los extremos alto y bajo y una buena dispersión en la parte media de la distribución. En relación a la disponibilidad del test a utilizar, a la hora de establecer las bases de la convocatoria en ocasiones se produce una situación bastante paradójica e incluso lógicamente contradictoria. En no pocos procesos se solicitan tests psicométricos que sean completamente inéditos, a la medida o construidos ex profeso para esa convocatoria, aunque simultáneamente deben, de acuerdo a las bases, estar probados empíricamente y baremados con muestras similares a las del puesto objetivo, así como acumular estudios científicos y psicométricos que avalen y acrediten su uso. Este requisito es realmente complicado de alcanzar, puesto que para probar un test empíricamente y acumular casos que permitan una baremación representativa y evidencias que avalen su uso, inevitablemente el test debe ser aplicado a personas. La única solución que permite solventar este escollo se refiere a los bancos de ítems que manejan las grandes editoriales de tests, los cuales permiten construir pruebas completamente inéditas en su conjunto, aunque formadas por tareas y procedimientos que fueron empíricamente probados en distintos colectivos. David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública En cuanto al número de tareas a utilizar y su distribución, desde el punto de vista métrico resultan desaconsejables los tests tipo «ómnibus» en los que se mezclen, bajo un mismo tiempo de respuesta, muchos tipos de ejercicios con un número reducido de ítems por cada rasgo o aptitud a evaluar. Este tipo de tests o cuestionarios suelen dar lugar a índices métricos de menor calidad que aquellos que incluyen un amplio muestreo de contenidos. Por tanto, cada una de las variables que se considere importante evaluar debe contar con un número suficientemente amplio de ítems, de modo que el rasgo psicológico se evalúe con precisión y su contenido se encuentre suficientemente representado. En este sentido, y a grosso modo, en las pruebas de aptitudes se suele incluir un número superior a los 15 ítems por aptitud, siendo entre 10 y 15 ítems por rasgo en el caso de las pruebas de personalidad. No obstante, la ratio ítem/variable a evaluar depende fuertemente de la complejidad del rasgo o aptitud a evaluar. Por otra parte, una de las claves de la selección de personal en el contexto de la gestión de los recursos humanos se refiere a la adecuación puesto-persona, condición básica para que el trabajador pueda sentirse motivado y comprometido con la organización, para que su nivel de satisfacción profesional sea elevado, para evitar la rotación y la conflictividad, para promover un buen clima laboral y demás consecuencias deseables. En muchas ocasiones, el propio sistema de oposición lleva a una sobredotación de los candidatos seleccionados como aptos, ya que se adoptan puntos de corte o criterios que valoran como positivas algunas características propias de puestos de un nivel competencial superior. Sirva como ejemplo el siguiente perfil hipotético que supuestamente debiera poseer el opositor seleccionado para un puesto de auxiliar administrativo: nivel alto o muy alto en responsabilidad, liderazgo, trabajo en equipo, organización, comunicación, aptitud numérica, capacidad de atención y manejo de herramientas informáticas de gestión. Parece obvio tras lo expuesto que una persona con tales características difícilmente podrá adaptarse y sentirse profesional y plenamente desarrollada en un puesto de tipo administrativo. Otro error frecuente en la línea del punto anterior se refiere a los criterios respecto del perfil de competencias o personalidad de los opositores requerido para el puesto. Existe una tendencia muy marcada, y no exclusiva del sector público, a interpretar los valores altos de competencia como positivos para cualquier ocupación. Así, muchos procesos buscan entre sus candidatos u opositores características que consideran deseables para el desempeño, como pueden ser un nivel alto de liderazgo, de trabajo en equipo o de organización y planificación. Del mismo modo, niveles altos o muy altos en algunas variables emocionales, como podría ser la estabilidad, la tolerancia al estrés, la empatía… Sin embargo, conviene destacar que los perfiles muy apuntados o extremos en este tipo de variables podrían ser realmente contraproducentes. Por ejemplo, un nivel excesivamente alto de trabajo en equipo puede revelar una incapacidad para desarrollar el trabajo de forma independiente, un nivel muy alto de organización y planificación puede suponer dificultades para manejar el cambio y el estrés o una institución llena de líderes en todos los niveles jerárquicos resultaría prácticamente ingobernable. Igualmente, las personas con una elevada estabilidad emocional pueden resultar insensibles a los problemas o emocionalmente fríos, una excesiva tolerancia al estrés puede conducir a problemas de clima laboral o conflictos interpersonales… Por tanto, se debe prestar una especial atención a los puntos de corte que se establezcan de cara a ajustar el perfil psicológico objetivo, lo que idealmente debería hacerse bajo la supervisión de un profesional de la evaluación o de los recursos humanos con experiencia como asesor externo en este tipo de procesos. No por evidentes se deben dejar de mencionar algunos errores de procedimiento que se siguen observando en las sesiones de evaluación colectivas que utilizan tests psicométricos. Al margen de las cuestiones más generales sobre la aplicación de tests, muchas de ellas recogidas en las Directrices Internacionales para el Uso de los Tests (ITC, 2001), los errores sistemáticos más frecuentes y relacionados con los exámenes en la Administración Pública se centran en tres aspectos: las labores de vigilancia, la ayuda al examinando y la información sobre la penalización. En primer lugar, el nivel de vigilancia necesario para el buen desarrollo de una sesión se recomienda que sea de tipo medio, esto es, que no añada tensión innecesaria a la situación por una excesiva supervisión ni permita, claro está, alguna práctica fraudulenta por falta de atención. Una sesión de evaluación estándar frecuentemente consta de una o varias pruebas de aptitudes y conocimientos, junto con otra prueba de personalidad o competencias, a contestar todas ellas en una única hoja de respuestas. Durante los primeros tests, los que constan de ítems que admiten el acierto o el error, el nivel de vigilancia de las personas a cargo suele ser el adecuado. Sin embargo, en sesiones de varias horas, un error bastante común es el de bajar la guardia al final del examen, esto es, en la parte dedicada a los tests de personalidad, pensando que no existe la posibilidad de copia por incluir ítems en los que no es posible acertar o fallar… Aunque el diseño de las hojas de respuesta pueda dificultar la copia, no se debe olvidar que esta es común a todas las pruebas del examen, por lo que algunos opositoPertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 31 AZTERLANAK ESTUDIOS David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública res pueden tratar de copiar las respuestas a los tests de aptitudes o conocimientos, lo que supondría un grave perjuicio para el proceso. Por tanto, una primera recomendación respecto del procedimiento a seguir es mantener un nivel de atención o vigilancia medio durante toda la sesión, de principio a fin. En segundo lugar, se considera una buena práctica, de acuerdo a los últimos estándares para la evaluación psicológica mediante tests (AERA, APA y NCME, 2014), informar y ayudar al examinando en caso de dudas con el procedimiento (por ejemplo, sobre el modo de contestar o marcar las respuestas en la hoja) o ansiedad extrema ante la situación de examen. No obstante, en términos generales se debe poner un cuidado extremo a la hora de responder dudas o preguntas de los opositores, evitando a toda costa dar indicaciones o sugerencias sobre la opción de respuesta a marcar o cualquier otra circunstancia ajena a las instrucciones del test. Recordemos que un test es una situación estandarizada en la que las diferencias individuales deben tener su explicación única y exclusivamente en el nivel de aptitud o rasgo de los examinandos, por lo que se debe prestar una atención especial a cualquier aspecto que haga peligrar el principio de igualdad que garantiza dicha explicación. En este mismo sentido, por ejemplo, si se estima oportuno emitir una aclaración no contemplada en las instrucciones del test, la práctica correcta sería hacerlo públicamente a todos los examinandos y en voz alta y clara para continuar preservando la equidad de la situación de examen. Por último, existe una gran cantidad de tests para su uso en la Administración Pública que incluyen una penalización como medida para el control de la adivinación o la respuesta al azar, la cual consiste en restar a la puntuación directa el número de errores cometidos ponderado por un determinado valor. El valor de la penalización suele aparecer en las bases de la convocatoria, en las instrucciones del tests o en ambos sitios, pero no siempre es así. Por esta razón, siempre y cuando se desee comparar el rendimiento con un baremo general elaborado con anterioridad que dé cuenta del nivel poblacional del rasgo, se recomienda seguir escrupulosamente lo marcado por las instrucciones del test en lo que a informar sobre la penalización se refiere. Igualmente, si en las instrucciones no se alude a la existencia de penalización, el examinador o grupo de examinadores deberán ofrecer a todos los opositores la misma información, esto es, si existe o no penalización, y siempre en los mismos términos a todos los grupos, ya que de lo contrario se pueden producir serias alteraciones en el modo de contestar (fomentando intencionadamente o no la adivinación) y por consiguiente en las puntuaciones resultantes. 32 Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 6. Baremo general frentea baremo interno El marco de referencia más utilizado para la interpretación de los resultados de los tests es, con diferencia, el empleo de normas o baremos (Urbina, 2007). La pregunta que cabe plantearse bajo este enfoque es: ¿Cómo es el rasgo psicológico de la persona en comparación con otras personas? La puntuación resultante del test se utiliza por tanto para situar su aptitud, comportamiento, opinión o conocimiento dentro de una distribución de puntuaciones que refleja el nivel estándar o normativo de la población o grupo de referencia. Es aquí donde cabe realizar una importante distinción respecto al grupo normativo con el que comparar la ejecución de la persona, algo que suele generar confusión entre los profanos en la materia. Un grupo normativo no es más que un grupo de referencia, el cual puede estar formado por los mismos solicitantes u opositores a un puesto determinado (baremo interno) o por una muestra representativa de la población (baremo general). En función de si se trata de un colectivo u otro, la interpretación varía sustancialmente. Así, en la gran mayoría de las evaluaciones en la Administración Pública, la finalidad del proceso de selección pretende una simple ordenación en una o varias variables (o combinaciones de ellas), de modo que se pueda conocer quiénes son los mejores candidatos entre los presentados. Es la misma esencia del proceso de oposición, en el que compiten entre sí todos los presentados. En este caso, resulta apropiado y conveniente el uso de un baremo interno, es decir, un baremo que simplemente transforme las puntuaciones directas a una escala común para poder comparar u operar matemáticamente en los mismos términos, lo que se puede realizar mediante una transformación que tenga en cuenta los estadísticos descriptivos del grupo en cuestión. El lector podrá deducir cómo los resultados desde este enfoque son válidos y generalizables únicamente al grupo concreto que se use para dicha transformación, esto es, los presentados a examen. Sin embargo, este planteamiento tiene sus limitaciones, como por ejemplo la imposibilidad de determinar el nivel real del rasgo medido, esto es, si los mejores o peores en un listado interno son realmente altos o bajos en la población y como tal en las variables evaluadas. Tómese como ejemplo el caso extremo e hipotético de una muestra formada por personas con un elevado grado de ansiedad; bajo la perspectiva interna siempre tendríamos puntuaciones que cubrirían todo el rango posible, pero difícilmente se podría determinar que el grupo carece del autocontrol o estabi- David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública lidad emocional necesarios para un puesto al no disponer de un punto de referencia externo. cuya principal finalidad es la toma de decisiones referidas a las personas. Este matiz importante se consigue mediante el uso de un baremo general, representativo de la población, acercamiento que permite no solo una ordenación sino también una gradación del atributo evaluado en comparación con una muestra representativa. De esta forma, ante un grupo como el anterior, un baremo construido con estas características permitiría determinar que ninguna de las personas es válida dado que su nivel de ansiedad es muy superior al de la mayoría de la población. Varias son las medidas que existen para controlar y paliar el efecto de la falta de sinceridad a las respuestas de los cuestionarios y así se suelen contemplar en los cuestionarios que se utilizan en la Administración Pública. Entre ellas, las acciones que han sido corroboradas como las más efectivas para esta finalidad son: 7. El problema de la sinceridad en las medidas deautoinforme Para terminar, abordaremos en un punto aparte una de las cuestiones más habituales y controvertidas a las que se enfrentan los cuestionarios o autoinformes: la falta de sinceridad y la distorsión de las respuestas. A pesar de las críticas que han surgido al respecto de la validez de este tipo de medidas a expensas de la distorsión provocada por la deseabilidad social, numerosas investigaciones han comprobado y confirmado que las medidas de autoinforme son buenos predictores de diversos criterios organizacionales relevantes (Barrick y Mount, 1991; Barrick, Mount y Judge, 2001; Hogan y Holland, 2003; Hurtz y Donovan, 2000; Mount y Barrick, 1995; Rothman, Meining y Barrick, 2002; Salgado, 1997, 1998, 2002, 2003, 2005; Yoo y Ming, 2002). Está ampliamente demostrado el efecto de la deseabilidad social y la falta de sinceridad sobre los resultados de la evaluación: tiende a aumentar o disminuir las puntuaciones en aquellas escalas que los opositores consideran que están relacionadas positivamente o negativamente con el desempeño laboral, respectivamente, aunque no afecta drásticamente a la validez predictiva, ni es una variable mediadora, moderadora o supresora de la validez de este tipo de evaluación. A pesar de que en términos generales el efecto sobre las puntuaciones no es significativo, y especialmente en situaciones reales de evaluación, en determinados contextos de laboratorio puede alcanzar varias unidades de desviación, que oscilan entre los 0,13 y los 0,45 puntos típicos (Hough, 1998). En cualquier caso, parece adecuado ejercer cierto control sobre estas posibles distorsiones, sobre todo en las herramientas 1. Implementar escalas de control que permitan evaluar el grado en el que la persona ha tratado de distorsionar sus respuestas o la propia imagen. 2. Informar a los evaluados de que se examinarán sus respuestas en relación con las escalas para el control de la deseabilidad social y que la distorsión podrá tener consecuencias negativas para los distorsionadores. Esta medida suele aparecer reflejada en las instrucciones del cuestionario y así debe comunicarse a los examinandos en cualquier contexto de evaluación. 3. Comparar las puntuaciones con muestras competitivas de solicitantes o de personas que hayan contestado a los autoinformes en contextos en los que se asume una elevada carga de deseabilidad social. Las muestras normativas con las que se elaboran los baremos internos hacen que el efecto de la falta de sinceridad esté incluido en dichos baremos. En este sentido, como indica Salgado (2005): «la estrategia de crear baremos a partir de muestras de solicitantes de empleo neutraliza los efectos de la deseabilidad social. Por tanto, debería ser utilizada en todos los procesos de selección. Y los profesionales deberían utilizar en tales casos instrumentos que hayan elaborado tales baremos». Por otra parte, las escalas para el control de la sinceridad suelen interpretarse como excluyentes, es decir, a partir de cierta puntuación se considera que las respuestas del opositor no deberían ser tenidas en cuenta puesto que ha tratado de dar una imagen positiva de sí mismo. No obstante, esta práctica considero que debe ser matizada y analizada desde el sentido lógico y la literatura existente. El hecho de que un opositor quiera, y sobre todo sepa, dar una imagen favorable de sí mismo es algo positivo e incluso deseable. Mediante esta presentación de la propia imagen se están revelando varias características personales muy favorables para el mundo laboral actual, como pueden ser la capacidad de adaptación al contexto, la inteligencia social o el conocimiento sobre lo que es bien aceptado por las empresas. Sin embargo, es cierto que una exageración de las características positivas dentro de un contexto de por sí cargado de deseabilidad social sí debe llevar a la cautela antes de tomar decisiones sobre la Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 33 AZTERLANAK ESTUDIOS David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública adecuación de la persona a un puesto determinado. Por esta razón, mi recomendación es que se tenga en cuenta el nivel de las variables de control como si de cualquier otra variable psicológica se tratara, eliminando del proceso, eso sí, únicamente a las puntuaciones extremadamente insinceras (p. ej., a los percentiles 1 y 2 en sinceridad). Por otro lado, se ha comprobado cómo en ocasiones las respuestas extremadamente sinceras dentro de un contexto competitivo están relacionadas con características de personalidad poco favorables. Así, las personas con poca deseabilidad social suelen tener puntuaciones elevadas en variables como la ansiedad, el psicoticismo, la rigidez o la dependencia (Arribas, 2008). Por tanto, mi recomendación es tener igualmente en consideración el polo positivo de la sinceridad e interpretar con cautela, o incluso eliminar del proceso, las puntuaciones extremadamente superiores a las del grupo normativo en una posible escala de sinceridad (o extremadamente inferiores en una escala de deseabilidad social o manipulación de la imagen). Bibliografía Colom, R.; Andrés-Pueyo, A. «El estudio de la inteligencia humana: recapitulación ante el cambio de milenio», Psicothema, 1999, 11, p. 453-476. Deary, I. J., «Intelligence», Annual Review of Psychology, 2012, 63, p. 453-482. Deary, I. J.; Strand, S.; Smith, P.; Fernandes, C., «Intelligence and educational achievement», Intelligence, 2007, 35, p. 13-21. Ghiselli, E. E., «The validity of aptitude tests in personnel selection», Personnel Psychology, 1973, 26, p. 461-477. Gottfredson, L. S., «Why g matters: The complexity of everyday life», Intelligence, 1997, 24, p. 79-132. Gottfredson, L. S., «g: highly general and highly practical», en Sternberg, R.; Grigorenko, E. (Eds), The general intelligence factor: how general is it?, Nueva York, LEA, 2000. Hartigan, J.; Wigdor, A. K., Fairness in employment testing. Validity generalization, minority issues, and the General Aptitude Test Battery, Washington, National Academy Press, 1989. Hirsch, H. R.; Northrop, L.; Schmidt, F., «Validity generalization results for law enforcement occupations», Personnel Psychology, 1986, 39, p. 399-420. Hogan, J.; Holland, B. «Using theory to evaluate personality and job performance relations: A socioanalytic perspective», Journal of Applied Psychology, 2003, 88, p. 100-112. Hough, L. M., «Effects of intentional distortion in personality measurement and evaluation of suggested palliatives», Human Performance, 1998, 11, p. 209-244. Hunter, J. E., «Cognitive ability, cognitive aptitudes, job knowledge, and job performance», Journal of vocational behavior, 1986, 29, p. 340-362. American Educational Research Association; American Psychological Association; National Council on Measurement in Education, Standards for Educational and Psychological Testing, Washington, American Educational Research Association, 2014. Arribas, D., A new scale to assess Social Desirability in NEO PI-R, III European Congress of Methodology (Oviedo [SP], Julio 2008). Hurtz, G. M.; Donovan, J. J., «Personality and job performance: The big five revisited», Journal of Applied Psychology, 2000, 85, p. 869-879. Arribas, D.; Santamaría, P.; Sánchez-Sánchez, F.; Fernández-Pinto, I., BAT-7, Batería de Aptitudes de TEA, Madrid, TEA Ediciones, 2013. International Test Commission, «International Guidelines for Test Use», International Journal of Testing, 2001, 1 (2), p. 93-114. Barrick, M. R.; Mount, M. K. «The Big Five personality dimensions and job performance: A meta-analysis», Personnel Psychology, 1991, 44, p. 1-26. Levine, E. L.; Spector, P. E.; Menon, S.; Narayanan, L.; Cannon-Bowers, J., «Validity generalization for cognitive, psychomotor, and perceptual tests for craft jobs in the utility industry», Human Performance, 1996, 9, p. 1-22. Barrick, M. R.; Mount, M. K.; Judge, T., «Personality and performance at the beginning of the new millennium: What do we know and where do we go next?», International Journal of Selection and Assessment, 2001, 9, p. 9-30. Binet, A.; Simon, T., «Méthodes nouvelles pour le diagnostic du niveau intellectuel desanormaux», L’Anée Psychologique, 1905, 11, p. 191-211. Burks, S. V.; Carpenter, J. P.; Goette, L.; Rustichini, A., «Cognitive skills affect economic preferences, strategic behavior, and job attachment», Proceedings of the National Academy of Sciences, 2009, 106 (19), p. 7745-7750. Colom, R., En los límites de la inteligencia. ¿Es el ingrediente del éxito en la vida?, Madrid, Pirámide, 2002. 34 Hunter, J. E.; Hunter, R. F., «Validity and utility of alternative predictors of job performance», Psychological Bulletin, 1984, 96, p. 72-98. Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 Lubinski, D., «Scientific and social significance of assessing individual differences: «Sinking shafts at a few critical points».», Annual Review of Psychology, 2000, 51, p. 405-444. McHenry, J. J.; Hough, L. M.; Toquam, J. L.; Hanson, M. A.; Ashworth, S., «Project A validity results: the relationship between predictor and criterion domains», Personnel Psychology, 1990, 43, p. 335-354. Mount, M. K.; Barrick, M. R., «The Big Five personality dimensions: implications for research and practice in human resources management», en Rowland, M. K.; Ferris, G. (eds.), Research in personnel and human resources management, vol. 13, Greenwich, JAI Press, 1995, p. 153-200. David Arribas Águila Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública Neisser, U.; Boodoo, G.; Bouchard, T. J.; Boykin, A. W.; Brody, N.; Ceci, S. J.; Halpern, D. F.; Loehlin, J. C.; Perloff, R.; Sternberg, R. J.; Urbina, S., «Intelligence: Knowns and unknowns», American Psychologist, 1996, 51, p. 77-101. Schmidt, F. L.; Hunter, J. E., «The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings», Psychological Bulletin, 1998, 124, p. 262-274. Pearlman, K.; Schmidt, F. L.; Hunter, J. E., «Validity generalization results for tests used to predict job proficiency and training success in clerical occupations», Journal of Applied Psychology, 65, 1980, p. 373-406. Schmidt, F. L.; Gast-Rosenberg, I.; Hunter, J. E., «Validity generalization for computer programmers», Journal of Applied Psychology, 1980, 65, p. 643-661. Pereña, J., «Yo no creo en los tests. Cómo usar bien una “herramienta” imprescindible», Training and Development Digest, 2002, p. 23-26. Ree, M. J.; Carretta, T. R., «g2K», Human Performance, 2002, 15, 3-23. Strenze, T., «Intelligence and socioeconomic success: A metaanalytic review of longitudinal research», Intelligence, 2007, 35, p. 401-426. Terman, L. M., The measurement of intelligence: An explanation of and a complete guide for the use of the Stanford revision and extension of the Binet-Simon Intelligence Scale, Boston, Houghton Mifflin, 1916. Rothman, S.; Meining, D.; Barrick, M. R., Predicting performance using personality measures in South Africa, Annual Conference of the Society for Industrial and Organizational Psychology (Toronto [CN], Abril 2002). Urbina, S., Claves para la evaluación con tests psicológicos, Madrid, TEA Ediciones, 2007. Salgado, J. F., «The five factor model of personality and job performance in the European Community», Journal of Applied Psychology, 1997, 82, p. 30-43. Vinchur, A. J.; Schippmann, J. S.; Switzer F. A.; Roth, P. L., «A metaanalytic review of predictors of job performance for sales people», Journal of Applied Psychology, 1998, 83, p. 586-597. Salgado, J. F. «The Big Five personality dimensions and job performance in army and civil occupations: A European perspective», Human Performance, 1998, 11, p. 271-288. Wilhelm, O.; Engle, R. W., Handbook of understanding and measuring intelligence, California, Sage Publications, 2005. Salgado, J. F., «The Big Five personality dimensions and counterproductive behaviors», International Journal of Selection and Assessment, 2002, 10, p. 117-125. Yoo, T.Y.; Ming, B.M., A meta-analysis of the Big Five and performance in Korea, Annual Conference of the Society for Industrial and Organizational Psychology (Toronto [CN], Abril 2002). Salgado, J. F., «Predicting job performance using FFM and nonFFM personality measures», Journal of Occupational and Organizational Psychology, 2003, 76, p. 323-346. Salgado, J. F. «Personalidad y deseabilidad social en contextos organizacionales: implicaciones para la práctica de la Psicología del trabajo y las organizaciones», Papeles del psicólogo, 2005, 92, p. 115-128. Nota Salgado, J. F.; Moscoso, S., «Selección de personal en la empresa y las AAPP: De la visión tradicional a la visión estratégica», Papeles del Psicólogo, 2008, 29, p. 16-24. Salgado, J. F.; Anderson, N.; Moscoso, S.; Bertua, C.; De Fruyt, F.; Rolland, J. P., «GMA measures and the prediction of Job Performance and training success for different occupations in the European Community», Journal of Applied Psychology, 2003, 88, p. 1068-1081. Schmidt, F. L., «The role of general cognitive ability and job performance: Why there cannot be a debate», Human Performance, 2002, 15, p. 187-210. 1. Existen diferentes tipos de tests que utilizan muestras de trabajo. La filosofía subyacente consiste en construir simulaciones a la medida de parte o de la totalidad de la tarea a realizar por el candidato a un puesto de trabajo determinado. Por ejemplo, como parte de un test de muestra de trabajo, el candidato podría tener que reparar un motor eléctrico defectuoso en un tiempo determinado. Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria Revista Vasca de Gestión de Personas y Organizaciones Públicas Núm. 7 zk./2014. Págs. 24-35 or. ISSN: 2173-6405 35

ALGUNOS APUNTES SOBRE LOS TESTS PSICOLÓGICOS Y SU

Documentos relacionados

Productos

Apoyo

ALGUNOS APUNTES SOBRE LOS TESTS PSICOLÓGICOS Y SU

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib