ALGUNOS APUNTES SOBRE LOS TESTS PSICOLÓGICOS Y SU

Anuncio
I1
AZTERLANAK
ESTUDIOS
ALGUNOS APUNTES SOBRE LOS TESTS
PSICOLÓGICOS Y SU USO PARA LA
SELECCIÓN DE PERSONAL EN LA
ADMINISTRACIÓN PÚBLICA
SOME NOTES ABOUT PSYCHOLOGICAL
TESTS AND TESTING FOR PERSONNEL
SELECTION PURPOSES IN THE SPANISH
PUBLIC SERVICE
David Arribas Águila
Departamento de I+D+i de TEA Ediciones
[email protected]
Recibido: 23/9/2014
Aceptado: 4/11/2014
Laburpena: Ikuspegi orokorra ematen da langileen hautaketan
test psikologikoak erabiltzearekin lotutako hainbat alderdiei buruz.
Lehenengo eta behin, gaia ikuspegi historiko batetik aztertzen da.
Ondoren, Administrazio Publikoko langileen hautaketan kontuan
hartu beharreko kontzeptu psikometriko nagusien glosario bat eskaintzen da. Gainera, kritika et akats ohikoenak berraztertzen dira,
baita baremoak erabiltzearekin eta puntuazioak interpretatzearekin
lotutako kontu zehatz batzuk ere.
Gako-hitzak: Testa, ebaluazio psikologikoa, psikometria, psikoteknikoak, sarrera-probak.
Resumen: Se ofrece una panorámica general sobre diferentes aspectos relacionados con el uso de los tests psicológicos para la selección de personal. En primer lugar se analiza la temática desde
una breve perspectiva histórica. A continuación se ofrece un glosario con los conceptos psicométricos más esenciales a tener en
cuenta al abordar una selección de personal en el ámbito de la Administración Pública. Además, se repasan las críticas y errores más
comunes y algunas cuestiones específicas relacionadas con el uso
de baremos y la interpretación de puntuaciones.
Palabras clave: Test, evaluación psicológica, psicometría, psicotécnicos, pruebas de admisión.
Abstract: An overview about different features of the use of psychological tests for personnel selection purposes is provided. First,
psychological testing is briefly analyzed under a historical perspective. Next, it offers a glossary with the most essential psychometrics
concepts to keep in mind when addressing a personnel selection
process in the field of Public Service. In addition, the most common
mistakes and complaints concerning psychological assessment, as
well as some specific issues related to the use of norms and the interpretation of the test scores are reviewed.
Keywords: Test, psychological testing, psychometrics, psychometric
tests, admissions tests.
24
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
Sumario
1. Introducción.—2. Haciendo un poco de historia.—3. Conceptos psicométricos básicos: glosario.—4. Críticas
comunes a los tests psicométricos.—5. Errores frecuentes.—6. Baremo general frente a baremo interno.—7. El
problema de la sinceridad en las medidas de autoinforme.
1. Introducción
Hoy en día resulta difícil encontrar a alguien que no
haya tenido que enfrentarse a uno en algún momento
de su vida, bien sea en la escuela, en la universidad,
al buscar ayuda profesional o al optar a un puesto de
trabajo. Venerados por algunos, los evaluadores, y temidos por otros, los evaluados, los tests psicológicos
cumplen una función irremplazable en muchos ámbitos de la sociedad y poseen una gran influencia sobre
la vida y la carrera de las personas.
El uso de pruebas psicológicas en el ámbito de la selección de personal para la Administración Pública es
un hecho igualmente conocido y extendido, así como
comentado y en ocasiones fuertemente criticado. Así,
muchas de las cuestiones generales que sobre este
modo de evaluar se debaten en la sociedad o en los
foros científicos son plenamente válidas y aplicables
al sector público, desde las que ponen en duda la fiabilidad y validez del sistema a otras más específicas
en lo que al propio procedimiento o incluso a la interpretación de las puntuaciones se refiere.
En los siguientes párrafos se presentan algunos datos
e informaciones que pretenden proporcionar al lector una visión general sobre la evaluación psicológica
mediante tests, así como algunas pautas y prácticas
recomendadas que pueden servir de ayuda a las personas responsables de algún proceso de selección
en el ámbito de la Administración Pública.
2. Haciendo
un poco de historia
La Psicometría es la rama de la Psicología encargada
de fundamentar la construcción y el uso de los tests
psicológicos. Con más de un siglo de tradición como
disciplina, constituye hoy en día un extenso cuerpo
de conocimientos teóricos y técnicos al servicio de
la medición de atributos psicológicos. Esta es la razón, entre otras, por la que los profesionales expertos
en la materia denominan «tests psicométricos» a las
pruebas para la evaluación de rasgos psicológicos,
una denominación mucho más precisa que la comúnmente extendida de «tests psicotécnicos».
El uso de procedimientos psicométricos para el estudio de las diferencias individuales nace entre finales
del siglo XIX y principios del siglo XX, aunque existen
antecedentes de pruebas utilizadas para el ingreso
a los servicios civiles que datan de varios milenios
atrás. Así, en la China Imperial, en fechas tan tempranas como en el año 2200 a.C., se empleaba un sistema de exámenes para valorar y decidir si los funcionarios del gobierno eran aptos para el desempeño
de sus funciones. Dicho sistema era trienal y se servía
de «pruebas» para evaluar las habilidades en música,
tiro con arco, equitación y escritura o los conocimientos sobre los principios de Confucio, los ritos y las ceremonias, las leyes civiles, la agricultura, la geografía
o la poesía. Se trataba de exámenes orales, más que
escritos, que evaluaban no solamente lo que los candidatos decían, sino también cómo lo decían.
Aunque durante los siglos XVIII y XIX el sistema chino
influyó de forma determinante en la concepción de
los exámenes del servicio civil de países como Francia, Inglaterra, Alemania o incluso EE.UU., no fue hasta
principios del siglo XX cuando la evaluación psicológica tomó el rigor del método científico, comenzándose a labrar los cimientos de la auténtica cultura de
tests que conocemos hoy en día. De hecho, la evaluación psicométrica ha sido uno de los terrenos más
productivos, prolíficos y dinamizadores de la Psicología a lo largo de su historia como ciencia social, con
infinidad de propuestas ligadas en un primer momento
al estudio de la inteligencia y de las aptitudes y posteriormente de otras variables como la personalidad, las
actitudes o los intereses personales.
Los primeros tests para la evaluación sistemática de un
atributo psicológico, la inteligencia, fueron de aplicación
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
25
AZTERLANAK
ESTUDIOS
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
individual (Binet y Simon, 1905; Terman, 1916) y sembraron las bases para un cambio de paradigma que afectó
de forma determinante a la Psicología y al modo en que
era percibida por la sociedad. Su repercusión fue muy
notoria en aquella época, ya que supuso abordar por
primera vez de un modo riguroso alguno de los problemas importantes presentes en aquellos días, como el
de la escolarización o el de la clasificación de los niños
con deficiencias. Sin embargo, el sistema de evaluación
individual resultaba poco práctico cuando se deseaba
recabar información de grupos numerosos, necesidad
que surgió por primera vez en Estados Unidos durante
la I€Guerra Mundial y que llevó a la construcción de las
primeras baterías colectivas para la evaluación psicométrica de varias aptitudes bajo las denominaciones
de Army Alpha y Army Beta Test. Recopilando algunas
tareas clásicas, como las de series numéricas, antónimos o frases incompletas, y diseñando nuevos ejercicios apropiados para su aplicación colectiva, se pudo
evaluar, clasificar y seleccionar rápidamente a miles de
militares.
Tras el éxito de la operación, el modelo de evaluaciones masivas mediante tests fue extendiéndose con
celeridad hasta el comienzo de la II Guerra Mundial.
Una vez más, las necesidades bélicas llevan al estudio de las aptitudes especiales que se requiere de los
soldados. Sin embargo, a diferencia de lo ocurrido durante la I Guerra Mundial, no se trataba únicamente de
descartar potenciales soldados debido a su bajo nivel
intelectual, sino de seleccionar a los más capaces en
el dominio de ciertas habilidades. Todo ello supone
un enorme impulso para el desarrollo de tests de aptitudes generales y de otros más enfocados a aptitudes específicas, como fueron los de aptitud mecánica,
coordinación, cálculo, fluidez, etc.
En décadas sucesivas, la producción de nuevos tests
psicométricos se multiplica exponencialmente, no
sólo en el ámbito de las aptitudes intelectuales sino
también de la personalidad, de las actitudes y del rendimiento, dando lugar a una auténtica industria de
los tests. Los esfuerzos se centran no solo en producir nuevos instrumentos que den respuesta a las demandas de la sociedad, sino también en dotar de mayor rigor a la metodología psicométrica subyacente y
en acompañarlos de sólidas bases estadísticas, apareciendo nuevas y novedosas teorías de tests y de
medición a finales de 1960 y principios de 1970. Por
aquellos años los tests están ya plenamente presentes en la sociedad, la cual recoge y hace suyas algunas de las críticas vertidas por los teóricos y académicos de la época. Como consecuencia, en la década
de 1980 se comienza a apreciar una actitud contradictoria hacia el uso de los tests psicométricos: mientras que el profesional continúa usándolos cada vez
más, ya que ello le reporta claros beneficios para su
26
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
labor, el ámbito académico adopta una postura crítica,
lo que lleva a la instauración de fuertes dosis de escepticismo en la sociedad. Aunque esta contradicción
pueda seguir apreciándose incluso hoy día, afortunadamente comienza a decaer de forma mayoritaria a
principios de 1990, década en la que se evidencia un
claro uso no estigmatizador de los tests y se reconoce
que las pruebas psicológicas presentan limitaciones
sin que por ello se deba renunciar a su empleo.
En la actualidad, los tests psicológicos gozan de una
excelente salud, fiel reflejo del desarrollo de la Psicología y su asentamiento en la sociedad. Hoy en día los
esfuerzos de la vanguardia se centran en incorporar
plenamente los avances de la era digital a la evaluación psicométrica, con sistemas de corrección y aplicación por Internet que liberan de labores burocráticas
y administrativas y dotan de mayor flexibilidad al proceso, o en maximizar la eficiencia de la evaluación mediante sistemas adaptativos informatizados. Esta buena
salud no refleja más que la evolución realmente vertiginosa de esta joven tecnología desde los primeros
acercamientos de principios del siglo XX hasta la actualidad. En resumen, los tests psicológicos han sido y
continúan siendo una pieza clave para la toma de decisiones fundamentada en muchas de las esferas de la
sociedad, desde el ámbito educativo al laboral, sanitario o clínico, incluido, claro está, el de los procesos de
selección propios de la Administración Pública.
3. Conceptos
psicométricos básicos:
glosario
En ocasiones puede resultar realmente útil que las
personas a cargo de los procesos de selección bajo
el sistema de oposición se encuentren familiarizadas
con algunos conceptos psicométricos, en caso de utilizar como criterios selectivos uno o más tests. En este
punto se presenta a modo de glosario algunos términos frecuentes y otros algo específicos que pueden
servir de guía o ayuda durante el proceso.
• Ajuste a perfil: Índice estadístico usualmente comprendido entre 0 y 100 (de menor a mayor ajuste)
que determina hasta qué punto el perfil de puntuaciones del candidato se corresponde con el requerido por el puesto o plaza a cubrir.
• Banco de ítems: Conjunto de tareas, enunciados,
ejercicios o problemas, habitualmente de aptitudes (verbal, numérica, razonamiento, etc.), que
han sido probados empíricamente y de los que se
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
•
•
•
•
•
•
•
•
conoce su grado de idoneidad y sus propiedades
psicométricas (dificultad, discriminación…).
Baremo: Tabla con la que comparar las puntuaciones obtenidas en un test psicométrico respecto
de una muestra normativa. El resultado se suele
expresar en términos de una puntuación transformada que expresa similitud o diferencia con el
grupo de referencia.
Baremo interno: Referencia que compara la puntuación obtenida por el opositor con la del resto
de candidatos presentados a examen. Indica la posición y el nivel de rasgo psicológico de la persona
en relación con el mismo proceso de oposición.
Baremo general: Referencia que compara la puntuación obtenida por el candidato con la de otras
personas de la población, examinadas con la
misma finalidad (proceso de oposición) o finalidades afines (selección de personal). Indica la posición y el nivel de rasgo de la persona en relación
con la población.
Corrección por azar: Fórmula que permite corregir
la adivinación por azar en los tests con un número
determinado y finito de alternativas de respuesta.
La fórmula más comúnmente usada implica penalizar a la puntuación total con la cantidad de «1/(n.º
alternativas-1)» puntos por cada error cometido
(p. ej., en los test con 4 alternativas de respuesta,
cada error penalizaría 0,33 puntos de acuerdo a
esta formulación; en los tests de 2 alternativas de
respuesta, la penalización sería de 1 punto).
Grupo normativo o grupo de referencia: Muestra de personas representativa de una población
o colectivo a partir de la cual se construye un baremo.
Ítem: Cada uno de los ejercicios de que consta un
test.
Puntuación directa (PD): Número procedente de
la suma del valor otorgado a cada ítem de un test.
En los tests de aptitudes, la puntuación directa
suele ser la cantidad de aciertos tras aplicar, si corresponde, la corrección por azar de las respuestas. También se puede encontrar en algunos textos con la denominación de puntuación bruta.
Puntuación transformada (PT): Valor numérico resultado de transformar estadísticamente una puntuación directa. La mayoría de las veces indica la
posición relativa del candidato en relación con un
grupo normativo o de referencia (interno o general). Algunas de las puntuaciones transformadas
más comunes son los percentiles (Pc), los cuales
indican el porcentaje de personas del grupo normativo que deja por debajo de sí la puntuación
directa del candidato, las puntuaciones S (media€ =€ 100; Dt€ =€ 20) o los decatipos (media€ =€ 5,5;
Dt€ =€ 2), que expresan la posición estadística del
opositor en relación con el grupo de referencia,
•
•
•
•
•
•
•
o las transformaciones en base 10 (de 0 a 10 puntos), indicativas del porcentaje del examen o de
los contenidos que el candidato demuestra dominar o superar a partir de su rendimiento.
Punto de corte: Umbral expresado en puntuaciones transformadas que determina si un candidato
ha resultado apto o no apto para la plaza a cubrir
o fases posteriores dentro del proceso.
Fiabilidad: Propiedad psicométrica que determina
el grado de precisión del test utilizado como instrumento de medida para una finalidad concreta.
Suele expresarse mediante un coeficiente situado
entre 0 y 1 (de menor a mayor fiabilidad), el cual indica hasta qué punto las puntuaciones del test se
encuentran libres de error de medida.
Test de aptitudes: Prueba que evalúa una o más
habilidades o destrezas mediante ítems que plantean problemas a resolver. Los tests de aptitudes
se caracterizan por incluir tareas del tipo acierto/
error. Entre los tests de aptitudes más usados estarían los tests de razonamiento, los de factor g
o inteligencia general, los que evalúan la aptitud
verbal o los tests para medir el grado de atención
y concentración del candidato.
Test de conocimientos: Prueba que evalúa los conocimientos adquiridos del candidato mediante preguntas abiertas o cerradas sobre uno o varios temas. Los tests de conocimientos se caracterizan
igualmente por incluir ítems del tipo acierto/error. Entre los tests de conocimientos más comúnmente utilizados estarían los tests sobre leyes, sobre una temática específica o sobre la Constitución Española.
Test de personalidad (autoinforme): Cuestionario
que evalúa algunas competencias, actitudes o características de la personalidad de los candidatos.
Los tests de personalidad incluyen ítems que plantean situaciones sobre las que el candidato debe
opinar o indicar la frecuencia con la que se comporta de una determinada forma, por lo que no
existen respuestas correctas o incorrectas. Suelen incluir una o varias escalas o medidas para detectar la falta de sinceridad, lo que puede incluso
invalidar los resultados. Algunos de los rasgos de
personalidad y competencias más comúnmente
evaluados son la responsabilidad, la estabilidad
emocional, la tolerancia al estrés, la disposición a
trabajar en equipo, etc.
Test psicotécnico: Término comúnmente utilizado
para referirse a los tests psicométricos de aptitudes.
Validez: Tradicionalmente indicaba el grado en el
que el test medía lo que realmente pretendía medir. Actualmente se suele matizar esta definición,
entendiéndose como el grado en el que existen
evidencias o datos empíricos que apoyan la interpretación de las puntuaciones en un sentido determinado.
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
27
AZTERLANAK
ESTUDIOS
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
4. Críticas comunes
a los tests
psicométricos
Posiblemente derivado de la imposibilidad de desvincularse de su objeto de conocimiento, esto es, del ser
humano, los tests psicométricos han recibido históricamente, y reciben actualmente, intentos de descrédito, tanto por parte de la sociedad como incluso de
los propios profesionales de la Psicología. La siguiente
pregunta puede resultar ilustrativa de la falta de fundamento de una de las críticas más comunes que sobre
los tests psicométricos se vierten: ¿Qué pensaría Ud.
si en un análisis médico rutinario le detectan un nivel
alto de colesterol en sangre o hipertensión arterial?
Las respuestas que surgen ante esta pregunta suelen ser del tipo «Pensaría en ponerme a dieta», «en
comer más sano», «en hacer más deporte», «en tomar medicación»... Ahora bien, a nadie se le ocurriría
cualquier respuesta, más habitual de lo deseable en
referencia a los tests psicológicos, del tipo «Pensaría que esa prueba no mide bien», «ese test no sirve
para nada» o el ya famoso «es que yo no creo en ese
tipo de tests» (véase Pereña, 2002, para un excelente
tratamiento sobre este tema). Tomando como referencia una de las propiedades métricas más conocidas,
conviene apuntar aquí que la fiabilidad con la que se
mide algunos atributos físicos, como la presión sanguínea o el nivel de colesterol, suele estar entre 0,50
y 0,60. En el terreno de la Psicometría, la fiabilidad de
los tests de aptitudes sobrepasa habitualmente el valor de 0,80, el de las pruebas de inteligencia el 0,90
y en las pruebas de personalidad nos solemos mover
entre 0,70 y 0,85. Sirva como ejemplo uno de los últimos tests publicados para la evaluación de aptitudes,
el BAT-7 (Arribas et al., 2013), con una fiabilidad que
alcanza el 0,97 en alguno de sus índices para la estimación de la inteligencia general. No obstante, seguimos sin contar con un elevado índice de fiabilidad a
ojos de parte de la sociedad, uno de los criterios más
importantes para la aceptación de nuestra metodología, algo que, como hemos visto, no experimentan
otras disciplinas como la bioestadística.
Por otro lado, en lo que a la validez de los tests psicométricos se refiere, en la actualidad existe una contundente y abundante evidencia empírica, acumulada
durante más de un siglo de investigación, sobre cómo
se relacionan los resultados de los tests con infinidad de criterios externos de tipo social, demográfico,
biológico y psicológico (p. ej., Burks et al., 2009; Colom, 2002; Deary, 2012; Deary et al., 2007; Gottfredson, 1997, 2000; Lubinski, 2000; Ree y Caretta, 2002;
28
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
Schmidt, 2002; Strenze, 2007). A modo de ejemplo,
entre los años 2000 y 2010 se publicaron 24.087 investigaciones en revistas científicas que trataban sobre este tema, un volumen que lejos de parar se incrementa cada año.
Entre los criterios que se tienen en cuenta en las investigaciones, la relación con el rendimiento profesional es uno de los aspectos más estudiados y sobre los
que se ha acumulado una mayor cantidad de evidencia
empírica. Según la American Psychological Association
(Neisser et al, 1996), los tests estandarizados de inteligencia correlacionan 0,54 con el rendimiento laboral,
una relación que se puede considerar media-alta. Independientemente de la fuente que se analice, parece
claro que las puntuaciones en los tests son una fuente
de información relevante y valiosa a tener en cuenta a
la hora de tomar decisiones sobre una persona.
En este sentido, distintos estudios han puesto de manifiesto la relevancia de la capacidad mental general
(GMA; General Mental Ability) sobre el rendimiento laboral. Esta capacidad se define operativamente como
el rendimiento en cualquier instrumento que combine
dos o más aptitudes específicas o que incluya ítems
que evalúen diferentes habilidades (verbal, numérica,
espacial...; Schmidt, 2002). Los resultados de estos estudios son concluyentes: los tests de inteligencia y aptitudes son uno de los mejores (y más eficientes) predictores del rendimiento laboral (p. ej., Ghiselli, 1973;
Hunter, 1986; Hunter y Hunter, 1984; McHenry et al.,
1990; Salgado et al., 2003; Schimdt y Hunter, 1998).
Así, por ejemplo, Hunter y Hunter (1984) analizaron
más de 425 investigaciones previas y encontraron
que la correlación media entre el nivel aptitudinal y
las valoraciones de los superiores respecto del rendimiento laboral era de 0,53. Del mismo modo, McHenry
et al. (1990) analizaron la validez predictiva de diferentes medidas aptitudinales, encontrando una relación
de 0,65 entre el rendimiento y la capacidad GMA y de
0,68 si a dicha capacidad se le añadía la aptitud espacial.
Uno de los estudios más influyentes y clásicos en el
área es el de Schmidt y Hunter (1998), el cual resume
los resultados de 85 años de investigación sobre la
validez y la utilidad de 19 métodos de selección de
personal en relación con el rendimiento laboral. Además, estos autores calcularon las ganancias sobre la
predicción global del rendimiento si a los resultados
de los tests de inteligencia general se añadiera cualquiera de los otros métodos (tabla 1). Al comparar la
validez de los diferentes métodos de selección, los
tests psicométricos ocupan un lugar prominente por
las siguientes razones:
• Son aplicables a todo tipo de trabajos (independientemente del grado de cualificación que exi-
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
Tabla 1
Relación con el rendimiento laboral de diferentes métodos de selección
Tipo de evaluación
Relación con el rendimiento
general en el puesto
Incremento de la validez respecto
de los tests de inteligencia
Test de inteligencia
0,51
—
Muestra de trabajo
0,54
24%
Test de integridad u honestidad
0,41
27%
Test de personalidad
0,31
18%
Entrevista estructurada
0,51
24%
Entrevista (no estructurada)
0,38
8%
Test de conocimientos
0,48
14%
Simulaciones de trabajo
0,44
14%
Evaluación de los compañeros
0,49
14%
Consistencia comportamental de formación y experiencia
0,45
14%
Referencias
0,26
12%
Experiencia en el puesto
0,18
6%
Datos biográficos
0,35
2%
Assessment center
0,37
4%
Años de educación
0,10
2%
Intereses
0,10
2%
0,02
0%
–0,01
0%
Grafología
Edad
Fuente: Schmidt y Hunter (1998).
jan) y tienen el mayor índice de validez y el menor coste económico. Los procedimientos que
utilizan muestras de trabajo tienen resultados ligeramente mejores, pero son mucho más costosos y solo pueden realizarse con candidatos
que ya conozcan el trabajo o hayan sido formados previamente1. Del mismo modo, las entrevistas, por ejemplo de competencias o incidentes
críticos, pueden requerir algún grado de conocimiento del trabajo a realizar y por lo tanto no ser
adecuadas para candidatos aprendices de un
nuevo puesto.
• La investigación empírica sobre la validez de
los tests para predecir el rendimiento laboral
es más sólida que la de cualquier otro método.
Así, por ejemplo, existen miles de estudios sobre la capacidad predictiva de los tests de inteligencia, en contraste, por ejemplo, con los
estudios sobre la validez de la entrevista estructurada.
• Los fundamentos teóricos de los tests son más sólidos que los de cualquier otra medida usada en
los procesos de selección. Así, por ejemplo, las
teorías de la inteligencia han sido objeto de estudio durante más de un siglo y, como tal, los tests
que la evalúan arrojan resultados más claros y contextualizados que cuando se utiliza, por ejemplo, la
técnica del assessment center o la entrevista.
Por estas razones, estos autores consideraron que
los tests que evalúan la capacidad general deberían ser el principal instrumento a utilizar en los procesos de selección de personal (de hecho, se ha
demostrado que su omisión disminuye sistemáticamente la validez predictiva del proceso; Wilhelm y Engle, 2005). Además, su uso conjunto con otros tests,
como los de integridad u honestidad, personalidad o
conocimientos, hace que se incremente entre un 14%
y un 27% la validez de la predicción, en la línea de lo
apuntado por otros autores, como Salgado y MosPertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
29
AZTERLANAK
ESTUDIOS
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
coso (2008), en relación con la entrevista conductual
estructurada.
Sin embargo, esta relación con el rendimiento laboral parece que se encuentra modulada por el tipo de
ocupación (Salgado et al., 2003). Los estudios realizados con diferentes familias de ocupaciones (p.€ ej.,
Hartigan y Wigdor, 1989; Hunter y Hunter, 1984) o
con determinas profesiones específicas (p. ej., Hirsch,
Northrop y Schmidt, 1986; Levine et al., 1996; Pearlman, Schmidt y Hunter, 1980; Vinchur et al., 1998) revelan que la capacidad predictiva puede depender de
la complejidad del puesto laboral, llegando incluso a
alcanzar valores de validez operativa por encima de
0,70 (Schmidt, Gast-Rosenberg y Hunter, 1980).
En definitiva, los tests psicométricos son una de las
opciones más eficaces y menos costosas para reducir la incertidumbre de cara a la toma de decisiones
en los procesos de selección. Colom y Andrés-Pueyo
(1999) resumen de la siguiente forma las implicaciones
operativas que tiene la relación entre los tests de inteligencia y el rendimiento laboral en el ámbito de la selección de personal:
«Para hacerse una idea del significado de estos valores veamos la siguiente argumentación: consideremos
una situación en la que tienen éxito el 60% de los individuos. Para ser más específicos, alrededor del 60%
de la población laboral se sitúa por encima del nivel de
inteligencia (CI€=€100) necesario para rendir adecuadamente en un banco (por ejemplo). Si ese banco contratase a sus empleados aleatoriamente, la probabilidad
de éxito sería de 1,5:1 (60:40). Si el banco seleccionase
a sus empleados según un test con una validez predictiva de 0,30 (y contratase a la mitad de los candidatos),
la probabilidad de éxito aumentará a 2:1 (69:31). Si la
validez del test fuese de 0,45 (algo bastante habitual)
la probabilidad pasará a 3:1 (74:26), lo que duplicará las
probabilidades iniciales. Por supuesto, cuanto mayor
sea el número de candidatos y menores los puestos
disponibles, mayores beneficios se obtendrán al emplear un test incluso con índices de validez por debajo
de 0,30». (Colom et al, 1999, p. 465-466)
5. Errores frecuentes
En las evaluaciones que se llevan a cabo para la provisión de plazas públicas pueden aparecer algunos
errores que no son exclusivos de este ámbito, pero
que conviene tener presentes puesto que de aparecer podrían acarrear consecuencias poco deseables
o difícilmente solventables. Estos errores pueden tener su origen incluso en las mismas bases de la con30
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
vocatoria, por lo que una primera recomendación sería no tomar como buenas sin más las prácticas de
otros procesos que aparentemente puedan parecer
formalmente similares.
Una de las primeras decisiones relacionadas con el
uso de pruebas psicométricas para la selección de
personal se refiere a la dificultad media de los tests
a utilizar. En este sentido, un error frecuente consiste
en seleccionar tests que incluyen tareas cuya dificultad está ajustada al nivel educativo mínimo exigido
por las bases de la convocatoria, aun a sabiendas de
que la mayoría de los presentados a examen probablemente serán de un nivel superior o muy superior.
Lo importante de cara a la selección de los tests es
que estos garanticen la equidad y homogeneidad de
la evaluación, que sean máximamente discriminativos
e informativos y que aseguren una buena medición.
Al igual que un test podría ver mermada su capacidad
de medición por ser extremadamente difícil y acumular un elevado porcentaje de puntuaciones muy bajas,
un test extremadamente fácil para el perfil aptitudinal
medio de los opositores puede provocar un efecto
«techo», esto es, una acumulación de casos con puntuaciones muy altas, lo que llevaría a una poco recomendable toma de decisiones final basada en pocas
décimas de diferencia. Por tanto, lo ideal desde el
punto de vista métrico será encontrar un nivel de dificultad de las tareas que maximice la capacidad de
discriminar entre los aptos y no aptos y se ajuste lo
máximo posible a una distribución en forma de campana de gauss o curva normal, esto es, con pocos casos en los extremos alto y bajo y una buena dispersión en la parte media de la distribución.
En relación a la disponibilidad del test a utilizar, a la
hora de establecer las bases de la convocatoria en
ocasiones se produce una situación bastante paradójica e incluso lógicamente contradictoria. En no pocos
procesos se solicitan tests psicométricos que sean
completamente inéditos, a la medida o construidos ex
profeso para esa convocatoria, aunque simultáneamente deben, de acuerdo a las bases, estar probados
empíricamente y baremados con muestras similares
a las del puesto objetivo, así como acumular estudios
científicos y psicométricos que avalen y acrediten su
uso. Este requisito es realmente complicado de alcanzar, puesto que para probar un test empíricamente y
acumular casos que permitan una baremación representativa y evidencias que avalen su uso, inevitablemente el test debe ser aplicado a personas. La única
solución que permite solventar este escollo se refiere
a los bancos de ítems que manejan las grandes editoriales de tests, los cuales permiten construir pruebas
completamente inéditas en su conjunto, aunque formadas por tareas y procedimientos que fueron empíricamente probados en distintos colectivos.
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
En cuanto al número de tareas a utilizar y su distribución, desde el punto de vista métrico resultan
desaconsejables los tests tipo «ómnibus» en los que
se mezclen, bajo un mismo tiempo de respuesta, muchos tipos de ejercicios con un número reducido de
ítems por cada rasgo o aptitud a evaluar. Este tipo de
tests o cuestionarios suelen dar lugar a índices métricos de menor calidad que aquellos que incluyen un
amplio muestreo de contenidos. Por tanto, cada una
de las variables que se considere importante evaluar
debe contar con un número suficientemente amplio
de ítems, de modo que el rasgo psicológico se evalúe
con precisión y su contenido se encuentre suficientemente representado. En este sentido, y a grosso
modo, en las pruebas de aptitudes se suele incluir un
número superior a los 15 ítems por aptitud, siendo entre 10 y 15 ítems por rasgo en el caso de las pruebas
de personalidad. No obstante, la ratio ítem/variable a
evaluar depende fuertemente de la complejidad del
rasgo o aptitud a evaluar.
Por otra parte, una de las claves de la selección de
personal en el contexto de la gestión de los recursos
humanos se refiere a la adecuación puesto-persona,
condición básica para que el trabajador pueda sentirse motivado y comprometido con la organización,
para que su nivel de satisfacción profesional sea elevado, para evitar la rotación y la conflictividad, para
promover un buen clima laboral y demás consecuencias deseables. En muchas ocasiones, el propio sistema de oposición lleva a una sobredotación de los
candidatos seleccionados como aptos, ya que se
adoptan puntos de corte o criterios que valoran como
positivas algunas características propias de puestos
de un nivel competencial superior. Sirva como ejemplo el siguiente perfil hipotético que supuestamente
debiera poseer el opositor seleccionado para un
puesto de auxiliar administrativo: nivel alto o muy alto
en responsabilidad, liderazgo, trabajo en equipo, organización, comunicación, aptitud numérica, capacidad de atención y manejo de herramientas informáticas de gestión. Parece obvio tras lo expuesto que
una persona con tales características difícilmente podrá adaptarse y sentirse profesional y plenamente desarrollada en un puesto de tipo administrativo.
Otro error frecuente en la línea del punto anterior se
refiere a los criterios respecto del perfil de competencias o personalidad de los opositores requerido
para el puesto. Existe una tendencia muy marcada, y
no exclusiva del sector público, a interpretar los valores altos de competencia como positivos para cualquier ocupación. Así, muchos procesos buscan entre
sus candidatos u opositores características que consideran deseables para el desempeño, como pueden
ser un nivel alto de liderazgo, de trabajo en equipo o
de organización y planificación. Del mismo modo, ni-
veles altos o muy altos en algunas variables emocionales, como podría ser la estabilidad, la tolerancia al
estrés, la empatía… Sin embargo, conviene destacar
que los perfiles muy apuntados o extremos en este
tipo de variables podrían ser realmente contraproducentes. Por ejemplo, un nivel excesivamente alto de
trabajo en equipo puede revelar una incapacidad para
desarrollar el trabajo de forma independiente, un nivel muy alto de organización y planificación puede suponer dificultades para manejar el cambio y el estrés
o una institución llena de líderes en todos los niveles jerárquicos resultaría prácticamente ingobernable.
Igualmente, las personas con una elevada estabilidad
emocional pueden resultar insensibles a los problemas o emocionalmente fríos, una excesiva tolerancia
al estrés puede conducir a problemas de clima laboral
o conflictos interpersonales… Por tanto, se debe prestar una especial atención a los puntos de corte que se
establezcan de cara a ajustar el perfil psicológico objetivo, lo que idealmente debería hacerse bajo la supervisión de un profesional de la evaluación o de los
recursos humanos con experiencia como asesor externo en este tipo de procesos.
No por evidentes se deben dejar de mencionar algunos errores de procedimiento que se siguen observando en las sesiones de evaluación colectivas que
utilizan tests psicométricos. Al margen de las cuestiones más generales sobre la aplicación de tests, muchas de ellas recogidas en las Directrices Internacionales para el Uso de los Tests (ITC, 2001), los errores
sistemáticos más frecuentes y relacionados con los
exámenes en la Administración Pública se centran en
tres aspectos: las labores de vigilancia, la ayuda al
examinando y la información sobre la penalización.
En primer lugar, el nivel de vigilancia necesario para
el buen desarrollo de una sesión se recomienda que
sea de tipo medio, esto es, que no añada tensión innecesaria a la situación por una excesiva supervisión
ni permita, claro está, alguna práctica fraudulenta por
falta de atención. Una sesión de evaluación estándar frecuentemente consta de una o varias pruebas
de aptitudes y conocimientos, junto con otra prueba
de personalidad o competencias, a contestar todas
ellas en una única hoja de respuestas. Durante los primeros tests, los que constan de ítems que admiten el
acierto o el error, el nivel de vigilancia de las personas
a cargo suele ser el adecuado. Sin embargo, en sesiones de varias horas, un error bastante común es el
de bajar la guardia al final del examen, esto es, en la
parte dedicada a los tests de personalidad, pensando
que no existe la posibilidad de copia por incluir ítems
en los que no es posible acertar o fallar… Aunque el
diseño de las hojas de respuesta pueda dificultar la
copia, no se debe olvidar que esta es común a todas
las pruebas del examen, por lo que algunos opositoPertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
31
AZTERLANAK
ESTUDIOS
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
res pueden tratar de copiar las respuestas a los tests
de aptitudes o conocimientos, lo que supondría un
grave perjuicio para el proceso. Por tanto, una primera
recomendación respecto del procedimiento a seguir
es mantener un nivel de atención o vigilancia medio
durante toda la sesión, de principio a fin.
En segundo lugar, se considera una buena práctica,
de acuerdo a los últimos estándares para la evaluación psicológica mediante tests (AERA, APA y NCME,
2014), informar y ayudar al examinando en caso de
dudas con el procedimiento (por ejemplo, sobre el
modo de contestar o marcar las respuestas en la hoja)
o ansiedad extrema ante la situación de examen. No
obstante, en términos generales se debe poner un
cuidado extremo a la hora de responder dudas o preguntas de los opositores, evitando a toda costa dar
indicaciones o sugerencias sobre la opción de respuesta a marcar o cualquier otra circunstancia ajena a
las instrucciones del test. Recordemos que un test es
una situación estandarizada en la que las diferencias
individuales deben tener su explicación única y exclusivamente en el nivel de aptitud o rasgo de los examinandos, por lo que se debe prestar una atención
especial a cualquier aspecto que haga peligrar el principio de igualdad que garantiza dicha explicación. En
este mismo sentido, por ejemplo, si se estima oportuno emitir una aclaración no contemplada en las instrucciones del test, la práctica correcta sería hacerlo
públicamente a todos los examinandos y en voz alta y
clara para continuar preservando la equidad de la situación de examen.
Por último, existe una gran cantidad de tests para su
uso en la Administración Pública que incluyen una penalización como medida para el control de la adivinación o la respuesta al azar, la cual consiste en restar
a la puntuación directa el número de errores cometidos ponderado por un determinado valor. El valor de
la penalización suele aparecer en las bases de la convocatoria, en las instrucciones del tests o en ambos sitios, pero no siempre es así. Por esta razón, siempre
y cuando se desee comparar el rendimiento con un
baremo general elaborado con anterioridad que dé
cuenta del nivel poblacional del rasgo, se recomienda
seguir escrupulosamente lo marcado por las instrucciones del test en lo que a informar sobre la penalización se refiere. Igualmente, si en las instrucciones no
se alude a la existencia de penalización, el examinador o grupo de examinadores deberán ofrecer a todos los opositores la misma información, esto es, si
existe o no penalización, y siempre en los mismos términos a todos los grupos, ya que de lo contrario se
pueden producir serias alteraciones en el modo de
contestar (fomentando intencionadamente o no la adivinación) y por consiguiente en las puntuaciones resultantes.
32
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
6. Baremo general
frente€a
baremo interno
El marco de referencia más utilizado para la interpretación de los resultados de los tests es, con diferencia, el empleo de normas o baremos (Urbina, 2007). La
pregunta que cabe plantearse bajo este enfoque es:
¿Cómo es el rasgo psicológico de la persona en comparación con otras personas? La puntuación resultante
del test se utiliza por tanto para situar su aptitud, comportamiento, opinión o conocimiento dentro de una
distribución de puntuaciones que refleja el nivel estándar o normativo de la población o grupo de referencia.
Es aquí donde cabe realizar una importante distinción
respecto al grupo normativo con el que comparar la
ejecución de la persona, algo que suele generar confusión entre los profanos en la materia. Un grupo normativo no es más que un grupo de referencia, el cual
puede estar formado por los mismos solicitantes u
opositores a un puesto determinado (baremo interno)
o por una muestra representativa de la población (baremo general). En función de si se trata de un colectivo
u otro, la interpretación varía sustancialmente. Así, en
la gran mayoría de las evaluaciones en la Administración Pública, la finalidad del proceso de selección pretende una simple ordenación en una o varias variables
(o combinaciones de ellas), de modo que se pueda conocer quiénes son los mejores candidatos entre los
presentados. Es la misma esencia del proceso de oposición, en el que compiten entre sí todos los presentados. En este caso, resulta apropiado y conveniente
el uso de un baremo interno, es decir, un baremo
que simplemente transforme las puntuaciones directas a una escala común para poder comparar u operar matemáticamente en los mismos términos, lo que
se puede realizar mediante una transformación que
tenga en cuenta los estadísticos descriptivos del grupo
en cuestión. El lector podrá deducir cómo los resultados desde este enfoque son válidos y generalizables
únicamente al grupo concreto que se use para dicha
transformación, esto es, los presentados a examen.
Sin embargo, este planteamiento tiene sus limitaciones, como por ejemplo la imposibilidad de determinar
el nivel real del rasgo medido, esto es, si los mejores
o peores en un listado interno son realmente altos o
bajos en la población y como tal en las variables evaluadas. Tómese como ejemplo el caso extremo e hipotético de una muestra formada por personas con
un elevado grado de ansiedad; bajo la perspectiva interna siempre tendríamos puntuaciones que cubrirían
todo el rango posible, pero difícilmente se podría determinar que el grupo carece del autocontrol o estabi-
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
lidad emocional necesarios para un puesto al no disponer de un punto de referencia externo.
cuya principal finalidad es la toma de decisiones referidas a las personas.
Este matiz importante se consigue mediante el uso de
un baremo general, representativo de la población,
acercamiento que permite no solo una ordenación
sino también una gradación del atributo evaluado en
comparación con una muestra representativa. De esta
forma, ante un grupo como el anterior, un baremo
construido con estas características permitiría determinar que ninguna de las personas es válida dado que
su nivel de ansiedad es muy superior al de la mayoría
de la población.
Varias son las medidas que existen para controlar y
paliar el efecto de la falta de sinceridad a las respuestas de los cuestionarios y así se suelen contemplar en
los cuestionarios que se utilizan en la Administración
Pública. Entre ellas, las acciones que han sido corroboradas como las más efectivas para esta finalidad son:
7. El problema
de la sinceridad
en las medidas
de€autoinforme
Para terminar, abordaremos en un punto aparte una de
las cuestiones más habituales y controvertidas a las que
se enfrentan los cuestionarios o autoinformes: la falta de
sinceridad y la distorsión de las respuestas. A pesar de
las críticas que han surgido al respecto de la validez de
este tipo de medidas a expensas de la distorsión provocada por la deseabilidad social, numerosas investigaciones han comprobado y confirmado que las medidas de autoinforme son buenos predictores de diversos
criterios organizacionales relevantes (Barrick y Mount,
1991; Barrick, Mount y Judge, 2001; Hogan y Holland,
2003; Hurtz y Donovan, 2000; Mount y Barrick, 1995;
Rothman, Meining y Barrick, 2002; Salgado, 1997, 1998,
2002, 2003, 2005; Yoo y Ming, 2002).
Está ampliamente demostrado el efecto de la deseabilidad social y la falta de sinceridad sobre los resultados de la evaluación: tiende a aumentar o disminuir
las puntuaciones en aquellas escalas que los opositores consideran que están relacionadas positivamente
o negativamente con el desempeño laboral, respectivamente, aunque no afecta drásticamente a la validez
predictiva, ni es una variable mediadora, moderadora
o supresora de la validez de este tipo de evaluación.
A pesar de que en términos generales el efecto sobre
las puntuaciones no es significativo, y especialmente
en situaciones reales de evaluación, en determinados
contextos de laboratorio puede alcanzar varias unidades de desviación, que oscilan entre los 0,13 y los
0,45 puntos típicos (Hough, 1998). En cualquier caso,
parece adecuado ejercer cierto control sobre estas
posibles distorsiones, sobre todo en las herramientas
1. Implementar escalas de control que permitan evaluar el grado en el que la persona ha tratado de
distorsionar sus respuestas o la propia imagen.
2. Informar a los evaluados de que se examinarán sus respuestas en relación con las escalas
para el control de la deseabilidad social y que
la distorsión podrá tener consecuencias negativas para los distorsionadores. Esta medida suele
aparecer reflejada en las instrucciones del cuestionario y así debe comunicarse a los examinandos en cualquier contexto de evaluación.
3. Comparar las puntuaciones con muestras competitivas de solicitantes o de personas que hayan contestado a los autoinformes en contextos
en los que se asume una elevada carga de deseabilidad social. Las muestras normativas con
las que se elaboran los baremos internos hacen que el efecto de la falta de sinceridad esté
incluido en dichos baremos. En este sentido,
como indica Salgado (2005): «la estrategia de
crear baremos a partir de muestras de solicitantes de empleo neutraliza los efectos de la deseabilidad social. Por tanto, debería ser utilizada
en todos los procesos de selección. Y los profesionales deberían utilizar en tales casos instrumentos que hayan elaborado tales baremos».
Por otra parte, las escalas para el control de la sinceridad suelen interpretarse como excluyentes, es decir, a partir de cierta puntuación se considera que las
respuestas del opositor no deberían ser tenidas en
cuenta puesto que ha tratado de dar una imagen positiva de sí mismo. No obstante, esta práctica considero
que debe ser matizada y analizada desde el sentido
lógico y la literatura existente.
El hecho de que un opositor quiera, y sobre todo
sepa, dar una imagen favorable de sí mismo es algo
positivo e incluso deseable. Mediante esta presentación de la propia imagen se están revelando varias características personales muy favorables para el
mundo laboral actual, como pueden ser la capacidad
de adaptación al contexto, la inteligencia social o el
conocimiento sobre lo que es bien aceptado por las
empresas. Sin embargo, es cierto que una exageración de las características positivas dentro de un contexto de por sí cargado de deseabilidad social sí debe
llevar a la cautela antes de tomar decisiones sobre la
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
33
AZTERLANAK
ESTUDIOS
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
adecuación de la persona a un puesto determinado.
Por esta razón, mi recomendación es que se tenga
en cuenta el nivel de las variables de control como si
de cualquier otra variable psicológica se tratara, eliminando del proceso, eso sí, únicamente a las puntuaciones extremadamente insinceras (p. ej., a los percentiles 1 y 2 en sinceridad).
Por otro lado, se ha comprobado cómo en ocasiones
las respuestas extremadamente sinceras dentro de un
contexto competitivo están relacionadas con características de personalidad poco favorables. Así, las personas con poca deseabilidad social suelen tener puntuaciones elevadas en variables como la ansiedad,
el psicoticismo, la rigidez o la dependencia (Arribas,
2008). Por tanto, mi recomendación es tener igualmente en consideración el polo positivo de la sinceridad e interpretar con cautela, o incluso eliminar del
proceso, las puntuaciones extremadamente superiores a las del grupo normativo en una posible escala de
sinceridad (o extremadamente inferiores en una escala
de deseabilidad social o manipulación de la imagen).
Bibliografía
Colom, R.; Andrés-Pueyo, A. «El estudio de la inteligencia humana:
recapitulación ante el cambio de milenio», Psicothema, 1999,
11, p. 453-476.
Deary, I. J., «Intelligence», Annual Review of Psychology, 2012, 63,
p. 453-482.
Deary, I. J.; Strand, S.; Smith, P.; Fernandes, C., «Intelligence and educational achievement», Intelligence, 2007, 35, p. 13-21.
Ghiselli, E. E., «The validity of aptitude tests in personnel selection», Personnel Psychology, 1973, 26, p. 461-477.
Gottfredson, L. S., «Why g matters: The complexity of everyday
life», Intelligence, 1997, 24, p. 79-132.
Gottfredson, L. S., «g: highly general and highly practical», en
Sternberg, R.; Grigorenko, E. (Eds), The general intelligence factor: how general is it?, Nueva York, LEA, 2000.
Hartigan, J.; Wigdor, A. K., Fairness in employment testing. Validity generalization, minority issues, and the General Aptitude Test
Battery, Washington, National Academy Press, 1989.
Hirsch, H. R.; Northrop, L.; Schmidt, F., «Validity generalization results for law enforcement occupations», Personnel Psychology,
1986, 39, p. 399-420.
Hogan, J.; Holland, B. «Using theory to evaluate personality and
job performance relations: A socioanalytic perspective», Journal of Applied Psychology, 2003, 88, p. 100-112.
Hough, L. M., «Effects of intentional distortion in personality measurement and evaluation of suggested palliatives», Human Performance, 1998, 11, p. 209-244.
Hunter, J. E., «Cognitive ability, cognitive aptitudes, job knowledge, and job performance», Journal of vocational behavior,
1986, 29, p. 340-362.
American Educational Research Association; American Psychological Association; National Council on Measurement in Education, Standards for Educational and Psychological Testing, Washington, American Educational Research Association, 2014.
Arribas, D., A new scale to assess Social Desirability in NEO PI-R, III European Congress of Methodology (Oviedo [SP], Julio 2008).
Hurtz, G. M.; Donovan, J. J., «Personality and job performance:
The big five revisited», Journal of Applied Psychology, 2000, 85,
p. 869-879.
Arribas, D.; Santamaría, P.; Sánchez-Sánchez, F.; Fernández-Pinto, I.,
BAT-7, Batería de Aptitudes de TEA, Madrid, TEA Ediciones, 2013.
International Test Commission, «International Guidelines for Test
Use», International Journal of Testing, 2001, 1 (2), p. 93-114.
Barrick, M. R.; Mount, M. K. «The Big Five personality dimensions
and job performance: A meta-analysis», Personnel Psychology,
1991, 44, p. 1-26.
Levine, E. L.; Spector, P. E.; Menon, S.; Narayanan, L.; Cannon-Bowers, J., «Validity generalization for cognitive, psychomotor,
and perceptual tests for craft jobs in the utility industry», Human Performance, 1996, 9, p. 1-22.
Barrick, M. R.; Mount, M. K.; Judge, T., «Personality and performance at the beginning of the new millennium: What do we
know and where do we go next?», International Journal of Selection and Assessment, 2001, 9, p. 9-30.
Binet, A.; Simon, T., «Méthodes nouvelles pour le diagnostic du niveau intellectuel desanormaux», L’Anée Psychologique, 1905,
11, p. 191-211.
Burks, S. V.; Carpenter, J. P.; Goette, L.; Rustichini, A., «Cognitive
skills affect economic preferences, strategic behavior, and job
attachment», Proceedings of the National Academy of Sciences,
2009, 106 (19), p. 7745-7750.
Colom, R., En los límites de la inteligencia. ¿Es el ingrediente del éxito
en la vida?, Madrid, Pirámide, 2002.
34
Hunter, J. E.; Hunter, R. F., «Validity and utility of alternative predictors of job performance», Psychological Bulletin, 1984, 96,
p. 72-98.
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
Lubinski, D., «Scientific and social significance of assessing individual differences: «Sinking shafts at a few critical points».»,
Annual Review of Psychology, 2000, 51, p. 405-444.
McHenry, J. J.; Hough, L. M.; Toquam, J. L.; Hanson, M. A.; Ashworth, S., «Project A validity results: the relationship between
predictor and criterion domains», Personnel Psychology, 1990,
43, p. 335-354.
Mount, M. K.; Barrick, M. R., «The Big Five personality dimensions:
implications for research and practice in human resources
management», en Rowland, M. K.; Ferris, G. (eds.), Research in
personnel and human resources management, vol. 13, Greenwich, JAI Press, 1995, p. 153-200.
David Arribas Águila
Algunos apuntes sobre los tests psicológicos y su uso para la selección de personal en la Administración Pública
Neisser, U.; Boodoo, G.; Bouchard, T. J.; Boykin, A. W.; Brody, N.;
Ceci, S. J.; Halpern, D. F.; Loehlin, J. C.; Perloff, R.; Sternberg,
R. J.; Urbina, S., «Intelligence: Knowns and unknowns», American Psychologist, 1996, 51, p. 77-101.
Schmidt, F. L.; Hunter, J. E., «The validity and utility of selection
methods in personnel psychology: Practical and theoretical
implications of 85 years of research findings», Psychological
Bulletin, 1998, 124, p. 262-274.
Pearlman, K.; Schmidt, F. L.; Hunter, J. E., «Validity generalization
results for tests used to predict job proficiency and training
success in clerical occupations», Journal of Applied Psychology,
65, 1980, p. 373-406.
Schmidt, F. L.; Gast-Rosenberg, I.; Hunter, J. E., «Validity generalization for computer programmers», Journal of Applied Psychology, 1980, 65, p. 643-661.
Pereña, J., «Yo no creo en los tests. Cómo usar bien una “herramienta” imprescindible», Training and Development Digest,
2002, p. 23-26.
Ree, M. J.; Carretta, T. R., «g2K», Human Performance, 2002, 15, 3-23.
Strenze, T., «Intelligence and socioeconomic success: A metaanalytic review of longitudinal research», Intelligence, 2007, 35,
p. 401-426.
Terman, L. M., The measurement of intelligence: An explanation of
and a complete guide for the use of the Stanford revision and extension of the Binet-Simon Intelligence Scale, Boston, Houghton
Mifflin, 1916.
Rothman, S.; Meining, D.; Barrick, M. R., Predicting performance using personality measures in South Africa, Annual Conference of
the Society for Industrial and Organizational Psychology (Toronto [CN], Abril 2002).
Urbina, S., Claves para la evaluación con tests psicológicos, Madrid,
TEA Ediciones, 2007.
Salgado, J. F., «The five factor model of personality and job performance in the European Community», Journal of Applied
Psychology, 1997, 82, p. 30-43.
Vinchur, A. J.; Schippmann, J. S.; Switzer F. A.; Roth, P. L., «A metaanalytic review of predictors of job performance for sales
people», Journal of Applied Psychology, 1998, 83, p. 586-597.
Salgado, J. F. «The Big Five personality dimensions and job performance in army and civil occupations: A European perspective», Human Performance, 1998, 11, p. 271-288.
Wilhelm, O.; Engle, R. W., Handbook of understanding and measuring intelligence, California, Sage Publications, 2005.
Salgado, J. F., «The Big Five personality dimensions and counterproductive behaviors», International Journal of Selection and
Assessment, 2002, 10, p. 117-125.
Yoo, T.Y.; Ming, B.M., A meta-analysis of the Big Five and performance in Korea, Annual Conference of the Society for Industrial and Organizational Psychology (Toronto [CN], Abril
2002).
Salgado, J. F., «Predicting job performance using FFM and nonFFM personality measures», Journal of Occupational and Organizational Psychology, 2003, 76, p. 323-346.
Salgado, J. F. «Personalidad y deseabilidad social en contextos organizacionales: implicaciones para la práctica de la Psicología
del trabajo y las organizaciones», Papeles del psicólogo, 2005,
92, p. 115-128.
Nota
Salgado, J. F.; Moscoso, S., «Selección de personal en la empresa y
las AAPP: De la visión tradicional a la visión estratégica», Papeles del Psicólogo, 2008, 29, p. 16-24.
Salgado, J. F.; Anderson, N.; Moscoso, S.; Bertua, C.; De Fruyt, F.;
Rolland, J. P., «GMA measures and the prediction of Job Performance and training success for different occupations in
the European Community», Journal of Applied Psychology,
2003, 88, p. 1068-1081.
Schmidt, F. L., «The role of general cognitive ability and job performance: Why there cannot be a debate», Human Performance, 2002, 15, p. 187-210.
1.
Existen diferentes tipos de tests que utilizan muestras de
trabajo. La filosofía subyacente consiste en construir simulaciones a la medida de parte o de la totalidad de la
tarea a realizar por el candidato a un puesto de trabajo
determinado. Por ejemplo, como parte de un test de
muestra de trabajo, el candidato podría tener que reparar un motor eléctrico defectuoso en un tiempo determinado.
Pertsonak eta Antolakunde Publikoak kudeatzeko Euskal Aldizkaria
Revista Vasca de Gestión de Personas y Organizaciones Públicas
Núm. 7 zk./2014. Págs. 24-35 or.
ISSN: 2173-6405
35
Descargar