Construcción de una lista de
colocaciones para medir la
competencia colocacional
Ana Orol González
AESLA 2014, Sevilla
Universidad da Coruña
Organización de la exposición
1) ¿Qué es una colocación?
2) ¿Por qué necesitamos una lista de colocaciones?
3) Listas de palabras y listas de colocaciones
4) Características de la lista de colocaciones
5) Metodología de la lista de colocaciones
6) Test piloto de colocaciones
7) Conclusiones y líneas futuras
1. ¿Qué es una colocación?
Definición
Combinación restringida de palabras
Componentes
Base
Colocativo
Ejemplos
dar un paseo, *dar un viaje
hacer un viaje, *hacer un paseo
La frecuencia no es un criterio definitorio
base
paseo
colocativo
dar
colocación
2. ¿Por qué necesitamos una lista de
colocaciones del español?
Vacío en el campo de la evaluación de lenguas
No hay test de colocaciones
¿Qué colocaciones testar?
No hay lista de colocaciones
OBJETIVO del trabajo: Construir una lista de colocaciones del español
FUNCIÓN de la lista: herramienta de selección de ítems para el diseño de test
3. Lista de palabras y lista de
colocaciones
LISTA DE PALABRAS FRECUENTES
Colección de las palabras más
frecuentes que aparecen en textos
Corpus
LISTA DE COLOCACIONES (FRECUENTES)
Identificación problemática de
colocaciones en el corpus
Ranking frecuencias
Metodología alternativa basada en
diccionarios
Carencias: no incluyen expresiones
combinatorias (colocaciones,
locuciones, etc.)
Asignación de frecuencias a
posteriori
4. Características de la lista de
colocaciones del español (LCE)
Necesitamos una lista de entre 150 y 200 colaciones
Colocaciones con sustantivo como base
4 colocaciones por base, uno por cada esquema sintáctico
Verbo + nombre: dar la posibilidad
Nombre + verbo: cabe la posibilidad
Nombre + adjetivo: posibilidad lejana
Nombre de nombre: abanico de posibilidades
5. Metodología
PRIMERA FASE
SEGUNDA FASE
RESULTADO
Selección de
las bases
Selección de
los
colocativos
Lista de
colocaciones
5.1. Metodología: primera fase
SELECCIÓN DE LAS BASES
A frequency dictionary of Spanish.
Core vocabulary for learners
(Davies, 2006)
5000 palabras más frecuentes
1ª BANDA (1-1000)
2ª BANDA (1001-2000)
3ª BANDA (2001-3000)
50 sustantivos, 10 por cada banda
de frecuencia
4ª BANDA (3001-4000)
Lista aleatoria de sustantivos
5ª BANDA (4001-5000)
5.2. Metodología: segunda fase
SELECCIÓN DE LOS COLOCATIVOS
Diccionario combinatorio práctico del español actual (Bosque, 2006)
Elegir uno por categoría sintáctica
V+n
N+v
N+ a
N de n
Además, debe cumplir unos CRITERIOS
5.2.1. Metodología: ejemplo de selección
de las colocaciones
departamento
rueda
2º banda
cola
¿Está en el
Práctico?
coche
juventud
cadena
dedo
zapato
señal
vacío
¡DESCARTADA!
NO
5.2.2. Metodología: ejemplo de selección
de las colocaciones
¿Está en el
Práctico?
¿Hay tres
colocativos
como mínimo?
¡DESCARTADA!
SÍ
NO
5.2.3. Metodología: ejemplos de
selección de los colocativos
¿Está en el
Práctico?
SÍ
¿Hay tres
colocativos
como mínimo?
SÍ
¡INCLUIDA!
n + v: avanzar
v + n: ponerse a / en
n + a: interminable
n de n: -
5.2.4. Metodología: ejemplo de selección
de las colocaciones
Fragmento de la entrada de leche (Práctico):
frita, merengada, pasteurizada, semidesnatada, solar, limpiadora, descremada, entera
Transparente
¡DESCARTADA!
No son colocación
¡DESCARTADAS!
No está entre las
5000 más frecuentes
de Davies
¡DESCARTADAS!
Pertenece a
otro sentido
¡DESCARTADAS!
¡INCLUIDA!
5.3. Metodología: resumen criterios
Si la base no está
en el Práctico, la
descartamos
Si no hay un mínimo
de tres colocativos
por base (uno por
cada esquema), la
descartamos
Si el colocativo no
forma colocación
según nuestro
marco teórico, la
descartamos
Si el colocativo no
aparece entre las
5000 palabras más
frecuentes, la
descartamos
Si el colocativo
pertenece a otro
sentido, la
descartamos
Si hay varios
colocativos
posibles,
seleccionamos el
más “colocacional”
5.4. Metodología: muestra resultado
BANDAS
Primera
banda
1-1000
Segunda
banda
1001-2000
Tercera
banda
2001- 3000
BASES
posibilidad
leche
colonia
COLOCATIVOS
EJEMPLO
FRECUENCIA
caber
Cabe la posibilidad de que venga.
?
dar
Nos dio la posibilidad de irnos.
?
lejana
Irse del país no es una posibilidad lejana.
?
abanico
Es difícil decidirse, hay un gran abanico de posibilidades.
?
cortar
No bebas, la leche se ha cortado.
?
beber
Bebo leche todas las mañanas.
entera
La leche entera tiene más grasa.
litro
Un litro de leche cuesta un euro.
oler
Esta colonia huele bien.
llevar
Lleva una colonia fantástica.
fresca
Me gusta el olor, es una colonia fresca.
frasco
El frasco de la colonia está vacío, necesito otro.
?
?
?
?
?
?
?
5. Asignación de la frecuencia
¿Cuál es la frecuencia de una colocación?
Frecuencia de las palabras individuales
la frecuencia de la combinación
o disculpa (quinta banda) y pedir disculpas (entre las diez más frecuentes)
¿Cómo hallar la frecuencia de una colocación? (Vincze y Alonso Ramos 2013)
Nº de ocurrencias de la base en un corpus de referencia
Nº de ocurrencias de la combinación en un corpus de referencia
Suma ponderada de ambos resultados
6. Diseño del test piloto
Colocaciones nombre + adjetivo
FORMATO PRODUCCIÓN
Completa la frase con la palabra
que falta, la primera letra ya
está escrita.
1) Se puso zapato (sin tacón) p...
FORMATO COMPRENSIÓN
Elige la opción correcta
1) Zapato plano
a) Con tacón
b) Sin tacón
c) Pequeño
d) Liso, sin adornos
6.1. Administración y resultados del test
10 colocaciones nombre + adjetivo: barba cerrada, lógica aplastante, zapato plano,
leche entera, negocio redondo, posibilidad lejana, colonia fresca, queso fresco, tacto
áspero e infección grave
10 personas: 4 nativos, 6 no nativos
Resultados
Desajuste entre frecuencias y aciertos: la colocación más frecuente es la más problemática
Negocio redondo
Los aciertos se corresponden con las colocaciones que designan referencialmente un objeto
Zapato plano
7. Conclusiones y líneas futuras
CONCLUSIONES
Lista variada
Variedad de esquemas
Amplitud de frecuencia de las colocaciones
LÍNEAS FUTURAS
Utilizar la frecuencia como criterio para incluir o excluir colocaciones de la lista
Creación de un banco de colocaciones con otra metodología y finalidad pedagógicos
[email protected]
[email protected]
Muchas gracias por
su atención