Construcción de una lista de colocaciones para medir la competencia colocacional Ana Orol González AESLA 2014, Sevilla Universidad da Coruña Organización de la exposición 1) ¿Qué es una colocación? 2) ¿Por qué necesitamos una lista de colocaciones? 3) Listas de palabras y listas de colocaciones 4) Características de la lista de colocaciones 5) Metodología de la lista de colocaciones 6) Test piloto de colocaciones 7) Conclusiones y líneas futuras 1. ¿Qué es una colocación? Definición Combinación restringida de palabras Componentes Base Colocativo Ejemplos dar un paseo, *dar un viaje hacer un viaje, *hacer un paseo La frecuencia no es un criterio definitorio base paseo colocativo dar colocación 2. ¿Por qué necesitamos una lista de colocaciones del español? Vacío en el campo de la evaluación de lenguas No hay test de colocaciones ¿Qué colocaciones testar? No hay lista de colocaciones OBJETIVO del trabajo: Construir una lista de colocaciones del español FUNCIÓN de la lista: herramienta de selección de ítems para el diseño de test 3. Lista de palabras y lista de colocaciones LISTA DE PALABRAS FRECUENTES Colección de las palabras más frecuentes que aparecen en textos Corpus LISTA DE COLOCACIONES (FRECUENTES) Identificación problemática de colocaciones en el corpus Ranking frecuencias Metodología alternativa basada en diccionarios Carencias: no incluyen expresiones combinatorias (colocaciones, locuciones, etc.) Asignación de frecuencias a posteriori 4. Características de la lista de colocaciones del español (LCE) Necesitamos una lista de entre 150 y 200 colaciones Colocaciones con sustantivo como base 4 colocaciones por base, uno por cada esquema sintáctico Verbo + nombre: dar la posibilidad Nombre + verbo: cabe la posibilidad Nombre + adjetivo: posibilidad lejana Nombre de nombre: abanico de posibilidades 5. Metodología PRIMERA FASE SEGUNDA FASE RESULTADO Selección de las bases Selección de los colocativos Lista de colocaciones 5.1. Metodología: primera fase SELECCIÓN DE LAS BASES A frequency dictionary of Spanish. Core vocabulary for learners (Davies, 2006) 5000 palabras más frecuentes 1ª BANDA (1-1000) 2ª BANDA (1001-2000) 3ª BANDA (2001-3000) 50 sustantivos, 10 por cada banda de frecuencia 4ª BANDA (3001-4000) Lista aleatoria de sustantivos 5ª BANDA (4001-5000) 5.2. Metodología: segunda fase SELECCIÓN DE LOS COLOCATIVOS Diccionario combinatorio práctico del español actual (Bosque, 2006) Elegir uno por categoría sintáctica V+n N+v N+ a N de n Además, debe cumplir unos CRITERIOS 5.2.1. Metodología: ejemplo de selección de las colocaciones departamento rueda 2º banda cola ¿Está en el Práctico? coche juventud cadena dedo zapato señal vacío ¡DESCARTADA! NO 5.2.2. Metodología: ejemplo de selección de las colocaciones ¿Está en el Práctico? ¿Hay tres colocativos como mínimo? ¡DESCARTADA! SÍ NO 5.2.3. Metodología: ejemplos de selección de los colocativos ¿Está en el Práctico? SÍ ¿Hay tres colocativos como mínimo? SÍ ¡INCLUIDA! n + v: avanzar v + n: ponerse a / en n + a: interminable n de n: - 5.2.4. Metodología: ejemplo de selección de las colocaciones Fragmento de la entrada de leche (Práctico): frita, merengada, pasteurizada, semidesnatada, solar, limpiadora, descremada, entera Transparente ¡DESCARTADA! No son colocación ¡DESCARTADAS! No está entre las 5000 más frecuentes de Davies ¡DESCARTADAS! Pertenece a otro sentido ¡DESCARTADAS! ¡INCLUIDA! 5.3. Metodología: resumen criterios Si la base no está en el Práctico, la descartamos Si no hay un mínimo de tres colocativos por base (uno por cada esquema), la descartamos Si el colocativo no forma colocación según nuestro marco teórico, la descartamos Si el colocativo no aparece entre las 5000 palabras más frecuentes, la descartamos Si el colocativo pertenece a otro sentido, la descartamos Si hay varios colocativos posibles, seleccionamos el más “colocacional” 5.4. Metodología: muestra resultado BANDAS Primera banda 1-1000 Segunda banda 1001-2000 Tercera banda 2001- 3000 BASES posibilidad leche colonia COLOCATIVOS EJEMPLO FRECUENCIA caber Cabe la posibilidad de que venga. ? dar Nos dio la posibilidad de irnos. ? lejana Irse del país no es una posibilidad lejana. ? abanico Es difícil decidirse, hay un gran abanico de posibilidades. ? cortar No bebas, la leche se ha cortado. ? beber Bebo leche todas las mañanas. entera La leche entera tiene más grasa. litro Un litro de leche cuesta un euro. oler Esta colonia huele bien. llevar Lleva una colonia fantástica. fresca Me gusta el olor, es una colonia fresca. frasco El frasco de la colonia está vacío, necesito otro. ? ? ? ? ? ? ? 5. Asignación de la frecuencia ¿Cuál es la frecuencia de una colocación? Frecuencia de las palabras individuales la frecuencia de la combinación o disculpa (quinta banda) y pedir disculpas (entre las diez más frecuentes) ¿Cómo hallar la frecuencia de una colocación? (Vincze y Alonso Ramos 2013) Nº de ocurrencias de la base en un corpus de referencia Nº de ocurrencias de la combinación en un corpus de referencia Suma ponderada de ambos resultados 6. Diseño del test piloto Colocaciones nombre + adjetivo FORMATO PRODUCCIÓN Completa la frase con la palabra que falta, la primera letra ya está escrita. 1) Se puso zapato (sin tacón) p... FORMATO COMPRENSIÓN Elige la opción correcta 1) Zapato plano a) Con tacón b) Sin tacón c) Pequeño d) Liso, sin adornos 6.1. Administración y resultados del test 10 colocaciones nombre + adjetivo: barba cerrada, lógica aplastante, zapato plano, leche entera, negocio redondo, posibilidad lejana, colonia fresca, queso fresco, tacto áspero e infección grave 10 personas: 4 nativos, 6 no nativos Resultados Desajuste entre frecuencias y aciertos: la colocación más frecuente es la más problemática Negocio redondo Los aciertos se corresponden con las colocaciones que designan referencialmente un objeto Zapato plano 7. Conclusiones y líneas futuras CONCLUSIONES Lista variada Variedad de esquemas Amplitud de frecuencia de las colocaciones LÍNEAS FUTURAS Utilizar la frecuencia como criterio para incluir o excluir colocaciones de la lista Creación de un banco de colocaciones con otra metodología y finalidad pedagógicos [email protected] [email protected] Muchas gracias por su atención