Responde a las siguientes cuestiones relacionadas con el apartado

Anuncio
ACTIVIDAD 7. CUESTIONES DE CODIFICACIÓN Y ANOTACIÓN
Responde a las siguientes cuestiones relacionadas con el apartado 6 del curso de
Lingüística de corpus:
1) ¿Por qué un corpus codificado y anotado resulta útil? Pon un ejemplo. (2 puntos)
2) A continuación tienes un fragmento del primer capítulo de la primera parte de la
novela Blanco nocturno de Ricardo Piglia (Anagrama, Barcelona, 2010). ¿Qué aspectos
extratextuales podrías codificar? ¿Y qué aspectos textuales? (4 puntos)
[Tomado de URL: http://www.elpais.com/especial/libros/pdf/blanco_nocturno.pdf]
3) ¿Por qué se han propuesto estándares de etiquetación? (1 punto)
4) Utilizando el sistema de las referencias COCOA, codifica el fragmento de texto
anterior. No olvides incluir la clave de las etiquetas que emplees. (10 puntos)
5) Codifica el mismo texto usando la propuesta de la TEI. Para la cabecera, codifica solo
la información obligatoria. (10 puntos)
6) ¿En qué se diferencia la anotación de la codificación? (1 punto)
7) ¿Por qué no se puede emplear la anotación automática en todos los casos? (1 punto)
8) ¿Qué ventajas se han señalado para los corpus anotados frente a los no anotados? (1
punto)
9) La anotación categorial es la más frecuente en los corpus. Haz una propuesta de
anotación de este tipo para el texto siguiente. No olvides incluir la clave de las etiquetas
que utilices. (30 puntos)
Una amante inoportuna
“Algunas veces suelo recostar mi cabeza en el hombro de la luna y le hablo de esa amante
inoportuna que se llama soledad” (Joaquín Sabina)
10) Luego introduce el texto en los analizadores para el español que figuran a
continuación. Contrasta los resultados de tu análisis con los de los programas (2 puntos)
 http://gemini.uab.es:9080/SFNsite/sfn-tools/sfn-parser
 http://nlp.lsi.upc.edu/freeling/demo/demo.php
11) La anotación gramatical no está exenta de problemas. Comenta los que detectes en
el siguiente fragmento de “Que se llama soledad” (Hotel dulce hotel, 1987) de Joaquín
Sabina. (10 puntos)
[…]
Algunas veces vivo
Algunas veces gano
y otras veces
y otras veces
la vida se me va con lo que escribo;
pongo un circo y me crecen los enanos;
algunas veces busco un adjetivo
algunas veces doy con un gusano
inspirado y posesivo
en la fruta del manzano
que te arañe el corazón;
prohibido del padre Adán;
luego arrojo mi mensaje,
o duermo y dejo la puerta
se lo lleva de equipaje
de mi habitación abierta
una botella…, al mar de tu incomprensión.
por si acaso se te ocurre regresar;
No quiero hacerte chantaje,
más raro fue aquel verano
sólo quiero regalarte una canción.
que no paró de nevar.
12) La lematización es otro proceso que permite aumentar la utilidad de un corpus. Lee
de nuevo el texto anterior y señala únicamente las palabras que suelen estar recogidas
como entradas en un diccionario, es decir, aquellas que son formas básicas. ¿Qué clase
de palabras son las que se beneficiarían más de la lematización? Después contrasta los
resultados con el DRAE y el lematizador de Thera. (35 puntos)
 DRAE: http://www.rae.es/rae.html
 Thera: http://www.thera-clic.com/site/Demos/Morfologico-ES.html
Palabra
Lema
DRAE
Thera
*Las palabras que aparecen más de una vez no es necesario que las analices dos veces.
13) El análisis sintáctico y semántico de los textos también añade valor a un corpus.
Consulta
la
Base
de
Datos
Sintácticos
del
Español
Actual
(http://www.bds.usc.es/consultas/index.html) para contestar las cuestiones que
figuran debajo a propósito de estos dos titulares: (13 puntos)
El 2010 acaba con 4.100.073 parados,
un 4,5% más
Público.es, 04/01/2011
El mejor diciembre de paro en 10 años
cierra un 2010 para olvidar
El Pais.com, 04/01/2011
13a) ¿En qué esquema sintáctico son más frecuentes los verbos acabar y cerrar? Piensa en
ejemplos de uso y luego consulta el corpus para contrastar tu intuición. (Opción: verbos
 esquemas)
13b) Busca en el corpus un ejemplo de cada verbo en el esquema más frecuente.
(Opción: ejemplos  de un verbo  con un esquema)
13c) ¿En qué esquema aparecen usados estos verbos en los textos? ¿Es el esquema más
frecuente de estos verbos?
13d) ¿Con es la única preposición con la que aparece acabar en este esquema concreto?
¿Se emplea con esta preposición en otro esquema? ¿En cuál? (Opción: verbos 
subesquemas)
13e) ¿Qué verbos crees que se utilizan frecuentemente con este subesquema? (Opción:
preposiciones  verbos y subesquemas con una preposición)
13f) Por lo que se refiere al verbo cerrar, ¿en el ejemplo se usa en el subesquema más
frecuente? ¿Cuál es este subesquema?
14) Por último, observa el siguiente texto y subraya los sintagmas que contienen
referencias anafóricas que se refieren al mismo referente. Identifícalas con un mismo
número, de tal forma que quede claro cuáles son correferentes. (12 puntos)
Soy Inés Suárez, vecina de la leal ciudad de Santiago de la Nueva Extremadura, en el Reino
de Chile, en el año 1580 de Nuestro Señor. De la fecha exacta de mi nacimiento no estoy
segura, pero, según mi madre, nací después de la hambruna y la tremenda pestilencia que
asoló a España cuando murió Felipe el Hermoso. No creo que la muerte del rey provocara la
peste, como decía la gente al ver pasar el cortejo fúnebre, que dejó flotando en el aire,
durante días, un olor a almendras amargas, pero nunca se sabe. La reina Juana, aún joven y
bella, recorrió Castilla durante más de dos años llevando de un lado a otro el catafalco, que
abría de vez en cuando para besar los labios de su marido, con la esperanza de que
resucitara. A pesar de los ungüentos del embalsamador, el Hermoso hedía. Cuando yo vine
al mundo, ya la infortunada reina, loca de atar, estaba recluida en el palacio de Tordesillas
con el cadáver de su consorte; eso significa que tengo por lo menos setenta inviernos entre
pecho y espalda y que antes de la Navidad he de morir.
Isabel Allende, Inés del alma mía, 2006
Expresión referencial
Expresión correferente
Descargar