reconocimiento automático de rimas para el cancionero folklórico de

RECONOCIMIENTO A U T O M Á T I C O DE RIMAS PARA EL CANCIONERO FOLKLÓRICO DE MÉXICO Entre los trabajos de c o m p u t a c i ó n preparados para obtener los í n d i c e s del Cancionero folklórico de México hemos elaborado u n programa rastreador para el reconocimiento a u t o m á t i c o de rimas, cuyo resultado será el í n d i c e de las mismas. Su importancia se halla en los interesantes problemas que plantea la c o n s t r u c c i ó n de u n programa no solamente de o r d e n a c i ó n , sino t a m b i é n de análisis. Queremos presentar a q u í la forma en que lo realizamos y los resultados que hemos obtenido. 1 L a finalidad de nuestro í n d i c e de rimas es la de reconocer tanto las rimas iguales que aparecen en distintas coplas como el juego de rimas que se da en el i n t e r i o r de una misma copla. E l í n d i c e de r i mas consta de todas las palabras rimantes, presentadas en todos los ó r d e n e s posibles (hay versiones que i n v i e r t e n los versos) de cada una de las coplas; por ejemplo, de la copla n ú m . 847: M i corazón, pobrecito, preso en tus brazos está: castígale su delito y dale la libertad, que él te pagará sólito y en buena conformidad. necesitamos obtener las siguientes listas: pobrecito, delito, delito, pobrecito, sólito / sólito, pobrecito, d e l i t o / está, conformidad / l i b e r t a d , está, conformidad / conformidad, bertad. L a u t i l i d a d inmediata de este juego de combinaciones sólito / libertad, está, l i es la de i E l Cancionero folklórico de México es el resultado de u n a i n v e s t i g a c i ó n colectiva realizada bajo la d i r e c c i ó n de Margit F r e n k Alatorre en el C e n t r o de Estudios L i n g ü í s t i c o s y L i t e r a r i o s de E l Colegio de M é x i c o . A la fecha se h a n publicado dos tomos: Coplas del amor feliz, 1975 y Coplas del amor desdidiado, 1977. 500 M . A. SOLER Y S. F O N C E D E L E C N NRFH, XXVI localizar coplas similares y relacionarlas dentro del Cancionero, pues debido al v o l u m e n d e l m a t e r i a l con que se trabaja (12 000 coplas, muchas de ellas con m á s de una v e r s i ó n ) , es m u y difícil poder encontrarlas ú n i c a m e n t e con la ayuda de l a memoria; t a m b i é n será u n a u x i l i a r m u y ú t i l para los lectores interesados en localizar una copla determinada de la obra, cuyos índices, incluyendo el de rimas, se p u b l i c a r á n en el q u i n t o tomo. Llamamos "verso" a cada una de las l í n e a s que componen una estrofa o copla. Para la d e f i n i c i ó n de " r i m a " nos hemos basado en u n trabajo de A . M . Cirese q u i e n la define (siguiendo l a tradición) como la i d e n t i d a d o s i m i l i t u d entre las terminaciones de la ú l t i m a palabra de los versos que componen una estrofa o copla. L a " t e r m i n a c i ó n " abarca desde la vocal t ó n i c a hasta el final de la palabra. Existe i d e n t i d a d cuando tanto las vocales como las consonantes de las terminaciones son iguales ( r i m a consonante) ; existe s i m i l i t u d cuando ú n i c a m e n t e las vocales son iguales (rima asonante). E n esta etapa del programa n o hemos tenido en cuenta otros casos de r i m a asonante como cuando hay dos vocales en la t e r m i n a c i ó n y la vocal t ó n i c a es igual, pero la á t o n a puede ser e o i u o o u. T a m p o c o hemos considerado casos de a l i t e r a c i ó n . Si q u i s i é r a m o s comprobarlos en el Cancionero b a s t a r í a a m p l i a r e l programa. E l factor decisivo en la r i m a es la vocal t ó n i c a ; es el punto a part i r del cual medimos la t e r m i n a c i ó n y es el ú n i c o elemento necesar i o : puede o no haber otra vocal o consonante, pero la vocal t ó n i c a siempre está presente. E l m a t e r i a l del Cancionero ha sido codificado y perforado en tarjetas. Las convenciones para la t r a n s c r i p c i ó n han sido las siguientes: cada tarjeta debe contener u n verso de una copla copiado textualmente, a c o m p a ñ a d o por una clave que nos permite su localizac i ó n dentro del corpus del Cancionero; esta clave consta de diez caracteres en total. E l p r i m e r o i n d i c a el n ú m e r o de tomo en que se encuentra la copla y es u n d í g i t o con valor 1, 2, 3 o 4. A continuac i ó n tenemos cinco caracteres que f o r m a n una cifra de cinco dígitos con valores posibles del 00001 al 99999 donde se marca el n ú m e r o de la copla: el s é p t i m o c a r á c t e r se u t i l i z a para los casos de intercal a c i ó n de coplas en la n u m e r a c i ó n o r i g i n a l del Cancionero y puede ser u n d í g i t o del 0 al 9, donde se p r e v é u n caso extremo de nueve coplas intercaladas; el octavo c a r á c t e r es a l f a b é t i c o y marca los casos 2 3 2 "Inventaires et r é p e r t o i r e s lexicaux, formulaires et m é t r i q u e s des chants populaires italiens" en Linguistica matematica e calcolatori, ed. A . Zampolli, Firenze, 1973, p. 227. 3 P a r a evitar correr toda la n u m e r a c i ó n se les dio el n ú m e r o de l a que las precede pero con las marcas bis o ter para diferenciarlas. C f . Cancionero, t. 1, p. x x x i i , § 4. NRFH, XXVI RECONOCIMIENTO AUTOMÁTICO D E RIMAS 501 de familias de c o p l a s l o s dos ú l t i m o s caracteres forman una cifra de dos dígitos del 00 al 99 que nos indica el lugar que ocupa el verso dentro de la copla. Así la clave 1004920Í01 se lee de la siguiente forma: es u n verso que se encuentra en el t o m o 1, que pertenece a la copla 00492, la cual está intercalada y pertenece a u n a famil i a de coplas ocupando el lugar / y es el p r i m e r verso de la copla. Los pasos que debe seguir el programa rastreador de rimas son los siguientes: 1) T o m a r como u n i d a d de análisis la copla; 2) Aislar la ú l t i m a palabra de cada verso, pero con las siguientes restricciones: a) N o tomar en cuenta los elementos a ñ a d i d o s al final de la línea cuando van entre p a r é n t e s i s . E n esta s i t u a c i ó n podemos encontrar la palabra sic, u n signo ?, o b i e n una palabra o grupo de palabras que llamamos a p é n d i c e s y que quedan fuera de l a c o n f i g u r a c i ó n m é t r i c a del verso, por ejemplo en la copla n ú m . 351: Si porque te quiero, quieres (Llorona) quieres que te quiera más, te quiero más que a m i vida (Llorona): ¿qué más quieres?, ¿quieres más? donde las ú l t i m a s palabras de los versos 1 y 3 son quieres, vida y no Llorona. b) Si el a p é n d i c e no va entre paréntesis, sino separado del cuerpo p r i n c i p a l del verso con u n g u i ó n largo , se toma la ú l t i m a palabra antes del g u i ó n y la ú l t i m a del a p é n d i c e ; por ejemplo en la copla n ú m . 630: 5 D i si me quieres, Lola para comprarte una barca con remos — y con sus velas para pasearte. t o m a r í a m o s las palabras Lola, comprarte, remos, velas y pasearte. Son m u y pocos estos casos en el cuerpo general del Cancionero, pero es necesario tomarlos en cuenta. 4 " E n cuanto a las coplas que tienen versiones de distinto n ú m e r o de versos hay motivos para verlas como 'una sola'. . . P o r razones de claridad, sin embargo, c o n v e n í a i m p r i m i r l a s p o r separado; lo que se h a hecho es ponerles u n mismo n ú m e r o seguido de las letras a, b, c, etc." (ibid., § 2 ) . B " E n algunas seguidillas mexicanas e l a p é n d i c e aparece sustituido por palabras que son indispensables para la c o m p r e n s i ó n del texto. L a s hemos puesto a c o n t i n u a c i ó n del verso y s e p a r á n d o l a s de é l por medio de u n g u i ó n " , ibid., p. x x x v i . 502 M . A. SOLER Y S. P O N C E D E L E Ó N c) NRFH, XXVI E n algunas ocasiones se u t i l i z a n corchetes cuando una fracc i ó n del verso (que se ha tomado de una g r a b a c i ó n magnetofónica) n o se escuchó bien, pero p o r a l g ú n m e d i o se pudo completar; si esto sucede en la ú l t i m a palabra d e l verso, ésta debe leerse, para nuestros fines, como si los corchetes n o estuvieran allí; p o r ejemplo en l a copla n ú m . 1386&: Ariles y m á s ariles que ariles del que decía: "De noche te vengo a ver, porque no puedo de día, v si pudiera [viniera] a todas horas del [día]". tanto viniera como día se consideran palabras finales. 3} Localizar l a vocal t ó n i c a en cada ú l t i m a palabra. Como ya dijimos, la vocal t ó n i c a se identifica por m e d i o d e l acento y por l o tanto para localizarla es necesario, en p r i m e r lugar, u n algoritmo de reconocimiento de vocales (formado con u n inventario de vocales y u n cuadro de reconocimiento y r e d u c c c i ó n de diptongos; cf. infra, p. 503) ; y, en segundo lugar, u n proceso de p r e - e d i c i ó n en donde se m a r q u e n los acentos prosódicos; o b i e n es necesario u n algoritmo de i d e n t i f i c a c i ó n , que contenga las reglas de a c e n t u a c i ó n d e l españ o l , por m e d i o d e l cual se localice y a c e n t ú e la vocal t ó n i c a cuando ésta n o lleva acento ortográfico. Puesto que las reglas de acentuac i ó n del e s p a ñ o l son bastante sencillas « hemos preferido la segunda posibilidad, que a d e m á s e l i m i n a e l trabajo de p r e - e d i c i ó n . Las reglas para el reconocimiento de la vocal t ó n i c a ( V T ) son: i) Si hay acento ortográfico, la V T es la que precede al acento: V/ . Si n o hay acento o r t o g r á f i c o : a) y la palabra sólo tiene una vocal, se considera que ésa es la V T ; b) y l a palabra tiene sólo dos vocales y éstas forman diptongo, se aplican las reglas de r e d u c c i ó n de diptongo (cf. infra, p. 503) ; la que resulta será la V T ; c) y la palabra t e r m i n a en n, s o vocal, la V T es la p e n ú l tima, siempre y cuando ésta no forme diptongo con la T ii) « N o s basamos en las reglas presentadas en u n estudio sobre o r t o g r a f í a y p r o n u n c i a c i ó n elaborado para el Diccionario del español de México por L o u r des G a v a l d ó n , L o u r d e s R o s y M a n u e l F e r n á n d e z . i E n l a c o d i f i c a c i ó n q u é utilizamos, el acento o r t o g r á f i c o se marca " / " a c o n t i n u a c i ó n de l a vocal acentuada, por ejemplo: C A N C I O / N . NRFH, XXVI d) 503 RECONOCIMIENTO AUTOMÁTICO D E RIMAS ú l t i m a , en cuyo caso se t o m a r á la anterior; por ejemplo, en gloria, la V T n o es la i sino l a o; y la palabra n o t e r m i n a en n, s, o vocal, la V T es la ú l tima. Las reglas para el reconocimiento y r e d u c c i ó n de los diptongos son: i) Si hay dos vocales unidas, pero una de ellas lleva acento ortográfico, se cuentan como dos vocales: V / V o W / . I g u a l tratamiento reciben si n o llevan acento pero n o son combinaciones con i o u, por ejemplo: ea dos vocales. Si hay dos vocales unidas, n i n g u n a de las dos lleva acento ortográfico, y una de ellas es i, u o una c o m b i n a c i ó n de ambas iu, ui, se cuentan como una sola vocal, de acuerdo con el siguiente cuadro: 8 ii) P a - -i e i 1 + a e — > u _ _ o i " u ü _ - a + " i u —> u "1 ui —> i üi —» i e o o _ a — » e o 9 4) Separar la t e r m i n a c i ó n a p a r t i r de l a V T incluyendo a ésta. 5) Comparar las terminaciones entre sí y r e u n i r l o que muestra una r e l a c i ó n de i d e n t i d a d ( r i m a consonante) o de s i m i l i t u d ( r i m a asonante). T a m b i é n existe una r i m a " i n t e r m e d i a " en la que las vocales son i d é n t i c a s y las consonantes m u y similares, pues corresponden a los casos en que puede darse n e u t r a l i z a c i ó n entre ellas p o r q u e casi todos sus rasgos distintivos son iguales; por ejemplo, 8 N o siguen este p a t r ó n las formas de la segunda persona p l u r a l terminadas e n -áis, - é i s ; tampoco las palabras d i e c i s é i s , v e i n t i s é i s , a g n u s d é i , a i n d a m á i s , b u é i s , m a r r a m á u (cf. G . S C A V M C K Y a n d A . S T A H L , A reverse diclionary of the Spanish language, U r b a n a , 1973), n i de los apellidos M o n s i v á i s , B e r i s t á i n , A r a q u i s t á i n . E n todas ellas se mantiene el diptongo a pesar del acento. N o hemos considerado estas excepciones porque es m u y poco probable que aparezcan e n u n cancionero mexicano. » L a ü no es u n a vocal especial, sino u n a c o n v e n c i ó n o r t o g r á f i c a para i n dicar que l a u suena en las combinaciones güi, güe. 504 M . A. SOLER NRFH, Y S. PONCE D E L E Ó N XXVI m y n son nasales y sonoras y sólo se oponen por ser una b i l a b i a l y l a otra alveolar. Para las comparaciones se necesita: aj u n inventario de vocales; l o que no aparezca en éste se cons i d e r a r á consonante; b) u n i n v e n t a r i o de las diferentes grafías para u n mismo fonema (en el sistema fonológico d e l e s p a ñ o l mexicano) : b = v; g = j ; z = s; c = s; y = 11; c) u n i n v e n t a r i o de las consonantes con las que se puede dar la r i m a intermedia: m-n; l-r; r-rr w. Como hemos encontrado en el Cancionero diferentes patrones de r i m a (abcb, abab, abba, ababab, etc.), es necesario comparar entre sí todas las palabras rimantes de una copla. E l p a t r ó n general de la t e r m i n a c i ó n sería el que viene a contin u a c i ó n , donde todo l o que va entre corchetes es opcional: VT C V C fcf v — i a V c b d donde V T = vocal t ó n i c a , C = consonante o g r u p o de consonantes, V = vocal o diptongo. Por ejemplo, en las palabras nombró, crió, fe la t e r m i n a c i ó n está constituida ú n i c a m e n t e por la V T ó, e; en corazón tenemos la t e r m i n a c i ó n -ón con los elementos marcados con a y c en el esquema, o sea V T - o y C-n; en l a t e r m i n a c i ó n de flores aparecen los cuatro elementos a, c, b y d : V T - o , C-r, V-e, y C-s. En el esquema se incluye la posibilidad de analizar palabras e s d r ú j u l a s rimantes, como en la copla n ú m . 377a (caso r a r í s i m o en el corpus d e l Cancionero) : Por por por me tu boquitica, tus p i r á t i c o s , tus ojíticos, muero yótico. donde las cuatro palabras finales de verso son e s d r ú j u l a s ; así, la t e r m i n a c i ó n íticos (de los versos 2 y 3) tiene el esquema !« S ó l o hemos considerado estos tres casos pues parecen ser los m á s claros. Esto no e l i m i n a l a p o s i b i l i d a d de que se d e n otros; e l p r o b l e m a sería marcarnos u n l í m i t e y explicarlos. NRFH, XXVI RECONOCIMIENTO AUTOMÁTICO D E RIMAS í VT t G i V c o G V 505 s C a ' c ' b d Los elementos que se comparan en las terminaciones son u n o como m í n i m o (a) y cuatro como m á x i m o : a) l a V T ; b) la ú l t i m a V de l a t e r m i n a c i ó n , si no es ésta la V T ; c) la letra o g r u p o de letras que van d e s p u é s de la V T o entre la V T y la ú l t i m a V ; d) la letra o letras que van después de la ú l t i m a V si n o es ésta la V T . T o d o s los requisitos que hemos enumerado a q u í se han traducido a u n programa en lenguaje F o r t r a n con u n arreglo de tabla, que consta de siete subrutinas. L a p r i m e r a se denomina T C H A R D y es l a que crea la tabla y las subtablas que la componen. E n las subtablas encontramos traducidos a caracteres n u m é r i c o s todos los elementos importantes para la d e t e r m i n a c i ó n de la r i m a : acento, vocales, corchetes, paréntesis, blancos, etc. Las subrutinas restantes (llamadas A C E N T O , P A R E N , C O R C H E , E R R O R , D E T A C E y D E T R I M ) son de dos tipos diferentes; las cinco primeras se encargan de localizar las terminaciones y guardar todos sus componentes analizados; la ú l t i m a , con base en las anteriores, compara los componentes de las terminaciones de una copla y establece la existencia y t i p o de r i m a que se da entre los versos. E l programa tiene como u n i d a d de trabajo la copla, y funciona de l a siguiente manera: U n a vez creada la tabla, se aplica a l a ú l t i m a palabra de cada verso u n a l g o r i t m o de lectura que funciona de derecha a izquierda; este a l g o r i t m o analiza carácter por c a r á c t e r y cuando aparece u n car á c t e r significativo (acento, p a r é n t e s i s , corchete o blanco) entra a u n a de las subrutinas siguientes: 1) Subrutina A C E N T O . E n t r a en funcionamiento cuando aparece en la lectura u n acento o r t o g r á f i c o ( / ) ; reconoce la vocal tónica y guarda la t e r m i n a c i ó n completa, las vocales de que consta y su n ú m e r o para la c o m p a r a c i ó n posterior. 2) Subrutina P A R E N . Se entra a ella cuando aparece u n par é n t e s i s derecho [ } ] ; analiza cada c a r á c t e r hasta encontrarse el par é n t e s i s izquierdo [ ( ] ; si l o encuentra, i n i c i a el análisis de la palabra que l o precede, pues, como ya dijimos, las palabras entre p a r é n t e s i s n o se t o m a n en cuenta; si n o encuentra el p a r é n t e s i s izquierdo, se traslada a la subrutina E R R O R . 3) S u b r u t i n a E R R O R . E n ella se guardan los casos en que se h a n encontrado errores de codificación para marcarse en la impresión f i n a l y corregirse a mano. 4) S u b r u t i n a C O R C H E . Se u t i l i z a cuando aparece u n corchete derecho (]) ; sigue el análisis ya sea para encontrar el acento ortográfico o para determinar el p r o s ó d i c o . 506 M . A. SOLER Y S. PONCE D E L E Ó N NRFH, XXVI 5) Subrutina D E T A C E . E n t r a en funcionamiento al reconocer el p r i m e r blanco, d e t e r m i n á n d o s e así el l í m i t e de la palabra. A l n o haber encontrado el acento ortográfico, aplica las reglas de acentuac i ó n (cf. supra, pp. 502 s.), que en ellas están contenidas para localizar la vocal t ó n i c a . U n a vez determinada, sigue los mismos pasos que la s u b r u t i n a A C E N T O . 6) S u b r u t i n a D E T R I M . U n a vez establecidas las terminaciones de una copla, en base a las cinco subrutinas precedentes, se entra a ésta para realizar sus comparaciones en todas las combinaciones posibles: t e r m i n a c i ó n del p r i m e r verso con el segundo, tercero, etc., la del segundo con e l tercero, cuarto, etc. Puede asignar en cada una de las comparaciones los siguientes valores: 0 1 2 3 no hay rima rima asonante rima intermedia rima consonante E n el valor 3 se incluyen los casos de diferentes grafías para u n mismo fonema. Esta subrutina analiza las vocales de las terminaciones que compara; si n o son iguales asigna el valor 0; si son iguales compara las consonantes (cuando las haya) y, si son iguales, asigna u n valor 3. En el caso de que las consonantes n o sean iguales las analiza para ver si se trata de u n caso de diferente grafía o de r i m a i n t e r m e d i a ; cuando sucede l o p r i m e r o asigna u n valor 3, cuando l o segundo, u n valor 2, y si no se da n i n g u n o de estos casos, asigna el valor 1. Los datos producidos por e l programa rastreador se ordenan, por medio de programas m u y sencillos, de acuerdo con las terminaciones rimantes atendiendo p r i n c i p a l m e n t e a las vocales de la termin a c i ó n y se obtienen grupos d e l t i p o á, d-a, á-e,. . .é, é-a, é-e,.. .i, etc. D e n t r o de cada u n o de los grupos se presentan las palabras rimantes de cada copla en orden a l f a b é t i c o y en todas las combinaciones posibles; por ejemplo, para una copla con r i m a é, cuyas palabras rimantes son hallé y corté, encontramos en la a g r u p a c i ó n é, en l a H : hallé y corté y en la C: corté, hallé. Incluimos a q u í u n a hoja de los listados, que se debe interpretar de l a siguiente forma: en el extremo izquierdo aparece la a s i g n a c i ó n del grupo a l que corresponden todos los datos (en este caso E O = é - o ) . Los datos de cada copla ocupan tres renglones consecutivos; en el p r i m e r o se leen las palabras rimantes con u n n ú m e r o a la derecha que indica el verso a que corresponde cada una » ; en el seg u n d o r e n g l ó n vuelve a aparecer la palabra bajo la que se está alfa¬ " E l espacio entre l a p a l a b r a y su n ú m e r o se debe a necesidades prácticas, pues puede h a b e r palabras muy largas que lo o c u p e n casi e n su totalidad. fttontoiottrtiOK)ioK)iôiOfQmfOrtfOKiK)rtrtfQiônrtK)iQKtio» o Oo o 2000000C O o CO O C*} o o o o o o O í~1 f-i i—t o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o 0 0 0 3 o o o o o o oooooooooo ooo oooooooooo o o o o o o o o Í — * o o o s I ig I 2 g -H to C M I o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o 0 0 0 0 0 0 o o o o o o o >ooooooooooooooooooo o o o o o o o o o o o o o o o m 3 O o g uot ' oc o o o o o o o o o oooo g g 1 I o o o o o o o o o OOOOOOOOOOOOOOOOOOOOOOOOOO ° | o o o o o o o o o o o o o o o 3000000C o o o o o o o o 1 o o o oo o o o 0 0 0 0 0 0 = = = o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o 3 o o o o o o o 3 o o o o o o o o o o 3 o o o o o o o a o o o o o o o o o o o o o o o o o o o o o o o o o O o a o o o o o 3 •3 o o ; g g o o o o o o c o o o I o o o o o o o o o o o o > o o o o o o o o o o 3 » o o o o o o 3 3 3 3 3 I o o o o o o o o 3 3 3 o o ) o o o o o o o o o o o o o o o o o o o o o • 33333333 3 3 3 33-33^33-000 o 0*00.00000 o o o o o o o i a o o o c o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o 3 9 3 a o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o a o rr o o o o o o o o o O UJ o o c o o o o o< o o m H IO rO IO UI ! I ; g : g g gg c o o o o o o o o o o o o o o o o o o 3 o o o o o o o O o u z O 1-4 o o o 3 3 3 O o o # LJ * u O ID o tn z < * ce ! 1 g 1 I o o I i o o < o o \ *l o •¿ ; s¿_ _1 * 7 I CM « o o o o a: > o 04 t-» — o o u / >/ o OCMOO^roOd-OOCMOOCMfl o * _1 u ce o O o o to IO to to lOONOOrt OOOJO! Ì 2 t g L ° 9 •* UJ + CM < ¥ o o O O !X « ill CM 3 O O * O C£ U CM J CM N o o _j — O X O X o X. UJ o xUJ O X UJ D S O o 3< M OO CJ\ O O O o o o 3 3 o o O 3 o 3 O o O o 3 3 3 3 3o O o 3 o ï UJ s o 3 O O N O Q i O O O Í J O o o * cr ID CO 3 o œ UJ o ut # O te UJ - O X UJ O a: — ¥ íT LJ *- C M - O a: UJ O zUJ d" eg H O xU i S Z. E ) o o o o oo o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o ¡ J ^ U J U I U I — CM UJ UJ UJ UJ UJ UJ n UJLÜUJUJUJUJUJUJUJUJUJUJUJUJUiUJUJUJUJuJUJuJUJUJUJUJUJUJUJUJUIUJUJUJUiUJUJUJUJUJUJUJUJuJúJ í m (e N to ~ffT o zz ~c3~ to *t ""¡o" í£ " t " °2 ~cr>~ 508 M . A. SOLER Y S. P O N C E D E L E Ó N NRFH, XXVI betizando y espacios para el caso en que la copla tenga m á s de seis palabras rimantes, que son las que caben en el primer r e n g l ó n ; en el tercero encontramos varias agrupaciones de n ú m e r o s : en p r i m e r lugar están los n ú m e r o s de los versos entre los eme se da esa r i m a (los ceros son espacios para los casos de coplas largas) ; la siguiente serie indica los valores que se obtienen como resultado de la comp a r a c i ó n entre las terminaciones rimantes, o sea, el t i p o de r i m a que existe entre cada c o m b i n a c i ó n (se lee como está marcado con las flechas en algunos de los grupos) ; a c o n t i n u a c i ó n , vienen los datos de l a copla ( n ú m e r o de t o m o y n ú m e r o de copla; los dos ceros finales son espacios para n ú m e r o de verso, que en este caso n o es pertinente) . Los n ú m e r o s de l a extrema derecha marcan el orden en que se t r a b a j ó l a copla, antes de ordenarse como aparece en la hoja. Así, por ejemplo, en el cuadro hay 19 coplas analizadas. L a exp l i c a c i ó n que sigue se refiere a las coplas 1, 6, 13: 1 6 13 En esta esquina te espero; dime que sí, chaparrita, porque de pena me muero. ¡Ay de mí!, Llorona, Llorona, llévame al cielo a ver a las rezadoras (Llorona), que digan c u á n d o me muero. Preso estoy, vida mía, porque te quiero, y yo sigo diciendo que por t i muero. E n este cuadro aparece sólo la r i m a en e-o; otras rimas que pueda haber dentro de las coplas aparecen en el g r u p o de la t e r m i n a c i ó n que les corresponde. E n el p r i m e r g r u p o de tres renglones tenemos las palabras rimantes muero en el verso 3 y espero en el 1; por l o tanto en el tercer r e n g l ó n leemos 1 y 3, que nos indican los n ú m e r o s de verso entre los que se d a una r i m a con valor 3 (consonante), y al f i n a l de ese mismo r e n g l ó n vemos que los datos pertenecen a la copla 880 del t. 1. E n el g r u p o 13 leemos muero del verso 4, quiero del 2 y diciendo del 3; en el tercer r e n g l ó n encontramos los n ú m e ros 2, 3 y 4 que i n d i c a n los n ú m e r o s de versos rimantes; entre el verso 2 y el 3 tenemos r i m a 1 (asonante), entre el 2 y el 4 r i m a 3 ('consonante') v entre el 3 v el 4 r i m a 1 ('asonante) • los datos pertenecen a la copla 1863 del t. 1. T a m b i é n encontramos u n caso de r i m a intermedia, en el g r u p o 6. E l programa rastreador de rimas, planeado y aplicado en la forma que a q u í l o presentamos, funciona en u n 100% de los casos y NRFH, XXVI RECONOCIMIENTO AUTOMÁTICO D E RIMAS 509 n o requiere trabajo de post-edición para utilizar los datos que proporciona; al presentarnos el juego completo de rimas de todo nuest r o corpus se abre u n campo bastante a m p l i o para investigaciones posteriores sobre este tema. E n base a esos datos se pueden obtener frecuencias de los tipos de rimas, obtener y analizar los diferentes tipos de estrofa que existen en r e l a c i ó n a la r i m a y conocer, a p o y á n donos en su frecuencia, cuáles de estos tipos son los m á s característicos y cuáles los m á s raros. Si se combina este programa con el analizador gramatical del DEM , se p o d r í a n obtener y analizar t a m b i é n los tipos y frecuencia de las palabras rimantes, su n ú m e r o de sílabas, la c a t e g o r í a gramatical a la que pertenecen (sustantivos, verbos, pronombres, etc.), los sufijos y terminaciones verbales empleados para crear rimas, etc. T a m b i é n se p o d r í a pensar en una i n vestigación en l a que se compararan los datos resultantes con a q u é llos obtenidos en corpus similares de otros países h i s p á n i c o s . 1 2 MARÍA ÁNGELES SOLER DE L A CUEVA SILVIA PONCE DE L E Ó N E l Colegio de M é x i c o . 12 P a r a u n a e x p l i c a c i ó n de lo que es y c ó m o f u n c i o n a e l analizador gramatical del Diccionario del español de México, véase L . F . L A R A , " M é t h o d e en lexicographie: v a l e u r et m o d a l i t é d u dictionnaire de machine", CLex, 1976, m i m . 2, 103-128.

reconocimiento automático de rimas para el cancionero folklórico de

Documentos relacionados

Productos

Apoyo

reconocimiento automático de rimas para el cancionero folklórico de

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib