reconocimiento automático de rimas para el cancionero folklórico de

Anuncio
RECONOCIMIENTO A U T O M Á T I C O DE
RIMAS PARA EL CANCIONERO
FOLKLÓRICO
DE MÉXICO
Entre los trabajos de c o m p u t a c i ó n preparados para obtener los
í n d i c e s del Cancionero
folklórico
de México
hemos elaborado u n
programa rastreador para el reconocimiento a u t o m á t i c o de rimas,
cuyo resultado será el í n d i c e de las mismas. Su importancia se halla
en los interesantes problemas que plantea la c o n s t r u c c i ó n de u n programa no solamente de o r d e n a c i ó n , sino t a m b i é n de análisis. Queremos presentar a q u í la forma en que lo realizamos y los resultados
que hemos obtenido.
1
L a finalidad de nuestro í n d i c e de rimas es la de reconocer tanto
las rimas iguales que aparecen en distintas coplas como el juego de
rimas que se da en el i n t e r i o r de una misma copla. E l í n d i c e de r i mas consta de todas las palabras rimantes, presentadas en todos los
ó r d e n e s posibles (hay versiones que i n v i e r t e n los versos) de cada
una de las coplas; por ejemplo, de la copla n ú m . 847:
M i corazón, pobrecito,
preso en tus brazos está:
castígale su delito
y dale la libertad,
que él te pagará sólito
y en buena conformidad.
necesitamos obtener las siguientes listas: pobrecito, delito,
delito, pobrecito, sólito / sólito, pobrecito, d e l i t o / está,
conformidad / l i b e r t a d , está, conformidad / conformidad,
bertad.
L a u t i l i d a d inmediata de este juego de combinaciones
sólito /
libertad,
está, l i es la de
i E l Cancionero
folklórico
de México
es el resultado de u n a i n v e s t i g a c i ó n
colectiva realizada bajo la d i r e c c i ó n de Margit F r e n k Alatorre en el C e n t r o
de Estudios L i n g ü í s t i c o s y L i t e r a r i o s de E l Colegio de M é x i c o . A la fecha se
h a n publicado dos tomos: Coplas
del amor feliz, 1975 y Coplas del amor
desdidiado,
1977.
500
M . A. SOLER Y S. F O N C E D E L E C N
NRFH, XXVI
localizar coplas similares y relacionarlas dentro del
Cancionero,
pues debido al v o l u m e n d e l m a t e r i a l con que se trabaja (12 000 coplas, muchas de ellas con m á s de una v e r s i ó n ) , es m u y difícil poder encontrarlas ú n i c a m e n t e con la ayuda de l a memoria; t a m b i é n
será u n a u x i l i a r m u y ú t i l para los lectores interesados en localizar
una copla determinada de la obra, cuyos índices, incluyendo el de
rimas, se p u b l i c a r á n en el q u i n t o tomo.
Llamamos "verso" a cada una de las l í n e a s que componen una estrofa o copla. Para la d e f i n i c i ó n de " r i m a " nos hemos basado en u n
trabajo de A . M . Cirese q u i e n la define (siguiendo l a tradición)
como la i d e n t i d a d o s i m i l i t u d entre las terminaciones de la ú l t i m a
palabra de los versos que componen una estrofa o copla. L a " t e r m i n a c i ó n " abarca desde la vocal t ó n i c a hasta el final de la palabra.
Existe i d e n t i d a d cuando tanto las vocales como las consonantes de
las terminaciones son iguales ( r i m a consonante) ; existe s i m i l i t u d
cuando ú n i c a m e n t e las vocales son iguales (rima asonante). E n esta
etapa del programa n o hemos tenido en cuenta otros casos de r i m a
asonante como cuando hay dos vocales en la t e r m i n a c i ó n y la vocal
t ó n i c a es igual, pero la á t o n a puede ser e o i u o o u. T a m p o c o hemos considerado casos de a l i t e r a c i ó n . Si q u i s i é r a m o s comprobarlos
en el Cancionero
b a s t a r í a a m p l i a r e l programa.
E l factor decisivo en la r i m a es la vocal t ó n i c a ; es el punto a part i r del cual medimos la t e r m i n a c i ó n y es el ú n i c o elemento necesar i o : puede o no haber otra vocal o consonante, pero la vocal t ó n i c a
siempre está presente.
E l m a t e r i a l del Cancionero
ha sido codificado y perforado en
tarjetas. Las convenciones para la t r a n s c r i p c i ó n han sido las siguientes: cada tarjeta debe contener u n verso de una copla copiado textualmente, a c o m p a ñ a d o por una clave que nos permite su localizac i ó n dentro del corpus del Cancionero;
esta clave consta de diez
caracteres en total. E l p r i m e r o i n d i c a el n ú m e r o de tomo en que se
encuentra la copla y es u n d í g i t o con valor 1, 2, 3 o 4. A continuac i ó n tenemos cinco caracteres que f o r m a n una cifra de cinco dígitos
con valores posibles del 00001 al 99999 donde se marca el n ú m e r o
de la copla: el s é p t i m o c a r á c t e r se u t i l i z a para los casos de intercal a c i ó n de coplas en la n u m e r a c i ó n o r i g i n a l del Cancionero
y puede ser u n d í g i t o del 0 al 9, donde se p r e v é u n caso extremo de nueve
coplas intercaladas; el octavo c a r á c t e r es a l f a b é t i c o y marca los casos
2
3
2 "Inventaires et r é p e r t o i r e s lexicaux, formulaires et m é t r i q u e s des chants
populaires italiens" en Linguistica
matematica
e calcolatori,
ed. A . Zampolli,
Firenze, 1973, p. 227.
3 P a r a evitar correr toda la n u m e r a c i ó n se les dio el n ú m e r o de l a que las
precede pero con las marcas bis o ter para diferenciarlas. C f . Cancionero,
t. 1,
p. x x x i i , § 4.
NRFH, XXVI
RECONOCIMIENTO AUTOMÁTICO D E RIMAS
501
de familias de c o p l a s l o s dos ú l t i m o s caracteres forman una cifra de dos dígitos del 00 al 99 que nos indica el lugar que ocupa el
verso dentro de la copla. Así la clave 1004920Í01 se lee de la siguiente forma: es u n verso que se encuentra en el t o m o 1, que pertenece
a la copla 00492, la cual está intercalada y pertenece a u n a famil i a de coplas ocupando el lugar / y es el p r i m e r verso de la copla.
Los pasos que debe seguir el programa rastreador de rimas son
los siguientes:
1) T o m a r como u n i d a d de análisis la copla;
2) Aislar la ú l t i m a palabra de cada verso, pero con las siguientes restricciones:
a)
N o tomar en cuenta los elementos a ñ a d i d o s al final de la línea cuando van entre p a r é n t e s i s . E n esta s i t u a c i ó n podemos
encontrar la palabra sic, u n signo ?, o b i e n una palabra o grupo de palabras que llamamos a p é n d i c e s y que quedan fuera
de l a c o n f i g u r a c i ó n m é t r i c a del verso, por ejemplo en la copla n ú m . 351:
Si porque te quiero, quieres (Llorona)
quieres que te quiera más,
te quiero más que a m i vida (Llorona):
¿qué más quieres?, ¿quieres más?
donde las ú l t i m a s palabras de los versos 1 y 3 son quieres, vida
y no
Llorona.
b) Si el a p é n d i c e no va entre paréntesis, sino separado del cuerpo p r i n c i p a l del verso con u n g u i ó n largo , se toma la ú l t i m a
palabra antes del g u i ó n y la ú l t i m a del a p é n d i c e ; por ejemplo en la copla n ú m . 630:
5
D i si me quieres, Lola
para comprarte
una barca con remos — y con sus velas
para pasearte.
t o m a r í a m o s las palabras Lola, comprarte, remos, velas y pasearte. Son m u y pocos estos casos en el cuerpo general del
Cancionero,
pero es necesario tomarlos en cuenta.
4 " E n cuanto a las coplas que tienen versiones de distinto n ú m e r o de versos hay motivos para verlas como 'una sola'. . . P o r razones de claridad, sin embargo, c o n v e n í a i m p r i m i r l a s p o r separado; lo que se h a hecho es ponerles u n
mismo n ú m e r o seguido de las letras a, b, c, etc." (ibid., § 2 ) .
B " E n algunas seguidillas mexicanas e l a p é n d i c e aparece sustituido por palabras que son indispensables para la c o m p r e n s i ó n del texto. L a s hemos puesto
a c o n t i n u a c i ó n del verso y s e p a r á n d o l a s de é l por medio de u n g u i ó n " ,
ibid.,
p. x x x v i .
502
M . A. SOLER Y S. P O N C E D E L E Ó N
c)
NRFH, XXVI
E n algunas ocasiones se u t i l i z a n corchetes cuando una fracc i ó n del verso (que se ha tomado de una g r a b a c i ó n magnetofónica) n o se escuchó bien, pero p o r a l g ú n m e d i o se pudo
completar; si esto sucede en la ú l t i m a palabra d e l verso, ésta
debe leerse, para nuestros fines, como si los corchetes n o estuvieran allí; p o r ejemplo en l a copla n ú m . 1386&:
Ariles y m á s ariles
que ariles del que decía:
"De noche te vengo a ver,
porque no puedo de día,
v si pudiera [viniera]
a todas horas del [día]".
tanto viniera
como día se consideran palabras finales.
3} Localizar l a vocal t ó n i c a en cada ú l t i m a palabra. Como ya
dijimos, la vocal t ó n i c a se identifica por m e d i o d e l acento y por l o
tanto para localizarla es necesario, en p r i m e r lugar, u n algoritmo
de reconocimiento de vocales (formado con u n inventario de vocales
y u n cuadro de reconocimiento y r e d u c c c i ó n de diptongos; cf. infra,
p. 503) ; y, en segundo lugar, u n proceso de p r e - e d i c i ó n en donde se
m a r q u e n los acentos prosódicos; o b i e n es necesario u n algoritmo
de i d e n t i f i c a c i ó n , que contenga las reglas de a c e n t u a c i ó n d e l españ o l , por m e d i o d e l cual se localice y a c e n t ú e la vocal t ó n i c a cuando
ésta n o lleva acento ortográfico. Puesto que las reglas de acentuac i ó n del e s p a ñ o l son bastante sencillas « hemos preferido la segunda
posibilidad, que a d e m á s e l i m i n a e l trabajo de p r e - e d i c i ó n . Las reglas para el reconocimiento de la vocal t ó n i c a ( V T ) son:
i)
Si hay acento ortográfico, la V T es la que precede al acento:
V/ .
Si n o hay acento o r t o g r á f i c o :
a) y la palabra sólo tiene una vocal, se considera que ésa es
la V T ;
b) y l a palabra tiene sólo dos vocales y éstas forman diptongo, se aplican las reglas de r e d u c c i ó n de diptongo (cf.
infra, p. 503) ; la que resulta será la V T ;
c) y la palabra t e r m i n a en n, s o vocal, la V T es la p e n ú l tima, siempre y cuando ésta no forme diptongo con la
T
ii)
« N o s basamos en las reglas presentadas en u n estudio sobre o r t o g r a f í a y
p r o n u n c i a c i ó n elaborado para el Diccionario
del español
de México
por L o u r des G a v a l d ó n , L o u r d e s R o s y M a n u e l F e r n á n d e z .
i E n l a c o d i f i c a c i ó n q u é utilizamos, el acento o r t o g r á f i c o se marca " / " a
c o n t i n u a c i ó n de l a vocal acentuada, por ejemplo: C A N C I O / N .
NRFH, XXVI
d)
503
RECONOCIMIENTO AUTOMÁTICO D E RIMAS
ú l t i m a , en cuyo caso se t o m a r á la anterior; por ejemplo, en gloria, la V T n o es la i sino l a o;
y la palabra n o t e r m i n a en n, s, o vocal, la V T es la ú l tima.
Las reglas para el reconocimiento y r e d u c c i ó n de los diptongos son:
i)
Si hay dos vocales unidas, pero una de ellas lleva acento ortográfico, se cuentan como dos vocales: V / V o W / . I g u a l
tratamiento reciben si n o llevan acento pero n o son combinaciones con i o u, por ejemplo: ea dos vocales.
Si hay dos vocales unidas, n i n g u n a de las dos lleva acento
ortográfico, y una de ellas es i, u o una c o m b i n a c i ó n de ambas iu, ui, se cuentan como una sola vocal, de acuerdo con
el siguiente cuadro:
8
ii)
P
a
-
-i
e
i
1
+
a e
— >
u
_
_ o i "
u
ü
_
-
a
+
" i u —> u "1
ui —> i
üi —» i
e
o
o _
a
— »
e
o
9
4) Separar la t e r m i n a c i ó n a p a r t i r de l a V T incluyendo a ésta.
5) Comparar las terminaciones entre sí y r e u n i r l o que muestra una r e l a c i ó n de i d e n t i d a d ( r i m a consonante) o de s i m i l i t u d
( r i m a asonante). T a m b i é n existe una r i m a " i n t e r m e d i a " en la que
las vocales son i d é n t i c a s y las consonantes m u y similares, pues corresponden a los casos en que puede darse n e u t r a l i z a c i ó n entre ellas
p o r q u e casi todos sus rasgos distintivos son iguales; por ejemplo,
8 N o siguen este p a t r ó n las formas de la segunda persona p l u r a l terminadas
e n -áis, - é i s ; tampoco las palabras d i e c i s é i s , v e i n t i s é i s , a g n u s d é i , a i n d a m á i s , b u é i s ,
m a r r a m á u (cf. G . S C A V M C K Y a n d A . S T A H L , A reverse diclionary
of the
Spanish
language,
U r b a n a , 1973), n i de los apellidos M o n s i v á i s , B e r i s t á i n , A r a q u i s t á i n .
E n todas ellas se mantiene el diptongo a pesar del acento. N o hemos considerado
estas excepciones porque es m u y poco probable que aparezcan e n u n cancionero mexicano.
» L a ü no es u n a vocal especial, sino u n a c o n v e n c i ó n o r t o g r á f i c a para i n dicar que l a u suena en las combinaciones güi, güe.
504
M . A. SOLER
NRFH,
Y S. PONCE D E L E Ó N
XXVI
m y n son nasales y sonoras y sólo se oponen por ser una b i l a b i a l
y l a otra alveolar. Para las comparaciones se necesita:
aj
u n inventario de vocales; l o que no aparezca en éste se cons i d e r a r á consonante;
b) u n i n v e n t a r i o de las diferentes grafías para u n mismo fonema (en el sistema fonológico d e l e s p a ñ o l mexicano) : b =
v; g = j ; z = s; c = s; y = 11;
c) u n i n v e n t a r i o de las consonantes con las que se puede dar la
r i m a intermedia: m-n; l-r; r-rr w.
Como hemos encontrado en el Cancionero
diferentes patrones
de r i m a (abcb, abab, abba, ababab, etc.), es necesario comparar entre sí todas las palabras rimantes de una copla.
E l p a t r ó n general de la t e r m i n a c i ó n sería el que viene a contin u a c i ó n , donde todo l o que va entre corchetes es opcional:
VT
C
V
C
fcf
v
—
i
a
V
c
b
d
donde V T = vocal t ó n i c a , C = consonante o g r u p o de consonantes, V = vocal o diptongo. Por ejemplo, en las palabras
nombró,
crió, fe la t e r m i n a c i ó n está constituida ú n i c a m e n t e por la V T ó, e; en corazón tenemos la t e r m i n a c i ó n -ón con los elementos marcados con a y c en el esquema, o sea V T - o y C-n; en l a t e r m i n a c i ó n
de flores aparecen los cuatro elementos a, c, b y d : V T - o , C-r, V-e,
y C-s.
En el esquema se incluye la posibilidad de analizar palabras
e s d r ú j u l a s rimantes, como en la copla n ú m . 377a (caso r a r í s i m o en
el corpus d e l Cancionero)
:
Por
por
por
me
tu boquitica,
tus p i r á t i c o s ,
tus ojíticos,
muero yótico.
donde las cuatro palabras finales de verso son e s d r ú j u l a s ; así, la
t e r m i n a c i ó n íticos (de los versos 2 y 3) tiene el esquema
!« S ó l o hemos considerado estos tres casos pues parecen ser los m á s claros.
Esto no e l i m i n a l a p o s i b i l i d a d de que se d e n otros; e l p r o b l e m a sería marcarnos
u n l í m i t e y explicarlos.
NRFH, XXVI
RECONOCIMIENTO AUTOMÁTICO D E RIMAS
í
VT
t
G
i
V
c o
G V
505
s
C
a
'
c
' b d
Los elementos que se comparan en las terminaciones son u n o
como m í n i m o (a) y cuatro como m á x i m o : a) l a V T ; b) la ú l t i m a V
de l a t e r m i n a c i ó n , si no es ésta la V T ; c) la letra o g r u p o de letras
que van d e s p u é s de la V T o entre la V T y la ú l t i m a V ; d) la letra
o letras que van después de la ú l t i m a V si n o es ésta la V T .
T o d o s los requisitos que hemos enumerado a q u í se han traducido a u n programa en lenguaje F o r t r a n con u n arreglo de tabla,
que consta de siete subrutinas. L a p r i m e r a se denomina T C H A R D
y es l a que crea la tabla y las subtablas que la componen. E n las
subtablas encontramos traducidos a caracteres n u m é r i c o s todos los
elementos importantes para la d e t e r m i n a c i ó n de la r i m a : acento,
vocales, corchetes, paréntesis, blancos, etc. Las subrutinas restantes
(llamadas A C E N T O , P A R E N , C O R C H E , E R R O R , D E T A C E y
D E T R I M ) son de dos tipos diferentes; las cinco primeras se encargan de localizar las terminaciones y guardar todos sus componentes
analizados; la ú l t i m a , con base en las anteriores, compara los componentes de las terminaciones de una copla y establece la existencia
y t i p o de r i m a que se da entre los versos.
E l programa tiene como u n i d a d de trabajo la copla, y funciona
de l a siguiente manera:
U n a vez creada la tabla, se aplica a l a ú l t i m a palabra de cada
verso u n a l g o r i t m o de lectura que funciona de derecha a izquierda;
este a l g o r i t m o analiza carácter por c a r á c t e r y cuando aparece u n car á c t e r significativo (acento, p a r é n t e s i s , corchete o blanco) entra
a u n a de las subrutinas siguientes:
1) Subrutina A C E N T O . E n t r a en funcionamiento cuando aparece en la lectura u n acento o r t o g r á f i c o ( / ) ; reconoce la vocal tónica y guarda la t e r m i n a c i ó n completa, las vocales de que consta
y su n ú m e r o para la c o m p a r a c i ó n posterior.
2) Subrutina P A R E N . Se entra a ella cuando aparece u n par é n t e s i s derecho [ } ] ; analiza cada c a r á c t e r hasta encontrarse el par é n t e s i s izquierdo [ ( ] ; si l o encuentra, i n i c i a el análisis de la palabra
que l o precede, pues, como ya dijimos, las palabras entre p a r é n t e s i s
n o se t o m a n en cuenta; si n o encuentra el p a r é n t e s i s izquierdo, se
traslada a la subrutina E R R O R .
3) S u b r u t i n a E R R O R . E n ella se guardan los casos en que se
h a n encontrado errores de codificación para marcarse en la impresión f i n a l y corregirse a mano.
4) S u b r u t i n a C O R C H E . Se u t i l i z a cuando aparece u n corchete
derecho (]) ; sigue el análisis ya sea para encontrar el acento ortográfico o para determinar el p r o s ó d i c o .
506
M . A. SOLER
Y S. PONCE D E L E Ó N
NRFH,
XXVI
5) Subrutina D E T A C E . E n t r a en funcionamiento al reconocer
el p r i m e r blanco, d e t e r m i n á n d o s e así el l í m i t e de la palabra. A l n o
haber encontrado el acento ortográfico, aplica las reglas de acentuac i ó n (cf. supra, pp. 502 s.), que en ellas están contenidas para localizar la vocal t ó n i c a . U n a vez determinada, sigue los mismos pasos
que la s u b r u t i n a A C E N T O .
6) S u b r u t i n a D E T R I M . U n a vez establecidas las terminaciones de una copla, en base a las cinco subrutinas precedentes, se entra a ésta para realizar sus comparaciones en todas las combinaciones posibles: t e r m i n a c i ó n del p r i m e r verso con el segundo, tercero,
etc., la del segundo con e l tercero, cuarto, etc. Puede asignar en
cada una de las comparaciones los siguientes valores:
0
1
2
3
no hay rima
rima asonante
rima intermedia
rima consonante
E n el valor 3 se incluyen los casos de diferentes grafías para u n
mismo fonema.
Esta subrutina analiza las vocales de las terminaciones que compara; si n o son iguales asigna el valor 0; si son iguales compara las
consonantes (cuando las haya) y, si son iguales, asigna u n valor 3.
En el caso de que las consonantes n o sean iguales las analiza para
ver si se trata de u n caso de diferente grafía o de r i m a i n t e r m e d i a ;
cuando sucede l o p r i m e r o asigna u n valor 3, cuando l o segundo, u n
valor 2, y si no se da n i n g u n o de estos casos, asigna el valor 1.
Los datos producidos por e l programa rastreador se ordenan, por
medio de programas m u y sencillos, de acuerdo con las terminaciones rimantes atendiendo p r i n c i p a l m e n t e a las vocales de la termin a c i ó n y se obtienen grupos d e l t i p o á, d-a, á-e,. . .é, é-a, é-e,.. .i,
etc. D e n t r o de cada u n o de los grupos se presentan las palabras
rimantes de cada copla en orden a l f a b é t i c o y en todas las combinaciones posibles; por ejemplo, para una copla con r i m a é, cuyas palabras rimantes son hallé y corté, encontramos en la a g r u p a c i ó n é,
en l a H : hallé y corté y en la C: corté,
hallé.
Incluimos a q u í u n a hoja de los listados, que se debe interpretar
de l a siguiente forma: en el extremo izquierdo aparece la a s i g n a c i ó n
del grupo a l que corresponden todos los datos (en este caso E O
= é - o ) . Los datos de cada copla ocupan tres renglones consecutivos;
en el p r i m e r o se leen las palabras rimantes con u n n ú m e r o a la derecha que indica el verso a que corresponde cada una » ; en el seg u n d o r e n g l ó n vuelve a aparecer la palabra bajo la que se está alfa¬
"
E l espacio entre l a p a l a b r a y su n ú m e r o se debe a necesidades prácticas,
pues puede h a b e r palabras muy
largas que lo o c u p e n casi e n su totalidad.
fttontoiottrtiOK)ioK)iôiOfQmfOrtfOKiK)rtrtfQiônrtK)iQKtio»
o
Oo
o
2000000C
O o
CO
O
C*}
o
o
o
o
o
o
O
í~1
f-i
i—t
o o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
0
0
0
3
o
o
o
o
o
o
oooooooooo ooo
oooooooooo
o
o
o
o
o
o
o
o
Í
—
*
o
o
o
s
I ig
I
2
g
-H
to
C
M
I
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
0 0
0
0
0
0
o
o
o
o
o
o
o
>ooooooooooooooooooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
m
3 O
o
g
uot '
oc
o
o
o
o
o
o
o
o
o
oooo
g
g
1 I
o
o
o
o
o
o
o
o
o
OOOOOOOOOOOOOOOOOOOOOOOOOO ° | o o o o o o o o o o o o o o o
3000000C
o
o
o
o
o
o
o
o
1 o o o oo
o
o
o
0
0
0
0
0
0
=
=
=
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
3
o
o
o
o
o
o
o
3
o
o
o
o
o
o
o
o
o
o
3
o
o
o
o
o
o
o
a
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
O
o
a
o
o
o
o
o
3
•3
o
o
;
g g
o
o
o
o
o
o
c
o
o
o
I
o
o
o
o
o
o
o
o
o
o
o
o
>
o
o
o
o
o
o
o
o
o
o
3
»
o
o
o
o
o
o
3
3
3
3
3
I
o
o
o
o
o
o
o
o
3
3
3
o
o
)
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
• 33333333
3 3 3
33-33^33-000
o 0*00.00000 o o o o o o o
i
a
o
o
o
c
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
3
9
3
a
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o o o
o
o
o
o
o
o
a
o rr
o
o o o
o
o
o
o
o
O UJ
o
o
c
o
o
o
o
o<
o
o
m
H
IO
rO
IO
UI
!
I
; g
: g
g
gg
c
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
3
o o
o
o
o
o
o
O
o u
z
O 1-4
o
o
o
3
3
3 O
o o
# LJ
* u
O ID
o
tn z
<
* ce
!
1
g
1
I
o
o
I
i
o
o
<
o
o
\ *l
o
•¿
; s¿_
_1
*
7
I
CM «
o
o
o
o
a:
>
o
04 t-»
—
o
o u /
>/
o
OCMOO^roOd-OOCMOOCMfl
o
* _1
u
ce
o
O
o
o
to
IO
to
to
lOONOOrt OOOJO!
Ì
2
t
g
L
° 9
•* UJ
+
CM <
¥
o
o
O O
!X
« ill
CM 3
O
O
*
O
C£
U
CM J
CM
N
o
o
_j
—
O
X
O
X
o
X.
UJ
o
xUJ
O
X
UJ
D
S
O
o
3<
M OO CJ\ O O
O
o
o
o
3
3
o
o
O
3
o
3
O
o
O
o
3
3
3
3
3o
O o
3
o
ï
UJ
s
o
3
O O N O Q i O O O Í J O
o
o
* cr
ID
CO 3
o
œ
UJ
o ut
#
O
te
UJ
-
O
X
UJ
O
a:
—
¥
íT LJ
*-
C
M
-
O
a:
UJ
O
zUJ
d"
eg
H
O
xU i
S
Z.
E
) o o o o oo o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o
¡ J ^ U J U I U I
— CM
UJ UJ UJ UJ UJ UJ
n
UJLÜUJUJUJUJUJUJUJUJUJUJUJUJUiUJUJUJUJuJUJuJUJUJUJUJUJUJUJUJUIUJUJUJUiUJUJUJUJUJUJUJUJuJúJ
í m (e N to ~ffT o
zz ~c3~ to *t ""¡o"
í£ " t "
°2 ~cr>~
508
M . A. SOLER
Y S. P O N C E D E L E Ó N
NRFH,
XXVI
betizando y espacios para el caso en que la copla tenga m á s de seis
palabras rimantes, que son las que caben en el primer r e n g l ó n ; en
el tercero encontramos varias agrupaciones de n ú m e r o s : en p r i m e r
lugar están los n ú m e r o s de los versos entre los eme se da esa r i m a
(los ceros son espacios para los casos de coplas largas) ; la siguiente
serie indica los valores que se obtienen como resultado de la comp a r a c i ó n entre las terminaciones rimantes, o sea, el t i p o de r i m a que
existe entre cada c o m b i n a c i ó n (se lee como está marcado con las
flechas en algunos de los grupos) ; a c o n t i n u a c i ó n , vienen los datos
de l a copla ( n ú m e r o de t o m o y n ú m e r o de copla; los dos ceros finales son espacios para n ú m e r o de verso, que en este caso n o es pertinente) . Los n ú m e r o s de l a extrema derecha marcan el orden en
que se t r a b a j ó l a copla, antes de ordenarse como aparece en la hoja.
Así, por ejemplo, en el cuadro hay 19 coplas analizadas. L a exp l i c a c i ó n que sigue se refiere a las coplas 1, 6, 13:
1
6
13
En esta esquina te espero;
dime que sí, chaparrita,
porque de pena me muero.
¡Ay de mí!, Llorona,
Llorona, llévame al cielo
a ver a las rezadoras (Llorona),
que digan c u á n d o me muero.
Preso estoy, vida mía,
porque te quiero,
y yo sigo diciendo
que por t i muero.
E n este cuadro aparece sólo la r i m a en e-o; otras rimas que pueda
haber dentro de las coplas aparecen en el g r u p o de la t e r m i n a c i ó n
que les corresponde. E n el p r i m e r g r u p o de tres renglones tenemos
las palabras rimantes muero en el verso 3 y espero en el 1; por l o
tanto en el tercer r e n g l ó n leemos 1 y 3, que nos indican los n ú m e r o s
de verso entre los que se d a una r i m a con valor 3 (consonante), y
al f i n a l de ese mismo r e n g l ó n vemos que los datos pertenecen a la
copla 880 del t. 1. E n el g r u p o 13 leemos muero del verso 4, quiero
del 2 y diciendo del 3; en el tercer r e n g l ó n encontramos los n ú m e ros 2, 3 y 4 que i n d i c a n los n ú m e r o s de versos rimantes; entre el
verso 2 y el 3 tenemos r i m a 1 (asonante), entre el 2 y el 4 r i m a 3
('consonante') v entre el 3 v el 4 r i m a 1 ('asonante) • los datos pertenecen a la copla 1863 del t. 1. T a m b i é n encontramos u n caso de
r i m a intermedia, en el g r u p o 6.
E l programa rastreador de rimas, planeado y aplicado en la forma que a q u í l o presentamos, funciona en u n 100% de los casos y
NRFH, XXVI
RECONOCIMIENTO AUTOMÁTICO D E RIMAS
509
n o requiere trabajo de post-edición para utilizar los datos que proporciona; al presentarnos el juego completo de rimas de todo nuest r o corpus se abre u n campo bastante a m p l i o para investigaciones
posteriores sobre este tema. E n base a esos datos se pueden obtener
frecuencias de los tipos de rimas, obtener y analizar los diferentes
tipos de estrofa que existen en r e l a c i ó n a la r i m a y conocer, a p o y á n donos en su frecuencia, cuáles de estos tipos son los m á s característicos y cuáles los m á s raros. Si se combina este programa con el
analizador gramatical del DEM , se p o d r í a n obtener y analizar
t a m b i é n los tipos y frecuencia de las palabras rimantes, su n ú m e r o
de sílabas, la c a t e g o r í a gramatical a la que pertenecen (sustantivos,
verbos, pronombres, etc.), los sufijos y terminaciones verbales empleados para crear rimas, etc. T a m b i é n se p o d r í a pensar en una i n vestigación en l a que se compararan los datos resultantes con a q u é llos obtenidos en corpus similares de otros países h i s p á n i c o s .
1 2
MARÍA ÁNGELES SOLER DE L A CUEVA
SILVIA PONCE DE L E Ó N
E l Colegio de M é x i c o .
12 P a r a u n a e x p l i c a c i ó n de lo que es y c ó m o f u n c i o n a e l analizador gramatical del Diccionario
del español
de México,
véase L . F . L A R A , " M é t h o d e en
lexicographie: v a l e u r et m o d a l i t é d u dictionnaire de machine", CLex,
1976,
m i m . 2, 103-128.
Descargar