Nuevas tecnologías y enseñanza de la lengua española

Anuncio
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
NUEVAS TECNOLOGÍAS Y ENSEÑANZA DE LA
LENGUA ESPAÑOLA
JOAQUIM LLISTERRI
Departament de Filologia Espanyola
Universitat Autònoma de Barcelona
[email protected]
http://liceu.uab.es/~joaquim/home.html
1.- Introducción
En el documento que, como parte del Real Decreto 3474/2000 de 29 de diciembre de
2000, define los objetivos, contenidos y criterios de evaluación de las materias “Lengua
Castellana y Literatura I y II” en el Bachillerato, se puede apreciar un constante interés
por el uso de las denominadas “nuevas tecnologías”, tanto en lo que se refiere a su
aplicación a las técnicas de trabajo como en lo que respecta a los propios contenidos de
las asignaturas. En “Lengua Castellana y Literatura I” se mencionan, en el apartado
dedicado al estudio de la lengua, los “principios generales del diccionario en soporte
CD-ROM y en las páginas de Internet” (p.46), mientras que en la materia de segundo
curso se incluye “La lengua española en Internet. Recursos lingüísticos fundamentales.
RAE, Agencias de prensa, medios de comunicación digitales, colecciones de textos, etc.
(p.49). En cuanto a la metodología, se requiere el conocimiento por parte del alumno de
las técnicas de búsqueda de información empleando “nuevas tecnologías (CD-ROM,
bases de datos, Internet, etc.)” (p.46) y se cuentan entre los criterios de evaluación el
manejo de recursos informáticos básicos y su aplicación a la búsqueda y elaboración de
información.
El presente trabajo1 tiene como objetivo presentar, en primer lugar, algunos de los
recursos lingüísticos en español que pueden encontrarse tanto en CD-ROM como en
Internet, centrándose principalmente en los diccionarios y en los corpus textuales y
orales. En segundo lugar, se exponen sucintamente otros recursos y materiales para el
estudio de la lengua española disponibles en la red, así como algunos foros de discusión
y listas de difusión de información que pueden ser útiles al profesor.
1
Este trabajo se basa en las sesiones “La enseñanza de la lengua española y las nuevas tecnologías” y
“Recursos lingüísticos escritos y orales” del Curso de Formación del Profesorado de Enseñanza
Secundaria “Conocimiento de la lengua española y estudios superiores”, dirigido por el Dr. J.M. Blecua
y celebrado en la Universidad Internacional Menéndez Pelayo en Santander en septiembre de 2001.
Ambas presentaciones completas, así como una bibliografía detallada y enlaces a diversos recursos se
encuentran en:
http://liceu.uab.es/~joaquim/teaching/Applied_linguistics/UIMP_01/UIMP
_Santander_01.html
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
1
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
2.- Recursos lingüísticos básicos: diccionarios y corpus
Los diccionarios y los corpus constituyen recursos esenciales para el estudio de la
lengua. Si la función de los primeros es bien conocida por los profesionales de la
enseñanza, el papel de un corpus – es decir, de una colección estructurada de textos,
sean escritos u orales – en la descripción lingüística y en la exploración de los diversos
usos de la lengua no siempre ha sido tenido en cuenta, especialmente desde la
perspectiva de los planteamientos teóricos más orientados hacia la introspección. Por
ello, tras una breve revisión de los diccionarios de español disponibles en CD-ROM y
en Internet, se presentarán en este apartado algunos corpus, tanto textuales como orales,
que el profesor o el estudiante pueden utilizar provechosamente para ampliar sus
conocimientos a partir de datos reales.
2.1.- Diccionarios en soporte electrónico
Una primera constatación importante sobre los diccionarios en formato electrónico es
que, al menos en el caso de las obras lexicográficas fundamentales, su contenido
coincide con las respectivas versiones en papel. Las ventajas de utilizar los diccionarios
en formato electrónico residen sobre todo en la flexibilidad en la búsqueda de
información, que se manifiesta, por ejemplo, en la posibilidad de localizar elementos
dentro de las definiciones, algo prácticamente imposible de realizar en las obras
impresas. Por otra parte, Internet ofrece, como veremos, la facilidad de acceso a
repertorios léxicos que difícilmente se encuentran en otros medios y la nada desdeñable
posibilidad de la consulta a obras de las que puede no disponerse en un momento dado.
2.1.1.- DICCIONARIOS EN CD-ROM
Tal como indicábamos anteriormente, muchas de las obras lexicográficas de referencia
del español se encuentran en CD-ROM, con alguna notable excepción como es el caso
de los diccionarios de Casares y de Seco. Encontramos versiones en este soporte del
diccionario de la Real Academia Española y del de María Moliner, así como el
Diccionario General de la Lengua Española de Vox, el Gran Diccionario de la Lengua
Española de Larousse, y el Diccionario de uso del español actual (Clave) de la
Editorial SM.
Recientemente, siguiendo con la línea iniciada en su momento por el Bookshelf en
español de Microsoft, que reunía en un único CD-ROM varias obras de consulta entre
las que figuraban el diccionario general de la lengua de Vox y el de sinónimos y
antónimos de Espasa, han aparecido compilaciones como la Biblioteca Multimedia
Santillana, que incluye el Nuevo Diccionario Esencial de la Lengua Española y un
Diccionario de Dificultades de la Lengua Española, o el volumen E-diccion@rios
Espasa, en el que se encuentran nueve diccionarios, entre ellos uno general de la lengua
y otro de sinónimos y antónimos, acompañados de diccionarios de argot, de citas, de
dichos y frases hechas, de refranes y de un diccionario etimológico.
Existen también en CD-ROM diccionarios de sinónimos como el de Ediciones Nauta o
el Diccionario interactivo Océano de sinónimos editado por Océano Multimedia,
además de los incluidos en otras obras. Igualmente puede encontrarse en este formato el
Multidiccionario Everest de la lengua española, en el que se recoge, además,
información de tipo enciclopédico.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
2
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Desde la perspectiva que ahora nos concierne, es interesante mencionar la edición
electrónica de, al menos, tres diccionarios para estudiantes: el Diccionario del
estudiante de la lengua española de Larousse, especialmente creado para los alumnos
de la ESO, la versión en CD-ROM del Diccionario escolar de la lengua española de E.
Fontanilla y M.I. Riesco, publicada por Vicens Vives, y el Diccionario escolar de la
lengua española de la editorial Everest.
Finalmente, aunque se aparte un tanto del tipo de materiales que estamos describiendo,
cabe citar el Nuevo Tesoro Lexicográfico de la Lengua Española, publicado por Espasa
en DVD-ROM, en el que se han recopilado en versión facsímil – es decir, con las
imágenes digitalizadas de las páginas - sesenta y seis diccionarios de la lengua española,
desde el de Nebrija hasta la última edición del DRAE. El DVD incorpora un sistema
que permite visualizar la página correspondiente a la entrada buscada en las ediciones
de los diccionarios previamente seleccionadas.
Decíamos también al comienzo que el principal interés de los diccionarios en CD-ROM
reside en la flexibilidad en la búsqueda de información. Puesto que, por razones de
espacio, no es posible describir detalladamente cada una de las obras disponibles en el
mercado editorial, ejemplificaremos brevemente las posibilidades de un diccionario en
en CD-ROM tomando como referencia la segunda edición electrónica del Diccionario
de Uso del Español (DUE) de María Moliner.
El primer tipo de búsqueda que puede realizarse es, obviamente, la de una entrada del
diccionario para consultar la definición. Tal como se ve en la figura 1, en el panel
superior de la columna de la izquierda aparece la lista de entradas ordenada
alfabéticamente, mientras que en el inferior se muestra la estructura de la entrada; a la
derecha, se encuentra la definición de la palabra con todas sus acepciones.
Figura 1: Ejemplo de búsqueda de la definición de una palabra en la segunda edición electrónica del
Diccionario de Uso del Español de María Moliner.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
3
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Desde cualquier palabra presente en la definición y que esté incluida en el diccionario
puede accederse, a través de un menú contextual que aparece al pulsar el botón derecho
del ratón – recordemos que el DUE en CD-ROM existe, por el momento, únicamente
para el sistema operativo Windows -, a la definición de otra, de modo que el diccionario
se convierte en un completo sistema hipertextual. También en el interior de una entrada
es posible realizar búsquedas, tal como se observa en la figura 2. En este caso, aparecen
señaladas las apariciones de “derecha”, el término buscado, dentro de la entrada
“mano”.
Figura 2: Ejemplo de búsqueda en el interior de la definición de una palabra en la segunda edición
electrónica del Diccionario de Uso del Español de María Moliner.
Sin embargo, como ya hemos señalado, una de las posibilidades más interesantes de los
diccionarios en CD-ROM es la localización de información en el interior de las
definiciones. La figura 3 recoge parcialmente el resultado de este tipo de búsqueda en el
caso de la palabra “mano”. En la columna de la izquierda encontramos todas las
palabras en cuya definición aparece “mano”, mientras que en la de la derecha podemos
ver señalada la palabra buscada en el interior de la definición de la preposición “a”.
Como el resultado puede ser muy amplio, el DUE incluye diferentes criterios de
selección, con el fin de efectuar la búsqueda únicamente en determinadas partes de la
entrada, como pueden ser los ejemplos, los sinónimos y las variantes, las notas de uso,
etc.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
4
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Figura 3: Ejemplo de búsqueda en las definiciones y de los criterios de selección en la segunda edición
electrónica del Diccionario de Uso del Español de María Moliner.
Las mayores posibilidades de encontrar información muy específica la ofrecen las
llamadas “búsquedas avanzadas”, que permiten combinar distintos criterios. En el caso
del DUE, como se muestra en la figura 4, es posible seleccionar entradas que contengan
determinados nombres científicos, buscar lemas que incluyan expresiones pluriverbales,
restringir la búsqueda a palabras que presenten una determinada marca relativa a la
etimología, la zona geográfica en la que se usa la palabra, la especialidad, la categoría
gramatical o el registro, buscar palabras que empiecen o terminen con una determinada
secuencia de letras o que contengan esta secuencia, e incluso palabras que sean formas
flexionadas de otras. Este tipo de búsquedas puede combinarse con las denominadas
“búsquedas complejas”, que permiten incorporar operadores lógicos como “y”, “o”,
“no”, así como combinaciones entre ellos. En la figura 4 se reproduce el cuadro de
diálogo que se usaría para encontrar palabras que simultáneamente tengan la marca de
registro “informal”, sean “nombres” y contengan “España” como marca de uso
geográfico.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
5
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Figura 4: Cuadro de diálogo de búsquedas avanzadas y de búsquedas complejas en la segunda edición
electrónica del Diccionario de Uso del Español de María Moliner.
Otra posibilidad interesante es el empleo de “comodines”, símbolos especiales que
substituyen a cualquier letra o a una serie de letras. Escribiendo, por ejemplo, “p?t?c?”
pueden hallarse todas las palabras que contienen “p”, “t” y “c” con una letra intercalada
entre cada consonante, como “petaca”; en cambio, la búsqueda de “*oide” daría como
resultado todas las palabras que acaban en “-oide”. Podríamos combinar esta búsqueda
con las posibilidades mencionadas anteriormente y obtener, por ejemplo, todas las
entradas que simultáneamente acaban en “-oide”, son adjetivos y tienen la marca de
registro “informal”, con los resultados que se observan en la figura 5.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
6
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Figura 5: Resultado de la búsqueda de adjetivos acabados en “-oide” y con la marca de registro
“informal” en la segunda edición electrónica del Diccionario de Uso del Español de María Moliner.
Es claro que un diccionario en papel no permite, en la práctica, obtener la información
que nos proporciona un diccionario en CD-ROM. Sin embargo, debe tenerse en cuenta
que si, como sucede a menudo, la edición electrónica reproduce fielmente la impresa,
accederemos siempre a datos procedentes de la misma fuente; es decir, que en el caso de
la búsqueda que ejemplificábamos más arriba, sólo hallaremos las palabras que en el
DUE contengan explícitamente las marcas “adjetivo” e “informal”, y no ninguna otra.
En el campo de la enseñanza del español se han publicado algunas experiencias sobre el
uso de diccionarios en CD-ROM que, aun estando principalmente orientadas a la
enseñanza a extranjeros, pueden proporcionar ideas útiles para la clase de lengua
materna (Capanaga, 1998; Carbó, 2001). Una relación de las obras lexicográficas
disponibles en CD-ROM se encuentra en las páginas dedicadas a la enseñanza de la
lengua en Secundaria de E. Larequi, y una reseña de algunas de ellas se presenta en
Pajares (1998).
2.1.2. DICCIONARIOS EN INTERNET
Si el diccionario en CD-ROM tiene como principal ventaja la flexibilidad en la
localización de información, seguramente el diccionario en Internet debe caracterizarse,
en primer lugar, por su accesibilidad. Torruella (2002) lleva a cabo un análisis de las
principales características de los diccionarios en línea, entre las que destacaríamos,
además, la facilidad de manejo, el carácter hipertextual, la posibilidad de consultar
simultáneamente más de un diccionario y, cuando así lo programan los responsables de
la obra, la actualización permanente.
No es tarea fácil realizar una presentación exhaustiva de los diccionarios de español que
se encuentran en la Red, precisamente debido al carácter dinámico de la misma. Nos
centraremos, por ello, en las obras lexicográficas en línea puestas a disposición del
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
7
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
público por instituciones oficiales y por editoriales, y dejaremos de lado los numerosos
diccionarios bilingües o multilingües, así como los glosarios especializados. El lector
interesado en encontrar información sobre este tipo de obras puede consultar páginas
especializadas como YourDictionary.com, ForeignWord.com, One Look Dictionaries o
reseñas como la de Bullón (2001).
Dos son quizás los diccionarios generales de la lengua más frecuentemente consultados
en Internet: el de la Real Academia Española y el Diccionario General de la Lengua
Española de Vox. El acceso al primero, en su vigésima segunda edición, puede
realizarse desde la página de la RAE; desde esta misma dirección se ofrece también la
posibilidad de añadir un práctico sistema de búsqueda directa a la barra de favoritos del
navegador. En la figura 6 se muestra la ventana de búsqueda y las primeras líneas de la
entrada correspondiente a la palabra “mano”. Es interesante destacar que situando el
ratón sobre una abreviatura o una marca puede leerse su significado, y que desde el
texto de una entrada es posible también consultar palabras relacionadas con ella.
Figura 6: Ventana de búsqueda y primeras líneas de la entrada correspondiente a “mano” en el
Diccionario de la Real Academia Española en línea.
El diccionario Vox es accesible tanto desde las páginas de la propia editorial como
desde un sitio específicamente dedicado a la consulta de diccionarios, en el que también
es posible consultar el Diccionario de Sinónimos y Antónimos de la Lengua Española y
los diccionarios bilingües de inglés, francés y catalán publicados por Vox.
Registrándose gratuitamente como usuario se pueden realizar búsquedas más complejas,
especificando por ejemplo las letras en las que empieza o termina una palabra, y acceder
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
8
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
también a las numerosas relaciones hipertextuales establecidas en el diccionario, así
como introducir formas verbales flexionadas para obtener el lema correspondiente. En
la Figura 7 se muestra la pantalla inicial de búsqueda de diccionarios.com.
Figura 7: Pantalla inicial de búsqueda en los diccionarios Vox en línea.
Existen, como indicábamos, otras obras lexicográficas en red. Los diccionarios de la
RAE reunidos en el Tesoro Lexicográfico de la Lengua Española anteriormente
comentado están también disponibles en Internet, y el Departamento de Español
Urgente (DEU) de la Agencia EFE ofrece en línea su Vademécum del Español Urgente.
Debe mencionarse también el exhaustivo sitio dedicado a diccionarios de variantes del
español elaborado por J.R. Morala en la Universidad de León. Referencias sobre otros
diccionarios se encuentran en el citado trabajo de Torruella (2002), en Gelpí (1999) o en
índices especializados en lengua española como El Oteador del Centro Virtual
Cervantes (CVC).
Aunque no se trate propiamente de un diccionario convencional, podemos consultar
actualmente en Internet de una versión española de WordNet – accesible desde las
páginas de demostraciones del Centre de Lingüística i Computació (CLiC) de la
Universidad de Barcelona y del Centre de Tecnologies i Aplicacions del Llenguatge i la
Parla (TALP) de la Universidad Politécnica de Cataluña -, un recurso léxico concebido
como una red semántica en el que las palabras se ordenan y clasifican por su
significado. Por ejemplo, la figura 8 muestran los hipónimos de “coche” que aparecen
en WordNet, mientras que en la figura 9 se recogen sus hiperónimos y en la 10 los
merónimos de “coche” que corresponden a la relación “partes de”.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
9
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Fig. 8: Hipónimos de “coche” recogidos en la versión castellana de WordNet accesible desde las páginas
del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
10
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Fig. 9: Hiperónimos de “coche” recogidos en la versión castellana de WordNet accesible desde las
páginas del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
11
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Fig. 10: Merónimos (“partes de”) de “coche” recogidos en la versión castellana de WordNet accesible
desde las páginas del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona.
2.2.- Corpus textuales y corpus orales
Junto con los diccionarios, los corpus constituyen un recurso básico para el estudio de la
lengua. Los hemos definido ya como colecciones estructuradas de textos, que pueden
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
12
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
proceder de la lengua escrita o de transcripciones de la lengua hablada. En este último
caso, también deberían formar parte del corpus las grabaciones realizadas por los
investigadores que lo han recogido, ya que así es posible acceder a información que, de
otro modo, no se refleja adecuadamente en una representación ortográfica.
El estudio de la lengua mediante corpus y las técnicas para su recopilación y
explotación constituyen hoy en día una rama muy activa de las ciencias del lenguaje,
denominada “Lingüística de corpus”. Aunque no es posible realizar aquí una
presentación detallada de la disciplina – remitimos al lector interesado a trabajos como
los de Biber et al. (1998), Garside et al. (1997), Habert et al. (1997), Kennedy (1998),
McEnery y Wilson (1996), Rafel – Soler (2001) o Stubbs (1996) -, mencionaremos que
en el proceso de diseño de un corpus suelen tenerse en cuenta elementos como la
finalidad del corpus, sus límites temporales, geográficos o lingüísticos, la proporción de
los diversos tipos de textos que se incorporan, el tamaño de la muestra de cada tipo de
texto y, como consecuencia de todos estos criterios, el grado de representatividad del
corpus (Torruella – Llisterri 1999; Moreno, 1999).
Un segundo aspecto importante es el procedimiento de recogida de los materiales, ya
sean textos procedentes de Internet o escaneados de fuentes impresas y procesados con
un sistema de reconocimiento óptico de caracteres (OCR) para convertirlos en
documentos en formato textual. Si se trata de un corpus oral, es preciso realizar también
una transcripción ortográfica de las grabaciones realizadas, estableciendo para ello una
serie de convenciones, de modo que el corpus final sea coherente.
En tercer lugar, un corpus verdaderamente útil para la investigación contiene lo que se
denomina una “anotación”, o un conjunto de “etiquetas” relacionadas con el texto. Esta
anotación puede realizarse en todos los niveles del análisis lingüístico, y generalmente
se centra en el léxico, asignando a cada palabra un conjunto de códigos que describen
sus propiedades morfológicas – género, número, modo, tiempo, etc. – e indican a qué
parte de la oración pertenece. También es posible realizar una anotación sintáctica,
indicando los constituyentes de una oración y la función de cada uno. Existen
herramientas que permiten llevar a cabo de forma automática este tipo de anotaciones,
aunque se requiere, en última instancia, la revisión final por parte de un lingüista. En la
figuras 11 y 12 se muestran los resultados de la anotación morfológica y sintáctica
automáticas de una frase simple, obtenidas mediante las herramientas disponibles en las
páginas del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP) de la
Universidad Politécnica de Cataluña. Puede observarse en la figura 11 que un paso
previo es la llamada “lematización”, es decir, la búsqueda de la palabra en su forma
básica: “gato” es el lema de “gatos” y “comer” el de “comen”; también se aprecia aquí
que la información morfológica está codificada: así, por ejemplo, “NCMP” corresponde
a “nombre común masculino plural”. Utilizando recursos como WordNet, mencionado
anteriormente, es factible llevar a cabo la anotación semántica de un corpus.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
13
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Figura 11: Anotación morfológica automática de la frase “Los gatos sabios comen atunes frescos”
obtenida el línea con las herramientas del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla
(TALP) de la Universidad Politécnica de Cataluña.
Figura 12: Anotación sintáctica automática de la frase “Los gatos sabios comen pescados frescos”
obtenida en línea con las herramientas del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla
(TALP) de la Universidad Politécnica de Cataluña.
En el caso específico de los corpus consistentes en transcripciones de lengua hablada
(Leech et al., 1995; Pino – Sánchez, 1999), se emplean sistemas de anotación
especialmente pensados para reflejar los fenómenos propios del discurso oral o de la
conversación (Payrató, 1995); en otras ocasiones, las grabaciones originales se
transcriben fonéticamente tanto en el nivel segmental como en el suprasegmental,
recurriendo para ello a herramientas informáticas que permiten visualizar la onda sonora
y relacionarla con la transcripción (Llisterri, 1999).
Finalmente, a la hora de plantearse la creación de un corpus, es preciso no olvidar la
selección de las herramientas informáticas y de los formatos más adecuados para
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
14
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
almacenar los materiales y poder después recuperar fácilmente la información.
Consorcios internacionales como la Text Encoding Initiative (TEI) han definido con
todo detalle estos aspectos, proponiendo, por ejemplo, el uso del lenguaje SGML
(Standard Generalized Mark-up Language) – del que deriva el HTML en el que se
escriben las páginas web – para introducir en los textos las marcas que definen su
estructura (Arrarte, 1999); por ejemplo, corpus como el Corpus de Referencia del
Español Actual de la Real Academia española están codificados utilizando este
lenguaje.
2.2.1.- CORPUS EN CD-ROM
No son especialmente abundantes los corpus sincrónicos en español fácilmente
accesibles en CD-ROM y concebidos inicialmente del modo en que hemos definido un
corpus. Podríamos citar, por ejemplo, el Macrocorpus de la norma lingüística culta de
las principales ciudades del mundo hispánico (MC-NLCH) que distribuye la
Universidad de Las Palmas de Gran Canaria. El MC-NLCH ofrece la transcripción
ortográfica de ochenta y cuatro horas de grabación, en las que se recogen entrevistas
realizadas en nueve capitales americanas y tres ciudades españolas; para cada ciudad se
incluyen catorce entrevistas individuales de aproximadamente media hora, cuyas
transcripciones se encuentran en documentos de Word, con y sin codificación
estructural. Existe también el corpus CUMBRE (Sánchez et al., 1995), una versión
reducida del cual se ofrece gratuitamente en CD-ROM a los compradores del Gran
Diccionario de Uso del Español Actual de la editorial SGEL.
Puede mencionarse también en este apartado una base de datos léxica, LEXESP, editada
en CD-ROM por la Universidad de Barcelona (Sebastián et al., 2000) y basada en el
corpus del mismo nombre, que permite búsquedas de apariciones de palabras y de
categorías de palabras en contexto.
No debe olvidarse, sin embargo, que cualquier CD-ROM con textos puede constituir un
corpus de datos para el estudio de la lengua. En este sentido, los anuarios de los
periódicos, que suelen encontrarse en este formato como en el caso de El País en CDROM, son una excelente herramienta.
2.2.2.- CORPUS EN INTERNET
Algunos corpus en español pueden obtenerse a través de Internet para trabajar con ellos
en los propios ordenadores personales – el Corpus Oral de Referencia del Español
Contemporáneo, el Corpus de Referencia de la Lengua Española en Argentina y el
Corpus de Referencia de la Lengua Española en Chile del Laboratorio de Lingüística
Informática de la Universidad Autónoma de Madrid, o parte del corpus LEXESP
accesible desde la Universidad de Oviedo -, mientras que otros pueden únicamente
consultarse. Entre los segundos, se encuentran, por ejemplo, los corpus LEXESP y
Pirápides del Centre de Lingüística i Computació (CliC) de la Universidad de
Barcelona. Centraremos nuestra atención, a modo de ejemplo, en el Corpus de
Referencia del Español Actual (CREA) de la Real Academia Española, accesible desde
las páginas en Internet de esta entidad.
La consulta del CREA se realiza, al igual que en los diccionarios, a través de una
ventana como la que se muestra en la figura 13. En ella puede seleccionarse, además, el
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
15
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
autor de los textos en los que se buscará la palabra, la obra, el medio, el país de
procedencia de las obras y los temas, así como también es posible delimitar la búsqueda
a un determinado período en el tiempo.
Figura 13: Ventana de consulta del CREA (Corpus de Referencia del Español Actual) de la Real
Academia Española.
La primera información que se obtiene es una estadística de la aparición de la palabra
buscada en el corpus. En la figura 14 se reproducen los resultados para la forma verbal
“hubiere”: en la primera columna se ordena su frecuencia de aparición por años, en la
segunda por países y en la tercera por campos temáticos.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
16
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Figura 14: Estadística de la aparición de la forma verbal “hubiere” en el CREA (Corpus de Referencia del
Español Actual) de la Real Academia Española.
A continuación se podría solicitar un lista de todos los documentos en lo que aparece la
palabra buscada, ordenados en función de los criterios de selección utilizados al
principio, con el resultado que se recoge parcialmente en la figura 15.
Figura 15: Listado parcial de documentos en los que aparece la forma verbal “hubiere” en el CREA
(Corpus de Referencia del Español Actual) de la Real Academia Española.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
17
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
El último paso (figura 16) sería la consulta de los párrafos que contienen la palabra
objeto de interés, ordenándolos, como en los casos anteriores, en función del año, del
autor, de los países de procedencia de los textos o de los temas.
Figura 16: Muestra de un párrafo en el que aparece la forma verbal “hubiere” en el CREA (Corpus de
Referencia del Español Actual) de la Real Academia Española.
Se hallan también en la red otros materiales más específicos, como la Base de Datos
Sintácticos del Español Actual (BDS) de la Universidad de Santiago de Compostela,
centrada en los aspectos sintácticos de la estructura de la oración, o los resultados del
proyecto Varilex, un estudio sobre la variación léxica en los países hispanohablantes,
coordinado por la Universidad de Tokio, que han sido adaptados para su consulta en la
red por la empresa ecuatoriana Signum. Igualmente cabe destacar el Archivo
Gramatical de Salvador Fernández Ramírez (AGLE), accesible desde el Centro Virtual
Cervantes; en el Archivo, realizado bajo la dirección científica de I. Bosque, se
encuentran los ejemplos reunidos por Fernández Ramírez adecuadamente clasificados y
comentados.
Al margen de los materiales específicamente considerados como tal, la red constituye en
sí misma un enorme corpus. Los medios de comunicación, por ejemplo, proporcionan
un valiosísimo recurso para el estudio del uso lingüístico y pueden constituir la base de
un corpus de trabajo (Vera, 1998; Garrido, 2002). Con herramientas de trabajo sencillas
como un navegador y un procesador de texto, y utilizando las opciones de “copiar” y
“pegar” es factible construir un corpus para uso personal, cuyo tamaño dependerá del
tiempo utilizado en localizar y seleccionar los materiales y en dar un formato final
adecuado a los archivos de texto, homogeneizando el tipo de letra, el tamaño, los
márgenes, etc. Otra alternativa es el empleo de los programas que permiten la descarga
de sitios web; sin embargo, los documentos se guardan en este caso con todas las
marcas de HTLM – que son necesarias para visualizarlos en un navegador, pero no para
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
18
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
trabajar con ellos con un procesador de textos – y, por otra parte, los portales de los
periódicos presentan una complejidad de diseño que no siempre hace factible esta
alternativa si no se cuenta con los conocimientos adecuados. Tampoco debe olvidarse la
cuestión de los derechos de propiedad intelectual, por lo que antes de iniciar un
proyecto de recopilación de corpus a gran escala es conveniente asesorarse sobre este
aspecto.
Un corpus oral puede crearse a partir de las numerosas radios que emiten en Internet o
que mantienen archivos sonoros de sus programas. Muchas de ellas no organizan sus
fonotecas de modo que los documentos sonoros puedan guardarse en el propio
ordenador personal – sí lo hace, por ejemplo, Radio InterEconomía -, pero siempre
existe la alternativa de conectar mediante un cable la salida de sonido del ordenador a la
entrada de una grabadora de casetes y posteriormente digitalizar los fragmentos que
interesen de las cintas. Utilizando buscadores es posible localizar documentos sonoros
que pueden descargarse, como por ejemplo algunas conferencias o entrevistas a
Vázquez Montalbán desde la página de vespino.net, fragmentos de “La rosa de los
vientos”, recopilados en el portal dedicado a este programa radiofónico de Onda Cero o
programas de radio relacionados con Rayados, el equipo de fútbol de la ciudad de
Monterrey en México.
2.2.3.- HERRAMIENTAS PARA EL TRATAMIENTO DE CORPUS
Una vez recogidos y organizados los textos que constituirán un corpus, es útil conocer
algunas herramientas informáticas que ayudan a obtener de él un mejor provecho. Las
más difundidas son los programas que se denominan a veces “concordancieros”,
justamente porque permiten obtener concordancias, es decir, listados de palabras en
contexto, que pueden ordenarse según la palabra que precede o sigue a la que nos
interesa, de modo que se puedan estudiar de un modo sistemático los entornos en los
que aparece en el corpus. Estos mismos programas facilitan también la creación de
listados de todas las palabras del corpus por orden alfabético directo e inverso o, lo que
es más interesante, en función de su frecuencia de aparición. Recogen información útil
para el análisis de textos utilizando este tipo de herramientas manuales como
Barnbrook (1996) y Hockey (2001) o trabajos más específicos como Sassi (1999), en el
que se presenta el programa de concordancias DBT del Instituto de Lingüística
Computacional de Pisa, incluido en el CD-ROM que acompaña la edición del Quijote
del Instituto Cervantes publicada por Crítica.
Dos de los programas de concordancias más conocidos son WordSmith, comercializado
por Oxford University Press, y MonoConc, distribuido por Athelstan, del que existe una
versión básica gratuita para Macintosh (Reppen, 2001). Desde las páginas del Summer
Institute of Linguistics (SIL) y de la lista Linguist se puede acceder a otras herramientas
para el tratamiento de corpus y el análisis textual, algunas de ellas de libre distribución.
Las figuras 17 y 18 reproducen las concordancias de la palabra “bueno” en una de las
entrevistas correspondientes a la ciudad de Sevilla del Macrocorpus de la norma
lingüística culta de las principales ciudades del mundo hispánico anteriormente
mencionado, obtenidas mediante la versión gratuita de MonoConc. El listado contiene
todas las apariciones de “bueno”, en la figura 18 ordenadas según la primera palabra
que aparece a la derecha y en la figura 17 según la primera palabra que aparece a la
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
19
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
izquierda; es habitual también disponer de la posibilidad de ordenar la palabra buscada
según la penúltima o antepenúltima palabra que tiene en su contexto derecho o
izquierdo.
Fig. 17 Concordancias de la palabra “bueno” ordenadas según la primera palabra que aparece a la derecha
en una entrevista del Macrocorpus de la norma lingüística culta de las principales ciudades del mundo
hispánico obtenidas con el programa MonoConc (versión gratuita para Macintosh).
Fig. 18 Concordancias de la palabra “bueno” ordenadas según la primera palabra que aparece a la
izquierda en una entrevista del Macrocorpus de la norma lingüística culta de las principales ciudades del
mundo hispánico obtenidas con el programa MonoConc (versión gratuita para Macintosh).
La información sobre los contextos de aparición más frecuentes de la palabra buscada se
sintetiza en las llamadas “colocaciones”, tal como se muestra en la figura 19. En ellas se
observa cuáles son las palabras que más frecuentemente preceden y anteceden a
“bueno”, de lo que pueden deducirse algunas especificidades de uso de este conector en
la lengua oral. Debe aclararse aquí que “Enc” es la abreviatura usada en el corpus para
referirse a las intervenciones del encuestador; tal como puede verse, es frecuente que
éste inicie sus preguntas con “bueno”; la elevada aparición de secuencias “Sí, bueno” es
también propia de las preguntas y de las respuestas en este tipo de corpus.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
20
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Fig. 19 Colocaciones de la palabra “bueno” en una entrevista del Macrocorpus de la norma lingüística
culta de las principales ciudades del mundo hispánico obtenidas con el programa MonoConc (versión
gratuita para Macintosh).
Podrían, por ejemplo, compararse estos datos con los de la palabra “bien”, que se
muestran en la figura 20, y con ello se observarían las diferencias y las similitudes de
comportamiento entre ambos conectores.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
21
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Fig. 20 Colocaciones de la palabra “bien” en una entrevista del Macrocorpus de la norma lingüística
culta de las principales ciudades del mundo hispánico obtenidas con el programa MonoConc (versión
gratuita para Macintosh).
Es también posible acceder a concordancias y colocaciones desde la web. Las páginas
de consulta del CREA de la Real Academia Española ofrecen esta información, tal
como se muestra, para la forma verbal “hubiere”, en las figuras 21 y 22.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
22
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Figura 21: Muestra de concordancias de la forma verbal “hubiere” en el CREA (Corpus de Referencia del
Español Actual) de la Real Academia Española.
Figura 22: Muestra de colocaciones – o agrupaciones - de la forma verbal “hubiere” en el CREA (Corpus
de Referencia del Español Actual) de la Real Academia Española.
También desde las páginas de la Universidad de Göteborg se accede a concordancias en
español, basadas en dos corpus creados por D. Mighetto (SOL – Spanish On Line) y en
el Corpus Oral de Referencia del Español Contemporáneo de la Universidad Autónoma
de Madrid; en este caso, puede seleccionarse el corpus sobre el que se efectúan las
búsquedas, el tamaño del contexto y la preponderancia del contexto a la izquierda o a la
derecha.
Parece evidente que este tipo de herramientas asociadas a corpus textuales
representativos constituyen un poderoso método de investigación, así como un recurso
didáctico útil en la enseñanza de la lengua. Existe una abundante bibliografía sobre el
uso de recursos lingüísticos y programas de concordancias en el contexto docente
(Battaner – López (Eds.), 2000; Aston (Ed.), 2001; Tribble – Barlow (Eds.), 2001) y
páginas monográficas en la web como la de T. Johns de la Universidad de Birmingham.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
23
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Aunque se centren predominantemente en la enseñanza del inglés como lengua
extranjera (Ghadessy, et al., 2001; McCullough, 2001) y, en algún caso, en el español,
también desde la perspectiva de su enseñanza a extranjeros (Córdoba, 2001), las ideas
que allí se exponen son, en muchas ocasiones, relativamente fáciles de adaptar a la
enseñanza del español como primera lengua, campo en el que empiezan a aparecer
trabajos como el de Martín (2001) sobre el uso de corpus en línea.
3.- Otros recursos en Internet
Concluiremos este trabajo comentando sucintamente otros recursos relevantes para el
estudio de la lengua española que pueden consultarse en Internet, refiriéndonos también
a listas de difusión de información y a foros de discusión a los que puede acceder el
profesor. Debemos señalar también aquí que, además de las páginas generales sobre la
lengua española como las del Centro Virtual Cervantes o La Página del Idioma Español
del periodista R. Soca, las dedicadas a la enseñanza del español como lengua extranjera
constituyen también una interesante fuente de recursos (Arrarte – Sánchez de
Villapadierna, 2001; Cruz, 2001 a, b).
3.1.- Materiales sobre lingüística y lengua españolas
Evidentemente, dadas las características de la red, es del todo imposible presentar un
listado completo de los materiales que por ella circulan sobre lingüística y lengua
españolas. Por otra parte, cualquier lista de direcciones de páginas que
proporcionáramos quedaría pronto inevitablemente obsoleta. Por ello, nos limitaremos a
mencionar los tipos de recursos que nos parecen más útiles y a proporcionar algún
ejemplo de cada uno de ellos.
En Internet podemos emplear correctores ortográficos que permiten introducir una
palabra o una frase y verificar su ortografía, como el que ofrece desde sus páginas la
empresa Signum, que también facilita un silabificador, un guionizador y el denominado
“motor de semejanza fonética”, que busca palabras con una pronunciación similar a la
de la introducida en su forma ortográfica convencional.
Pueden hallarse también páginas que proporcionan la conjugación de verbos, por
ejemplo en el sitio de la Real Academia Española, en el de Signum, en las páginas del
Grupo de Estructura de Datos y Lingüística Computacional (GEDLC) de la Universidad
de las Palmas de Gran Canaria o en las de Daniel M. Germán, de la Universidad de
Waterloo. Igualmente disponemos en Internet de herramientas que permiten obtener
lemas a partir de formas flexionadas o flexionar palabras – por ejemplo en las
demostraciones del Centre de Llenguatge i Computació (CLiC) de la Universidat de
Barcelona o en el sitio revisado.com de la empresa Daedalus -, incluyendo, en
algunos casos como en las herramientas desarrolladas por el GEDLC, prefijos y sufijos.
También en las secciones dedicadas a demostraciones en los sitios web de CLiC y del
Centre de Tecnologia i Aplicacions del Llenguatge i la Parla (TALP) de la Universidad
Politécnica de Cataluña pueden utilizarse analizadores sintácticos en línea, con
resultados como los que se han mostrado en la figura12.
Estas herramientas, aunque no perfectas, tal vez ayuden a los estudiantes - al igual que
la consulta de diccionarios y de corpus o el uso de concordancias -, a descubrir de forma
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
24
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
interactiva y en un medio que les es familiar, aspectos ortográficos, morfológicos y
sintácticos de la lengua.
La red es también rica en información, pues desde ella se accede a publicaciones en
línea o a bibliografías que profesores e investigadores difunden por este medio. La
consulta de buen un buscador mediante palabras clave ayuda a localizarlas con relativa
facilidad. Puede obtenerse igualmente información sobre asociaciones profesionales
como la Sociedad Española de Didáctica de la Lengua y la Literatura (SEDLL), la
Sociedad Española de Lingüística (SEL) o la Asociación Internacional de Hispanistas
(AIH), por citar únicamente algunas. También existen, como es lógico, revistas y
colecciones como los Estudios de Lingüística Española (ELiEs), Círculo de Lingüística
Aplicada a la Comunicación (CLAC), Tonos Digital, Cuadernos Cervantes de la
Lengua Española, Especulo y otras muchas, tanto en España como en Hispanoamérica.
Finalmente, en el contexto que ahora nos concierne, no faltan las páginas que ofrecen
materiales útiles para la enseñanza de la lengua y la literatura españolas en la ESO y en
el Bachillerato como, por ejemplo, las de E. Larequi o de L. Canós.
3.2.- Listas de difusión de información y foros de
discusión
Otra fuente de información son las listas de distribución y los foros de discusión sobre
la lengua española. Entre las primeras, mencionaremos Infoling, coordinada por el
Laboratorio de Lingüística Informática (LaLI) de la Universidad Autónoma de
Barcelona, que distribuye casi diariamente a través del correo electrónico información
sobre lingüística española referente a congresos, novedades editoriales, cursos,
proyectos, tesis y ofertas de trabajo. Hispania es una lista dedicada a cuestiones más
generales sobre la lengua española, en la que pueden encontrarse, por ejemplo, noticias
sobre los artículos dedicados al español en los medios de comunicación, junto con
discusiones e información sobre diversas facetas, tanto internas como externas, de la
lengua.
Apuntes constituye, en cambio, un foro de discusión sobre normativa y uso del español
promovido desde 1997 por el Departamento de Español Urgente (DEU) de la Agencia
EFE; en él se pueden leer las respuestas a las múltiples consultas realizadas por los
participantes, así como debates sobre todos aquellos temas que afectan al uso del
español en los medios de comunicación. Finalmente, el Foro del Español de Hoy y
Mañana y el Foro del Hispanista recogen en las páginas web del Centro Virtual
Cervantes una amplia variedad de informaciones y de consultas en el ámbito de la
lengua, la literatura y la filología hispánicas.
4.- Conclusión
En este trabajo se ha pretendido mostrar que existen una serie de recursos tanto en CDROM como en Internet que están en la actualidad a disposición de profesores y de
alumnos. No todos tienen, seguramente, una aplicación directa e inmediata en el aula
pero, en cualquier caso, constituyen herramientas que el profesor puede utilizar bien
para su propia investigación, bien para introducir en la clase nuevos métodos y nuevas
perspectivas. Las orientaciones ministeriales que citábamos al principio parece que
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
25
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
llevan inevitablemente por este camino. Sin embargo, más allá de la obligación
administrativa, creemos que el uso de tecnologías que para los estudiantes no son
nuevas a pesar de que los docentes sigamos denominándolas de este modo, no puede
sino redundar en una mayor motivación de los alumnos y en una formación más
actualizada y más rica de los profesores.
5.- Bibliografía
ARRARTE, G. (1999) "Normas y estándares para la codificación de textos y para la
ingeniería lingüística”, in BLECUA, J.M.- CLAVERÍA, G.- SÁNCHEZ, C.TORRUELLA, J. (Eds.) Filología e informática. Nuevas tecnologías en los estudios
filológicos. Barcelona: Seminario de Filología e Informática, Departamento de Filología
Española, Universidad Autónoma de Barcelona - Editorial Milenio. pp. 17-44.
ARRARTE, G.- SÁNCHEZ DE VILLAPADIERNA, J.I. (2001) Internet y la enseñanza
del español. Madrid: Arco/Libros (Cuadernos de Didáctica del Español L/E).
ASTON, G. (Ed.) (2001) Learning with corpora. Bologna: CLUEB (Biblioteca della
Scuola superiore di linguemoderne per interpreti e traduttori, Forlì, 29) - Houston, TX;
Athelstan.
BARNBROOK, G. (1996) Language and Computers. A Practical Introduction to the
Computer Analysis of Language. Edinburgh: Edinburgh University Press (Edinburgh
Textbooks in Empirical Linguistics).
BATTANER, M.P.- LÓPEZ, C. (Eds.) (2000) VI Jornada de Corpus Lingüístics.
Corpus lingüístics i ensenyament de llengües. Barcelona: Institut Universitari de
Lingüística Aplicada, Universitat Pompeu Fabra.
BIBER, D.- CONRAD, S.- REPPEN, R. (1998) Corpus Linguistics. Investigating
Language Structure and Use. Cambridge: Cambridge University Press (Cambridge
Approaches to Linguistics).
Biblioteca Multimedia Santillana. Edición en CD-ROM. Madrid: Santillana, 2000.
BLECUA PERDICES, J.M. (2001) "Lengua española y tecnologías", Archipiélago 48:
100-197.
BLECUA PERDICES, J.M. (2002) “Nuevos lenguajes de la tecnología para el futuro de
la educación”, in Ministerio de Educación, Cultura y Deporte. En_clave de Calid@d: la
dirección escolar. Madrid: Instituto Superior de Formación del Profesorado.
BULLÓN, P. (2001) “Diccionarios online o cómo encontrar (y perder) las palabras”,
PC World 178 (julio-agosto): 227-235.
CAPANAGA, P. (1998) "Le enciclopedie e i dizionari elettronici in spagnolo:
indicazioni didattiche", in ACCIETTO, T.- ZORZI, D. (Eds.) (1998) Nuove tecnologie e
didattica delle lingue. Bologna: CLUEB, Cooperativa Libraria Universitaria Editrice
Bologna. (Centro Linguistico Interfacoltà, Sezione del Centro di Coordinamento Forlì). pp. 87-94.
CARBÓ, C. (2001) "Aplicaciones didácticas de la edición en CD-ROM del DRAE: la
búsqueda por anagrama, por palabra al azar, por familia de palabras y con el diccionario
inverso", EsEspasa, Revista de Profesores, Metodología. 27 de septiembre de 2001.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
26
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
http://www.esespasa.com/esespasa/sta/html/es/revistaprofeso
res/investigacion/metodologiadidactica/historico/metod_01_2
7_09.zip
CERVANTES, M. de. Don Quijote de la Mancha. Edición del Instituto Cervantes
dirigida por Francisco Rico. Barcelona: Crítica (Biblioteca Clásica, 50), 1998.
Clave. Diccionario de uso del español actual. Edición en CD-ROM. Madrid: Ediciones
SM, 1997.
CÓRDOBA RODRÍGUEZ, F. (2001) "El uso de los corpus lingüísticos en la enseñanza
del español", Boletín de la Asociación de Profesores de Español de la República Checa,
2001.
http://www.upol.cz/res/ssup/ape/boletin2001/cordoba.htm
CRUZ PIÑOL, M. (2001 a) El español a través de Internet. Aprendizaje con un nuevo
lenguaje. Tesis doctoral. Secció de Llengua Espanyola, Departament de Filologia
Hispànica, Universitat de Barcelona.
http://perso.wanadoo.es/mar_cruz/TESIS/BIBLIOGRAF.HTML
CRUZ PIÑOL, M. (2001 b) "Recursos en Internet para la elaboración de actividades.
Modelos de uso de la lengua española" Carabela 50: 163-176.
http://www.ub.es/filhis/culturele/50MCruzP.html
Diccionario de sinónimos. Edición en CD-ROM. Barcelona: Ediciones Nauta, 2002.
Diccionario del estudiante de la lengua española. Edición en CD-ROM. Madrid:
Larousse, 1999.
Diccionario escolar de la lengua española. Edición en CD-ROM. Barcelona. VicensVives, 1998.
Diccionario escolar de la lengua española. Edición en CD-ROM. León: Everest, 1997.
Diccionario General de la Lengua Española Vox. Edición en CD-ROM. Barcelona:
Biblograf, 1997.
Diccionario interactivo Océano de sinónimos. Edición en CD-ROM. Barcelona:
Océano Multimedia, 1999.
E-diccion@rios Espasa. Edición en CD-ROM. Madrid: Espasa, 2000.
El País en CD-ROM. Madrid: Diario El País SL, 2001.
GARRIDO ALMIÑANA, J.M. (2002) “El uso de la prensa electrónica en la
investigación lingüística", Filología en Internet. Curso de Doctorado del Departamento
de Filología Española, Universitat Autònoma de Barcelona.
http://seneca.uab.es/gould/cursoweb/sesiones/Ses4_tot/Princ
ipal.html
GARSIDE, R.- LEECH, G.- McENERY, T. (Eds.) (1997) Corpus Annotation:
Linguistic Information from Computer Text Corpora. Harlow: Addison Wesley
Longman.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
27
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
GELPÍ, C. (1999) “Diccionarios del español en Internet”, Biblio 3W. Revista
Bigliográfica de Geografía y Ciencias Sociales (Universidad de Barcelona) 189.
http://www.ub.es/geocrit/b3w-189.htm
GHADESSY, M.- HENRY, A.- ROSEBERRY, R.L. (2001) Small Corpus Studies and
ELT. Amsterdam: John Benjamins (Studies in Corpus Linguistics, 5).
Gran Diccionario de la Lengua Española. Edición en CD-ROM. Barcelona: Larousse Planeta, 1996.
HABERT, B.- NAZARENKO, A.- SALEM, A. (1997) Les linguistiques de corpus.
Paris: Armand Colin (U Linguistique).
HOCKEY, S. (2001) Electronic Texts in the Humanities. Principles and Practices.
Oxford: Oxford University Press.
KENNEDY, G. (1998) An Introduction to Corpus Linguistics. London: Longman
(Studies in Language and Linguistics).
LEECH, G.- MYERS, G.- THOMAS, J. (Eds.) (1995) Spoken English on Computer:
Transcription, Markup and Applications. Harlow: Longman.
Lengua castellana y literatura I y II. Real Decreto 3474/2000, de 29 de diciembre, por
el que se modifican el Real Decreto 1700/1991, de 29 de noviembre, por el que se
establece la estructura del Bachillerato, y el Real Decreto 1178/1992, de 2 de octubre,
por el que se establecen las enseñanzas mínimas del Bachillerato. Boletín Oficial del
Estado, 16 de enero de 2001.
http://www.mec.es/gabipren/documentos/realdecreto/bac_lenyl
it.pdf
LLISTERRI, J. (1999) “Transcripción, etiquetado y codificación de corpus orales", in
GÓMEZ GUINOVART, J.- LORENZO SUÁREZ, A.- PÉREZ GUERRA, J.ÁLVAREZ LUGRÍS, A. (Eds.) Panorama de la investigación en lingüística informática.
RESLA, Revista Española de Lingüística Aplicada, Volumen monográfico. pp. 53-82.
Macrocorpus de la norma lingüística culta de las principales ciudades del mundo
hispánico (MC-NLCH). Preparado por José Antonio Samper Padilla, Clara Eugenia
Hernández Cabrera y Magnolia Troya Déniz. Edición en CD-ROM. Las Palmas de Gran
Canaria: Servicio de Publicaciones de la Universidad de Las Palmas de Gran Canaria,
1998.
MARTÍN VEGAS, R.A. (2001) "La recreación y/o actualización de los temas de la
literatura clásica en las TIC", in Congreso de la Educación en Internet e Internet en la
Educación. Congreso virtual. 27 de noviembre - 12 de diciembre de 2001. Centro
Nacional de Información y Comunicación Educativa, Ministerio de Educación, Cultura
y Deporte.
http://congreso.cnice.mecd.es/area3/documentacion/comunicac
iones/html/3comunicacion03.html
McCULLOUGH, J.L. (2001) "Los usos de los córpora de textos en la enseñanza de
lenguas", in TRENCHS, M. (Ed.) Nuevas tecnologías para el autoaprendizaje y la
didáctica de lenguas. Lleida: Milenio. pp. 125-140.
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
28
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
McENERY, T.- WILSON, A. (1996) Corpus Linguistics. Edinburgh: Edinburgh
University Press (Edinburgh Textbooks in Empirical Linguistics)
http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/contents
.htm
Microsoft Bookshelf en español. Edición en Cd-ROM. Microsoft,1997.
MIGHETTO, D. (1998) “Notas sobre lingüística de corpus y técnicas de información
por Internet”, in DELBECQUE, N.- DE PAEPE, C. (Eds.) Estudios en honor del
profesor Josse de Kock. Leuven: Leuven University Press (Symbolae, Facultatis
Litterarum Lovaniensie, Series A, Vol. 25). pp. 383-393.
MOLINER, M. Diccionario de uso del español. Edición en CD-ROM. Segunda
Edición. Versión 2.0. Madrid: Gredos, 2001.
MORENO FERNÁNDEZ, F. (1999) "La formación de corpus-corpora de lengua
hablada", in DE LAS CUEVAS, J.- FASLA, D. (Eds.) Contribuciones al estudio de la
lingüística aplicada. Castellón: Asociación Española de Lingüística Aplicada. pp. 447464.
Multidiccionario Everest de la lengua española. Edición en CD-ROM. León: Everest,
1996.
PAJARES TOSCA, S. (1998) "Diccionarios de discurso en soporte digital", Cuadernos
Cervantes 20: 81-85.
PAYRATÓ, Ll. (1995) "Transcripción del discurso coloquial", in CORTÉS
RODRÍGUEZ, L. (Ed.) El español coloquial. Actas del I Simposio sobre Análisis del
Discurso Oral. Almería, 23-25 de noviembre de 1994. Almería: Universidad de
Almería, Servicio de Publicaciones. pp. 43-70.
PINO MORENO, M.- SÁNCHEZ SÁNCHEZ, M. (1999) "El subcorpus oral del banco
de datos CREA-CORDE (Real Academia Española): Procedimientos de transcripción y
codificación", Oralia 2: 83-138.
RAFEL i FONTANALS, J.- SOLER i BOU, J. (2001) “El processament de corpus. La
lingüística empírica", in MARTÍ, M.A. (Coord.) Les tecnologies del llenguatge.
Barcelona: Edicions de la Universitat Oberta de Catalunya (Manuals, 53). pp. 27-59.
REAL ACADEMIA ESPAÑOLA Diccionario de la lengua española. Edición en CDROM. Madrid: Espasa – Calpe, 1995.
REAL ACADEMIA ESPAÑOLA Nuevo Tesoro Lexicográfico de la Lengua Española.
Edición en DVD-ROM. Madrid: Espasa, 2001.
REPPEN, R. (2001) "Review of MonoConc Pro and WordSmith Tools", Language
Learning and Technology 5, 3: 32-36.
http://llt.msu.edu/vol5num3/review4/default.html
SÁNCHEZ, A. - SARMIENTO, R.- CANTOS, P.- SIMÓN, J. (1995) Cumbre. Corpus
lingüístico del español contemporáneo. Fundamentos, metodología y aplicaciones.
Madrid: SGEL.
SASSI, M. (1999) "Concordancias para filólogos: en pos de la simplicidad”, in
BLECUA, J.M.- CLAVERÍA, G.- SÁNCHEZ, C.- TORRUELLA, J. (Eds.) Filología e
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
29
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Seminario de
Filología e Informática, Departamento de Filología Española, Universidad Autónoma de
Barcelona - Editorial Milenio. pp. 165-182.
SEBASTIÁN GALLÉS, N.- CUETOS VEGA, F.- MARTÍ ANTONIN, M.A.CARREIRAS VALIÑA, M.F. (2000) LEXESP: Léxico informatizado del español.
Edición en CD-ROM. Barcelona: Edicions de la Universitat de Barcelona (Col.lecions
Vàries, 14).
STUBBS, M. (1996) Text and Corpus Analysis. Computer Assisted Studies of Language
and Culture. Oxford: Basil Blackwell (Language in Society).
TORRUELLA, J. (2002) "Los diccionarios en la Red", Filología en Internet. Curso de
Doctorado del Departamento de Filología Española, Universitat Autònoma de
Barcelona.
http://seneca.uab.es/gould/cursoweb/sesiones/Ses2_M3.htm
TORRUELLA, J.- LLISTERRI, J. (1999) “Diseño de corpus textuales y orales”, in
BLECUA, J.M.- CLAVERÍA, G.- SÁNCHEZ, C.- TORRUELLA, J. (Eds.) Filología e
informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Seminario de
Filología e Informática, Departamento de Filología Española, Universidad Autónoma de
Barcelona - Editorial Milenio. pp. 45-77.
TRIBBLE, C.- BARLOW, M. (Eds.) (2001) Using Corpora in Language Teaching and
Learning. Special Issue of Language Learning and Technology, 5. 3.
http://llt.msu.edu/vol5num3/default.html
VERA LUJÁN, A. (1998) "Los medios de comunicación como recurso lingüístico
(proyecto de acopio y distribución de materiales lingüísticos. Instituto Cervantes,
España)", in La lengua española y los medios de comunicación. México: Siglo XXI
Editores en coedición con la Secretaría de Educación Pública (México) y el Instituto
Cervantes (España). Vol 2. pp. 1331-1338.
http://cvc.cervantes.es/obref/congresos/zacatecas/tecnologi
as/proyectos/vera.htm
6.- Recursos en Internet citados en el texto
Apuntes, Lista del Español Urgente, Agencia EFE
http://majordomo.eunet.es/listserv/apuntes/
Archivo Gramatical de Salvador Fernández Ramírez (AGLE), Instituto Cervantes
http://cvc.cervantes.es/obref/agle/
Asociación Internacional de Hispanistas (AIH)
http://www.dartmouth.edu/~aih/
Base de Datos Sintácticos del Español Actual (BDS), Universidad de Santiago de
Compostela http://www.bds.usc.es/
Canós, L., Esp@ñol-e, Español electrónico: proyecto para Lengua y Literatura de 3º de
ESO, Departament de Castellà, IES Francesc Ribalta
http://inicia.es/de/iesribalta/html/departaments/castella/h
tml/espanyol-e.html
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
30
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
Centre de Llenguatge i Computació (CLiC), Universidad de Barcelona
http://clic.fil.ub.es/
Centre de Tecnologia i Aplicacions del Llenguatge i la Parla (TALP), Universidad
Politécnica de Cataluña http://www.talp.upc.es/
Centro Virtual Cervantes, Instituto Cervantes http://cvc.cervantes.es/
Círculo de Lingüística Aplicada a la Comunicación (CLAC), Universidad Complutense
de Madrid http://www.ucm.es/info/circulo/
CompJugador, Daniel M. Germán, Universidad de Waterloo
http://csgrs6k1.uwaterloo.ca/~dmg/lando/verbos/conjugador.html
Corpus de Referencia del Español Actual (CREA), Real Academia Española
http://cronos.rae.es/creanet.html
Cuadernos Cervantes de la Lengua Española
http://www.cuadernoscervantes.com/
Data-driven Learning Page, T. Johns, Universidad de Birmigham
http://web.bham.ac.uk/johnstf/timconc.htm
Departamento de Español Urgente (DEU), Agencia EFE
http://www.efe.es/esurgente/lenguaes/
Diccionarios de variantes del español, J.R. Morala, Universidad de León
http://www3.unileon.es/dp/dfh/jmr/dicci/0000.htm
Diccionarios y correctores ortográficos, Lengua en secundaria, A.M. Larequi García
http://www.terra.es/personal/elg00001/programa/prog-dic.htm
Diccionarios.com, Vox http://www.diccionarios.com
Especulo http://www.ucm.es/info/especulo/
Estudios de Lingüística Española (ELiEs) http://elies.rediris.es/
ForeignWord.com http://www.foreignword.com/
Foro del Español de Hoy y Mañana, Centro Virtual Cervantes
http://cvc.cervantes.es/foros/
Foro del Hispanista, Centro Virtual Cervantes
http://cvc.cervantes.es/foros/
Grupo de Estructura de Datos y Lingüística Computacional (GEDLC), Universidad de
Las Palmas de Gran Canaria http://www.gedlc.ulpgc.es/
Hispania, Foro sobre la lengua española
http://www.rediris.es/list/info/hispania.es.html
Infoling, Lista de distribución de lingüística española
http://elies.rediris.es/infoling/
La Página del Idioma Español http://www.el-castellano.com/
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
31
Joaquim Llisterri, Universitat Autònoma de Barcelona
Nuevas tecnologías y enseñanza de la lengua española
http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf
La Rosa de los Vientos http://rosavientos,host.sk/
Laboratorio de Lingüística Informática, Universidad Autónoma de Madrid
http://www.lllf.uam.es/
Larequi García, E., Materiales Curriculares, Lengua y Literatura Españolas
http://www.lenguaensecundaria.com/
LEXESP, Universidad de Oviedo
http://www.uniovi.es/UniOvi/Apartados/Departamento/Psicolog
ia/metodos/soft/corpus/
Linguist List http://www.linguistlist.org/
Manuel Vázquez Montalbán, Vespino.net http://www.vespino.net/mvm/
MonoConc, Athelstan http://www.athel.com/mono.html
One Look Dictionaries http://www.onelook.com/
Radio InterEconomía http://www.intereconomia.com/
Rayados, Club de Fútbol de Monterrey http://www.rayados-mty.com/
Real Academia Española http://www.rae.es/
Revisado.com, Daedalus http://www.revisado.com/
Signum http://www.lenguaje.com/
Sociedad Española de Didáctica de la Lengua y la Literatura (SEDLL)
http://sedll.org/
Sociedad Española de Lingüística (SEL) http://www.uned.es/sel/
SOL – Spanish On Line, Universidad de Göteborg
http://spraakdata.gu.se/lb/konk/rom2/
Summer Institute of Linguistics (SIL) http://www.sil.org/
Text Encoding Initiative (TEI) http://www.tei-c.org/
Tonos Digital, Universidad de Murcia http://www.um.es/tonosdigital/
Varilex en Red, Signum
http://www.lenguaje.com/herramientas/varilex/varilex.asp
WordSmith, Mike Scott, Universidad de Liverpool
http://www.liv.ac.uk/~ms2928/wordsmith/index.htm
YourDictionary.com http://www.yourdictionary.com/
Curso de Formación del Profesorado de Enseñanza Secundaria
“Conocimiento de la lengua española y estudios superiores”
Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001
32
Descargar