Recursos lingüísticos y terminológicos en Internet

Anuncio
M ÁS TE R E S P AÑOL/ING LÉ S P AR A FINE S E S P E C ÍFIC O S
“E spañol de la ciencia y la tecnología”
Tema 5
R ecurs os ling üís ticos y terminológ icos
en Internet
Grupo E P A
M ÁS TE R E S P AÑO L/ING LÉ S P AR A FINE S E S P E C ÍFIC O S
“E s pañol de la ciencia y la tecnología”
Tema 5:
R ecursos lingüísticos y terminológicos en Internet
D ra. Isabel S antamaría P érez
mi.s antamaria@ ua.es
D r. Jos é Joaquín M artínez E gido
jj.martinez@ ua.es
• “La web es un mundo de aplicaciones
textuales… hay un gran conjunto de imágenes e
incontables archivos de audio, pero el texto
predomina no sólo en cantidad, sino en
utilización… ” (M illán, 2001: pág. 35-36)
OB JETIVOS
• C ons ultar y localizar información de interés
lingüístico y terminológico.
• Localizar,
ges tionar
y
evaluar
especializados de una materia.
textos
• C ons tituir un corpus textual especializado, útil
para la investigación lingüística y terminológica.
• P resentar distintos recursos de
lingüística y terminológica en Internet.
consulta
C ONTENIDOS
• Internet como fuente de información especializada:
obtención de corpus
• Herramientas lingüísticas para el tratamiento de textos:
Antconc
• Internet como almacén de recursos lingüísticos y
terminológicos
¿ Qué es Internet?
• Internet es la red de redes que permite la
interconexión de redes y ordenadores de
todo
tipo
mediante
ruteadores
(dispositivos de conexión y distribución de
datos en una red).
¿ Qué s e puede hacer en
Internet?
•
•
•
•
•
•
•
•
•
E nviar mensajes
O pinar sobre temas
‘C hatear’
C onsultar catálogos de bibliotecas
Visitar museos
C onseguir información
O frecer información
C onseguir programas informáticos
C omprar/vender, etc.
Internet para el ling üis ta
• Fuente de comunicación (listas de discusión,
correo electrónico, foros )
• Intercambio de datos (bases de datos,
publicaciones, documentación, corpus, etc.)
• Fuente de información terminológ ica y
documental (catálogos, contextos, definiciones,
términos, glos arios, bas es de datos).
• C aptura de información para realizar un
trabajo terminológico (término, contextos, textos,
publicaciones, herramientas, etc.)
Internet como fuente de información
es pecializada: el corpus
Internet
fuente de información lingüística
C orpus
– información textual y discursiva
– información sobre unidades concretas (variantes,
definiciones, categoría gramatical)
– ejemplos de coocurrencias, etc.
Internet como fuente de información
es pecializada: el corpus
• Necesidad de información
INFORMACIÓN
EN LA WEB
Criterios o estrategias
de búsqueda para la
recuperación
de
información
Herramientas de búsqueda
en Internet
Internet como fuente de información
es pecializada: el corpus
• ¿ Q ué tipo de información recuperamos?
– M aterial textual dis ponible en Internet que
contiene información lingüística.
– P roductos finales que contienen información
lingüís tica (bas es de datos, glosarios,
diccionarios en línea, corpus , etc.).
Directorios vs . motores de bús queda
BUSCADORES
Índices o directorios
Motores de búsqueda
Metabuscadores
Directorios vs. motores de búsqueda
• Tendencia actual
convertir a los buscadores en portales que
ofrecen servicios , ventas y productos
Imposibilidad de ubicar a los actuales
buscadores en una sola des cripción (directorios,
motores de búsquedad, etc.)
Directorios vs . motores de bús queda
D irectorios
• B úsqueda dirigida
M otores de bús queda
• C onsulta libre
•
Funcionan por navegación
•
Funcionan por recuperación de
información
•
Lista de recursos clasificados por
temas
•
•
R ecogen una pequeña parte de
los recursos digitales de la WWW
P rogramas automáticos que
constituyen una BD con todas las
páginas web exploradas
•
R ecogen la totalidad de recursos
•
O rganizan la información
manualmente asignando los
recursos a una o más clases
•
O rganizan la información por
comparación automática y
creación de índices
•
Actualización de la información
lenta
•
Actualización automática y rápida
Indices-directorios
Ventajas
D es ventajas
-Información clasificada, precisa y de
calidad
-Resultados menores que con los
motores de búsqueda
-Suelen
presentar
comentados
-Enlaces no siempre actualizados
-Realizada por expertos
sus
enlaces
calidad
-Permiten buscar por una catalogación
temática preexistente
-Es posible navegar por una temática
determinada sin concretar la palabra
clave
-Cada directorio tiene su propia
clasificación
-Sistema menos intuitivo que en
los motores
-En las clasificaciones priman los
criterios comerciales
M otores de búsqueda
Ventajas
D es ventajas
-Abundante información
-Exceso de información
-Está todo
-Los primeros resultados suelen
ser páginas que enlazan con
otras
-Buscan en toda la red
-Fáciles de usar e intuitivos
-Actualización de los enlaces
-Presencia de resultados que no
interesan
M otores de búsqueda
• R ecurs os más utilizados para bus car en Internet
• S e bas an en programas automáticos que saltan
de una página a otra de la web, siguiendo los
enlaces que encuentran en cada página para
construir una gigantesca bas e de datos.
• La búsqueda es por palabras clave.
Ejemplos
• D irectorios:
– Yahoo http://es.yahoo.com/
– E xcite http://www.excite.es /directory
– Lycos http://www.tripod.lycos.es
• B uscadores:
– Google http://www.google.com
– AltaVista http://www.altavista.com
– O zú http://www.ozu.es
– Terra http://www.terra.es
M etabuscadores
• Buscador de bus cadores
– R edirigen las consultas simultáneamente a bases de
datos de varios motores y directorios
– Útiles para consultar datos muy concretos.
– Algunos permiten realizar una consulta simultánea a
todos los buscadores indexados o bien determinar el
buscador en concreto al que se desea enviar la
interrogación.
• E jemplos de metabuscadores
– http://metacrawler.com
– http://www.i-une.com
– http://www.kartoo.com
– O tros metabuscadores en:
• http://www.cuervoblanco.com/metabuscadores.html
• http://www.buscopio.net
• http://www.internetinvisible.com
B uscadores especializados
• S e estructuran sobre la base de un directorio
temático, aunque pueden ofrecer un motor de
búsqueda.
• S u atractivo reside en la especialización
temática y en la calidad de los vínculos.
• Los recursos que proporcionan son muy
variados : portales temáticos , sitios web de
asociaciones, páginas personales, etc.
http://www.scirus.com
R ecuperación de información: operadores
booleanos
• P ermiten expresar nuestras necesidades
de información con la máxima precisión.
• S irven para exigir o excluir conceptos en
la búsqueda avanzada y en determinados
motores de búsqueda.
Tipos de operadores booleanos
• AND (&): localiza documentos que contengan
uno y otro términos expresados en la consulta.
• O R (I): localiza documentos que contengan uno
u otro de los términos es pecificados en la
consulta.
• NO T (!): recupera documentos que no
contengan un término expres ado en la consulta.
Tipos de operadores booleanos
• Frase exacta: P ermite buscar ocurrencias
de fragmentos textuales que coincidan
exactamente con el contenido de un
documento.
– S e representan:
• “transcripción genética”
Tipos de operadores booleanos
• Limitar idioma: P ermite limitar los resultados de
la bús queda a los que se encuentren en una
determinada lengua especificada previamente.
• Limitar a un s ervidor (domain: host): E ncuentra
las páginas con la palabra o frase especificada
en el dominio del servidor Web donde se
encuentre estas páginas .
– D omain: .mx (limitamos la búsqueda a ese dominio:
M éxico)
Tipos de operadores booleanos
• Limitar a título: E l motor de búsqueda
encuentra las páginas que contienen la
palabra o frase en el título.
• Limitar a texto: el contenido de la página.
• Limitar a período temporal.
Tipos de operadores booleanos
• Formatos de documentos en Internet
– P áginas .html
– D ocumentos de word .doc
– Archivos .pdf
– Imágenes .jpg, .gif
– C omprensión y descomprens ión de
ficheros .zip
Internet como almacén de recursos
lingüísticos y terminológicos
• a. R ecursos lexicográficos
• b. R ecursos terminológicos: catálogos de
diccionarios especializados
• c. R ecursos textuales
• d. B ases de datos terminológicos y
neológicos
• e. C onsulta con otros especialistas: listas
de discusión y foros…
a) R ecursos lexicográficos
•
R ecurs os lingüís ticos generales: D iccionarios y enciclopedias
– E spañol
• http://www.rae.es
• http://clavecorp.grupo-sm.com
– C atalán
• http://pdl.iecat.net
– Inglés
•
•
•
•
•
http://www.m-w.com (M erriam Webster)
http://www.ldoceonline.com (Longman)
http://dictionary.cambridge.org
http://www.hyperdictionary.com
http://www.oed.com/ (O xford E nglis h D ictionary)
– Francés
• http://atilf.atilf.fr/tlfv3.htm
– Alemán
• http://www.dwds.de/
– AllWords .com: D iccionario inglés con
traducción a s eis idiomas
• http://www.allwords.com
– D iccionario de sinónimos
• http://tradu.scig.uniovi.es/sinon.html
– E lM undo.es
• http://www.elmundo.es/diccionarios
a) R ecursos lexicográficos
– P ortales
• http://www.yourdictionary.com. P ortal con 2.500
diccionarios y gramáticas en 300 lenguas
• http://www.onelook.com/browse.shtml. P ortal con
cerca de 900 diccionarios
• http://www.diccionarios.com. P ortal de Larousse.
• http://www.lexicool.com. P ortal con más de 4.000
enlaces de diccionarios y glosarios bilingües y
multilingües
b) R ecursos terminológicos
•
P ortales
– P ortalingua http://www.portalingua.info. P ortal dedicado a las
lenguas neolatina. C onsulta de recurs os en línea.
– TermS ciences http://www.terms ciences .fr/. P ortal terminológico
multidis ciplinario. P ermite la cons ulta de términos en francés ,
inglés , es pañol y alemán
– E ureka http://www.foreignword.com/eureka/default.as p. P ortal
que recoge información s obre bancos de datos terminológicos ,
glos arios , diccionarios , traducción, etc.
– Latinos apiens
http://www.latinos apiens.info.
P ortal
de
información científica en lenguas neolatina. C ontiene artículos ,
foros , revis tas .
b) R ecursos terminológicos
•
C atálogo de glos arios y diccionarios especializados
– Hiperenciclopèdia http://www.grec.net/home/cel/mainc.htm
– Visual dictionary http://www.infovis ual.info/
– G los sarist http://www.glos s aris t.com/
– Terminology
http://lipas .uwas a.fi/comm/termino/collect/
C ollection
– Vademécum
del
traductor
externo
http://www.europarl.europa.eu/trans l_es/plataforma/pagina/celter/celu
– Inventerm http://www.inventerm.com/
c) R ecursos textuales
• C orpus
– BwanaNet
– BNC (British National C orpus)
– C R E A (C orpus de R eferencia del español
actual)
– Internet (S cirus [científico], G oogle)
d) B ancos de datos terminológicos
y neológicos
•
•
•
•
•
•
•
•
•
TE R M ITE (Banco creado por la International Telecommunications
Union) http://www.itu.int/terminology/index.html
Terminología de la FAO
http://www.fao.org/faoterm/index.as p? lang=E S
IATE http://iate.europa.eu/
UP F_Term http://upfterm.upf.edu:8080/cat/index.htm
TIS (Terminological Information S ystem)
http://tis.consilium.eu.int/utfwebtis /frames /introfs E N.htm
Termium http://www.termium.gc.ca/s ite/accueil_home_f.html
C ercaterm http://www.termcat.es
Neoloteca http://www.termcat.es
Bobneo http://obneo.iula.upf.edu/bobneo/
f) Listas de discusión, foros y
blogs
• The Linguis t List. C onjunto de listas (corpora,
E LE X , lexicography)
http://www.linguistlis t.org/
• R elación temática de listas de distribución de
R edIris (tecnotrad, traducción, tradumática)
http://www.rediris.es /lis t/
E valuación de resultados
•
•
•
•
•
•
•
•
Autoría
Actualidad
P recisión y corrección
Tratamiento del contenido
O riginalidad
E nlaces a otros recursos
E rgonomía
C itación en otros sitios
Descargar