“Lenguas y Tecnologías de la Lengua en España“

Anuncio

“Lenguas y Tecnologías de la Lengua
en España“!
Núria Bel!
Universitat Pompeu Fabra!
META-NET Executive Board!
Co-editora del !
“Informe sobre el estado de las tecnologías del lenguaje
en España dentro de la Agenda Digital para España”!
Taller ELRC Madrid (España), 26-­‐01-­‐2016 1
Tecnologías de la Lengua,
Procesamiento del Lenguaje y
Traducción Automática!
•  Tecnología para leer documentos y …"
–  corregirlos"
–  extraer información, "
–  inducir información, "
–  traducirlos, "
–  … lo que hacemos las personas con textos …"
automáticamente!
•  Estas tecnologías requieren
“motores” (algoritmos) y “gasolina” (datos). "
•  La gasolina son muchos documentos para cada
idioma: los recursos lingüísticos"
Taller ELRC Madrid (España), 26-­‐01-­‐2016 2
Multilingual Europe Technology Alliance !
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Evaluación de la existencia de recursos
lingüísticos en Europa (2012) !
""
""
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Resultados Evaluación Traducción Automática (2012) !
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Diagnóstico!
Taller ELRC Madrid (España), 26-­‐01-­‐2016 6
Traducción Automática en España!
2006
2005
2000
2011
2015
Taller ELRC Madrid (España), 26-­‐01-­‐2016 2013
La dimensión del multilingüismo en
España!
•  España cuenta con una lengua oficial y 3 cooficiales"
•  Además, en lo cotidiano, el multilingüismo se amplía por:"
– 
– 
– 
– 
– 
– 
Turismo"
Comercio"
Desarrollo y cooperación entre regiones de Europa"
Cuestiones legales transfronterizas"
Inmigración"
y Relaciones Internacionales. "
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Entorno lingüístico de España !
Lenguas
vecinas:
Portugués
Francés
Árabe
Bereber
Taller ELRC Madrid (España), 26-­‐01-­‐2016 9
Multilingüismo en la colaboración
transfronteriza !
FRANCÉS
•  Relaciones transfronterizas, ejemplos:"
PORTUGUÉS
"
•  Colaboración de ambulancias y servicios de
emergencias"
•  Seguridad y control de fronteras"
•  Proyectos de infraestructuras"
–  Carreteras"
–  Trenes"
–  Servicios postales"
•  Infraestructuras financieras"
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Multilingüismo e Inmigración
!
8000
Número de residentes extranjeros
Thousands of foreign citizens
7000
(fuente: Eurostat 2009)
6000
5000
4000
Comparativa países EU
España el 2º país con más
residentes extranjeros
3000
2000
1000
0
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Multilingüismo e Inmigración!
•  Residentes extranjeros en España (ine, 1-07-2015)"
–  4.426.000 residentes extranjeros"
–  2.823.000 provienen de la Unión Europea (libre circulación)"
•  Las lenguas más habladas :"
1. 
2. 
3. 
4. 
5. 
6. 
Rumano"
Árabe / bereber"
Inglés"
Italiano"
Chino"
Búlgaro"
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Multilingüismo y Comercio
Exportación Española (2015) !
Ranking Exportaciones
Países y lenguas
1. 
2. 
3. 
4. 
5. 
6. 
7. 
Francia, francés
Alemania, alemán
Italia, italiano
Portugal, portugués
Reino Unido, inglés
Estados Unidos, inglés
Países Bajos,
neerlandés
8.  Bélgica, francés,
neerlandés
9.  Marruecos, árabe y
bereber
10. Turquía, turco
Taller ELRC Madrid (España), 26-­‐01-­‐2016 13
Multilingüismo y Comercio Importación Española(2015)!
Ranking Importaciones
Países y lenguas
1. 
2. 
3. 
4. 
5. 
6. 
Alemania, alemán
Francia, francés
Italia, italiano
China, chino
Reino Unido, inglés
Países Bajos,
neerlandés
7.  Estados Unidos,
inglés
8.  Portugal, portugués
9.  Bélgica, francés,
neerlandés
10. Rusia, ruso
11. Argelia, árabe,
bereber
Taller ELRC Madrid (España), 26-­‐01-­‐2016 14
Recursos disponibles + tecnología!
""
" La necesidad de traducción
" es garantía de que existen
datos: documentos y
"
traducciones
La tecnología actual permite
re-utilizar todos los recursos
disponibles para ayudar a
cubrir las enormes
necesidades de traducción
que existen.
Taller ELRC Madrid (España), 26-­‐01-­‐2016 15
ya ampliamente utilizados ... en
sectores especializados!
El rendimiento mejora si se dispone de
datos de cada dominio en el que se
quiere utilizar
Taller ELRC Madrid (España), 26-­‐01-­‐2016 16
TL en España: Empresas españolas!
Andalucía: MTC Soft, Victor Translator, Indysys
Cataluña: Lucy Software, Verbio Technologies, INCYTA, Inbenta ,
AutomaticTrans, Viclone virtual solutions, websays, Tekstum, sisu-labs,
tauyou <language technology>, Artificial Solutions, Ateknea Solutions,
Inbenta, ExpertSystem Ibérica.
Extremadura: Oteara.
Galicia: Cilenis, Imaxin.
Madrid: Daedalus, Celer soluciones, Seprotec Multilingual Solutions,
Habla Computing, Molino de Ideas, Bitext innovations, Paradigma
Tecnológico, Mamvo Performance, Sigma Technologies, Linguaserve,
Sentisis, Playence, Fonetic Solutions, Semantia Lab, Hermés
Traducciones.
País Vasco: Fundación Eleka, Elhuyar, Anboto Europe, Todoentradas,
Centro Tecnológico Vicomtech, Mapalia Networks, IK4-IDEKO, Mondragón
Lingua, Sherpa.
Valencia: Innovative Social Technologies, Pangeanic, Prompsit.
Taller ELRC Madrid (España), 26-­‐01-­‐2016 17
TL en España:
Centros de investigación en
tecnologías de la lengua!
"
"
"
"
"
"
Mapa de la investigación en España
UVigo,
UCoruña
UNED, UAM,
UPM, UEM,
UCM, UCIII,
RAE
UGC
UPV, Deusto
Taller ELRC Madrid (España), 26-­‐01-­‐2016 UPC, UPF, UB,
UOC, UAB
UPV, UA
UJaén,
USevilla,
UGranada
TL en España
Plan de Impulso SETSI (2016-2020)!
Taller ELRC Madrid (España), 26-­‐01-­‐2016 19
Organización, organización,
organización…!
"
"
Tenemos datos ...
hay que organizarse!
Taller ELRC Madrid (España), 26-­‐01-­‐2016 Taller ELRC Madrid (España), 26-­‐01-­‐2016 21
Descargar