IBASQUE.COM

ONGI ETORRI

Corpus euskera-español-polaco-francés-inglés(más que un diccionario)

Ago 17, 2007

Gracias a «Berriak» me he enterado de un EXTRAORDINARIO TRABAJO DE KAMIL MAREK Y OTROS. (Kamil Marek, doctor un joven polaco, discount estudiante de euskera y promotor de los derechos de Euskal Herria en Polonia)

Se trata de un corpus multilingue que incluye (por ahora) 5 idiomas: euskara, discount polaco, castellano, frances e ingles (plantean añadir el aleman).  Es una herramienta interesante que puede servir mientras traducir textos de/en estos cinco idiomas, al ser un corpus incluye textos literarios, cientificos y jurídicos. Luego los dividimos y ponemos en paralelo para que cada fragmento tenga su equivalente – y despues en linea.

Para acceder al Corpus: LAGUN Corpus (también tenéis el enlace, de una forma fija , en la sección de la derecha llamada «Webs útiles»

Corpus es un conjunto sistematizado y posiblemente extenso de “textos que sirven para investigaciones lingüísticas, tales como determinar la frecuencia de aparición de palabras, construcciones sintácticas, contextos en los cuales aparecen las palabras. Una aplicación más reciente de corpus consiste en enseñar ordenadoras durante el proceso de tratamiento de idiomas naturales” . Además “los datos extraídos de corpus […] sirven para la redacción de diccionarios, tesauros, glosarios y durante la enseñanza de vocabulario de lenguas extranjeras, […] las herramientas para extraer el vocabulario de corpus […] permiten utilizar estos materiales durante el procedimiento de traducción, efectuada tanto por un traductor (Computer-Aided Translation / CAT) […] como en la traducción automática (Machine Translation / MT) […]”