Corpus euskera-español-polaco-francés-inglés(más que un diccionario)

Gracias a “Berriak” me he enterado de un EXTRAORDINARIO TRABAJO DE KAMIL MAREK Y OTROS. (Kamil Marek, un joven polaco, estudiante de euskera y promotor de los derechos de Euskal Herria en Polonia)

Se trata de un corpus multilingue que incluye (por ahora) 5 idiomas: euskara, polaco, castellano, frances e ingles (plantean añadir el aleman).  Es una herramienta interesante que puede servir mientras traducir textos de/en estos cinco idiomas, al ser un corpus incluye textos literarios, cientificos y jurídicos. Luego los dividimos y ponemos en paralelo para que cada fragmento tenga su equivalente – y despues en linea.

Para acceder al Corpus: LAGUN Corpus (también tenéis el enlace, de una forma fija , en la sección de la derecha llamada “Webs útiles”

Corpus es un conjunto sistematizado y posiblemente extenso de “textos que sirven para investigaciones lingüísticas, tales como determinar la frecuencia de aparición de palabras, construcciones sintácticas, contextos en los cuales aparecen las palabras. Una aplicación más reciente de corpus consiste en enseñar ordenadoras durante el proceso de tratamiento de idiomas naturales” . Además “los datos extraídos de corpus […] sirven para la redacción de diccionarios, tesauros, glosarios y durante la enseñanza de vocabulario de lenguas extranjeras, […] las herramientas para extraer el vocabulario de corpus […] permiten utilizar estos materiales durante el procedimiento de traducción, efectuada tanto por un traductor (Computer-Aided Translation / CAT) […] como en la traducción automática (Machine Translation / MT) […]”

Publicado por

Pais Vasco - Juan

Juan Luis, Juanlas, Juan, Jon Koldo, Ibán...pero todos Yo Mismo.

Ongi etorri, bienvenido/a!