Catalan-Spanish Parallel Corpus

View resource name in all available languages

Corpus parallèle catalan-espagnol

ID:

ELRA-W0053

This corpus contains more than 100 million words and it contains 10 years of bilingual articles from “El Periódico de Catalunya”. Both language data are rather close as the Catalan text is a translation of the Spanish one, partly achieved by means of Machine translation and then post-edited.

The data are aligned at sentence level and stored in text files, in a one sentence per line basis. The data are provided in plain text, with no encoding whatsoever.

View resource description in all available languages

Ce corpus comprend plus de 100 millions de mots et consiste en 10 années d’articles bilingues de “El Periódico de Catalunya”. Les données des deux langues sont très proches puisque le texte catalan est une traduction de la version espagnole, achevée en partie au moyen d’une traduction automatique puis post-éditée.

Les données sont alignées au niveau de la phrase et stockées en fichiers texte, sur la base d’une phrase par ligne. Les données sont fournies au format texte plein, sans aucun codage.

You don’t have the permission to edit this resource.