TRAD Arabic-English Parallel corpus of transcribed Broadcast News Speech

View resource name in all available languages

Corpus TRAD parallèle arabe-anglais (transcriptions d’actualités télédiffusées)

ID:

ELRA-W0102

This is a parallel corpus of 10,000 words in Arabic and 2 reference translations in English. The source texts are transcriptions of broadcast news in Arabic recorded on France 24. The translation has been conducted by two different translation teams following a strict protocol aimed at producing high quality translations.

The content is also translated into French (see ELRA-W0101).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal evaluation campaign.

View resource description in all available languages

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et 2 traductions de référence en anglais. Les données sources sont constituées de la transcription d’enregistrements d'émissions diffusées en arabe sur France 24. La traduction a été réalisée par deux équipes de traduction différentes en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers le français (voir ELRA-W0101).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que données de test lors d’une campagne d’évaluation de la traduction automatique interne au projet.

You don’t have the permission to edit this resource.