TRAD Arabic-French Parallel corpus of transcribed Broadcast News Speech

View resource name in all available languages

Corpus TRAD parallèle arabe-français (transcriptions d’actualités télédiffusées)

ID:

ELRA-W0101

This is a parallel corpus of 10,000 words in Arabic and 4 reference translations in French. The source texts are transcriptions of broadcast news in Arabic recorded on France 24. The translation has been conducted by four different translation teams following a strict protocol aimed at producing high quality translations.

The content is also translated into English (see ELRA-W0102).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal MT evaluation campaign.

View resource description in all available languages

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et 4 traductions de référence en français. Les données sources sont constituées de la transcription d’enregistrements d'émissions diffusées en arabe sur France 24. La traduction a été réalisée par quatre équipes de traduction différentes en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers l’anglais (voir ELRA-W0102).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que données de test lors d’une campagne d’évaluation de la traduction automatique interne au projet.

You don’t have the permission to edit this resource.