TRAD Pashto-English Parallel corpus of transcribed Broadcast News Speech - Test data

View resource name in all available languages

Corpus TRAD parallèle pachto-anglais (transcriptions d’actualités télédiffusées) - Données de test

ID:

ELRA-W0095

This is a parallel corpus, which contains 10,000 Pashto words translated into English. The source texts come from 3 broadcast news transcriptions of the TRAD Pashto Broadcast News Speech Corpus (ELRA-S0381). These texts are VOA Ashna TV programs recorded on 15/01/2011, 18/01/2011 and 19/01/2011.

The content has also been translated into French (see ELRA-W0094 TRAD Pashto-French Parallel corpus of transcribed Broadcast News Speech - Test set).

Pashto is an indo-iranian language spoken by the Pashtun people mainly in Pakistan and Afghanistan.

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal MT evaluation campaign.

View resource description in all available languages

Il s’agit d’un corpus parallèle pachto-anglais qui contient 10 000 mots en pachto traduits vers l’anglais. Les textes sources correspondent à la transcription de trois émissions de VOA Ashna TV des 15/01/2011, 18/01/2011 et 19/01/2011, extraites du corpus TRAD d’actualités radio et télédiffusées en pachto (référence S0381).

Le contenu a également été traduit vers le français (voir ELRA-W0094 Corpus TRAD parallèle pachto-français - transcriptions d’actualités radio et télédiffusées - Données de test).

Le pachto (ou pachtou) appartient à la famille des langues indo-iranienne. Il est parlé par les Pachtounes, principalement au Pakistan et en Afghanistan.

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé lors d’une campagne d’évaluation interne en tant que données de test.

You don’t have the permission to edit this resource.