GlobalPhone 2000 Speaker Package
View resource name in all available languages
Ensemble de 2000 locuteurs GlobalPhone
ID:
ELRA-S0400
The GlobalPhone 2000 Speaker Package contains transcribed read speech spoken by 2000 native speakers in 22 languages. The data are sampled from the GlobalPhone Speech and Text Data available in the ELRA Catalogue, i.e.: Arabic (ELRA-S0192), Bulgarian (ELRA-S0319), Chinese-Mandarin (ELRA-S0193), Chinese-Shanghai (ELRA-S0194), Croatian (ELRA-S0195), Czech (ELRA-S0196), French (ELRA-S0197), German (ELRA-S0198), Hausa (ELRA-S0347), Japanese (ELRA-S0199), Korean (ELRA-S0200), Polish (ELRA-S0320), Portuguese (Brazilian) (ELRA-S0201), Russian (ELRA-S0202), Spanish (Latin America) (ELRA-S0203), Swahili (ELRA-S0375), Swedish (ELRA-S0204), Tamil (ELRA-S0205), Thai (ELRA-S0321), Turkish (ELRA-S0206), Ukrainian (ELRA-S0377), and Vietnamese (ELRA-S0322).
The GlobalPhone 2000 Speaker Package covers about 9,000 randomly selected utterances read by 2000 native speakers in 22 languages, i.e. on average 4.5 utterances corresponding to 40 seconds of speech per speaker amounting to a total of 22 hours of speech. The package is designed for various tasks in speaker recognition research and development, such as (1) text-dependent and text-independent speaker recognition (e.g. speaker verification and speaker identification), (2) speaker recognition in multiple languages, (3) multilingual speaker identification, (4) multilingual speaker verification, and (5) speaker recognition with low resources.
View resource description in all available languages
L’ensemble de 2000 locuteurs GlobalPhone contient de la parole lue transcrite pour 2000 locuteurs natifs en 22 langues. Les données sont échantillonnées à partir des données orales et textuelles Globalphone disponibles dans le catalogue ELRA: arabe (ELRA-S0192), bulgare (ELRA-S0319), chinois-mandarin (ELRA-S0193), chinois de Shanghai (ELRA-S0194), croate (ELRA-S0195), tchèque (ELRA-S0196), français (ELRA-S0197), allemand (ELRA-S0198), haoussa (ELRA-S0347), japonais (ELRA-S0199), coréen (ELRA-S0200), polonais (ELRA-S0320), portugais (Brésilien) (ELRA-S0201), russe (ELRA-S0202), espagnol (d’Amérique latine) (ELRA-S0203), swahili (ELRA-S0375), suédois (ELRA-S0204), tamoul (ELRA-S0205), thaï (ELRA-S0321), turc (ELRA-S0206), ukrainien (ELRA-S0377), et vietnamien (ELRA-S0322).
Cet ensemble couvre environ 9,000 occurrences sélectionnées aléatoirement et lues par 2000 locuteurs natifs en 22 langues, soit une moyenne de 4,5 occurrences correspondant à 40 secondes de parole par locuteur pour un total 22 heures de parole. T Il est conçu pour diverses tâches de recherche et développement en reconnaissance du locuteur, tells que (1) la reconnaissance du locuteur dépendant et indépendant du texte (par ex. vérification et identification du locuteur), (2) la reconnaissance du locuteur dans plusieurs langues, (3) l’identification multilingue du locuteur, (4) la verification multilingue du locuteur, et (5) la verification du locuteur à partir d’un faible nombre de ressources.
People who looked at this resource also viewed the following: