Mandarin Chinese Speech Synthesis Corpus (Basic Corpus)

6 Last view: 2026-07-05

Mandarin Chinese Speech Synthesis Corpus (Basic Corpus)

View resource name in all available languages

Corpus de synthèse de la parole du chinois mandarin (corpus de base)

http://catalog.elra.info/product_info.php?products_id=922

ID:

ELRA-S0228_01

This corpus contains the recordings of 1 native Chinese speaker (female).
The corpus is composed of 20 texts with 109,227 words and has been proofread manually. The corpus contents include: phrases, digit strings, letter strings, uncommon words, neutral tone, final retroflexion, Latin alphabet, interrogative sentences, 282 English words.
The speaker has been recorded in a professional recording studio over 2 channels: microphone and glottis wave (fundamental frequency) signals for a total of 18.2 hours.
Speech samples are stored as sequences of 16-bit 44,1 kHz PCM on two channels. The total data size is 5.67 Gb for a total of 12,679 files. The data is encoded in GB-2312 format.
The transcriptions include labels for four-class pause boundaries.
This database is aimed to be used within text-to-speech and speech synthesis applications.

View resource description in all available languages

Ce corpus contient les enregistrements d’une locutrice de langue maternelle chinoise.
Le corpus est composé de 20 textes de 109 227 mots et a été vérifié manuellement. Le corpus contient des locutions, des séquences de chiffres, de lettres, des mots peu fréquents, le ton neutre, la rétroflexion, l’alphabet latin, des phrases interrogatives, et 282 mots anglais.
La locutrice a été enregistrée dans un studio d’enregistrement professionnel sur deux canaux : microphone et signaux de la glotte (fréquence fondamentale), pour un total de 18,2 heures.
Les échantillons de parole sont stockés sous la forme de séquences 16-bit 44,1 kHz PCM sur deux canaux. La taille totale des données est de 5,67 Go pour un total de 12 679 fichiers. Les données sont codées au format GB-2312.
Les transcriptions comprennent la segmentation utilisant quatre types de balises.
Cette base de données a été conçue pour des applications relatives aux technologies texte-parole (« text-to-speech ») et à la synthèse de la parole.

You don’t have the permission to edit this resource.

DistributionAvailability

Available - Restricted Use

Start date: 17/01/2007

Licence

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Non Members of ELRA

User Nature: Commercial

ELRA VAR

Restrictions: Commercial Use

For Members of ELRA

User Nature: Commercial

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Members of ELRA

User Nature: Commercial

ELRA VAR

Restrictions: Commercial Use

For Members of ELRA

User Nature: Academic

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Members of ELRA

User Nature: Academic

ELRA VAR

Restrictions: Commercial Use

For Non Members of ELRA

User Nature: Commercial

ELRA VAR

Restrictions: Commercial Use

For Non Members of ELRA

User Nature: Academic

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Non Members of ELRA

User Nature: Academic

Contact Person

Mapelli Valérie

audio

Monolingual audio corpusLanguages

Chinese

Linguality

Linguality type: Monolingual

Size

no size available

Metadata

Created: 12/05/2005

Version

Version: 1.0

Last Updated: 17/01/2007

People who looked at this resource also viewed the following: