Large Farsdat

ID:

ELRA-S0380

Large Farsdat (L-FARSDAT) is a Persian (Farsi) Speech Database containing about 73 hours of read speech from formal Farsi texts (newspapers) which have been recorded by 100 speakers through a unidirectional desktop microphone. Each speaker uttered 20-25 pages of text from various subjects and recording was conducted in a noiseless environment. The average SNR of the desktop microphone is about 28 dB. The sampling rate is 22050 Hz for the whole corpus.
The whole database is segmented and labelled at word and sentence levels with byte count alignment and each word is transcribed according to the 29 standard Persian phonemes.
There are also three labels indicating silence (sil), breathy voice (br) and non-speech sounds (ns).

View resource description in all available languages

Large Farsdat (L-Farsdat) est une base de données de parole comprenant les enregistrements en persan (farsi) de textes de journaux lus par 100 locuteurs pour un total d’environ 73 heures. Chaque locuteur a lu environ 20-25 pages sur des sujets différents. Les enregistrements ont été réalisés au moyen d’un microphone de bureau unidirectionnel dans un environnement sans bruit. La fréquence d’échantillonnage est de 22050 Hz, et le rapport moyen signal sur bruit (RSB) est d’environ 28 dB.

La base de données a été segmentée et étiquetée au niveau du mot et de la phrase, avec un alignement basé sur la numérotation en octets. Chaque mot a été transcrit selon les 29 phonèmes standard du farsi. Il y a trois étiquettes supplémentaires qui annotent le silence (sil), la voix soufflée (breathy voice –br-) et les sons non linguistiques (ns).

You don’t have the permission to edit this resource.