Nautilus Speaker Characterization (NSC) Corpus

View resource name in all available languages

Corpus de caractérisation du locuteur Nautilus (NSC)

ID:

ELRA-S0395

The Nautilus Speaker Characterization (NSC) Corpus comprises clean microphone recordings of conversational speech from 300 German speakers (126 males and 174 females) aged 18 to 35 years, with no marked dialect/accent. The recordings were performed in the acoustically-isolated room "Nautilus" (which gives name to this database) of the Quality and Usability Lab of the Technische Universität Berlin, Germany, in 2016/2017.

Four scripted and four semi-spontaneous dialogs were elicited from the speakers, simulating telephone call inquiries. Additionally, spontaneous neutral and emotional (predominantly excitement or frustration) speech utterances and questions were produced. Interactions between speakers and their interlocutor (a recording assistant) are provided in separate mono files, accompanied by timestamps and tags that define the speaker's turns. All speech is sampled at 48 kHz (audio/wav 16-bit 1-channel files). The microphone AKG C 414B-XLS was employed to record the speakers (95.6 hours of speech) and the headset Sennheiser HMD 46 to record the interlocutor (59.5 hours of speech).

The speech corresponding to one of the semi-spontaneous dialogs was later evaluated with respect to 34 continuous numeric labels of perceived interpersonal speaker characteristics (such as likable, attractive, competent, childish, etc.), for the 300 speakers by 15 different listeners, on average. For a set of 20 selected "extreme" speakers, also 34 naive voice descriptions (such as bright, creaky, articulate, melodious, etc.) were evaluated by 26 external raters.

All labels are provided, together with the speech recordings and the speakers' metadata (age, gender, place of birth, chronological places of residence and duration of stay, place of birth of the mother and of the father, self-assessed personality, etc.).

The material provided in the NSC Corpus is expected to be of broad interest to phoneticians and speech scientists working on the perceptual and acoustic correlates of personal attributes. Speech and prosody production and conversational behavior in human-human interactions can be studied by analyzing speaker's and interlocutor's turns of spontaneous speech. The NSC data may also be adequate for other speech-related research requiring high-quality clean recordings in German.

View resource description in all available languages

Le corpus de caractérisation du locuteur Nautilus (NSC) comprend les enregistrements microphone propres de parole conversationnelle par 300 locuteurs allemands (126 hommes et 174 femmes) âgés de 18 à 35 ans, sans dialecte/accent marqué. Les enregistrements ont été réalisés dans la salle isolée au niveau acoustique "Nautilus" (d’où découle le nom de cette base de données) du laboratoire Qualité et Utilisabilité de la Technische Universität Berlin, Allemagne, en 2016/2017.

Quatre dialogues scénarisés et quatre autres semi-spontanés ont été réalisés par les locuteurs simulant des demandes d’information téléphoniques. En complément, des occurrences spontanées de parole neutre et émotionnelle (principalement excitation ou frustration) ont été produites. Les interactions entre les locuteurs et leur interlocuteur (un assistant d’enregistrement) sont fournies dans des fichiers mono séparés, accompagnés d’horodatage ("timestamp") et d’étiquettes définissant les tours de locuteur. Toutes les données audio sont échantillonnées à 48 kHz (fichiers audio/wav, 16-bit, 1 canal). Un microphone AKG C 414B-XLS a été utilisé pour enregistrer les locuteurs (95,6 heures de parole) et un micro-casque Sennheiser HMD 46 pour enregistrer l’interlocuteur (59,5 heures de parole).

La parole correspondant à l’un des dialogues semi-spontanés a ensuite été évaluée au regard de 34 étiquettes numériques constantes de caractéristiques du locuteur interpersonnelles (telles que "likable", "attractive", "competent", "childish", etc.), pour les 300 locuteurs et par 15 auditeurs différents, en moyenne. Sur un sous-ensemble de 20 locuteurs sélectionnés comme "extrême", 34 descriptions naïves de voix (telles que brillante, grinçante, articulée, mélodieuse, etc.) ont également été évaluées par 26 évaluateurs externes.

Toutes les étiquettes sont fournies avec les enregistrements de parole et les métadonnées des locuteurs (âge, genre, lieu de naissance, lieux chronologiques et durée de résidence, lieu de naissance de la mère et du père, personnalité auto-évaluée, etc.).

Le matériel fourni dans le corpus NSC a pour vue de couvrir un intérêt large par les phonéticiens et scientifiques de la parole travaillant sur les corrélations perceptuelles et acoustiques des traits personnels. La production de parole et de prosodie et le comportement conversationnel dans les interactions humain-humain peuvent être étudiés en analysant les tours de parole spontanée entre locuteurs et interlocuteurs. Les données NSC peuvent également être convenir à d’autres travaux de recherche liés à la parole et nécessitant des enregistrements propres de haute qualité en allemand.

You don’t have the permission to edit this resource.