BDLEX consists of a lexical database developed within the French GDR-PRC CHM at IRIT (IMH-PT team), Paul Sabatier University, Toulouse. The data cover lexical, phonological, and morphological information.
The database BDLEX consists of about 440,000 inflected forms (generated from about 50,000 canonical words) with the following attributes: spelling, pronunciation, morphosyntactic features (part of speech, agreements,...), the canonical word spelling and a frequency indicator.
Moreover the lexical resources include the version BDLex-syll which specifies the syllabic division in the field pronunciation.
The resource ELRA-S0004 BDLEX version 2.1.2 includes the resource BDLEX and in addition the lexicon MHATLex Standard which is a simplified version of MHATlex (S0100) and is closely connected to BDLex.
Il s'agit d'une base de données lexicales développée dans le cadre du groupe de recherche PRC (Communication Homme-Machine) au laboratoire IRIT de l'Université Paul Sabatier de Toulouse.
La base BDLex contient environ 440 000 formes fléchies (issues de 50 000 formes canoniques). Les informations associées sont la graphie accentuée, la prononciation, des attributs morphosyntaxiques (catégorie syntaxique, accords, ...), la graphie du mot canonique et un indicateur de fréquence.
Les ressources contiennent en outre la version BDLex-syll où les frontières syllabiques sont précisées dans le champ prononciation.
La ressource ELRA-S0004 BDLEX version 2.1.2 comprend les ressources BDLex et par ailleurs le lexique MHATlex Standard qui est une version simplifiée de MHATLex (S0100) et apparentée à BDLex.
