Euskararen Datu-Base Lexikala (EDBL) – Lexical Database for Basque

View resource name in all available languages

Euskararen Datu-Base Lexikala (EDBL) – Base de données lexicale du basque

ID:

ELRA-L0057

EDBL (Lexical database for Basque) is the lexical basis needed for the automatic treatment of Basque. It was first developed as a lexical support for the spelling checker and corrector XUXEN, but in the course of the time it has proved to be a multipurpose tool. Nowadays, it is not only the lexical support of the speller but also of the morphological analyser MORFEUS and the lemmatiser EUSLEM. In the future, it will be also used for syntactic and semantic analysis.

Being neutral in relation to linguistic formalisms, flexible, open and easy to use, EDBL is, along with corpora, an essential tool for the Natural Language Processing. It is made up of about 75,000 entries divided into dictionary entries (the same you can find in a conventional dictionary), verb forms and dependent morphemes, all of them with their respective morphological information.

Currently, it is organized in a hierarchical structure, according to a category-system adapted to Basque. It aims to reflect the general lexicon of standard Basque (Euskara Batua) and it is the essential lexical information-store for Basque NLP.

View resource description in all available languages

EDBL (Base de données lexicale du basque) est une base lexicale nécessaire au traitement automatique du basque. D’abord conçue comme support lexical du vérificateur et correcteur orthographique XUXEN, la base s’est révélée au cours du temps un outil véritablement polyvalent. Désormais, elle constitue non seulement le support lexical du correcteur mais également celui de l’analyseur morphologique MORFEUS et du lemmatiseur EUSLEM. Dans le futur, elle sera également utilisée pour l’analyse syntaxique et sémantique.

Sa neutralité vis-à-vis des formalismes linguistiques, sa conception flexible et ouverte et son utilisation facile font de la base EDBL un outil essentiel, en association avec des corpus, pour le traitement automatique de la langue. Elle est constituée de 75 000 entrées environ divisées en entrées dictionnairiques (similaires à celles que l’on peut trouver dans un dictionnaire conventionnel), de formes verbales et de morphèmes dépendants, fournis avec leur information morphologique.

Actuellement, elle est organisée suivant une structure hiérarchique utilisant un système de catégories adapté au basque. Son but est de fournir le lexique général du basque standard (Euskara Batua). Elle est une source principale d’informations lexicales pour le traitement automatique de la langue basque.

You don’t have the permission to edit this resource.