GLiCom Spanish Wordform list – Regular word-forms

View resource name in all available languages

Liste de formes de mots GLiCom en espagnol – Formes de mots réguliers



GLiCom Spanish Wordform List v.1 is a computational lexicon of inflected wordforms in Spanish. Each entry has the following information: (i) lemma, (ii) morphosyntactic tag, and (iii) word type. This lexicon can be used in any application for Text Analysis in Spanish, in particular those in need for a lemmatizer, POS tagger, or Named Entity recogniser.

This set consists of a subdivision of the full lexicon and contains the list of word forms only. For the full lexicon, see ELRA-L0095-01.

The list of wordforms contains 1,152,242 entries, including (i) regular words (1,144,086), (ii) toponyms and anthroponyms (8,032), (iii) abbreviations and acronyms (775), and (iv) computational terms (124). Each entry consists of: form, lemma, morphosyntactic tag and the word type.

View resource description in all available languages

La liste de formes de mots GLiCom en espagnol v.1 est un lexique computationnel de formes de mots fléchies en espagnol. Chaque entrée détient l’information suivante: (i) lemme, (ii) etiquette morphosyntaxique, et (iii) type de mot. Ce lexique peut être utilisé dans tout type d’applications pour l’analyse de texte en espagnol, en particulier pour l’usage dans un lemmatiseur, un étiqueteur en partie du discours, ou un système de reconnaissance d’entités nommées.

Cet ensemble consiste en une subdivision du lexique complet et contient uniquement la liste de formes de mots. Pour le lexique complet, voir ELRA-L0095-01.

La liste de formes de mots contient 1,152,242 entrées, dont (i) des mots réguliers (1,144,086), (ii) des toponymes et anthroponymes (8,032), (iii) des abréviations et acronymes (775), et (iv) des termes informatiques (124). Chaque entrée consiste en: la forme, le lemma, l’étiquette morphosyntaxique et le type de mot.

You don’t have the permission to edit this resource.