LABEL-LEX (MW)

ID:

ELRA-L0054

LABEL-LEX (MW) is a Portuguese formalized lexicon, containing 88 619 inflected multiword lexical units (formally, sequences of simple words). The units are distributed as follows:
- 85,881 nouns, with information about type, gender, number, inflected forms, irregular inflected forms and subcategorisation frames
- 2,204 adverbs
- 409 adjectives, with information about degree, gender, number, comparison, position, inflected forms, irregular inflected forms and subcategorisation frames
- 125 pronouns, prepositions/postpositions and conjunctions

From a linguistic point of view, multiword lexical units exhibit distributional and selectional constraints; they lack compositionality, and have, most of the time, idiomatic interpretations.
MWUs occur frequently in both everyday language and technical and scientific texts to express ideas and concepts that in general cannot be stated by "free" linguistic structures.
So it is impossible to envisage automatic text analysis without adequate identification and treatment of multiword lexical units. The meaning of a text is mostly supplied by frequent occurrence of multiword units, especially by compound nouns.

Other formats and other services may be supplied by the data owner upon request (e.g. conversion into buyer's formalism, selection of subsets of the words missing from your own dictionary).

View resource description in all available languages

Ce lexique de portugais formalisé contient 88 619 unités lexicales fléchies constituées d'expressions composées (des séquences de mots simples). Les unités sont réparties comme suit :
- 85 881 noms, avec des informations sur le type, genre, nombre, les formes fléchies, les formes irrégulières non fléchies et les cadres de sous-catégorisation
- 2 204 adverbes
- 409 adjectifs, avec des informations sur le degré, genre, nombre, comparaison, position, les formes fléchies, les formes irrégulières non fléchies et les cadres de sous-catégorisation
- 125 pronoms, prépositions/postpositions et conjonctions

D'un point de vue linguistique, les unités lexicales constituées d'expressions composées (ou unités MWU) présentent des contraintes en termes de distribution et de sélection, elles manquent de compositionnalité et sont sujettes, la plupart du temps, à des interprétations idiomatiques.
Les unités MWU sont fréquentes dans le langage courant comme dans la littérature scientifique et technique car elles permettent d'exprimer des idées et des concepts que les périphrases ne peuvent généralement traduire.
Par conséquent, il est impossible d'envisager une analyse automatique de texte sans identification et traitement adaptés des unités lexicales MWU. En effet, les expressions composées, et les mots composés, notamment, sont fréquemment les éléments porteurs de sens d'un texte.

You don’t have the permission to edit this resource.