Bilingual English-Russian Russian-English Dictionaries
View resource name in all available languages
Dictionnaires bilingues anglais-russe russe-anglais
ID:
ELRA-M0025
The Bilingual English-Russian Russian-English Dictionaries were produced by the SCIPER company through a funding from ELRA in the framework of the European Commission project LRsP&P (Language Resources Production & Packaging - LE4-8335).
In this work were used linguistic resources produced originally in Russia. It is well-known that during the Soviet period, a number of linguistic resources of very high quality have been developed in Russia. Among those are dictionaries and especially bilingual dictionaries which generally have many more entries than those found in Western countries.
Bilingual language resources produced within the above-mentioned LRsP&P project contain, in total, more than 350,000 pairs of words (in tabular form). In XML format which corresponds to the DTD, the dictionaries have the following volumes:
1) Russian-English dictionary - more than 130 000 entries
2) English-Russian dictionary - more than 95 000 entries
In this format, a dictionary entry corresponds to more than one pair of words because it may contain several semantically equal translations in target language.
Each dictionary entry contains the following information:
- source word (lemma);
- part of speech of source word;
- target word(s) (lemma(s)), grouped by same meaning;
- part of speech of target word(s);
- domain(s);
Both dictionaries contain as 'source words' only significant parts of speech: nouns, adjectives, verbs, adverbs and nominals. Stop-words (prepositions, articles, pronouns, etc.) have not been included into the dictionaries because of the intended use in multilingual search and cross-lingual interrogation.
Both dictionaries are presented as XML files, with he same DTD. These files are coded in UNICODE - UTF-8.
The dictionaries are consistent, i.e. each of them presents the inverted version of the second one. This feature proves to be very useful for aligners, multilingual search engines, etc.
The list of domains may be found in DTD. It contains more than 100 domain names.
View resource description in all available languages
Ces dictionnaires bilingues anglais-russe et russe-anglais ont été réalisés par la société SCIPER dans le cadre du projet européen LRsP&P (Language Resources Production & Packaging - Production et mise au format des ressources linguistiques - LE4-8335) soutenu par la Commission Européenne.
Ce travail a utilisé des ressources linguistiques réalisées à l'origine en Russie. Il est connu que pendant la période soviétique, un grand nombre de ressources linguistiques de très bonne qualité ont été développées en Russie. Parmi ces ressources, les dictionnaires et particulièrement les dictionnaires bilingues avaient en général beaucoup plus d'entrées que ceux conçus dans les pays de l'Ouest.
Les ressources linguistiques bilingues réalisées pour le projet LRsP&P contiennent, au total plus de 350 000 paires de mots. Dans le format XML qui correspond à la DTD, les dictionnaires représentent le volume suivant :
Dictionnaire russe-anglais - plus de 130 000 entrées
Dictionnaire anglais-russe - plus de 95 000 entrées
Dans ce format, une entrée de dictionnaire correspond à plus d'une paire de mots, celle-ci pouvant comprendre plusieurs traductions sémantiquement identiques dans la langue cible.
Chaque entrée de dictionnaire fournit les informations suivantes :
mot source (lemme) ;
partie du discours du mot source ;
mot(s) cible(s) (lemme(s)), regroupé(s) par un même sens ;
partie du discours du/des mot(s) cible(s) ;
domaine(s).
Les deux dictionnaires contiennent comme "mots sources" uniquement les parties du discours significatrices : noms, adjectifs, verbes, adverbes et nombres. Les mots vides (prépositions, articles, pronoms, etc.) ne sont pas compris dans ces dictionnaires, puisque les applications visées concernent la recherche multilingue et l'interrogation interlingue.
Les deux dictionnaires sont présentés sous la forme de fichiers XML, suivant la même DTD. Ces fichiers sont codés en UNICODE - UTF-8.
Ces dictionnaires sont "consistants" : chacun représente une version inversée de l'autre, ce qui s'avère très utile pour des systèmes d'alignement, des moteurs de recherche multilingues, etc.
La liste des domaines se trouvent dans la DTD, où plus de 100 noms de domaines sont représentés.
People who looked at this resource also viewed the following:
- Bibliša: Aligned Collection Search Tool
- Bilingual Greek-English Comparable Corpus of News Texts
- Bilingual Spanish-English and English-Spanish lexicons (INCYTA) - Aeronautics, Navigation, Mechanical Engineering
- Bilingual Spanish-English and English-Spanish lexicons (INCYTA) - Data Processing, Electronics, Telecoms