An-Nahar Newspaper Text Corpus
View resource name in all available languages
Corpus de textes du quotidien An-Nahar
ID:
ELRA-W0027
The An-Nahar Lebanon Newspaper Text Corpus comprises articles in standard Arabic from 1995 to 2000 (6 years) stored as HTML files on CDRom media. Each year contains 45 000 articles and 24 million words. Each article includes information such as title, newspaper's name, date, country, type, page, etc. For each year, the size in byte is as follows:
1995 : 128 MB
1996 : 138 MB
1997 : 152 MB
1998 : 140 MB
1999 : 130 MB
2000 : 118 MB
View resource description in all available languages
Le corpus de textes du quotidien libanais An-Nahar est constitué d'articles en arabe standard de 1995 à 2000 (6 ans), stockés sous la forme de fichiers HTML sur CD-ROM. Chaque année contient 45 000 articles et 24 millions de mots. Chaque article contient des informations telles que le titre, le nom du quotidien, la date, le pays, le type, la page, etc.
La taille du fichier, pour chaque année, est comme suit :
1995 : 128 MB
1996 : 138 MB
1997 : 152 MB
1998 : 140 MB
1999 : 130 MB
2000 : 118 MB
People who looked at this resource also viewed the following: