An-Nahar Newspaper Text Corpus

View resource name in all available languages

Corpus de textes du quotidien An-Nahar

ID:

ELRA-W0027

The An-Nahar Lebanon Newspaper Text Corpus comprises articles in standard Arabic from 1995 to 2000 (6 years) stored as HTML files on CDRom media. Each year contains 45 000 articles and 24 million words. Each article includes information such as title, newspaper's name, date, country, type, page, etc. For each year, the size in byte is as follows:
1995 : 128 MB
1996 : 138 MB
1997 : 152 MB
1998 : 140 MB
1999 : 130 MB
2000 : 118 MB

View resource description in all available languages

Le corpus de textes du quotidien libanais An-Nahar est constitué d'articles en arabe standard de 1995 à 2000 (6 ans), stockés sous la forme de fichiers HTML sur CD-ROM. Chaque année contient 45 000 articles et 24 millions de mots. Chaque article contient des informations telles que le titre, le nom du quotidien, la date, le pays, le type, la page, etc.
La taille du fichier, pour chaque année, est comme suit :
1995 : 128 MB
1996 : 138 MB
1997 : 152 MB
1998 : 140 MB
1999 : 130 MB
2000 : 118 MB

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following: