English-Arabic scrapping and identifying (Python script)

Zamknięty Opublikowano Feb 20, 2010 Płatność przy odbiorze
Zamknięty Płatność przy odbiorze

You will be given 15 websites of newspapers having articles in both English and Arabic (written ina TXT file).

Your Python should do the following:

1) download locally those websites (only HTML/TEXT content, nothing binary); each newspaper will have its own main folder.

2) using a dictionary, identify the parallel texts (basically we need to know which text in Arabic corresponds to which text in English)

3) extract only the article text for both English and Arabic and place them in a separate folder (one folder per language pair).

Inżynieria MySQL PHP Python Architektura oprogramowania Testowanie oprogramowania

Numer ID Projektu: #3196458

O projekcie

4 ofert Zdalny projekt Aktywny Mar 8, 2010

4 freelancerów złożyło ofertę za $223 w tym projekcie

testpulsevw

See private message.

$425 USD w ciągu 4 dni
(102 Oceny)
7.5
moamenm

See private message.

$85 USD w ciągu 4 dni
(37 Oceny)
5.3
jayawardanajapan

See private message.

$297.5 USD w ciągu 4 dni
(17 Oceny)
4.8
zahra812000

See private message.

$85 USD w ciągu 4 dni
(2 Oceny)
1.2
writerhut

See private message.

$85 USD w ciągu 4 dni
(0 Oceny)
0.0