73532 Programik pod Windows: merge/uniq/diff plikow txt
min zł10 PLN
Anulowano
Opublikowano ponad 13 lat temu
min zł10 PLN
Płatne przy odbiorze
Jest potrzebny mały programik z GUI ;)
Mam spore (XXXMB) pliki tekstowe zawierajace adresy URL czasem sama domena czasem domena+ podstrona jeden wielki mix.
Co ma robic program:
1) Łączyc wybrane pliki w jeden.
2) Łączyc wszystkie pliki z katalogu X w jeden plik txt
3) Wybieram dwa pliki (plik1,plik2) a program robi plik3 w ktorym sa URLe z DOMENAMI i SUBDOMENAMI których nie ma w pliku nr1 (nie zwracamy uwagi na podstrony)!
plik1 zawartosc:
[login to view URL]
[login to view URL]
[login to view URL]
plik2 zawartosc (w nawiasie opis danej linijki):
[login to view URL] (url zostanie pokazana w plik3 bo takiej subdomeny+domeny nie ma jeszcze w plik1 mimo ze maja taki sam plik /[login to view URL] i domene [login to view URL] )
[login to view URL] (url nie zostanie pokazany bo domena [login to view URL] jest w plik1 mimo ze podstrona jest inna)
[login to view URL] (url zostanie pokazany w plik3 bo domeny [login to view URL] nie ma w plik1)
Wynik Plik3:
[login to view URL]
[login to view URL]
4)Usuń zdublowane domeny (opcjonalnie prosze podac ile wiecej za ten dodatek)
Funkcja nie zwraca uwagi na podstrony w URLU przy porownywaniu linijki/URL
Wejscie:
[login to view URL]
[login to view URL]
[login to view URL]
[login to view URL]
wyjscie:
[login to view URL]
[login to view URL]
[login to view URL]
Mam te funkcje w pythonie jak by ulatwilo ;)
__________________________________________________________________
Jak widac znajomosc REGEXP wymagana ;) i osoba piszaca musi miec swiadomosc jak to zrobic by mialo to dobra wydajnosc.