Nekromanti Batchkonvertera PDF till TXT

Troberg

Sinister eater
Joined
27 Jun 2001
Messages
17,659
Någon som har ett bra verktyg för att masskonvertera PDF-filer till rå TXT?

Filerna är automatgenererade med okomplicerad layout (textblock, sidfot, sidhuvud, och då kan jag lätt ta bort sidhuvud och sidfot i efterhand med en liten egenskriven programsnutt).

Det finns många bra program för enstaka filer, tex Boxoft PDF to Text, men det blir aaaaaningen tröligt när man ska köra >100000 filer...

Operativsystem är Linux eller Windows. Föredrar ett open source-program, men bara gratis är bra nog om det kniper.

Några förslag?
 

Spider Jerusalem_UBBT

Swashbuckler
Joined
13 May 2011
Messages
2,245
Location
The City
Det här gör jag dagligen på jobbet...
Men jag tror inte du har tillgång till en Mainframe.
Jag ska kolla vad dom på windows och *nix sidan använder.
Jag antar att det är pdf med text och inte bara med bild.
 

Troberg

Sinister eater
Joined
27 Jun 2001
Messages
17,659
Spider Jerusalem said:
Det här gör jag dagligen på jobbet...
Men jag tror inte du har tillgång till en Mainframe.
Jag ska kolla vad dom på windows och *nix sidan använder.
Jag antar att det är pdf med text och inte bara med bild.
Bara text, i den mån det finns bilder (vilket inte borde finnas) så är de kasserbara.

Nja, jag har inte tillgång till en mainframe, men jag har en hel del datorkraft att leka med ändå. Jag kan utan problem sätta upp ett halvdussin maskiner som får stå och tugga på problemet om jag vill.

Å andra sidan så kommer efterföljande steg i processen att ta tid, så prestanda i konverteringen är inte en viktig faktor.
 

Troberg

Sinister eater
Joined
27 Jun 2001
Messages
17,659
Teobald said:
Spider Jerusalem said:
http://www.pdfzilla.com/zilla_pdf_to_txt_converter.html
Den här har vi tydligen använt ibland på jobbet.
OK, will try!
Nja, konverterade bara första sidan i gratisversionen. Däremot hittade jag Some PDF to Text Converter som verkar funka kanonbra, har redan kört cirka 1000 filer (den gör nog ungefär 10 filer/s).

Helt klart värd att testa. Den gillade dock inte skyddade PDF-er.
 

Troberg

Sinister eater
Joined
27 Jun 2001
Messages
17,659
Teobald said:
Nja, konverterade bara första sidan i gratisversionen. Däremot hittade jag Some PDF to Text Converter som verkar funka kanonbra, har redan kört cirka 1000 filer (den gör nog ungefär 10 filer/s).

Helt klart värd att testa. Den gillade dock inte skyddade PDF-er.
Skyddade PDF-er hanteras af Boxoft PDF to Text, och de utgör bara en liten, liten bråkdel av filerna, så de kan jag köra separat. Synd bara att de krashar Some PDF to Text Converter, det bryter liksom arbetsflödet.
 
Top