Ubuntu giver grafiske og kommandolinje-værktøjer til at konvertere bærbare dokumentfiler (PDF ) til tekst -format . Kommandolinjen versionen, " pdftotext " automatiserer processen ved herunder omlægning kommando i en shell script. På denne måde kan flere PDF filer ændres på samme tid . En række kommandolinjetilvalg leveret med kommandoen aktivere specifikke aktioner (såsom kun at konvertere de første par sider) til at finde sted hver gang den køres . Indhentning pdftotext
Opnå de relevante pakker og kommando " pdftotext " fra Ubuntu biblioteker via kommandoen : Hej
sudo apt -get install poppler -utils
Sørg for, at pakken installerer korrekt, før du forsøger at bruge det.
pdftotext Man Page
Lær hvordan pdftotext kommando fungerer , og gøre dig bekendt med kommandolinje- muligheder. Kig på manden siden for kommandoen indtastning "man pdftotext " på kommandolinjen shell prompt, og klik på " Enter" . Kommandolinjeindstillingerne bestå af bogstaver , indledt med en streg , såsom " -L" , og de alle giver forskellige funktioner.
Standard kommando til pdftotext er " pdftotext " (uden anførselstegn) , hvor er navnet på den PDF fil for at pakke , såsom " report.pdf ", og er navnet på den tekst output-fil , såsom " report.txt " . Du kan bruge enhver navn efter eget valg .
Batch PDF konvertering
Test kommandoen ved at prøve det på et par PDF-filer individuelt. Hvis det er okay , du kan prøve at bruge det på en række PDF-filer i shell scripts til at automatisere processen . Et eksempel på en typisk script er vist nedenfor : Hej
for jeg i * pdf
gøre
pdftotext $ i $ i.txt
gjort < . br >
Dette script tager alle de PDF-filer i den aktuelle mappe og eksporterer dem med deres navn til en tekstfil , så " report.pdf " ville blive " report.pdf.txt "
< br > beskyttede PDF-filer
Nogle PDF-filer er beskyttet enten med adgangskoder eller oprette for at forhindre eksport af tekst fra dokumentet . Dette er et forsøg på at beskytte ophavsretten , og hvis dette er tilfældet du måske hellere genoverveje konverteringen fra et juridisk perspektiv . Hvis du har adgangskoden til en PDF-fil , kan dette være bestået i kommandolinjen muligheder for " pdftotext " .