Najvažniji alati iz poppler-utils paketa i njihove opcije:

poppler-utils je skup alata za rad sa PDF dokumentima u komandnoj liniji. Ovi alati omogućavaju ekstrakciju teksta i slika, konverziju, manipulaciju PDF fajlovima i druge operacije.


Instalacija poppler-utils zavisi od operativnog sistema koji koristiš. Pošto koristiš Linux (Ubuntu), evo kako se instalira na različitim distribucijama:

Ubuntu / Debian

sudo apt update
sudo apt install poppler-utils

Arch Linux / Manjaro

sudo pacman -S poppler

(Nema zasebnog poppler-utils paketa, već je deo poppler paketa.)

Fedora

sudo dnf install poppler-utils

openSUSE

sudo zypper install poppler-tools

MacOS (Homebrew)

brew install poppler

Provera instalacije

Nakon instalacije, možeš proveriti da li su alati dostupni pomoću:

pdftotext -v

Ako vidiš verziju, sve je uspešno instalirano! 🚀


Mogućnosti poppler-utils paketa

1. pdftotext – Ekstrakcija teksta iz PDF-a

Sintaksa:

pdftotext [opcijе] ulaz.pdf [izlaz.txt]

Opcije:

  • -layout → Očuva raspored teksta.
  • -raw → Izvlači tekst bez ikakvog formatiranja.
  • -f <stranica> → Početna stranica za ekstrakciju.
  • -l <stranica> → Krajnja stranica za ekstrakciju.

Primer:

pdftotext -layout dokument.pdf izlaz.txt

2. pdftohtml – Konverzija PDF-a u HTML

Sintaksa:

pdftohtml [opcijе] ulaz.pdf [izlaz.html]

Opcije:

  • -noframes → Generiše jednostavan HTML bez frejmova.
  • -stdout → Štampa HTML na standardni izlaz.
  • -xml → Izlaz u XML formatu umesto HTML-a.

Primer:

pdftohtml -noframes dokument.pdf

3. pdfimages – Ekstrakcija slika iz PDF-a

Sintaksa:

pdfimages [opcijе] ulaz.pdf prefiks_izlaza

Opcije:

  • -png → Ekstrakcija u PNG formatu.
  • -j → Ekstrakcija u JPEG formatu.
  • -f <stranica> → Početna stranica za obradu.
  • -l <stranica> → Krajnja stranica za obradu.

Primer:

pdfimages -png dokument.pdf slike

(Slike će biti sačuvane kao slike-000.png, slike-001.png, itd.)


4. pdfinfo – Prikazuje metapodatke PDF fajla

Sintaksa:

pdfinfo [opcijе] ulaz.pdf

Opcije:

  • -meta → Prikazuje dodatne metapodatke.

Primer:

pdfinfo dokument.pdf

(Ovo će prikazati informacije kao što su naslov, autor, broj stranica itd.)


5. pdftoppm – Konverzija PDF-a u slike

Sintaksa:

pdftoppm [opcijе] ulaz.pdf prefiks_izlaza

Opcije:

  • -png → Konvertuje stranice u PNG format.
  • -jpeg → Konvertuje stranice u JPEG format.
  • -f <stranica> → Početna stranica.
  • -l <stranica> → Krajnja stranica.

Primer:

pdftoppm -png dokument.pdf stranica

(Ovo generiše stranica-1.png, stranica-2.png, itd.)


6. pdftocairo – Napredna konverzija PDF-a u razne formate

Sintaksa:

pdftocairo [opcijе] ulaz.pdf izlaz

Opcije:

  • -png → Konvertuje u PNG format.
  • -svg → Konvertuje u SVG format.
  • -pdf → Kreira novi PDF fajl sa optimizacijama.

Primer:

pdftocairo -svg dokument.pdf izlaz.svg

7. pdfunite – Spajanje više PDF fajlova u jedan

Sintaksa:

pdfunite ulaz1.pdf ulaz2.pdf izlaz.pdf

Primer:

pdfunite prvi.pdf drugi.pdf spojeni.pdf

(Ovo spaja prvi.pdf i drugi.pdf u spojeni.pdf.)


8. pdfseparate – Razdvajanje PDF-a u pojedinačne stranice

Sintaksa:

pdfseparate ulaz.pdf izlaz-%d.pdf

Primer:

pdfseparate dokument.pdf stranica-%d.pdf

(Ovo generiše stranica-1.pdf, stranica-2.pdf, itd.)


9. pdfdetach – Ekstrakcija priloženih fajlova iz PDF-a

Sintaksa:

pdfdetach -saveall -o direktorijum ulaz.pdf

Primer:

pdfdetach -saveall -o prilozi dokument.pdf

(Ovo će izvući sve priložene fajlove u direktorijum prilozi.)


Zaključak

poppler-utils pruža moćne alate za rad sa PDF fajlovima, a korišćenjem kombinacija ovih komandi moguće je automatizovati mnoge zadatke.

By Abel

Leave a Reply

Your email address will not be published. Required fields are marked *