poppler-utils je skup alata za rad sa PDF dokumentima u komandnoj liniji. Ovi alati omogućavaju ekstrakciju teksta i slika, konverziju, manipulaciju PDF fajlovima i druge operacije.
Instalacija poppler-utils zavisi od operativnog sistema koji koristiš. Pošto koristiš Linux (Ubuntu), evo kako se instalira na različitim distribucijama:
Ubuntu / Debian
sudo apt update sudo apt install poppler-utils
Arch Linux / Manjaro
sudo pacman -S poppler
(Nema zasebnog poppler-utils paketa, već je deo poppler paketa.)
Fedora
sudo dnf install poppler-utils
openSUSE
sudo zypper install poppler-tools
MacOS (Homebrew)
brew install poppler
Provera instalacije
Nakon instalacije, možeš proveriti da li su alati dostupni pomoću:
pdftotext -v
Ako vidiš verziju, sve je uspešno instalirano! 🚀
Mogućnosti poppler-utils paketa
1. pdftotext – Ekstrakcija teksta iz PDF-a
Sintaksa:
pdftotext [opcijе] ulaz.pdf [izlaz.txt]
Opcije:
-layout→ Očuva raspored teksta.-raw→ Izvlači tekst bez ikakvog formatiranja.-f <stranica>→ Početna stranica za ekstrakciju.-l <stranica>→ Krajnja stranica za ekstrakciju.
Primer:
pdftotext -layout dokument.pdf izlaz.txt
2. pdftohtml – Konverzija PDF-a u HTML
Sintaksa:
pdftohtml [opcijе] ulaz.pdf [izlaz.html]
Opcije:
-noframes→ Generiše jednostavan HTML bez frejmova.-stdout→ Štampa HTML na standardni izlaz.-xml→ Izlaz u XML formatu umesto HTML-a.
Primer:
pdftohtml -noframes dokument.pdf
3. pdfimages – Ekstrakcija slika iz PDF-a
Sintaksa:
pdfimages [opcijе] ulaz.pdf prefiks_izlaza
Opcije:
-png→ Ekstrakcija u PNG formatu.-j→ Ekstrakcija u JPEG formatu.-f <stranica>→ Početna stranica za obradu.-l <stranica>→ Krajnja stranica za obradu.
Primer:
pdfimages -png dokument.pdf slike
(Slike će biti sačuvane kao slike-000.png, slike-001.png, itd.)
4. pdfinfo – Prikazuje metapodatke PDF fajla
Sintaksa:
pdfinfo [opcijе] ulaz.pdf
Opcije:
-meta→ Prikazuje dodatne metapodatke.
Primer:
pdfinfo dokument.pdf
(Ovo će prikazati informacije kao što su naslov, autor, broj stranica itd.)
5. pdftoppm – Konverzija PDF-a u slike
Sintaksa:
pdftoppm [opcijе] ulaz.pdf prefiks_izlaza
Opcije:
-png→ Konvertuje stranice u PNG format.-jpeg→ Konvertuje stranice u JPEG format.-f <stranica>→ Početna stranica.-l <stranica>→ Krajnja stranica.
Primer:
pdftoppm -png dokument.pdf stranica
(Ovo generiše stranica-1.png, stranica-2.png, itd.)
6. pdftocairo – Napredna konverzija PDF-a u razne formate
Sintaksa:
pdftocairo [opcijе] ulaz.pdf izlaz
Opcije:
-png→ Konvertuje u PNG format.-svg→ Konvertuje u SVG format.-pdf→ Kreira novi PDF fajl sa optimizacijama.
Primer:
pdftocairo -svg dokument.pdf izlaz.svg
7. pdfunite – Spajanje više PDF fajlova u jedan
Sintaksa:
pdfunite ulaz1.pdf ulaz2.pdf izlaz.pdf
Primer:
pdfunite prvi.pdf drugi.pdf spojeni.pdf
(Ovo spaja prvi.pdf i drugi.pdf u spojeni.pdf.)
8. pdfseparate – Razdvajanje PDF-a u pojedinačne stranice
Sintaksa:
pdfseparate ulaz.pdf izlaz-%d.pdf
Primer:
pdfseparate dokument.pdf stranica-%d.pdf
(Ovo generiše stranica-1.pdf, stranica-2.pdf, itd.)
9. pdfdetach – Ekstrakcija priloženih fajlova iz PDF-a
Sintaksa:
pdfdetach -saveall -o direktorijum ulaz.pdf
Primer:
pdfdetach -saveall -o prilozi dokument.pdf
(Ovo će izvući sve priložene fajlove u direktorijum prilozi.)
Zaključak
poppler-utils pruža moćne alate za rad sa PDF fajlovima, a korišćenjem kombinacija ovih komandi moguće je automatizovati mnoge zadatke.
