poppler-utils
je skup alata za rad sa PDF dokumentima u komandnoj liniji. Ovi alati omogućavaju ekstrakciju teksta i slika, konverziju, manipulaciju PDF fajlovima i druge operacije.
Instalacija poppler-utils
zavisi od operativnog sistema koji koristiš. Pošto koristiš Linux (Ubuntu), evo kako se instalira na različitim distribucijama:
Ubuntu / Debian
sudo apt update sudo apt install poppler-utils
Arch Linux / Manjaro
sudo pacman -S poppler
(Nema zasebnog poppler-utils
paketa, već je deo poppler
paketa.)
Fedora
sudo dnf install poppler-utils
openSUSE
sudo zypper install poppler-tools
MacOS (Homebrew)
brew install poppler
Provera instalacije
Nakon instalacije, možeš proveriti da li su alati dostupni pomoću:
pdftotext -v
Ako vidiš verziju, sve je uspešno instalirano! 🚀
Mogućnosti poppler-utils paketa
1. pdftotext
– Ekstrakcija teksta iz PDF-a
Sintaksa:
pdftotext [opcijе] ulaz.pdf [izlaz.txt]
Opcije:
-layout
→ Očuva raspored teksta.-raw
→ Izvlači tekst bez ikakvog formatiranja.-f <stranica>
→ Početna stranica za ekstrakciju.-l <stranica>
→ Krajnja stranica za ekstrakciju.
Primer:
pdftotext -layout dokument.pdf izlaz.txt
2. pdftohtml
– Konverzija PDF-a u HTML
Sintaksa:
pdftohtml [opcijе] ulaz.pdf [izlaz.html]
Opcije:
-noframes
→ Generiše jednostavan HTML bez frejmova.-stdout
→ Štampa HTML na standardni izlaz.-xml
→ Izlaz u XML formatu umesto HTML-a.
Primer:
pdftohtml -noframes dokument.pdf
3. pdfimages
– Ekstrakcija slika iz PDF-a
Sintaksa:
pdfimages [opcijе] ulaz.pdf prefiks_izlaza
Opcije:
-png
→ Ekstrakcija u PNG formatu.-j
→ Ekstrakcija u JPEG formatu.-f <stranica>
→ Početna stranica za obradu.-l <stranica>
→ Krajnja stranica za obradu.
Primer:
pdfimages -png dokument.pdf slike
(Slike će biti sačuvane kao slike-000.png
, slike-001.png
, itd.)
4. pdfinfo
– Prikazuje metapodatke PDF fajla
Sintaksa:
pdfinfo [opcijе] ulaz.pdf
Opcije:
-meta
→ Prikazuje dodatne metapodatke.
Primer:
pdfinfo dokument.pdf
(Ovo će prikazati informacije kao što su naslov, autor, broj stranica itd.)
5. pdftoppm
– Konverzija PDF-a u slike
Sintaksa:
pdftoppm [opcijе] ulaz.pdf prefiks_izlaza
Opcije:
-png
→ Konvertuje stranice u PNG format.-jpeg
→ Konvertuje stranice u JPEG format.-f <stranica>
→ Početna stranica.-l <stranica>
→ Krajnja stranica.
Primer:
pdftoppm -png dokument.pdf stranica
(Ovo generiše stranica-1.png
, stranica-2.png
, itd.)
6. pdftocairo
– Napredna konverzija PDF-a u razne formate
Sintaksa:
pdftocairo [opcijе] ulaz.pdf izlaz
Opcije:
-png
→ Konvertuje u PNG format.-svg
→ Konvertuje u SVG format.-pdf
→ Kreira novi PDF fajl sa optimizacijama.
Primer:
pdftocairo -svg dokument.pdf izlaz.svg
7. pdfunite
– Spajanje više PDF fajlova u jedan
Sintaksa:
pdfunite ulaz1.pdf ulaz2.pdf izlaz.pdf
Primer:
pdfunite prvi.pdf drugi.pdf spojeni.pdf
(Ovo spaja prvi.pdf
i drugi.pdf
u spojeni.pdf
.)
8. pdfseparate
– Razdvajanje PDF-a u pojedinačne stranice
Sintaksa:
pdfseparate ulaz.pdf izlaz-%d.pdf
Primer:
pdfseparate dokument.pdf stranica-%d.pdf
(Ovo generiše stranica-1.pdf
, stranica-2.pdf
, itd.)
9. pdfdetach
– Ekstrakcija priloženih fajlova iz PDF-a
Sintaksa:
pdfdetach -saveall -o direktorijum ulaz.pdf
Primer:
pdfdetach -saveall -o prilozi dokument.pdf
(Ovo će izvući sve priložene fajlove u direktorijum prilozi
.)
Zaključak
poppler-utils
pruža moćne alate za rad sa PDF fajlovima, a korišćenjem kombinacija ovih komandi moguće je automatizovati mnoge zadatke.