Skip to main content

Extraer páginas de un PDF en Linux desde el shell

Antecedentes

Mucha sveces necesitamos extraer de un docuemnto PDF una o varias páginas, y para mi la forma más comoda es la de usar un comando de terminal. Tampoco soy amigo de instalar software pirata como hacen muchos usuarios de Linux, que instalarían el Acrobat Pro en un windows emulado. Ni amigo de instalar apps de escritorio que muchas veces dependen de mucho software.

Pdftk

Pdftk es una herramienta para trabajar con documentos PDF en la linea de comandos.

Instalación

Apt (Debian, Ubuntu)

sudo apt install pdftk

Snap (Preferida por mi)

sudo snap install pdftk

Extraer páginas de un PDF con PDFtk

pdftk [nombre_original.pdf] cat [paginas_numeros] output [nombre_del_fichero_extraido.pdf]
  • nombre_original.pdf es el fichero del que queremos extraer la o las páginas
  • paginas_numeros, es la página o págins que queremos extraer, "2", "2-4" (de la 2 a la 4 inclusive)
  • nombre_del_fichero_extraido.pdf nombre del fichero resultante

Extrarer páginas especificas

pdftk [nombre_original.pdf] cat 2 4 6 output [nombre_del_fichero_extraido.pdf]

Otros enlaces