Manipulación de pdf con Ghostscript y pdftk
Un formato muy común para el manejo de información es el formato pdf, y muchas veces nos topamos con problemas como: “el archivo esta muy grande”, “no se puede enviar”, “como combinar varios archivos en uno”. Una solución a ésto y mucho más lo brinda Ghostscript y pdftk.
Para poder empezar a utilizar estas herramientas es necesaria la instalación de los paquetes gs y pdftk.
Una vez instalados estos paquetes se pueden realizar diferentes acciones con el comando gs, entre las que desatacan:
- Combinación de multiples archivos pdf.
- Reducir el tamaño y optimización de un archivo pdf.
- Split de archivo pdf.
Combinación de multiples archivos pdf
Con el comando gs la combinación de multiples pdf en uno es una tarea muy sencilla y se realiza con la siguiente instrucción:
gs -dNOPAUSE -sDEVICE=pdfwrite -sOUTPUTFILE=archivoCombinado.pdf -dBATCH archivo1.pdf archivo2.pdf ... archivoN.pdf
- archivoCombinado.pdf: Nombre del archivo resultante de la combinación de los archivos.
- archivo1.pdf archivo2.pdf … archivoN.pdf: Lista de los archivos pdf a combinar separados por un espacio.
Ejemplo de combinación varios archivos en uno:
gs -dNOPAUSE -sDEVICE=pdfwrite -sOUTPUTFILE=1_2.pdf -dBATCH 1.pdf 2.pdf
Reducir el tamaño y optimización de un archivo pdf
Para reducir el tamaño de un archivo pdf con gs se realiza con la siguiente instrucción:
gs -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=tipo -sOUTPUTFILE=archivoDestino.pdf -dBATCH archivoOrigen.pdf
- archivoDestino.pdf: Nombre del archivo resultante de la combinación de los archivos.
- archivoOrigen.pdf: Lista de los archivos pdf a combinar separados por un espacio.
- tipo: Tipo de pdf deseado. Valor utilizado para optimizar el pdf y puede tener los siguientes valores:
/screen: (screen-view-only quality, 72 dpi images)
/ebook: Baja calidad, imagenes de 150 dpi.
/printer: Alta calidad, imagenes de 300 dpi.
/prepress: Alta calidad, preservación del color, imagenes de 300 dpi.
/default: Muy similar al tipo /screen.
Ejemplo de optimización:
gs -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -sOUTPUTFILE=1b.pdf -dBATCH 1.pdf
Se pueden combinar ambas operaciones y lograr la combinación de varios pdf con un tipo determinado, para lograr esto basta agregar la opción -dPDFSETTINGS=tipo a la instrucción de combinación.
El comando gs tiene un mayor número de opciones y aplicaciones, los que mostré anteriormente son aplicaciones básicas para la manipulación de archivos pdf. Para mayor referencia del comando consulta: manual gs , así como tips de ghostscript
Split de pdf
Para separar 1 o varias páginas de un pdf se realiza con la siguiente instrucción:
pdftk archivoOrigen.pdf cat 12-15 output archivoDestino.pdf
- archivoDestino.pdf: Nombre del archivo resultante de la separación de páginas.
- archivoOrigen.pdf: Archivo del cual se quieren separar las páginas.
- 11-12: Rango de páginas a separar
LEAVE A COMMENT