Extracción de metadatos de documentos
Arnau Sanchez
pyarnau en gmail.com
Vie Sep 12 14:43:50 CEST 2008
Chema Cortes escribió:
> ¿Conocéis de alguna librería que use varios formatos de ficheros? No
> necesito que sea multiplataforma.
No los he usado en serio, pero alguna vez he probado "extract" (que usa
libextractor) y la librería "python-hachoir-metadata". Eso sí, no creo que con
ninguno de ellos puedas modificar los metadatos...
Package: extract
Description-es: Muestra los metadatos de archivos de cualquier tipo
Parecido al conocido programa «file», extract puede mostrar los metadatos
de un archivo e imprimir los resultados a stdout.
.
Actualmente, libextractor funciona con los siguientes formatos: HTML, PDF,
PS, OLE2 (DOC, XLS, PPT), OpenOffice (sxw), StarOffice (sdw), DVI, MAN, MP3
(ID3v1 y ID3v2), OGG, WAV, EXIV2, JPEG, GIF, PNG, TIFF, DEB, RPM, TAR(.GZ),
ZIP, ELF, REAL, RIFF (AVI), MPEG, QT y ASF.
----
Package: python-hachoir-metadata
Description: Program to extract metadata using Hachoir library
hachoir-metadata extracts metadata from multimedia files: music, picture,
video, but also archives. It supports most common file formats:
* Archives: bzip2, gzip, zip, tar
* Audio: MPEG audio ("MP3"), WAV, Sun/NeXT audio, Ogg/Vorbis (OGG), MIDI,
AIFF, AIFC, Real audio (RA)
* Image: BMP, CUR, EMF, ICO, GIF, JPEG, PCX, PNG, TGA, TIFF, WMF, XCF
* Video: ASF format (WMV video), AVI, Matroska (MKV), Quicktime (MOV),
Ogg/Theora, Real media (RM)
_______________________________________________
Lista de correo Python-es
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes
Más información sobre la lista de distribución Python-es