Extracción de metadatos de documentos

Arnau Sanchez pyarnau en gmail.com
Vie Sep 12 14:43:50 CEST 2008


Chema Cortes escribió:

  > ¿Conocéis de alguna librería que use varios formatos de ficheros? No
> necesito que sea multiplataforma.

No los he usado en serio, pero alguna vez he probado "extract" (que usa 
libextractor) y la librería "python-hachoir-metadata". Eso sí, no creo que con 
ninguno de ellos puedas modificar los metadatos...

Package: extract
Description-es: Muestra los metadatos de archivos de cualquier tipo
  Parecido al conocido programa «file», extract puede mostrar los metadatos
  de un archivo e imprimir los resultados a stdout.
  .
  Actualmente, libextractor funciona con los siguientes formatos: HTML, PDF,
  PS, OLE2 (DOC, XLS, PPT), OpenOffice (sxw), StarOffice (sdw), DVI, MAN, MP3
  (ID3v1 y ID3v2), OGG, WAV, EXIV2, JPEG, GIF, PNG, TIFF, DEB, RPM, TAR(.GZ),
  ZIP, ELF, REAL, RIFF (AVI), MPEG, QT y ASF.

----

Package: python-hachoir-metadata
Description: Program to extract metadata using Hachoir library
  hachoir-metadata extracts metadata from multimedia files: music, picture,
  video, but also archives. It supports most common file formats:
   * Archives: bzip2, gzip, zip, tar
   * Audio: MPEG audio ("MP3"), WAV, Sun/NeXT audio, Ogg/Vorbis (OGG), MIDI,
     AIFF, AIFC, Real audio (RA)
   * Image: BMP, CUR, EMF, ICO, GIF, JPEG, PCX, PNG, TGA, TIFF, WMF, XCF
   * Video: ASF format (WMV video), AVI, Matroska (MKV), Quicktime (MOV),
     Ogg/Theora, Real media (RM)
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es