[ANN] PyTables 0.8

Francesc Alted falted en pytables.org
Lun Mar 8 13:53:15 CET 2004


Hola,

Os hago una pequeña reseña (en castellano) del anuncio general de PyTables
que hice la semana pasada en c.l.p.a.

Saludos,

----

Ya está disponible la última y más potente versión de PyTables: 0.8.

PyTables es una base de datos jerárquica diseñada para trabajar con
grandes cantidades de datos. PyTables se basa en la libreria HDF5 y en
el paquete numarray. Ofrece una interface orientada al objecto que,
combinado con el nombrado natural (natural naming) y código C (generado
a partir de Pyrex), hace de él una herramienta rápida y muy fácil de
usar para salvar y recuperar grandes conjuntos de datos.

Con esta nueva versión (0.8) se ha conseguido batir un nuevo record de
capacidad: 5.6 TB (o sea, el contenido de 1000 DVD's aprox.) de datos en un
único fichero (!). [Ver más info en:
http://pytables.sourceforge.net/html/StressTests.html]

Las nuevas características de PyTables 0.8 se pueden resumir en:

	- Arrays de Longitud Variable (VLA's) para guardar colecciones
	  de elementos de longitud variable.
	- Arrays alargables (EA's) para agrandar conjuntos de datos
	  homogéneos en disco.
	- Capacidades de replicación de ficheros muy potente, desde
	  simples hojas a jerarquias completas.
	- Posibilidad de importación de ficheros HDF5 genéricos muy
	  mejorada.
	- Dos nuevas utilidades: ptdump y ptrepack.
	- Más plataformas soportadas: MacOSX, FreeBSD, Linux64, IRIX64 y,
	  probablemente, muchas más.
	- Documentación de las nuevas caracterísiticas y mejora del
	  manual. En particular, se ha documentado el formato interno de
	  PyTables.
	- Más unidades de test (más de 800).
	- ...y una serie de bugs y otras pequeñas mejoras.

 
Para una información más completa, visitar:
http://sourceforge.net/project/shownotes.php?group_id=63486&release_id=220773

Dónde puedo usar PyTables?
==========================

PyTables no se ha diseñado como un competidor de una base de datos
relacional, sino más bien como un compañero de trabajo. Si quieres
trabajar con datos multidimensionales (por ejemplo, para análisis
multidimensional) o simplemente para dotar de una estructura jerárquica
a alguna parte de tu ya saturada base de datos relacional, puedes
encontrar en PyTables a un aliado.

Los ámbitos donde mejor se adecúa PyTables pueden ser para guardar datos
provenientes de sistemas de adquisición de datos, software de
simulación, sistemas de monitorización de tráfico (por ejemplo, medidas
de tráfico IP efectuadas en routers), como repositorio centralizado de
logs de sistemas distribuidos o trabajar con ficheros XML realmente
grandes (típicamente, más de 100 MB), por nombrar tan sólo unos pocos.

Web site
========

Para más info sobre características generales, fiabilidad, benchmarks,
soporte técnico, etc., visitar: http://www.pytables.org.

-- 
Francesc Alted




Más información sobre la lista de distribución Python-es