[ANN] PyTables 0.8
Francesc Alted
falted en pytables.org
Lun Mar 8 13:53:15 CET 2004
Hola,
Os hago una pequeña reseña (en castellano) del anuncio general de PyTables
que hice la semana pasada en c.l.p.a.
Saludos,
----
Ya está disponible la última y más potente versión de PyTables: 0.8.
PyTables es una base de datos jerárquica diseñada para trabajar con
grandes cantidades de datos. PyTables se basa en la libreria HDF5 y en
el paquete numarray. Ofrece una interface orientada al objecto que,
combinado con el nombrado natural (natural naming) y código C (generado
a partir de Pyrex), hace de él una herramienta rápida y muy fácil de
usar para salvar y recuperar grandes conjuntos de datos.
Con esta nueva versión (0.8) se ha conseguido batir un nuevo record de
capacidad: 5.6 TB (o sea, el contenido de 1000 DVD's aprox.) de datos en un
único fichero (!). [Ver más info en:
http://pytables.sourceforge.net/html/StressTests.html]
Las nuevas características de PyTables 0.8 se pueden resumir en:
- Arrays de Longitud Variable (VLA's) para guardar colecciones
de elementos de longitud variable.
- Arrays alargables (EA's) para agrandar conjuntos de datos
homogéneos en disco.
- Capacidades de replicación de ficheros muy potente, desde
simples hojas a jerarquias completas.
- Posibilidad de importación de ficheros HDF5 genéricos muy
mejorada.
- Dos nuevas utilidades: ptdump y ptrepack.
- Más plataformas soportadas: MacOSX, FreeBSD, Linux64, IRIX64 y,
probablemente, muchas más.
- Documentación de las nuevas caracterísiticas y mejora del
manual. En particular, se ha documentado el formato interno de
PyTables.
- Más unidades de test (más de 800).
- ...y una serie de bugs y otras pequeñas mejoras.
Para una información más completa, visitar:
http://sourceforge.net/project/shownotes.php?group_id=63486&release_id=220773
Dónde puedo usar PyTables?
==========================
PyTables no se ha diseñado como un competidor de una base de datos
relacional, sino más bien como un compañero de trabajo. Si quieres
trabajar con datos multidimensionales (por ejemplo, para análisis
multidimensional) o simplemente para dotar de una estructura jerárquica
a alguna parte de tu ya saturada base de datos relacional, puedes
encontrar en PyTables a un aliado.
Los ámbitos donde mejor se adecúa PyTables pueden ser para guardar datos
provenientes de sistemas de adquisición de datos, software de
simulación, sistemas de monitorización de tráfico (por ejemplo, medidas
de tráfico IP efectuadas en routers), como repositorio centralizado de
logs de sistemas distribuidos o trabajar con ficheros XML realmente
grandes (típicamente, más de 100 MB), por nombrar tan sólo unos pocos.
Web site
========
Para más info sobre características generales, fiabilidad, benchmarks,
soporte técnico, etc., visitar: http://www.pytables.org.
--
Francesc Alted
Más información sobre la lista de distribución Python-es