[Python-es] Almacenado de datos

Francesc Alted faltet en pytables.org
Jue Mar 8 03:02:41 CET 2012


On Mar 6, 2012, at 11:03 PM, Kiko wrote:

> 
> 
> El 7 de marzo de 2012 00:30, Francesc Alted <faltet en pytables.org> escribió:
> On Mar 6, 2012, at 2:21 PM, Kiko wrote:
> > El 6 de marzo de 2012 22:55, Daπid <davidmenhur en gmail.com> escribió:
> > 2012/3/6 Inigo Aldazabal Mensa <inigo_aldazabal en ehu.es>:
> > > a. La verdad es que estuve en un tutorial de pytables
> > > y me pareció muy interesante, pero pensé que su principal utilidad era
> > > para cosas "grandes"
> >
> > Tienen mucho esfuerzo puesto en ello, parece su principal orientación,
> > pero si quieres hacer fácil lo complicado, acabas haciendo muy fácil
> > lo elemental. Lo que me gusta de Tables es que es una estructura muy
> > intuitiva (tablas) y muy pythónica. Como bonus, se puede escalar
> > mucho, pero eso ya no me interesa (todavía).
> >
> > Si la fusión de bases de datos se pusiera fea, se me ha ocurrido que
> > las simulaciones pueden generar ASCII, y una vez teniendo todas,
> > combinarlas en la BD. En cualquier caso, me paso por su lista a ver
> > qué me dicen, porque en la documentación no he encontrado nada.
> >
> > Y para simplificar un poco el tema, ¿no te valdría netcdf [1]? PyTables quizá sea para proyectos más gordos y para algo sencillo te pueda valer usar solo netcdf, que vienen a ser algo parecido a HDF. PyTables trabaja con HDF y permite hacer muchas cosas con datos en ese formato pero, como comento, quizá sea para desarrollos grandes que hagan uno intensivo de creación y lectura de datos. La librería que enlazo permite leer y escribir netcdf de forma muy sencilla.
> 
> Bueno, NetCDF4 necesita HDF5 para correr, así que la instalación en principio es mas complicada, no?  Y después, supongo que hay cosas mas fáciles en una librería que en otra y viceversa, pero no creo que haya muchas diferencias en términos de usabilidad (pero puedo estar equivocado).  Pero sobretodo, donde PyTables hace énfasis es en la manipulación de tablas, y es ahí donde creo que puede aportar cosas que otros paquetes no pueden.
> 
> -- Francesc Alted
> 
> Obviamente, Francesc tiene más autoridad que yo para hablar de estos temas y agradecería que corrigiera cualquier burrada que yo haya podido decir.
> Por otra parte, creo recordar que netcdf4 sí que hace uso de HDF5, pero netcdf3 no.

Cierto, pero a no ser que tengas muchos datos en formato NetCDF3 no creo que valga la pena usar un formato para el que no van salir nuevas cosas.  NetCDF4 es lo que se ha decidido para mejorar NetCDF3, y esta basado en HDF5.  Ademas, el netcdf4-python que recomendabas esta hecho para NetCDF4, no NetCDF3.

-- Francesc Alted








Más información sobre la lista de distribución Python-es