[Python-es] Indexación de archivos

José Javier Castro Matamoros el4tomo en gmail.com
Mie Feb 22 16:35:30 CET 2012


Muy buenos días miembros de la lista.

Hace unos días me involucré en un proyecto que tiene por finalidad
proporcionar al usuario inexperto un repositorio de Software Libre. En él
se puede consultar Software vía web según determinadas categorías,
arquitecturas y sistemas operativos. Hasta aquí nada del otro mundo.

Como requerimiento del proyecto, debemos utilizar un repositorio de espejos
[1] que ya se encuentra instalado y en funcionamiento. La idea, según me
comentaron los responsables del proyecto, es utilizar ese repositorio para
indexar los diversos programas existentes en él. Sin embargo, esto
representa un problema, pues los repositorios de los diversos proyectos,
tienen una estructura arbitraria y solo en pocos casos se encuentra una
leve similitud en la estructura de carpetas y archivos.

Lo que se espera, es, que a través de la indexación de los archivos y
carpetas del repositorio, es determinar qué proyectos existen en el
repositorio, sus versiones, arquitecturas y sistemas operativos, utilizando
para ello, solo la información que se encuentra en el repositorio, que
dicho sea de paso, no es mucha o al menos yo solo veo unos recortes de
información.

¿Por qué se quiere utilizar la información de los archivos en el
repositorio? Esto es porque los repositorios son espejos de los
repositorios reales de cada proyecto, por lo que no son administrados por
los admins de server de espejos. Por otro lado, se espera que si una nueva
versión de un proyecto es agregada el repositorio la aplicación web vía el
indice de archivos, pueda mostrar el cambio en forma automática.

Se estarán preguntando por qué posteo acá este caso. Bueno, el proyecto lo
estamos desarrollando en Python/Django y mi interés es saber si conocen de
algún indexador de archivos, conocer sus impresiones sobre la idea y
averiguar si alguien está tratando de implementar algo similar, o si
conocen algún proyecto parecido.

Muchas gracias por su tiempo.

Saludos cordiales.

[1] http://espejos.ucr.ac.cr/
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.python.org/pipermail/python-es/attachments/20120222/9ef911b2/attachment.html>


Más información sobre la lista de distribución Python-es