[Python-es] Otaku script

Chema Cortes pych3m4 en gmail.com
Mar Feb 12 11:12:48 CET 2013


El 12 de febrero de 2013 10:54, Alexandro Colorado <jza en oooes.org> escribió:

>
> 2013/2/12 Chema Cortes <pych3m4 en gmail.com>
>
>> El 12 de febrero de 2013 06:24, Alexandro Colorado <jza en oooes.org>escribió:
>>
>> Hola, no se cuanto fan de Anime y Manga Japonesa haya por aqui, pero
>>> tengo un script que jala del sitio http://www.mangareader.net/
>>>
>>> comics usando python, curl y beautifulsoup. Estas imagenes las mete en
>>> un folder que crea y titula como el comic.
>>>
>>
>> No veo que preguntes nada en concreto, así que sólo pondré algunos
>> comentarios:
>>
>
> La pregunta es mas de deciones, seria mejor tener una clase o una serie de
> condicionales para que pueda trabajar el sitio de manera transparente?
>
>
No es fácil trabajar con condicionales. Las dos webs pueden requerír
distintas estrategias para extraer la información e implementar ésto con
condicionales es muy farragoso. Mucho más adecuado es darle una orientación
a objetos, con un script principal que lleve la lógica de la extracción de
datos y luego varias clases con el método de extracción específico para
cada web.

Mi recomendación es que te construyas una API sencilla con la que se
comuniquen el método principal y los scrappers. Esta API iría como una
clase abstracta de la cuál derivarían las clases para los scrappers.



-- 
Hyperreals *R: http://ch3m4.org/blog
Quarks, bits y otras criaturas infinitesimales
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.python.org/pipermail/python-es/attachments/20130212/79561778/attachment.html>


Más información sobre la lista de distribución Python-es