[Python-es] ¿cómo indicar a python una url incompleta?

Marc Garcia garcia.marc en gmail.com
Sab Feb 20 17:39:17 EST 2021


Sí, tienes que descargar el contenido de la página, puedes usar urllib o
requests. Una vez tengas un string con el código html, puedes usar una
simple regex, o algo más sofisticado como xpath con lxml o BeautifulSoup.

Yo usaría urllib y regex para este caso.

On Sat, 20 Feb 2021, 17:36 Criss, <crisspro en hotmail.com> wrote:

> ¿y hay forma de listar los enlaces de la página, y obtener el que termine
> en .zip?
> El 20-02-2021 a las 19:05, Marc Garcia escribió:
>
> Eso no existe en el protocolo HTTP, no podrás hacerlo con Python ni con
> nada. La única opción sería si el servidor http tiene una página con un
> indice, entonces podrías ver lo que hay, e implementar tú el wildcard.
>
> On Sat, 20 Feb 2021, 16:53 Criss, <crisspro en hotmail.com> wrote:
>
>> Perdón por explicarme mal. Cuando decía el día de mañana, hablaba en
>> sentido figurado para señalar que el archivo puede cambiar de nombre en
>> cualquier momento.
>>
>> Lo que busco es alguna instrucción o algún símbolo que indique cualquier
>> nombre, algo así como cuando buscamos un archivo por su extención con
>> "*.zip", pero aplicado a las url.
>>
>>
>>
>> From datatime import date
>>
>> nombre_arch="archivo_"
>> Hoy = date.today()
>> Día = today.day +1
>>
>> Print("nombre_archivo_{}{}{}.Zip". format(día, today.month, today.year)
>>
>>
>>
>> El sáb., 20 feb. 2021 21:50, Criss <crisspro en hotmail.com> escribió:
>>
>>> hola.
>>>
>>>
>>>   sucede que tengo una url que descarga un archivo, el punto es que el
>>> nombre del mismo cambia, no así el resto de la url, por ejemplo:
>>>
>>>
>>> webbrowser.open('https://sitio.com/pagina/archivo1.zip')
>>>
>>>
>>> como hago para indicar la url si donde dice 'archivo1' el día de mañana
>>> puede ser 'archivo2' o 'archivo3', pero siempre terminado en .zip.
>>>
>>>
>>> Un saludo.
>>>
>>> _______________________________________________
>>> Python-es mailing list
>>> Python-es en python.org
>>> https://mail.python.org/mailman/listinfo/python-es
>>>
>>
>> _______________________________________________
>> Python-es mailing listPython-es en python.orghttps://mail.python.org/mailman/listinfo/python-es
>>
>> _______________________________________________
>> Python-es mailing list
>> Python-es en python.org
>> https://mail.python.org/mailman/listinfo/python-es
>>
>
> _______________________________________________
> Python-es mailing listPython-es en python.orghttps://mail.python.org/mailman/listinfo/python-es
>
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> https://mail.python.org/mailman/listinfo/python-es
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://mail.python.org/pipermail/python-es/attachments/20210220/b4f63717/attachment.html>


Más información sobre la lista de distribución Python-es