[Python-es] ¿Propuesta de algoritmo o estructura de datos para conjuntos aleatorios con pocos cambios?

Jesus Cea jcea en jcea.es
Lun Nov 27 17:46:09 EST 2017


On 27/11/17 21:38, Francesc Alted wrote:
> En tu
> caso creí entender que ordenabas los valores de alguna manera, pero
> viendo los ratios que obtienes, y que son bastante más pobres que mi
> prueba, posiblemente no entiendo bien a que te refieres cuando dices
> 'ordenados'. ​

Lo cierto es que puedes comprobarlo tú mismo:

>>> hashes = [sha256(b'%d' % i).digest() for i in range(256000)]
>>> hashes.sort()  # Ordeno los hashes
>>> b=blosc.compress(b''.join(hashes), typesize=32)
>>> len(b)
8045911
>>> 100*(1-8045911/(256000*32))
1.7833129882812493

1.78%. Clava a mis resultados con datos reales:

>     Para quedarnos todos tranquilos, voy a ver mi caso real:
[...]>     1.7785873168091881
> 
>     La compresión es del 1.78%.
-- 
Jesús Cea Avión                         _/_/      _/_/_/        _/_/_/
jcea en jcea.es - http://www.jcea.es/     _/_/    _/_/  _/_/    _/_/  _/_/
Twitter: @jcea                        _/_/    _/_/          _/_/_/_/_/
jabber / xmpp:jcea en jabber.org  _/_/  _/_/    _/_/          _/_/  _/_/
"Things are not so easy"      _/_/  _/_/    _/_/  _/_/    _/_/  _/_/
"My name is Dump, Core Dump"   _/_/_/        _/_/_/      _/_/  _/_/
"El amor es poner tu felicidad en la felicidad de otro" - Leibniz

------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 473 bytes
Desc: OpenPGP digital signature
URL: <http://mail.python.org/pipermail/python-es/attachments/20171127/66a309bf/attachment.sig>


Más información sobre la lista de distribución Python-es