[Python-es] OT Detectar similitud de datos

Miguel Beltran R. yourpadre en gmail.com
Jue Nov 21 17:13:27 CET 2013


Hola lista,

En mi trabajo me pidieron que hiciera un sistema que detectara similitud en
unos datos para revisar que no nos esten engañando. Se supone que con un
analizador se toman lecturas de diferentes vehiculos pero en ocasiones
ciertas personas usan un mismo vehiculo para ser analizado en lugar del que
se capturo, es decir en lugar los datos de V1, V2 y V3 tengo realmente los
datos V1, V1 y V1. Los datos nunca son iguales pero si son similares.

La estructura de los datos es basicamente así:

campo - valor - descripcion
ID - 1 - quien genera los datos (unos 600 analizadores)
año - 2007 - año del vehiculo que se supone se esta midiendo. Mayor año,
menor el valor de a1.
modelo - UNO - identificador del vehiculo
a1 - 11.0 - dato1
b1 - 0.03 - dato2
c1 - 14.9 - dato3
d1 - 0.30 - dato4
a2 - 13.0 - dato1 medido en otras condiciones
b2 - 0.04 - dato2 medido en otras condiciones
c2 - 14.8 - dato3 medido en otras condiciones
d2 - 0.30 - dato4 medido en otras condiciones


Alguien que me pueda dar una pista de como hacer esto

Gracias de antemano.

-- 
________________________________________
Lo bueno de vivir un dia mas
es saber que nos queda un dia menos de vida
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.python.org/pipermail/python-es/attachments/20131121/7cf886f1/attachment.html>


Más información sobre la lista de distribución Python-es