Ver Mensaje Individual
  #3  
Antiguo 24-11-2007
danilo_candales danilo_candales is offline
Miembro
 
Registrado: nov 2007
Posts: 28
Reputación: 0
danilo_candales Va por buen camino
Para darle seguimiento a esto.

Primeramente, muchísimas gracias Héctor, cada vez la brújula está mejor afinada. Te cuento que después de varias pruebas y validaciones y todo lo demás el algoritmo no me convence, se me hace muy ineficiente, en tiempos me refiero. Los resultados son bastante cercanos a lo que deseo, sobre todo porque puedo establecer parámetros, si es menor/igual a 5 entonces la relevancia es 100% , etc. Pero... muy lento mi amigo, incluso llegó a marcar Time Out la BD....(utilicé la variante TSQL)
Por otra parte, también hice mil pruebas utilizando las funciones SOUNDEX y DIFFERENCE de SQL. Ambas son muy rápidas y confiables, pero.... DIFFERENCE solo devuelve valores enteros del 1 al 4, para establecer una relevancia porcentual está muy amplio el rango....

select Difference('Karlos','Carlos) = 3

Y en casos como este debe ser con una relevancia mayor a 90% y el 3 caería en el rango 50-75.....

Y con SOUNDEX sucede que si la primera letra de la cadena es diferente a la que se busca ya no sirve.

select Soundex('carlos'),soundex('Karlos')

Ej: Soundex('Carlos') = C642 y Soundex('Karlos') = K642.

Con la siguiente sentencia ya no me trae lo que neceito:

select * from Lista where soundex(Nombre) like soundex('Karlos')

En fin, todo este rollo para volver a apelar a ustedes. Si se les ocurre otra idea será bienvenida por loca que parezca (la idea, claro).
Muchas gracias a todos y en particular a Hector nuevamente.

Otro par de ejemplos para si están interesados, comprueben algo.... no se parecen en nada....

select Soundex ('carlos martinex lopez'),soundex('martinex lopez carlos')
select difference ('carlos martinex lopez', 'martinex lopez Carlos')

PD. Testeado en SQL Server 2005. Incluso con la versión express funciona...

Última edición por danilo_candales fecha: 24-11-2007 a las 02:45:52. Razón: Agregar dos ejemplos
Responder Con Cita