Hola, necesito saber si una cadena de texto está en un fichero de texto, pero con un condicionante, pongo un ejemplo:
Un fichero de texto:
Código:
Bello, hermoso, guapo,lindo,
agraciado; precioso, horrendo,
coqueto, feo,horrible, etc.
Quiero saber si existe la palabra OSO, y efectivamente existe.
Código:
Bello, hermoso, guapo,lindo,
agraciado; precioso, horrendo,
coqueto, feo,horrible, etc.
Sin embargo, necesito que sean palabras completas, no trozos de palabras, debería decirme que existe la palabra OSO solamente si está "sola", ejemplo:
Código:
Bello, hermoso, guapo,lindo,
agraciado;oso, precioso, oso horrendo,
oso,coqueto, feo,horrible, etc.
Aparece tres veces:
Código:
Bello, hermoso, guapo,lindo,
agraciado;oso, precioso, oso horrendo,
oso,coqueto, feo,horrible, etc.
Las palabras pueden estar separadas por espacio, coma, punto y coma, dos puntos o por nada si es la primera de la línea.
He estado viendo algo sobre el
Levenshtein distance, pero me parece que es muy lento, y para el caso que lo necesito son miles de ficheros con miles de líneas.
¿Conocéis algún método rápido y funcional?
Gracias.