Bueno, ahora mismo estoy evaluando la implantación de un sistema de Gestión Documental; Con otras características y más pequeño, pero al final un sistema documental, así que el temame interesa. En nuestro caso, no lo vamos a implementar, pero tal vez sí tengamos que hacer módulos de integración.
Cita:
Empezado por PaFernan99
¿Qué motor es es que más me conviene usar?
¿Conviene (o posible), guardar las imágenes en la BD?
¿Conviene tener una BD para cada colección o es preferible tener una sola BD para todas, ya que debo realizar búsquedas cruzadas entre las colecciones ?
¿Suponiendo que el texto escaneado esté entre 1 GB y 2 GB (creo que exagerando un poco), cuál es el tipo de campo que debo usar para lograr la mejor performance de búsqueda?
|
Bueno, en cuanto a Base de Datos yo tiraría hacia SQL Server.
El tema de las imágenes, yo recomendaría fuera.
Si Suponemos que todo el peso de las imágenes va a estar fuera de la Base de Datos, yo optaría por tener todas las colecciones en la misma DB.
El tema del texto, no me queda claro cómo lo vas a hacer. No se si quieres escanear TODOS los documentos y guardar TODAS las palabras para luego poder buscar o escanear documentos y guardar lo que serían TAG's asociados a cada documento para luego poder buscar por esos TAG's. Dependiendo de lo que necesites tal vez sea mejor tirar por un sitio o por otro.
Nuestro caso es el segundo. Escaneamos documentos a PDF y se guardan (se deben guardar) algunas referencias a ese documento para después buscar. En este caso, los documentos van fuera (PDF firmado) y las palabras se guardan dentro. Otras opciones, aunque no las he evaluado odavía son motores de búsqueda externos que permiten buscar dentro de documentos escaneados en PDF.