Evotec crea en Sharepoint una nueva solución de búsqueda en PDF

Evotec crea en Sharepoint una nueva solución de búsqueda en PDF

Con esta nueva solución podemos:

• Escanear facturas de proveedores y realizar una búsqueda posterior por número de factura, producto, fecha, CIF del proveedor, etc.
• Escanear contratos firmados
• Escanear y realizar una búsqueda por DNIs, pasaportes…

Evotec utiliza para la búsqueda en PDF el motor de OCR “tesseract-ocr”, cuyo funcionamiento se basa en redes neuronales y unos datos de entrenamiento disponibles en más de 60 idiomas en su página oficial.

Evotec PDF OCR IFilter destaca por su transparencia en la indexación de documentos y la sencillez en su instalación y configuración, consiguiendo que se lleve a cabo en menos de un día. A diferencia de otros productos alternativos presentes en el mercado la solución creada por Evotec no modifica masivamente todos los PDF cargados, ya que se basa en la modificación del documento original escaneado por otro que incluye una capa de texto oculta con el OCR realizado.

La solución Evotec PDF OCR IFilter se integra con el componente Adobe IFilter 64 bit. Por este motivo cuando se procesa un documento PDF, se pasa primero por el componente estándar de Adobe y, sólo si éste no ha recuperado una cantidad de texto representativa (parámetro configurable), se pasa por el proceso de OCR, optimizando de esta manera la carga de trabajo, ya que en un gestor documental no todos los PDF son escaneados.

Este módulo desarrollado por Evotec cuenta con varias ventajas que dan lugar a un alto rendimiento y optimización para grandes entornos, ya que soluciona de manera sencilla los posibles inconvenientes que conllevaría el no modificar los PDF originales como el exceso de tiempo para volver a procesar por OCR todos los documentos. Nuestra solución lo que hace es guardar en una caché el resultado del proceso OCR de cada documento, de modo que cada documento únicamente se procesa una vez, aunque lancemos indexaciones completas.

Al utilizar la tecnología estándar IFilter de Microsoft, el mismo componente puede usarse para la búsqueda de escritorio (Desktop Search), y para el motor de indexación de texto de SQL Server, ya que ambos utilizan el interface IFilter para procesar ficheros.

Este componente es compatible con diversas versiones de Sharepoint:
– SharePoint Services 3.0, SharePoint 2007 Portal, Search Server 2007
– SharePoint Foundation 2010, Search Express 2010, y SharePoint Server 2010.

– SharePoint Foundation 2013, SharePoint Server 2013

Puede consultar más información sobre este módulo en nuestra página web sobre Sharepoint: http://www.consultoriasharepoint.com/Funcionalidades/B%C3%BAsquedaconOCRenPDF.aspx

Share

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.