Athento SE es el motor inteligente de Athento que concentra la funcionalidad de captura de documentos. Athento Smart Engine es una aplicación web diseñada para procesar documentos y obtener información de los mismos en entornos online.
Athento SE puede analizar numerosas características de documentos tales como colores predominantes, histogramas, OCR, HOCR, análisis de blanco, orientación del texto, entre otras características.
Gracias a este análisis permite automatizar tareas como la clasificación automática de documentos, su organización y categorización automática en repositorios documentales o la extracción de datos dentro del contenido textual de los mismos.
Athento SE es una aplicación web, desarrollada en Python y diseñada para soportar entornos Cloud. Athento incorpora más de 100 operaciones de análisis de documentos.
El motor de OCR del SE por defecto es Tesseract, pero el sistema puede acoplar otros motores OCR, OMR o ICR. Entre los distintos motores se encuentra Abby OCR SDK, OpenText RecoStar.
Funcionalidad de Captura
Auto-clasificación de documentos:
- Definición de plantillas de documentos para su clasificación por mecanismos de análisis de texto o de imagen.
Extracción de datos:
- Extracción del Histograma.
- Extracción de los colores predominantes en los documentos.
- Detección del porcentaje de blanco en una página.
- Extracción del texto del documento (OCR)
- Extracción de etiquetas semánticas del documento.
- Extracción de metadatos por coordenadas.
- Extracción de metadatos por expresiones regulares.
- Extracción de códigos de barras y QR.
- Extracción de metadatos en tablas.
- Extracción de metadatos mediante anclajes (HOCR)
Exportación:
- Exportación de metadatos en Excel.
- Exportación de metadatos en XML.
Inteligencia:
- Validación manual de metadatos vía formulario.
- Validación automática de metadatos vía conexión a base de datos.
- Validación sintáctica de metadatos.
- Carga mediante carpetas monitorizadas.
- Carga mediante e-mail.
- Carga mediante formularios.
- API
Otra funcionalidad destacada de captura
Mediante el Smart Engine se conseguirán automatizar tareas como la clasificación de documentos, la organización y la indexación de metadatos.
El sistema permite varios orígenes de captura, entre los que se encuentran:
- Interfaz del Smart Engine
2. Hot folders o carpetas monitorizadas mediante tareas tipo cron. La periodicidad de la monitorización puede definirse desde el backend del Smart Engine, en el menú Djcelery. Estos Los Hot folders pueden ser accedidos mediante FTP.
- Mediante correo electrónico.
- Integración con Dropbox
El Smart Engine de Athento es capaz de identificar de forma automática tipos documentales. Esta tarea puede llevarla a cabo por diferentes medios, por ejemplo:
- Palabras clave contenidas en el documento
- Uso de anclajes de clasificación
- Lectura de códigos de barras o QR.
Estos mecanismos de clasificación pueden ser configurados desde la propia interfaz del software.
Además, Athento Smart Engine permite la extracción automática de metadatos asociados a un tipo documental. Estos metadatos pueden definirse desde la interfaz del software.
Athento proporciona múltiples métodos para la extracción de datos.
- Expresiones regulares.
- Expresiones delimitadas por cadenas de texto de inicio y de final.
- OCR zonal.
- Códigos de barras y QR.
- Coordenadas dentro del documento que hacen referencia a una determinada palabra contenida dentro del texto del documento (HOCR).
Para más información sobre la configuración de metadatos puede revisar la documentación de extracción de metadatos de Athento Smart Engine.
https://athento.atlassian.net/wiki/pages/viewpage.action?pageId=13434904
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.