Athento puede extraer datos de forma automática. Configurar esta extracción debe hacerse desde desde la administración del campo.
Buena parte de los mecanismos de extracción de Athento utilizan estrategias de análisis de texto para hacerse con la información. A continuación veremos algunas de las opciones disponibles desde la interfaz de usuario.
Antes de empezar este tutorial, le recomendamos cargar en el sistema varias muestras del mismo tipo de documento y extraer el OCR de los mismos.
Indicar de qué página se debe extraer el valor
Utilice el desplegable Extract from para indicar la página desde la que se debe extraer la información. Puede indicar una página concreta o la opción Full OCR para buscar el dato en todo el documento. También puede extraer el valor a partir del nombre del archivo con la opción Filename.
Extraer un valor utilizando otras palabras para delimitar el dato
Puede usar este mecanismo cuando el valor que quieres extraer se encuentra siempre entre dos palabras o expresiones conocidas.
Por ejemplo, suponga que en el OCR extraído de su documento se muestra la siguiente información.
Si quisiera extraer el número de factura, puede indicar a Athento que ese datos siempre aparece entre una palabra o expresión de inicio (Extract starting from word) y una final. Para este caso concreto:
- Extract starting from word-> N° Factura:
- Extract ending in www.101.es
Puede indicar varias expresiones de inicio o de fin, separandolas con el caracter | (pipe).
Extraer usando una expresión regular
Para usar este mecanismo de extracción, debe indicarle a Athento un patrón de texto que debe encontrar en el OCR del documento. Este método funciona muy bien con datos que tienen un patrón definido, como por ejemplo, un DNI, un CIF, una fecha, etc.
En el campo Regular Expression to Extract en la administración del campo, indique el patrón que desee buscar, por ejemplo, si busca un número de 7 dígitos, podrá ingresar una expresión como la que sigue:
- Regular Expression to Extract -> [0-9]{7}
Para extraer una fecha, puede usar la expresión que se muestra en la siguiente captura de pantalla.
Probar la extracción de un campo
Una vez configurada la extracción de un campo, para probarla, abra un documento de ejemplo que esté clasificado con el mismo Document Form en el que se encuentra el campo.
Desboque los botones bajo los campos y utilice la opción de la mirilla para extraer el dato.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.