Entre las innovaciones que impulsan automatizacion mas simple, flexible y efectiva para procesos rutinarios y de alto volumen, hay una que suele perderse cuando la inteligencia artificial (IA), la automatizacion robotica de procesos ( RPA ) y el aprendizaje automatico compiten por atencion. El hijo menor de esas tecnologias de moda es la que puede generar mayor impacto al apoyarse en las otras tres, porque ataca la parte mas dolorosa de cualquier proceso: ingresar datos en sistemas de negocio que pueden venir de un documento, un correo u otra fuente no estructurada.
Esa tecnologia no es nueva, pero hoy tiene mas relevancia e impacto porque es mas precisa, mas flexible y mas facil de integrar en ecosistemas tecnologicos existentes.
Hablamos de extraccion inteligente de datos, tambien llamada extraccion inteligente documental. El termino que prefiera, el foco es encontrar informacion relevante y accionable dentro de contenido no estructurado: el numero de factura, el nombre del proveedor, el numero de orden de compra o el monto dentro de una factura en papel escaneada o electronica. Puede significar analizar partidas de una orden de venta y extraer detalles de inventario para cargar en un ERP para pronostico, inventario o analisis de compras.
A menudo, la extraccion inteligente de datos se asocia a OCR u optical character recognition. Hoy el OCR es una tecnologia madura, conocida y poco glamurosa; viene de la epoca en que el visionario Ray Kurzweil se enfocaba mas en ayudar a personas con discapacidad visual a leer que en ayudar a Google con procesamiento de lenguaje natural.
En ese sentido, la extraccion inteligente de datos viene de una larga linea de innovaciones pensadas para resolver problemas de negocio basicos.
Y hoy es mas relevante e impactante que nunca. A continuacion, por que.
Antes de explicar por que otras tecnologias de moda hacen tan valiosa la extraccion inteligente de datos, conviene una advertencia de comprador. Como en otras formas de automatizacion supuestamente inteligente que se venden hoy, algunas soluciones en realidad dependen de humanos detras de escena haciendo el trabajo que otros humanos no quieren hacer.
Algunos proveedores externos extraen datos de sus documentos manualmente detras de escena, ya sea ejecutando la captura a mano o para verificacion por terceros. En ese escenario puede haber demoras importantes en obtener los datos, porque la extraccion se hace a la antigua y puede tardar entre 24 y 72 horas habiles. En la practica, es una empresa que se hace pasar por proveedor de proceso inteligente, y eso NO es de lo que hablamos aqui.
En el escenario que describimos, donde la tecnologia hace el trabajo mas rapido, barato e inteligente, la extraccion inteligente de datos se apoya en OCR para transformar datos desde imagenes escaneadas que se suben al sistema o desde archivos digitales nativos recibidos por correo. Esos sistemas interpretan la fuente, identifican y extraen los datos adecuados. Luego pueden integrarse con un ERP, ECM u otro sistema de negocio e ingresar la informacion en el campo estructurado correspondiente.
Pero, que pasa si el sistema no puede leer un caracter porque el archivo fuente esta danado? Por ejemplo, una mancha de cafe en una factura en papel escaneada.
Ahi entra el aprendizaje automatico. Suele implicar que el sistema detecte un error o excepcion que no puede resolver, notifique al dueno del proceso humano, que interviene para identificar un caracter o palabra o validar un campo cruzando con otro sistema. En lugar de depender de un humano cada vez, el sistema puede observar y registrar las acciones del operador y actualizar su propio algoritmo, sin codigo ni configuracion adicional.
Que significa en la practica:Para empresas atrapadas en el statu quo, la extraccion inteligente de datos combinada con aprendizaje automatico y soluciones low code / no code hara cada vez mas dificil seguir a la antigua y mas facil decir si a la innovacion de forma escalable y acorde al presupuesto.
Para saber mas, visite la pagina de recursos de Artsyl en