Thursday, 17 de April de 2014

Ficha del recurso:

Fuente:

Instituto Tecnológico de Informática

Fecha de publicación:

Wednesday, 1 de December de 2010

Última actualización:

Thursday, 27 de January de 2011

Entrada en el observatorio:

Wednesday, 1 de December de 2010

Idioma:

Castellano

Archivado en:


ITI – OCR Proyecto de I+D para la Mejora de los Procesos de Digitalización Masiva

El software de Reconocimiento Óptico de Caracteres, conocido como OCR (Optical character recognition) es una de las tecnologías en las que el Instituto Tecnológico de Informática aporta una larga trayectoria de investigación.

 

Como resultado de esa investigación, desde el ITI se han desarrollo soluciones  y tecnologías basadas en el procesamiento de imágenes y reconocimiento de formas que han sido trasladadas a empresas dedicadas a la digitalización masiva de datos en sistema de OCR.

De ese “feedback” con las empresas se han detectado problemáticas específicas y nichos de mercado, en los que poder investigar y aportar innovación frente a las demandas de este sector.

La eficiente gestión de los documentos y de los procesos supone un importante ahorre de costes en las empresas y una mejora en la productividad de sus empleados.

A través de ITI – OCR se busca profundizar en la investigación de las técnicas y algoritmos que resuelvan los problemas recientemente encontrados en el sector industrial de la digitalización documental, y aún no cubiertos por el trabajo previo realizado en esta línea, ampliando así las capacidades futuras del sistema de reconocimiento automático mediante la implementación de nuevas funcionalidades.

El objetivo tecnológico principal del proyecto es la mejora de tecnologías y aplicaciones para facilitar la gestión documental y la captura y grabación de datos, incrementando la eficiencia (rentabilidad) del proceso.

La necesidad de este proyecto surgió porque aunque los productos con tecnología para el OCR sobre documentos impresos sin formato (como pueda ser un libro de texto) se encuentran disponibles en el mercado desde hace años, estos productos básicos y no especializados, no satisfacen las necesidades reales de las empresas.

Por un lado, los trabajos de digitalización suelen estar dirigidos a la captura de datos en documentos estructurados que, además, pueden estar cumplimentados con caracteres impresos o manuscritos. Por otro lado, a la hora de procesar este tipo de trabajos es muy importante que dicho proceso se realice en el menor tiempo posible y cometiendo un máximo de errores por debajo de un umbral bastante exigente.

Este proyecto está financiado por el Instituto de la Pequeña y Mediana Industria de la Generalitat Valenciana (IMPIVA) y por la Unión Europea a través del Fondo Europeo de Desarrollo Regional (FEDER), dentro del Programa de I+D para Institutos Tecnológicos de la Red IMPIVA para el ejercicio 2010,con número de expediente IMIDIC/2010/191.