Google sigue añadiendo nuevas capacidades a su servicio gratuito de Google Docs, y en su última revisión se le añadió la capacidad de hacer OCR a sus documentos. OCR (Optical Character Recognition) es la capacidad de una solución poder distinguir los caracteres o texto en una imagen y convertirlo en un documento el cual se pueda editar.
En el pasado si usted quería por ejemplo extraer el texto de un archivo impreso, tenía que primeramente digitalizar el mismo con un escáner y luego utilizar una aplicación de OCR para que este reconociera los caracteres en la digitalización y lo convirtiera en un archivo editable (como lo es un archivo .txt, .rtf o .doc).
Google ahora añade la opción de OCR en la página de cargar (upload) sus archivos. De esta forma si el documento el cual usted está subiendo es un PDF que no puede editar, o una imagen, Google reconoce los caracteres y crea un archivo de Google Docs con el texto.
Veamos cómo se utiliza esta nueva opción:
Paso #1: Simplemente ingrese a este enlace: https://docs.google.com/DocAction?action=updoc
Paso #2: Aquí especifique el documento a ser cargado arrastrando el mismo al espacio provisto.
Paso #3: Luego escoja la siguiente opción:
Recuerde escoger el idioma en que está escrito el documento original (español esta disponible).
Paso #4: Por ultimo oprima el botón de iniciar el proceso (START UPLOAD) y deje que Google Docs haga su magia.
Al finalizar, verá el documento cargado entre sus librería de archivos. Al ingresar al archivo verá tres partes, primero una nota indicando que el documento fue extrído de un PDF o una imagen y el formato pudo verse afectado…
… luego una imagen de cada hoja del documento original seguido por el texto extraído en el proceso del OCR.
Algunos temas que tiene que considerar para que Google Docs pueda trabajar el documento y reconocer los caracteres:
- El archivo tiene que ser en el formato .jpg, .gif, .png o PDF.
- El archivo no puede sobrepasar de 2MB.
- El archivo solo será analizado hasta las primeras 10 páginas.