Herramientas

Cómo recuperar el texto de documentos escaneados

Por Sofia Pichihua

Publicado el 30 de enero del 2012

Libros, resoluciones judiciales, boletines, o cualquier otro tipo de documento de varias páginas que ha sido almacenado en un PDF puede convertirse en un archivo editable de Microsoft Word. Lo mismo ocurre con los PDF que han sido protegidos (no puede copiarse el contenido). Los periodistas pueden necesitar el texto de estos materiales para editarlo, resaltarlo, recoger algunas citas y mucho más.

En un anterior post recomendamos FineReader para obtener información de una sola imagen. Sin embargo, también hay una opción para ‘leer’ el texto de un archivo con varias páginas.

Después de instalarlo en la versión de prueba, aparecerá la ventana “Tareas”. Haz clic en la segunda opción llamada “Archivo a Microsoft Word”. Se abrirá una pestaña para que elijas el documento en PDF/imagen. El programa lo reconocerá:

Luego se abrirá una ventana de Word con el documento:

El reconocimiento por defecto detectará imágenes, tablas y texto. Si deseas editar estas opciones, solo debes revisar cada página. Encontrarás que algunas zonas del archivo aparecerán resaltadas en verde y otras en rojo.

El color verde representa Texto y el rojo, Imagen. También puedes encontrar Tablas (color azul).

Para actualizar la revisión de esa página solo haz clic en el botón “Leer” (mira la imagen anterior).

¿Qué les parece? Si quieren obtener este software. Clases de Periodismo y ABBYY van a sortear tres licencias de este programa. La primera será obsequiada a un lector del blog. Solo debes enviar un comentario  con tu opinión sobre la utilidad de FineReader. Si haz probado la versión de prueba, no dejes de agregar tus dudas sobre su funcionamiento. Anunciaremos al ganador mañana a las 10 a.m. (hora peruana).

ACTUALIZADO: Nuestra lectora Antonieta Corrales ganó el sorteo. Le enviaremos un email. ¡Gracias a todos por participar!

Publicado por:

Periodista licenciada de la Pontificia Universidad Católica del Perú (PUCP). Máster en Periodismo Digital en la Universidad de Alcalá de España. Profesora de Periodismo Digital/Community Manager de ISIL. @zophiap en Twitter

Sígueme

Twitter

COMPATIR EN REDES

NOTICIAS RELACIONADAS

La calidad de la información impone el ritmo de publicación

El reconocido periodista de investigación, Gustavo Gorriti, presentó durante el cierre del International Symposium on Online Journalism (ISOJ), a IDL-Reporteros, para señalar el impacto y el cambio sobre el periodismo que realiza.

06-04-14

Un periodista que se busca la vida en su blog, en las redes sociales y ahora en un ebook

“Groenlandia cruje’ (y tres historias islandesas)” es el primer ebook del periodista español y el tercer título de la colección ‘El mejor periodismo’ de la editorial eCícero, la cual ha apostado por el ebook como un nuevo formato, entre la revista y el libro para los reportajes y las crónicas .

08-05-12

Periodista al Vaticano: “Prefiero ir a la cárcel que revelar una de las fuentes”

Un periodista italiano está bajo investigación por el Vaticano debido a la publicación de un libro sobre los escándalos en la Santa Sede. Y el último martes se negó a responder a las preguntas del fiscal durante un interrogatorio, citando su derecho bajo la ley italiana de proteger sus fuentes.

18-11-15

COMENTARIOS