¿Cuál es el mejor programa gratuito de ocr o icr para la transcripción del manuscrito?

Javier pregunta:

Soy un escritor de cuentos y cuentos. Estoy en busca de un carácter libre de reconocimiento óptico (OCR) o un programa de reconocimiento inteligente de caracteres (ICR) para escanear mis viejos manuscritos de imágenes o fotografías, así que puede convertirlos en archivos de Microsoft Word.

¿Hay programas gratuitos y precisos capaz de hacer esto? Por desgracia, no tengo un escáner, pero tengo acceso a una cámara digital con una resolución de 20 megapíxeles.

manuscrito

Responder de Kannon:

Como ya se ha mencionado, hay varios tipos de tecnologías de reconocimiento de caracteres que pueden convertir automáticamente mano oa máquina de escribir en caracteres digitales. El nivel de exactitud de estos tipos de software varía enormemente entre las distintas aplicaciones. Algunos convierten en una base letra por letra y otros pueden convertir palabras completas. Hay tres categorías generales de este programa:

  • Reconocimiento óptico de caracteres (OCR)
  • Reconocimiento inteligente de caracteres (ICR)
  • Inteligente de reconocimiento de palabras (IWR)

Reconocimiento óptico de caracteres

En verdad, OCR es un término genérico y muchas veces todos los métodos descritos en este artículo se refiere como OCR - Wikipedia, sin embargo, da OCR su propia clasificación, pero las implementaciones modernas tienden a agrupar varios métodos. Entonces ¿Qué es lo que hace? OCR convierte las letras -typed o handwritten- individuales en caracteres digitales. Por lo que el software busca en un documento y luego intenta convertirlo en texto sin formato al adivinar lo que cada personaje es.

El software no es perfecto. El software de OCR puede malinterpretar caracteres individuales con las apariencias similares, lo que resulta en las palabras mal escritas y los resultados inexactos. La mayoría de las veces, los usuarios pueden copiar el texto generado por un programa de OCR en un procesador de texto y corregir automáticamente los errores de ortografía. A menudo, los errores aparecerán como personajes similares. Por ejemplo, la letra “D” puede ser representado como “CL”.

Pero cuando se trata de textos escritos a mano, OCR no lo hace muy bien. Por lo menos, la mayoría de las implementaciones libres son trágicamente mal. Hay algunos productos comerciales que pueden De Verdad uñas de transcripción escrita a mano, pero sus lugares de fijación de precios por completo fuera del alcance del público en general. Por ejemplo, hay software de ReadSoft OCR de Lexmark. Esta empresa de sólo los costos de software miles de dólares.

Vídeo: ICR - Reconicimiento automático de texto manuscrito

-Texto anotado

El reconocimiento inteligente de caracteres

ICR es un subconjunto de OCR que se especializa en la conversión de texto escrito a mano en caracteres digitales individuales. Teniendo en cuenta que sus notas y manuscritos a mano, un programa de ICR es el más útil. Sin embargo, no estoy seguro de la precisión con la que pueden convertir textos escritos en idiomas extranjeros, como el español. Al igual que con OCR, los usuarios pueden mejorar la calidad de los textos que salen de copiarlas en un procesador de textos con corrección ortográfica encendido, la corrección de pruebas y luego con la mano.

Una prueba de carácter: 10 Juegos de fuente que prueban la tipografía puede ser divertido

Inteligente de reconocimiento de palabras

La última evolución de OCR e ICR es un software inteligente de reconocimiento de palabras. En vez de reconocer los caracteres individuales, que intenta traducir la totalidad de las palabras escritas a mano. Como OCR e ICR, el reconocimiento inteligente de palabra a menudo traduce mal las palabras, y requiere que el usuario corregir manualmente los errores cometidos.

¿Cuál es el mejor software de OCR libre?

Tesseract

Hay un montón de opciones disponibles. Tesseract es probablemente el mejor fuente abierta (Y gratis) software de OCR por ahí. Que yo sepa, sólo mira a los caracteres individuales y las palabras no enteras.

Debido a que usted está utilizando Microsoft Word (que tiene la mejor, la mayor parte de corrección ortográfica personalizable en los negocios), que sólo puede copiar todo el texto en Word y luego ejecutar un hechizo a verificar para limpiar los errores ortográficos.8 maneras de deletrear & Comprobar la gramática En Microsoft Word utilizando diferentes Diccionarios & idiomas8 maneras de deletrear & Comprobar la gramática En Microsoft Word utilizando diferentes Diccionarios & idiomasbuilt-in de ortografía y gramática herramientas de comprobación de Microsoft Word se pueden personalizar para satisfacer sus necesidades. Incluso puede utilizar Autocorrección para acelerar su escritura.Lee mas

Tesseract es en realidad un motor de OCR que se extiende desde la línea de comandos. A menos que usted está dispuesto a hacer frente a la dificultad de manejar una herramienta de línea de comandos, es probable que desee instalar algo más fácil de usar. Hay un descargable “front-end” (o una interfaz gráfica de usuario) que le permite utilizar Tesseract como una herramienta de arrastrar y soltar: PDF OCR X. En primer lugar, instale el paquete de software, a continuación, ejecutarlo. A continuación, aparecerá una ventana:

Vídeo: ABBYY FlexiCapture 10 | Procesamiento de Formularios

PDF interfaz de OCR

A continuación, sólo tiene que arrastrar y soltar el archivo de imagen en la ventana. Una vez cargada la imagen, ejecute el software de transcripción de OCR. Se puede tomar un minuto más o menos.

Por desgracia, resultó ser totalmente inadecuado para el manejo de su texto. Esto es lo que parece después de la extracción de texto del documento:

OCR extracción de la imagen usando Tesseract

microsoft OneNote

Dado que parece que ya está usando microsoft Oficina, la mejor opción es, probablemente, también de Microsoft. Voy a suponer que usted es dueño de una copia de Microsoft Office, que incluye OneNote. Esto viene equipado con la tecnología bastante avanzada de OCR.

Además, tanto en iOS y Android, también está el Microsoft Office lente completamente libre, que puede convertir JPEG (y otros formatos de imagen) directamente en el texto. Lo que hace que las versiones móviles tan maravilloso es que se puede tomar una imagen, subirlo al sistema de computación en la nube de Microsoft, y luego ejecutar la extracción de texto de OneNote en un escritorio.

El proceso es bastante simple. En primer lugar, tomar una foto de su texto. Si usted ha decidido utilizar la aplicación OneNote, después, sólo tendrá que guardar el archivo en su cuenta onedrive. De lo contrario, transferir la imagen al ordenador y soltarlos en OneNote.

A continuación, haga clic en la imagen y seleccionar Dupdo Texto de la Imagen en el menú contextual.

OneNote extracción de texto

Vídeo: Convertir imagen fotografiada a texto - 2016

A continuación, haga clic en una parte en blanco de OneNote (o en una aplicación de lectura de texto) y pega el siguiente texto en. El texto generan a través de su documento es el siguiente:

la extracción de texto OCR OneNote

Desafortunadamente, los resultados de OneNote no hacen en cualquier sitio cerca de un buen trabajo, produciendo un completo disparate. Esto podría ser causado por una combinación de factores, tales como una imagen distorsionada o la escritura que no se hace en línea recta, o simplemente porque el software no es lo suficientemente bueno.

google Keep

En este momento la mejor solución para OCR en documentos escritos a mano se relaciona con el aprendizaje automático: En concreto, en el fondo-aprendizaje. Profundo-learning es un método sofisticado de la formación de un ordenador para realizar tareas que antes sólo se destacó en humanos, tales como el reconocimiento facial (Picasa hace reconocimiento facial, por extraño que parezca). Google ha adquirido recientemente DeepMind, que se desarrolla La tecnología de profundidad-aprendizaje. Esta adquisición clave tuvo un gran efecto: Microsoft pierde a Google de OCR. Ahora Google ofrece uno de los métodos más avanzados (y gratuitas): Google Keep.Cómo utilizar el reconocimiento facial en los álbumes web de PicasaCómo utilizar el reconocimiento facial en los álbumes web de PicasaLee mas

google Keep (Que primero se revisaron en 2013) También ofrece una versión móvil de su aplicación para Android. Al igual que con OneNote, puede disparar la imagen y transferirla directamente en la nube de Google. Sólo tienes que arrastrar la imagen en la ventana de Google Keep. A continuación, haga clic en el botón de menú (tres puntos verticales) y seleccione texto de la imagen Grab en el menú contextual.

google Keep

Esto es lo que parece después de extraer el texto:

2015-07-18_19h45_34

Vídeo: EFECTIVIDAD OCR ICR 2

Google Keep Wins

Como se puede ver, Google Keep domina sobre la competencia. Los resultados se pueden incluso mejorarse aún más mediante el uso de una herramienta de edición de imágenes para aumentar el contraste y enderezar la imagen.10 Herramientas gratuito de edición de fotos para aprovechar al máximo de sus golpes10 Herramientas gratuito de edición de fotos para aprovechar al máximo de sus golpes¿Qué pasó con todas las instantáneas que ha tomado en el pasado? Si usted tiene planes e ideas que tengo, aquí están algunas grandes de Windows y algunas herramientas de plataforma cruzada por procesarlos con.Lee mas

Esperemos que esas opciones de ayuda. En caso de que necesite más opciones de OCR, por favor echa un vistazo a la 5 mejores herramientas de OCR, para más información.

Artículos Relacionados