
Michael Cain
0
4200
1077
Javier pregunta:Soy escritor de cuentos y cuentos. Estoy buscando un programa gratuito de Reconocimiento óptico de caracteres (OCR) o Reconocimiento inteligente de caracteres (ICR) para escanear mis manuscritos antiguos de imágenes o fotografías para poder convertirlos en archivos de Microsoft Word.
¿Hay algún programa gratuito y preciso capaz de hacer esto? Desafortunadamente, no tengo un escáner, pero sí tengo acceso a una cámara digital con una resolución de 20 megapíxeles.
Soy escritor de cuentos y cuentos. Estoy buscando un programa gratuito de Reconocimiento óptico de caracteres (OCR) o Reconocimiento inteligente de caracteres (ICR) para escanear mis manuscritos antiguos de imágenes o fotografías para poder convertirlos en archivos de Microsoft Word.
¿Hay algún programa gratuito y preciso capaz de hacer esto? Desafortunadamente, no tengo un escáner, pero sí tengo acceso a una cámara digital con una resolución de 20 megapíxeles.
Respuesta de Kannon:
Como ya mencionó, hay varios tipos de tecnologías de reconocimiento de caracteres que pueden convertir automáticamente la escritura manuscrita o mecanografiada en caracteres digitales. El nivel de precisión de este tipo de software varía mucho entre las diferentes implementaciones. Algunos convierten letra por letra y otros pueden convertir palabras enteras. Hay tres categorías generales de este software:
- Reconocimiento óptico de caracteres (OCR)
- Reconocimiento inteligente de caracteres (ICR)
- Reconocimiento inteligente de palabras (IWR)
Reconocimiento óptico de caracteres
En verdad, OCR es un término genérico y, a menudo, todos los métodos descritos en este artículo se denominan OCR. Sin embargo, Wikipedia le da a OCR su propia clasificación, pero las implementaciones modernas tienden a agrupar múltiples métodos. Entonces ¿Qué es lo que hace? OCR convierte letras individuales o manuscritas en caracteres digitales. Entonces, el software mira un documento y luego intenta convertirlo en texto plano adivinando qué es cada personaje.
El software no es perfecto. El software OCR puede malinterpretar caracteres individuales con apariencias similares, lo que resulta en palabras mal escritas y resultados imprecisos. La mayoría de las veces, los usuarios pueden copiar el texto generado por un programa OCR en un procesador de textos y corregir automáticamente los errores de ortografía. A menudo, los errores aparecerán como caracteres similares. Por ejemplo la carta “re” podría ser representado como “cl”.
Pero cuando se trata de textos escritos a mano, OCR no funciona muy bien. Al menos, la mayoría de las implementaciones gratuitas son trágicamente malas. Hay algunos productos comerciales que pueden De Verdad Clave transcripción manuscrita, pero su precio los coloca completamente fuera del alcance del público en general. Por ejemplo, está el software ReadSoft OCR de Lexmark. Este software solo para empresas cuesta miles de dolares.
Reconocimiento inteligente de caracteres
ICR es un subconjunto de OCR que se especializa en convertir texto escrito a mano en caracteres digitales individuales. Dado que sus notas y manuscritos están escritos a mano, un programa ICR es el más útil. Sin embargo, no estoy seguro de con qué precisión pueden convertir textos escritos en idiomas extranjeros, como el español. Al igual que con OCR, los usuarios pueden mejorar la calidad de los textos emitidos copiándolos en un procesador de textos con la corrección ortográfica activada y luego corrigiendo manualmente.
Reconocimiento inteligente de palabras
La última evolución de OCR e ICR es el software inteligente de reconocimiento de palabras. En lugar de reconocer caracteres individuales, intenta traducir palabras escritas a mano enteras. Al igual que OCR e ICR, el reconocimiento inteligente de palabras a menudo traduce mal las palabras y requiere que el usuario corrija manualmente los errores cometidos.
¿Cuál es el mejor software de OCR gratuito??
Tesseract
Hay muchas opciones disponibles. Tesseract es probablemente el mejor fuente abierta (y gratis) software de OCR por ahí. Que yo sepa, solo analiza caracteres individuales y no palabras completas.
Debido a que está utilizando Microsoft Word (que tiene el mejor y más personalizable corrector ortográfico Cómo deletrear y gramaticar en Microsoft Word Cómo deletrear y gramaticar en Microsoft Word Puede personalizar las herramientas de corrección ortográfica y gramatical incorporadas de Microsoft Word para cumplir sus necesidades. Incluso puede usar la Autocorrección para acelerar su escritura (en los negocios), simplemente puede copiar todo el texto en Word y luego ejecutar un corrector ortográfico para corregir errores ortográficos.
Tesseract es en realidad un motor de OCR que se ejecuta desde la línea de comandos. A menos que esté dispuesto a lidiar con la dificultad de manejar una herramienta de línea de comandos, es probable que desee instalar algo más fácil de usar. Hay una descargable “Interfaz” (o una interfaz gráfica de usuario) que le permite utilizar Tesseract como una herramienta de arrastrar y soltar: PDF OCR X. Primero, instale el paquete de software y luego ejecútelo. Luego verás una ventana:
Luego, simplemente arrastre y suelte el archivo de imagen en la ventana. Una vez que se carga la imagen, ejecute el software de transcripción OCR. Puede tomar un minuto más o menos.
Desafortunadamente, resultó completamente inadecuado para manejar su texto. Esto es lo que parece después de extraer el texto del documento:
Microsoft OneNote
Como parece que ya está utilizando Microsoft Office, la mejor opción es probablemente también de Microsoft. Supongo que posee una copia de Microsoft Office, que incluye OneNote. Esto viene equipado con tecnología OCR bastante avanzada.
Además, tanto en iOS como en Android, también existe la lente Microsoft Office completamente gratuita, que puede convertir JPEG (y otros formatos de imagen) directamente en texto. Lo que hace que las versiones móviles sean tan maravillosas es que puedes tomar una imagen, subirla al sistema de computación en la nube de Microsoft y luego ejecutar la extracción de texto desde OneNote en un escritorio.
El proceso es bastante simple.. Primero, toma una foto de tu texto. Si ha decidido usar la aplicación OneNote, solo tendrá que guardar el archivo en su cuenta de OneDrive. De lo contrario, transfiera la imagen a su computadora y colóquela en OneNote.
Luego haga clic derecho en la imagen y seleccione Dupdo Texto de imagen desde el menú contextual.
Luego haga clic derecho en una parte en blanco de OneNote (o en una aplicación de lectura de texto) y pegue el texto en. El texto de salida de su documento se ve así:
Desafortunadamente, los resultados de OneNote no funcionan en cualquier sitio cerca de un buen trabajo, produciendo tonterías. Esto podría deberse a una combinación de factores, como una imagen distorsionada o una escritura que no se realiza en línea recta, o simplemente porque el software no es lo suficientemente bueno.
Google Keep
En este momento, la mejor solución para OCR en documentos escritos a mano se relaciona con el aprendizaje automático: específicamente, el aprendizaje profundo. El aprendizaje profundo es un método sofisticado para entrenar una computadora para realizar tareas que antes solo los humanos sobresalían, como el reconocimiento facial (Picasa hace reconocimiento facial Cómo usar el reconocimiento facial en los álbumes web de Picasa Cómo usar el reconocimiento facial en los álbumes web de Picasa, cree o no). Google compró recientemente DeepMind, que desarrolla tecnología de aprendizaje profundo. Proyectos de investigación geniales que podrían cambiar el futuro. Proyectos de investigación geniales que podrían cambiar el futuro. Las megacorporaciones como Google, Microsoft, IBM e Intel continuarán brindando a las generaciones futuras el mundo que podamos. solo imagina ahora? Estos emocionantes proyectos de investigación dicen que es una promesa que cumplirán. . Esta adquisición clave tuvo un gran efecto: Microsoft pierde ante Google en OCR Microsoft vs Google: ¿quién lidera la carrera de inteligencia artificial? Microsoft vs Google: ¿quién lidera la carrera de inteligencia artificial? Los investigadores de inteligencia artificial están haciendo progresos tangibles, y las personas están comenzando a hablar en serio nuevamente sobre la IA. Los dos titanes que lideran la carrera de inteligencia artificial son Google y Microsoft. . En este momento, Google ofrece uno de los métodos más avanzados (y gratuitos): Google Keep.
Google Keep (que revisamos por primera vez en 2013 Notas simples sobre la marcha: Google Keep para Android revisado Notas simples sobre la marcha: Google Keep para Android revisado Hay algunas aplicaciones sorprendentes para tomar notas, pero aquí hay una que merece una mirada más cercana : Google Keep, un anotador que tiene una aplicación de Android de excelente aspecto y una elegante aplicación web.) También ofrece una versión móvil de su aplicación para Android. Al igual que con OneNote, puede tomar la imagen y transferirla directamente a la nube de Google. Simplemente arrastre la imagen a la ventana de Google Keep. Luego haga clic en el botón de menú (tres puntos verticales) y seleccione Tomar texto de imagen desde el menú contextual.
Así es como se ve después de extraer el texto:
Google Keep gana
Como puede ver, Google Keep domina en la competencia. Los resultados pueden mejorarse aún más mediante el uso de una herramienta de edición de imágenes. 10 Herramientas gratuitas del editor de fotos para aprovechar al máximo sus fotos. 10 Herramientas gratuitas del editor de fotos para aprovechar al máximo sus fotos. ? Si tiene planes e ideas, aquí hay algunas excelentes herramientas de Windows y varias plataformas para procesarlas. para aumentar el contraste y enderezar la imagen.
Esperemos que esas opciones ayuden. En caso de que necesite más opciones de OCR, consulte las 5 mejores herramientas de OCR Las 5 mejores herramientas de OCR para extraer texto de imágenes Las 5 mejores herramientas de OCR para extraer texto de imágenes Cuando tiene resmas de papel, ¿cómo se imprime todo? ¿texto convertido en algo que un programa digital podrá reconocer e indexar? Mantenga un buen software de OCR cerca. , para más información.