
Gabriel Brooks
0
4168
938
Buscando lo mejor gratis ¿Software de Windows para voz a texto? El mas repetido pagado La recomendación es Dragon Naturally Speaking (DNS). Pero algunos podrían burlarse de pagar dinero por el software. Afortunadamente, hay varios programas gratuitos excelentes como Google Docs Voice Typing (GDVT) y Windows Speech Recognition (WSR).
Dragon NaturallySpeaking Basics 13 (descontinuado) Dragon NaturallySpeaking Basics 13 (descontinuado) Comprar ahora en Amazon $ 29.99
Quizás se pregunte cómo se comparan estos dos productos con el DNS, y si DNS satisface o no sus necesidades. Para este artículo, he identificado tres tipos de usuarios: aquellos que necesitan transcripción de voz a texto para escribir novelas, los que necesitan transcripción académica, y los que escriben documentos empresariales, como memos Con este fin, probé tres programas de transcripción de voz (DNS, GDVT y WSR).
Configuración de transcripción de voz
Antes de comenzar la prueba, veamos primero la configuración recomendada de hardware y software..
Requisitos de hardware y software
Google Docs Voice Typing requiere el navegador Chrome y un micrófono. Y también necesita una conexión a Internet persistente (que no se menciona en los requisitos). De lo contrario, este es probablemente el método más fácil para comenzar con la transcripción del habla..
DNS requiere un procesador hecho en 2001 o posterior, Windows 7 o posterior, y alrededor de 4 GB de almacenamiento gratuito. Su requisito más estricto es 2 GB de RAM. Aquí hay una lista completa de los requisitos de hardware de DNS.
Reconocimiento de voz de Windows Habilite el control de voz a texto y voz configurando el reconocimiento de voz en Windows Habilite el control de voz a texto y voz configurando el reconocimiento de voz en Windows El reconocimiento de voz sigue siendo más poderoso que Cortana. Impulsa el control de voz a texto y voz. Este artículo le mostrará lo que puede hacer el Reconocimiento de voz, cómo configurarlo, entrenarlo y usarlo. , también conocido como Speech Platform Runtime (descargar WSR), no cuesta nada y solo requiere un sistema operativo Windows 7 o posterior.
Consideraciones de micrófonos
Utilizo un micrófono dinámico (el mejor micrófono para podcasting El mejor micrófono de podcast por su dinero en 2017 El mejor micrófono de podcast por su dinero en 2017 Los micrófonos importan mucho al hacer un podcast. Los costos iniciales son bastante bajos: software de grabación, una computadora de escritorio o portátil y, por supuesto, un micrófono. Entonces, ¿cuál es el mejor micrófono de podcast?) y un procesador Intel Core i7 relativamente rápido. Si bien se desea un micrófono de alta calidad, no es necesario. Aun así, sus resultados mejorarán con una mejor calidad de sonido y un ruido de fondo reducido.
El micrófono con el precio más bajo que recomendaría para una grabación de alta calidad es el Audio-Technica ATR-2100. Sin embargo, la diferencia de precisión entre un micrófono de $ 5 y un dispositivo de $ 200 es bastante mínima.
Audio-Technica ATR2100-USB Cardioide Dinámico Micrófono USB / XLR Audio-Technica ATR2100-USB Cardioide Dinámico Micrófono USB / XLR Comprar ahora en Amazon $ 62.99
Por otro lado, los requisitos mínimos para Microsoft Speech son prácticamente cualquier computadora remotamente moderna (la mayoría de las computadoras fabricadas en los últimos diez años) y un micrófono. Si posee una computadora portátil o tableta fabricada en los últimos cinco años, debería tener lo que necesita de manera predeterminada.
Configurar programas de transcripción de voz
A continuación, le indicamos cómo usar la escritura por voz de Google:
Aquí le mostramos cómo comenzar con el reconocimiento de voz de Windows:
Y, finalmente, así es cómo comenzar con Dragon Naturally Speaking:
Metodología de prueba
Quiero encontrar lo mejor gratis Aplicación de voz a texto basada en Windows. Debido a que diferentes consumidores pueden necesitar un producto diferente, he ideado una prueba simple. Leí tres pasajes diferentes de textos sin derechos de autor: uno de Charles Darwin Sobre la tendencia de las especies a formar variedades. Uno de H.P. Lovecraft's Llamada de Cthulu. El último proviene del discurso del Estado de la Unión de Jerry Brown en 2017. Mi metodología de ninguna manera es perfecta, pero da una impresión de las precisiones de cada suite de reconocimiento de voz.
Muestra de escritura de ficción (de H.P. Lovecraft's Llamada de Cthulu)
“Creo que lo más misericordioso del mundo es la incapacidad de la mente humana para correlacionar todos sus contenidos. Vivimos en una plácida isla de ignorancia en medio de los mares negros del infinito, y no significa que debamos viajar lejos. Las ciencias, cada una esforzándose en su propia dirección, hasta ahora nos han perjudicado poco; pero algún día la unión del conocimiento disociado abrirá vistas tan aterradoras de la realidad y de nuestra espantosa posición allí, que nos volveremos locos por la revelación o huiremos de la luz mortal hacia la paz y la seguridad de una nueva era oscura..”
Muestra de escritura comercial (discurso de Jerry Brown sobre el estado de la Unión en 2017)
“Es habitual en una ocasión como esta establecer una agenda específica para el año próximo. Seis veces antes desde esta tribuna, lo he hecho, y con cierto detalle. Y, al releer esas propuestas expuestas en discursos anteriores del Estado del Estado, me sorprendió ver cuánto hemos logrado juntos.”
Muestra de escritura académica (Charles Darwin's Sobre la tendencia de las especies a formar variedades)
“Ahora, cuando ocurre una variedad de tal animal, que tiene un mayor poder o capacidad en cualquier órgano o sentido, dicho aumento es totalmente inútil, nunca se pone en acción e incluso puede existir sin que el animal se dé cuenta de ello. En el animal salvaje, por el contrario, todas sus facultades y poderes se ponen en práctica para las necesidades de la existencia, cualquier aumento se vuelve inmediatamente disponible, se fortalece con el ejercicio e incluso debe modificar ligeramente la comida, los hábitos y el conjunto economía de la carrera.”
3 suites de transcripción de voz probadas
Es sorprendente cómo el reconocimiento de voz gratuito Las mejores aplicaciones de creación de listas para comandos de voz Las mejores aplicaciones de creación de listas para comandos de voz Muchas herramientas de productividad gratuitas admiten voz a texto para listas. Le mostraremos las mejores aplicaciones para crear listas con reconocimiento de voz y comandos que debe probar. pruebas realizadas contra software pago. Pero al final del día, la aplicación más precisa es Dragon Naturally Speaking. Sin embargo, tanto Google Voice Typing como Windows Speech Recognition no cuestan nada y ofrecen una precisión superior al 90 por ciento. Pero cada uno tiene sus propias fortalezas y debilidades y es posible que prefiera uno sobre el otro.
H.P. Lovecraft (Prueba de escritura de ficción)
A Lovecraft le encantaba escribir en prosa larga, ininterrumpida y entre paréntesis. Si bien las tres suites hacen un gran trabajo al transcribir con precisión el texto vocalizado de Lovecraft, DNS sale por delante de sus competidores. Incluye tanto mayúsculas como signos de puntuación (lo cual es completamente una locura).
DNS: DNS solo dejó caer una sola palabra del texto. En general, obtuvo 107 respuestas correctas de 108 palabras. También clavó varias oraciones largas y sin parar.
WSR: Windows hizo un muy buen trabajo, pero no sorprendente, al transcribir Lovecraft. Obtuvo alrededor de 97 de alrededor de 108 palabras correctas. Si bien eso no alcanza tanto a GDVT como a DNS, sigue siendo bueno para un programa de voz a texto gratuito que no requiere acceso en línea.
GDVT: No estoy seguro de lo que sucedió porque Google clavó la transcripción de los otros extractos. GDVT solo logró 103 de 108, dejando caer dos palabras y transcribiendo erróneamente tres. Incluso una vez deletreó “punto y coma” en lugar de insertar la puntuación correcta. También puso en mayúscula ciertas palabras, convirtiéndolas en sustantivos propios (pero no las penalizaré ya que lo que importa es la precisión y no las mayúsculas).
Estoy bastante seguro de que si vuelvo a leer el documento por segunda vez, no tendría ningún error.
Charles Darwin (Prueba de escritura científica o académica)
Darwin escribe, como Lovecraft, largas oraciones cargadas de información entre paréntesis. Sin embargo, su uso del lenguaje es muy claro y casi no usa jerga, lo que difiere de la escritura científica casi incomprensible de hoy..
DNS: El texto de Darwin sale casi perfecto en Dragon Naturally Speaking. DNS escribió mal una sola palabra (“dentro”) y de otro modo clavó completamente la prueba con 87 palabras de 88.
WSR: Microsoft hizo un gran trabajo, combinando 82 de 88 palabras. Sin embargo, cometió algunos errores relativamente extraños, como la ortografía. “sentido” como “centavos”.
GDVT: A Google le fue genial en el extracto de Darwin. GDVT solo ensució dos palabras, de 88. En general, para una aplicación gratuita, no puede encontrar una alternativa más precisa.
Jerry Brown Dirección del Estado del Estado 2016 (Prueba de escritura comercial)
El discurso de Brown no usa muchas oraciones o vocabulario complicados (aparte de la palabra “tribuna”) En general, la mayoría de los servicios de transcripción tuvieron un desempeño sorprendente. Más o menos, si necesita un servicio que maneje oraciones simples y vocabulario limitado, cualquiera de estos funciona muy bien.
DNS: DNS clavado en Brown's Dirección del Estado del Estado. Si bien se redujo un punto, de lo contrario, obtuvo cada palabra perfectamente. Sin embargo, tenga en cuenta que los discursos políticos a menudo carecen del tipo de lenguaje complejo que puede ver en la ficción o en la academia. Una nota o discurso es directo y al grano. Eso es algo que un cliente de reconocimiento de voz no debería tener problemas para manejar.
WSR: Windows Speech Recognition hizo un gran trabajo, aunque no tan bueno como DNS o Google, al transcribir el discurso de Brown. Obtuvo 55 de 58 palabras. Incluso reconoció la palabra “tribuna,” que ni siquiera sabía que era una palabra, ni sabía cómo pronunciarla. Aparentemente, lo entendí bien o la tecnología de reconocimiento de voz puede incluso captar pronunciaciones erróneas.
GDVT: El software de transcripción de Google clavó absolutamente la transcripción, con una precisión del 100 por ciento. Incluso logró capitalizar correctamente “Estado del estado”, sin necesidad de entrada del usuario. Curiosamente usaba el número, en lugar de la ortografía, para la palabra “seis”. Lo que resultó en un error estilístico.
¿Vale la pena utilizar los servicios de transcripción gratuitos??
Hay una diferencia entre Dragon Naturally Speaking, Google Voice Typing y Microsoft Windows Speech Recognition. Dragon es más preciso que sus competidores. Sin embargo, el mejor programa gratuito en términos de precisión es, por un margen estrecho, la escritura por voz de Google. Si bien los servicios de transcripción de Microsoft y Google se comparan menos favorablemente con el DNS, no cuestan $ 30.
Al contrastar los dos servicios gratuitos entre sí, Google ofrece una mejor precisión de reconocimiento de voz, puntuación y, por lo que requiere una conexión a Internet. Google también captura muchas cosas que no tiene intención, como la puntuación y las mayúsculas.
Sin embargo, si desea un programa de transcripción gratuito que no necesita una conexión a Internet para usar, el reconocimiento de voz de Windows se ajusta a la factura ¿Windows puede hacer ESTO? 15 características sorprendentes que no tenía idea sobre Windows ¿Puede hacer ESTO? 15 Características sorprendentes que no tenía idea sobre Windows puede hacer mucho más de lo que piensa. Incluso si es un usuario veterano de Windows, apuesto a que descubrirá una función en nuestra lista que nunca supo que existía. . De ninguna manera es malo y ofrece el 90 por ciento de lo que ofrece Dragon Naturally Speaking. Dale una oportunidad si aún no lo has hecho.
Y para hacer esto en su teléfono Android, eche un vistazo a las mejores aplicaciones de Android de voz a texto 7 Mejores aplicaciones de dictado de Android para Easy Speech-to-Text 7 Mejores aplicaciones de dictado de Android para Easy Speech-to-Text Buscando la mejor voz aplicaciones de texto para Android? Estas aplicaciones de dictado de Android te permiten tomar notas y más. .
¿Cuál es tu servicio de transcripción favorito? Por favor, háganos saber en los comentarios!