Cómo la escritura por voz es la nueva mejor característica de Google Docs

  • Brian Curtis
  • 0
  • 2556
  • 469
Anuncio

El reconocimiento de voz solía ser terriblemente inexacto. Solo funcionó para un puñado de personas un puñado de las veces. Pero ahora es bastante bueno, gracias a los esfuerzos combinados de Nuance, Microsoft, Apple y Google, que han arrojado innumerables recursos para mejorarlo..

De todas esas compañías, pocas han igualado el compromiso con el reconocimiento de voz de Google, que lo ha convertido en un eje fundamental de su estrategia móvil y de servicios..

Una de las primeras incursiones de Google fue el efímero GOOG-411 (o Búsqueda local de Google Voice). Se lanzó en 2008 y permitió a las personas buscar números de teléfono comerciales usando su voz. La tecnología de reconocimiento de voz también ha sido una pieza central de Android, y con el lanzamiento de JellyBean ¿Cuáles son las mejoras más importantes en Android 4.2 y 4.3? ¿Cuáles son las mejoras más importantes en Android 4.2 y 4.3? Si estás atrapado en 4.0 Ice Cream Sandwich o 4.1 Jelly Bean, ¿deberías actualizar? finalmente estuvo disponible sin conexión.

A principios de esta semana, Google finalmente introdujo el reconocimiento de voz en Google Docs..

Los usuarios pueden literalmente dicte sus documentos (al igual que estoy haciendo con este artículo) sin la necesidad de instalar ningún software adicional o complementos. Es un salto significativo para la suite ofimática en línea, pero ¿es bueno??

Empezando

Antes de comenzar a sumergirnos en sus características, quiero tocar cómo obtienes Google Voice Typing. Si tiene una cuenta de Google, ya la tiene. Simplemente abra Google Docs y abra un documento nuevo o existente. Luego, aparecerá una ventana emergente que le preguntará si desea probar el dictado de voz. Hacer clic Intentalo.

A continuación, debe dar permiso a Google Docs para usar su micrófono. Eso es solo cuestión de hacer clic Permitir a una ventana emergente.

Luego, debe seleccionar el idioma que desea usar con Google Voice Typing. La gama de idiomas y dialectos que se ofrecen van desde inglés y español hasta afrikaans y árabe..

Luego, simplemente haga clic en el icono del micrófono y comience a hablar.

¿Qué tan preciso es??

Uno de los mayores obstáculos para que el reconocimiento de voz llegue a la corriente principal es que a menudo no es lo suficientemente precisa. Solía ​​ser un hecho que si ves usar el reconocimiento de voz, tendrás que pasar unas buenas horas editando y corrigiendo tu texto. Entonces, ¿cómo funciona la oferta de Google a este respecto??

Bastante favorable, en realidad. En su mayor parte, Google Voice Typing entendió lo que dije, aunque tengo acento regional en inglés (hablaremos de acentos más tarde).

Me impresionó especialmente la forma en que el reconocimiento de voz de Google manejó el ruido de fondo. Mientras escribía este artículo, un Yorkshire Terrier estaba ladrando en mi sala de estar, y mi ventana estaba parcialmente abierta. Vivo en una calle concurrida donde los automóviles pasan constantemente. Pero a pesar de eso, Google pudo filtrar eso y enfocarse en lo que estaba diciendo..

El mayor problema fue que Google Voice Typing a menudo tuvo problemas con la puntuación. yo diría “coma”, “período” y “punto final”, y lo interpretaría como si quisiera escribir “coma”, “período”, y “punto final”. Esto fue frustrante por dos razones..

En primer lugar, porque me molestaría, al usar primero la puntuación correcta, antes de volver inmediatamente a la versión deletreada de la palabra. No había forma de detener esto, y tendría que editar manualmente el documento para solucionarlo.

Pero, quizás peor, no pude evitar que sucediera. No hay un diccionario en el que pueda anular la ortografía. Simplemente sucede, y tienes que lidiar con eso.

No quiero subestimar lo frustrante que es esto. Es muy molesto. Pero también es algo en lo que estoy seguro se mejorará a medida que más y más personas usen esta función, y a medida que Google asigne más recursos para mejorar su reconocimiento de voz..

Además de esa molestia particular, estaba bastante satisfecho con la precisión del reconocimiento de voz de Google.

Cómo maneja los acentos

Me sorprendió la cantidad de idiomas y dialectos que admite Google Voice Typing. Solo en inglés, admite los dialectos de Nueva Zelanda, Australia, India, Sudáfrica, América y Gran Bretaña, por nombrar solo algunos. El problema es que no hay realmente un acento estadounidense, al igual que no hay acento británico. Más bien, hay una gama de acentos y dialectos que difieren de un lugar a otro..

Es una verdad que el Reino Unido tiene un acento para cada código postal. El equipo MakeUseOf cuenta con una variedad de acentos diferentes entre el personal británico. Christian Cawley habla con un amplio acento de Middlesbrough. Rob Nightingale, que proviene de Southport, tiene un acento más al norte. Mientras que Mark O'Neil tiene un toque escocés.

Vivo en Liverpool, así que tengo un acento Scouse que se desplaza ligeramente hacia el Atlántico, en gran parte gracias a mi prometida estadounidense y al tiempo que pasé viviendo en Suiza..

Y es justo decir que los programas de reconocimiento de voz a menudo tienen dificultades para entender los dialectos regionales en inglés. Cuando salió Siri, por ejemplo, su incapacidad para comprender a los usuarios escoceses se convirtió en una broma..

Pero la oferta de Google fue excepcional. Créeme cuando digo que no tendrás que practicar hablar con un acento diferente. ¿Qué aplicaciones y sitios web ayudarán a mejorar mi acento cuando hables otro idioma? ¿Qué aplicaciones y sitios web ayudarán a mejorar mi acento cuando hablo otro idioma? Realmente quiero que mi pronunciación coincida con la de un hablante nativo. ¿Hay alguna aplicación o sitio web que pueda ayudarme? . He hablado con un puñado de amigos que también tienen acentos regionales en inglés, y han tenido experiencias similares positivas con él. Si bien admito que es una muestra pequeña y completamente no científica, ciertamente es prometedora.

Velocidad de dictado de voz

Los programas de reconocimiento de voz tradicionalmente se han visto obstaculizados por la incapacidad de mantenerse al día con la velocidad a la que el usuario dicta. Es cierto que estaba un poco preocupado porque la oferta de Google no sería diferente, especialmente dado que es un servicio en línea, en lugar de un programa que se ejecuta en mi MacBook Pro mejorado.

Pero me impresionó. Google pudo mantener mi ritmo de conversación altamente cafeinado y no actuó como un cuello de botella para mi productividad. Fue todo lo contrario de mis experiencias con otras herramientas de dictado de voz..

No sé si eso fue porque tengo un FTTC (fibra para el gabinete) rápido ¿Cuál es la diferencia entre FTTC y FTTP, y por qué debería importarle? ¿Cuál es la diferencia entre FTTC y FTTP, y por qué debería importarle? Todos hemos estado allí en un momento u otro. Enfermo de nuestro servicio de Internet, buscando una nueva forma de conectarse a Internet, pero confundido por las muchas opciones diferentes. conexión a Internet doméstica, o el hecho de que Google tiene un suministro ilimitado de servidores rápidos a su disposición. De cualquier manera, pude hacer cosas.

Una nota sobre micrófonos

Los micrófonos incorporados tienden a ser impredecibles. En mi experiencia, son excelentes, como si estuvieran en las computadoras portátiles de Apple, o no lo son. Rara vez hay un término medio.

Como regla general, las computadoras portátiles más baratas Las mejores computadoras portátiles con menos de $ 300: todo lo que necesita saber Mejores computadoras portátiles con menos de $ 300: todo lo que necesita saber Encontrar una buena computadora portátil por menos de $ 300 es casi imposible en estos días, pero se puede hacer si sabe qué buscar. Aquí está todo lo que necesita saber para hacer una compra que ... tendrá los peores micrófonos internos. Es solo una de esas características que los fabricantes de dispositivos pasan por alto..

Comencé a dictar este artículo usando el micrófono interno de mi MacBook Pro. Aunque Google Docs dijo con frecuencia que tenía problemas para escucharme, eso no se tradujo en un dictado más lento o inexacto. Todo funcionó bien.

También probé con Google Voice Typing con un costoso micrófono externo Blue Yeti. Estos son micrófonos con calidad de podcast que se venden en Amazon por más de $ 100.

Es cierto que no noté ninguna diferencia en cuanto a la precisión o la velocidad del dictado. Sin embargo, la mayor ventaja de usar este micrófono fue que pude insertar un par de auriculares AKG y usarlos como monitor. Esto me permitió ser más consciente del ruido de fondo y autoajustarme si estaba siendo demasiado ruidoso o demasiado silencioso.

Pensamientos finales

El reconocimiento de voz de Google no es perfecto. Pero eso no es una sorpresa, ya que el reconocimiento de voz sólido es una hazaña bastante difícil de lograr. Hay muchas cosas que sentí que podrían mejorarse.

Esto se centra principalmente en cómo el software trata la puntuación y la estructura de las oraciones. En un mundo ideal, Google insertará automáticamente la puntuación basada en el ritmo y la cadencia de su voz, pero somos un largo lejos de eso.

También es una pena que este software aún no haya llegado a otras ofertas de Google, como Gmail. Idealmente, me gustaría tener la oportunidad de descargar Google Voice Typing como una aplicación, y usarlo con otras piezas de software, como las páginas 5.0 de iWork's Pages 5.0 para Mac incluye el panel Smart Inspector, pero las características menos páginas 5.0 para Mac incluyen el panel Smart Inspector, Pero menos funciones Hay muchos editores de texto livianos y fáciles de usar para usuarios de Mac, pero para proyectos que requieren funciones de publicación de escritorio, las páginas recientemente revisadas de Apple siguen siendo una buena solución. o el editor de rebajas IA Writer iA Writer para Mac e iOS: el mejor procesador de textos que nunca ha usado iA Writer para Mac e iOS: el mejor procesador de textos que nunca ha usado Ya sea un periódico escolar o una publicación de blog, todo En algún momento nos encontramos en la posición de tener que volcar un montón de caracteres en un archivo de texto. Mientras que el teléfono celular ... .

Pero esas son dos molestias menores, Google Voice Typing es tan bueno como parece. Por el contrario, escribí esta sección del artículo usando el reconocimiento de voz incorporado de OS X, y no era ni tan preciso ni tan rápido.

Si esto no persuade a las personas a cambiar a Google Drive, no sé qué hará.

Ahora a ti! ¿Te ha tentado el reconocimiento de voz de Google Drive? ¿Lo has probado ya? Cuéntame todo al respecto en los comentarios a continuación.




Nadie ha comentado sobre este artículo todavía.