¿Qué lenguaje es este? 5 herramientas para identificar idiomas desconocidos

  • Michael Fisher
  • 0
  • 4701
  • 828
Anuncio

¿¿yo??´ yo›¹yo'¬¿¿yo??´yoŠ¸yo-?? í ™˜yo˜??. ¿¿yo??´ê²ƒì ?? € ë³´mi¸° ì›??mi³¸¿¿yo??´mi‹¤

¿Qué lenguaje es este? ¿Chino? japonés?

Es coreano en realidad. Detectar esto manualmente me habría llevado mucho tiempo. Afortunadamente, encontré algunas herramientas muy precisas que pueden hacer esto automáticamente. Todos se enumeran a continuación..

El experimento: Probé los sitios web usando texto de muestra (1-2 oraciones con 8 palabras) de los siguientes idiomas: portugués, ruso, coreano, vietnamita, italiano, turco, polaco, ucraniano, azerbaiyano, esloveno, macedonio, holandés, filipino (tagalo), Griego, gallego, checo, bielorruso, finlandés, tártaro y noruego.

En general, probé 20 idiomas diferentes.

3 herramientas para detectar texto de idioma desconocido

1. LangId (aprobó 18 de las 20 pruebas, no aprobó el tártaro y el bielorruso)

Pros: En general, una gran herramienta en línea. Ofrece una funcionalidad básica de detección de texto y también tienen bots de detección de Twitter y correo electrónico para resultados aún más rápidos..

Contras: Su motor está basado en la API de Google, pero parecen tener mejores resultados que el detector de Google que se describe a continuación. Parece que saben cómo utilizar las cosas muy bien. No me gustó que no tengan su propio algoritmo único para detectar idiomas.

2. Detector de idioma de Google [ya no está disponible] (aprobó 17 de 20 pruebas, no aprobó portugués, taglog y bielorruso)

Pros: Google tiene una de las mejores API del mundo para la detección de idiomas. Lo bueno es que puedes ver la probabilidad de que el resultado que muestran sea verdadero. Pudieron pasar la mayoría de las pruebas de muestra.

Contras: Me sorprendió bastante que no pasaran la prueba portuguesa. Parece que tienen un error (espero temporal) con este lenguaje. Además, seguramente pueden hacer un mejor trabajo para mejorar el diseño de la página.

3. Qué lenguaje es este (pasó 11 de 20 pruebas, no pasó ruso, coreano, ucraniano, azerbaiyano, macedonio, tagalo, griego, gallego y tártaro)

Pros: Algunos idiomas como los eslavos del sur (serbio, croata, esloveno) son bastante similares. En caso de que ingrese algún texto croata, digamos, este sitio web le dirá que el texto también podría ser serbio o esloveno.

Contras: Necesitan trabajar para hacer que su sistema de detección sea más sofisticado. Estaba pensando en poner Translated.net (otro sitio web para la detección de idiomas) en lugar de este, pero Translated prometió la detección de más idiomas y en realidad fue peor que WhatLanguageIsThis.com.

2 herramientas para detectar sitios web en idiomas desconocidos

4 4. Traductor de google con Detectar idioma como la primera opción

Aprobado: 18 de 20, no pasaron Bielorruso y Tártaro.

Pros: Esta herramienta hace su trabajo muy bien. Lo que me gusta de Google Translate Google Translate 2.1 aparece con el teclado nativo de iOS 7 y más compatibilidad con el idioma Google Translate 2.1 aparece con el teclado nativo de iOS 7 y más compatibilidad con el idioma y soporte de entrada de escritura a mano para nuevos idiomas. Google Translate finalmente obtiene un nuevo teclado iOS 7 para hacer todo ... es que si no admite un idioma específico, le ofrece la siguiente pantalla:

Es un gran detector de idiomas si me preguntas!

5 5. Traductor de Microsoft Bing con Detección automática como la primera opción.

Aprobado: 8 de 20, no pasaron holandés, vietnamita, turco, ucraniano, azerbaiyano, esloveno, macedonio, tagalo, griego, gallego, checo y bielorruso

Pros: Es compatible con un número limitado de idiomas. Para esos idiomas, hace bien su trabajo.

Contras: Estoy muy decepcionado con Microsoft. Tienen un número muy limitado de idiomas para detección y traducción. Los 4 servicios de traducción en línea más importantes Los 4 servicios de traducción en línea más importantes y su función de detección automática es terrible. En caso de que ingrese un idioma que no admite, obtendrá un resultado incorrecto en lugar de decirle que no admite ese idioma.

Pensamientos

En general, mi opinión es que las herramientas anteriores se dirigen en una buena dirección. Actualmente son los mejores para detectar idiomas en línea y hacen su trabajo bastante bien cuando se trata de idiomas populares. Sin embargo, deben trabajar para agregar idiomas más oscuros (ninguna de las herramientas fue capaz de reconocer el tártaro) y estoy seguro de que todos ellos, especialmente Google, irán en esa dirección en un futuro próximo..

Crédito de imagen: Kanko *




Nadie ha comentado sobre este artículo todavía.

Sobre tecnología moderna, simple y asequible.
Tu guía en el mundo de la tecnología moderna. Aprenda a usar las tecnologías y los dispositivos que nos rodean todos los días y aprenda a descubrir cosas interesantes en Internet.