¿Qué lenguaje es este? 5 herramientas para identificar idiomas desconocidos
I ?? `i> ¹ì,¬ì ??`트ì- ?? í ™ ~ì~ ??. I ?? ??`ê²ƒì € ë³`ê¸ ° i> ?? ?? 본ì`e <¤
Vídeo: Lenguaje corporal: 21 Gestos y sus significados
¿Qué lenguaje es este? ¿Chino? ¿Japonés?
Es coreana realidad. La detección de este manual me habría llevado mucho tiempo. Afortunadamente, he encontrado algunas herramientas muy precisas que pueden hacer esto automáticamente. Todos ellos se enumeran a continuación.
El experimento: Probé los sitios web que utilizan texto de la muestra (1-2 oraciones con 8 palabras) a partir de los siguientes idiomas: portugués, ruso, coreano, vietnamita, italiano, turco, polaco, ucraniano, Azerbaiyán, Eslovenia, Macedonia, holandés, filipina (tagalo), griego, gallego, Checa, Bielorrusia, Finlandia, tártaro y noruego.
En general, he probado 20 idiomas diferentes.
3 herramientas para detectar Desconocido idioma del texto
1. lANGID (Pasado 18 fuera de 20 pruebas, no pasó tártaro y bielorruso)
Vídeo: 5 COSAS QUE NO SABÍAS DEL IDIOMA ÁRABE | Lengua Larga
Pros: , Gran herramienta en línea en general. Ofrece una funcionalidad básica de detección de texto y también tienen Gorjeo y bots de correo electrónico de detección de resultados aún más rápidos.
Contras: Su motor se basa en la API de Google, pero que parecen tener mejores resultados que el detector de Google se describe a continuación. Parece que saben cómo utilizar las cosas muy bien. No me gustaría que no tienen su propio algoritmo único para detectar idiomas.
2. Detector de Lenguaje Google (Pasado 17 fuera de 20 pruebas, no pasó portugués, TAGLOG y bielorruso)
Pros: Google tiene uno de los mejores de la API del mundo para la detección de idioma. Ellos Lo bueno es que eres capaz de ver la probabilidad de que el resultado que muestran ser fiel. Ellos fueron capaces de pasar la mayor parte de las pruebas de muestra.
Contras: Me ha sorprendido que no pasan la prueba portuguesa. Parece que tienen un (espero que temporal) error con este lenguaje. También sin duda puede hacer un mejor trabajo en la fabricación del diseño de la página mejor.
3. Qué lenguaje es este (Aprobada el 11 de las 20 pruebas, no pasó de Rusia, Corea, Ucrania, Azerbaiyán, macedonio, tagalo, el griego, el gallego y el tártaro)
Pros: Algunos lenguajes como los eslavos del sur (Serbia, Croacia, Eslovenia) son bastante similares. En caso de que introduzca un texto de Croacia, digamos, este sitio web le dirá que el texto podría ser también de Serbia o Eslovenia.
Contras: Tienen que trabajar en hacer que su sistema de detección más sofisticado. Estaba pensando en poner Translated.net (otro sitio web para la detección de idioma) en lugar de éste, pero traducida prometí detección de más idiomas y en realidad peor que hice WhatLanguageIsThis.com.
2 herramientas para detectar los sitios web en Unknown Idiomas
4. traductor google con Detectar idioma como la primera opción
pasado: 18 de los 20, no pasó bielorruso y tártaro.
Pros: Esta herramienta hace su trabajo muy bien. Lo que me gusta de traductor google es que si no es compatible con un idioma específico que le da la siguiente pantalla:
Eso es un gran detector de idioma si usted me pregunta!
5. Microsoft Bing Translator con Detección automática como la primera opción.
Vídeo: Tengwar, Tutorial de escritura élfica de Tolkien | Tierras de Rol
pasado: 8 de cada 20, no pasaron holandés, vietnamita, turco, ucraniano, Azerbaiyán, Eslovenia, Macedonia, tagalo, griego, Gallego, Checa y Bielorrusia
Pros: Es compatible con un número limitado de idiomas. Para esos idiomas, que hace bien su trabajo.
Contras: Estoy muy decepcionado con Microsoft. Tienen un número muy limitado de idiomas para la detección& traducción y su función de autodetección es terrible. En caso de entrar en un idioma que no son compatibles, que obtendrá un resultado erróneo en lugar de decirle que no apoyan ese idioma.Top 4 en línea Servicios de TraducciónTop 4 en línea Servicios de TraducciónLee mas
pensamientos
En general, mi opinión es las herramientas anteriores se dirigen en una buena dirección. Actualmente son los mejores para la detección de idiomas en línea y hacer su trabajo bastante bien cuando se trata de lenguajes populares. Sin embargo, deben trabajar en la adición de más idiomas oscuros (ninguna de las herramientas fueron capaces de reconocer tártaro) y estoy seguro de que todos ellos, especialmente Google va a ir en esa dirección en un futuro próximo.