Digital Urdu: Digitalizando Uno de los 5 Lenguajes Mas hablados del Mundo.

Una de las cosas mas interesantes logradas por la era digital es que podemos encontrar textos de los diferentes lenguajes occidentales y estudiarlos cuando nos sea conveniente. Un trabajo al que miles de personas en el mundo le están dedicando tiempo y recursos y el cual en algun momento del futuro completarán.
Sin embargo otra vertiente es la del «data mining» es decir de esos textos como estudiar las palabras, los enunciados, las pronunciaciones para saber cosas que la sola lectura no nos diría: el que escribió ¿era hombre o mujer? ¿cuando fue escrito? ¿es posible conocer los sentimientos de esa persona por un análisis del lenguaje? Y así muchísimos datos que podemos inferir por cualquier método de los que existen muchos en idiomas occidentales. Pero hay lenguajes muy poulares que no cunmplen con los parámetros reglamentarios y se resisten a ser analizados. Tomemos el caso del Urdu que es el idioma oficial de Pakistán y que es uno de los 5 mas hablados del mundo y que no podía ser explorado hasta ahora que un grupo de estudiosos de la lengua ha creado el Digital Urdu, que es un programa que te permite el «data mining» del mismo.
Un trabajo en conjunto entre una profesora universitaria estadounidense y una empresa del mismo país y que ahora nos permitirá recorrer los miles de blogs, periódicos y revistas en ese idioma para saber en todo momento cual es el sentimiento general sobre lo que sucede sin nesecidad de leer específicamente cada cosa.
Aplicaciones asi son las que hacen increíble el poder dedicarse a la tecnología.

Deja un comentario