Servicio de búsqueda por voz para América latina
Google, la voz de las Américas
El buscador aggiornó localmente la aplicación que permite buscar en Internet con sólo hablarle al teléfono inteligente. Está disponible para Android y el iPhone y ya se puede usar en español “argentino”.
Por Mariano Blejman
La aplicación del buscador por voz reconoce palabras dictadas en “tono” argentino.
En cualquier lugar del mundo, el usuario le dicta la palabra “cines” al teléfono inteligente. El teléfono se conecta a Internet, usa miles de computadoras distribuidas alrededor del mundo para procesar esa búsqueda, entiende las variaciones regionales del lenguaje, la posición de quien busca en el planeta, las convierte en texto y devuelve la información recién buscada según el lugar donde el usuario se encuentre. Si el usuario le dijo “cines”, a la aplicación “Google búsqueda por voz”, esta le mostrará en su teléfono un mapa con los cines del barrio donde está. Una sola palabra: “cines”. Para todo lo demás está la aplicación de Google disponible para teléfonos Android, iPhone y próximamente para la web. No es ciencia ficción, pero se le parece. Aunque todavía Google no inventó la máquina del pre-crimen (ese departamento policial de Minority Report que detenía gente antes de que cometiera crímenes), el software de reconocimiento de voz sumado a la experiencia de sus búsquedas que suponen lo que vendrá se le parecen bastante. Es más probable que después de “frijoles” venga la palabra “mexicanos” que “alaskanos”.
Lo que darían lingüistas, antropólogos, sociólogos y comunicadores por zambullirse entre los algoritmos de Google dedicados al reconocimiento de voz que hay dentro de “búsqueda por voz”, la aplicación recientemente lanzada al mercado de América latina y que ya existen en inglés desde hace tres años. Se sabe, hasta hace no más de una década la antropología lingüística (o la lingüística antropológica) basaba sus estudios en la observación presencial: el científico analizaba las formas de conversación en extrañas tribus olvidadas, escribía en un cuaderno una larga lista de palabras, posibles traducciones y anotaciones acústicas. El modelo Google como plataforma global de distribución de la información apuesta a la distribución del uso cotidiano de nuestras costumbres para acumular conocimiento, y así acelerar las respuestas sobre nuestras necesidades.
Google sabe lo que significa llegar temprano. La búsqueda por voz (en vez de tipear una búsqueda, se la dicta) existe desde 2008 en Google en el inglés estadounidense, pero ya hay también versiones disponibles para el inglés británico, sudafricano, francés, español (de España), italiano, alemán, turco, ruso, polaco, checo, holandés, portugués, chino mandarín, cantonés, japonés, coreano e indonesio. La búsqueda por voz en español latinoamericano tardó en llegar. En el camino, Google encontró algunas dificultades: en la América de habla hispana la dialéctica, la fonología y la gramática tienen sus particularidades. ¿Se dice “vos”, “tú” o “ti”? ¿La calle Callao se pronuncia “cashao” o “caiao” o “cayao”? Lo que no deja de ser una molestia para cualquier paseante extranjero por Buenos Aires es un algoritmo, unas líneas de código que Google usa para resolver la cuestión. Para Google, claro, “Callao” se dice de todas esas formas, el asunto es descubrir quién la dice, con qué sentido y qué palabra usará después.
La percepción acústica de las palabras que interpreta Google fue recogida entre miles de frases habladas entre miles de locutores de América latina con diferentes edades, sexos y en distintas situaciones (casas, oficinas, bares, calles). Lo mejor es que aprende del uso que le dan miles de usuarios a Internet. Pero no se trata sólo de entender variaciones regionales o culturales, sino de interpretar maneras de pronunciar estructuras complejas. Por ejemplo, pregunta Moreno, “¿cómo se dice x1950pro?” Google tiene “cargadas” más de un millón de palabras locales, aunque el esfuerzo más grande ha sido entender modelos lingüísticos para poder predecir las probabilidades de que algunas palabras sean “seguidas” por palabras esperables. “Se trata de estimar probabilidades”, dice Moreno. Y para entender estas probabilidades la respuesta ya está dentro de Google: se trata de aprender de qué manera los usuarios usan el buscador, y de dejar que el software aprenda los modelos acústicos y lingüísticos de los usuarios.
“No nos importa que al principio lo usen sólo unos pocos”, dice Moreno. Google apuesta otra vez a sentar las bases para el “efecto palo de hockey”: una cantidad de usuarios que se mantiene lineal durante un buen tiempo hasta que de pronto crece de forma imparable. Pronto, estará también disponible para América latina una función que ya existe para el idioma inglés: la búsqueda por voz aprenderá de la manera de decir del usuario para entenderlo cada vez mejor. Pero, como reconoce Moreno, en la investigación de reconocimiento de voz nada es sencillo entre ovejas y cabras: “Las ovejas son los usuarios a quienes siempre se les entiende. Las cabras son usuarios que tienen acento extraño y cada vez que dicen algo el reconocimiento de voz no funciona”. Como sea, Google intenta una vez más ordenar el run run del pastoreo mundial.
Fuente Página/12
No hay comentarios:
Publicar un comentario