Hace unos días escuchamos a Pedro Moreno (Elche, 1964) en el programa de Onda Cero de Julia Otero. Este ingeniero es el responsable del área de investigación de reconocimiento de voz de Google. Dirige un grupo de tecnología del habla (compuesto por ingenieros, lingüistas y un equipo de gente que va recogiendo datos acústicos) que permite que el motor de búsqueda de Google reconozca ya 42 idiomas. La idea no es solo para la versión de escritorio, sino también, y sobre todo, para evitar teclear desde el móvil. El objetivo es que Google cambie de ser una caja blanca donde se meten unas palabras a un interfaz conversacional.

Buscando más datos sobre este tema, hemos encontrado un artículo que publicó El País en 2011 y una entrevista a Pedro Moreno que salió en La Vanguardia en 2012, textos de los que les ofrecemos algunas partes.

“Lo lógico era empezar por el inglés y así lo hicieron. El método usado para reconocer el habla en inglés y buscar tuvo que ser modificado para el segundo lenguaje, el chino mandarín. Hasta empezar con el chino mandarín usaban dos formas combinadas de reconocer el idioma: por léxico y por la gramática del lenguaje. Así, los sonidos iban cobrando significado. Pero, en el caso del chino, el tono era una nueva variante a tener en cuenta. Descubrieron que la entonación decía más que la propia sucesión de sonidos. Gracias a esta dificultad nació el método que ha servido para reconocer más de 30 idiomas. Al comienzo tardaron meses, ahora, con dos semanas de datos tienen material para ponerse a trabajar.

El objetivo de Google Voice es llegar a 300 idiomas. «Que son los que hablan más de un millón de personas», aclara Moreno, «pero nos gustaría seguir con más. Queremos que la gente pueda hablar al móvil y buscar en Google, sin más complicaciones». Como un guiño decidieron dar de alta una lengua muerta, teóricamente, pero llena de valor cultural: el latín. Más allá del agradecimiento por parte de la comunidad eclesiástica, les sirvió para manejar mejor los idiomas que se declinan, como ruso, alemán o los idiomas de los países nórdicos.

El último gran descubrimiento lo hicieron al traducir las lenguas africanas. El estreno fue con el zulú. Hubo una nueva dificultad: los chasquidos. «Es un tipo de sonido que se hace con la lengua, son como clics que, con nuestro oído occidental, resulta difícil de detectar», explica el experto, «pero nos sirvió para mejorar las técnicas de modelado acústico y usarlo en el afrikaans, por ejemplo».

Más difícil todavía para Google ha sido comprender el habla de Hong Kong, donde el 20% de las palabras son en inglés y el resto una mezcla de chino e influencias cercanas. Superada esta prueba, Pedro Moreno no se amilana ante ninguna otra.”

Fuente: elpais.com/diario; ondacero.es; lavanguardia.com