Google - IA: aplicaciones que mejoran la vida de las personas con discapacidad

Google – IA: aplicaciones que mejoran la vida de las personas con discapacidad

DOBLE LLAVE – Google explicó en un evento en Madrid cómo aplica la Inteligencia Artificial (IA) y el machine learning en sus aplicaciones para mejorar la accesibilidad para personas con discapacidad.

Durante un evento en la sede de Google en Madrid, la compañía mostró una serie de aplicaciones que ayudan a personas con discapacidad del habla o con alguna discapacidad visual en su día a día.

Científico de Google, Dimitri Kanevsky

Dimitri Kanevsky, un científico de Google, habló sobre el proyecto Euphonia, que tiene como objetivo mejorar el reconocimiento de voz en sus productos, centrándose en entrenar los dispositivos para que comprendan mejor a las personas que tienen dificultades a la hora de hablar debido a afecciones neurológicas como parálisis cerebral, esclerosis múltiple o lesiones cerebrales traumáticas.

Una de las aplicaciones que mostró es Live Transcribe (Transcripción Instantánea, en español), una herramienta que utiliza el sistema de reconocimiento de voz de Google para transcribir de forma simultánea en la pantalla del dispositivo del usuario aquello que le están diciendo las personas de su alrededor.

Live Transcribe permite elegir entre 70 idiomas y dialectos distintos, pero esta herramienta fue entrenada con una pronunciación estándar.

Por ello, Kanevsky explicó que para personas con discapacidad del habla se encuentra la herramienta Euphonia, a la que los usuarios deben entrenar mediante la grabación de audios.

Parrotron es otro proyecto específico para personas con discapacidad del habla. Mientras Euphonia convierte el audio en texto, Parrotron está entrenado para convertir un audio no estándar en estándar, es decir, convierte palabras y frases entrecortadas o que no se han pronunciado correctamente en audio comprensible.

Además, Kanevsky explicó el funcionamiento de Live Caption, una aplicación que agrega subtítulos de forma automática a vídeos, «podcasts» e incluso mensajes de audio. Mientras Live Transcribe codifica el audio del micrófono de los dispositivos, esta app pasa a texto el audio generado por otra aplicación.

Por el momento, esta app está únicamente disponible en dispositivos Pixel 4, aunque el científico de Google afirmó que pronto se usará en Pixel 3.