Proyecto brasileño traduce Libras simultáneamente con IA

Un traductor simultáneo de Libras a textos y audios en portugués fue destacado en la ceremonia de premiación de uno de los mayores eventos de innovación y tecnología del mundo, el SXSW. Desarrollado en colaboración entre CESAR (Centro de Estudios y Sistemas Avanzados de Recife) y Lenovo, el proyecto quedó finalista en la categoría Inteligencia Artificial y abre puertas para ampliar la accesibilidad en plataformas de atención al cliente, por ejemplo.

La innovadora tecnología interpreta y traduce la Lengua de Signos Brasileña (Libras) para romper cualquier tipo de barrera en el diálogo. Este proceso ocurre simultáneamente y en tiempo real con la ayuda de una solución patentada de inteligencia artificial que identifica gestos individuales para contextualizarlos visualmente en función de un conjunto de datos.

«El propósito de este proyecto va mucho más allá de ofrecer un nuevo servicio», dijo el gerente de ciencia de datos de CESAR que codirigió la iniciativa, Vitor Casadei. «Entendemos la importancia de la accesibilidad y la inclusión y, junto con Lenovo, buscamos desarrollar algo con un impacto en la sociedad.»

Sin modelos comerciales de IA

El proyecto es el resultado de cinco años de desarrollo y en él ha participado un equipo de 80 personas, entre ellas cinco profesionales con discapacidad auditiva. A Canaltech, CESAR explicó que la herramienta no utiliza modelos comerciales de OpenAI, Google y similares. En cambio, los componentes se personalizan y desarrollan exclusivamente para la solución.

Toda la iniciativa gira en torno a un gran desafío: trabajar con una gran cantidad de datos, como videos de diálogos y saludos, especialmente cuando se consideran los matices de las señales o incluso las variaciones regionales.

Para lograr esto, los desarrolladores confiaron en la informática de punta para ejecutar el modelo e interpretar los datos. Esta tecnología, conocida popularmente con el término inglés “edge Computing”, ayuda a procesar información sin depender de un servidor en la nube distante, muchas veces ubicado en otros estados o países.

“Si bien la computación en la nube es una opción, los servidores Edge brindan mayor velocidad y confiabilidad en el lugar exacto donde se necesita la IA”, explicó la institución. «Dependerse exclusivamente de la nube y, por lo tanto, de velocidades de Internet muy rápidas, funciona en algunos casos, pero no en todos».

De las señales al texto y al audio

El marco garantiza que la herramienta interprete las señales realizadas frente a una cámara y luego las traduzca. El resultado se entrega en textos y audios en portugués y permite incluso a quienes no entienden la lengua de signos mantener un diálogo sin ruidos con personas sordas.

“Esta solución de IA llena las brechas de comunicación existentes, además de mejorar su uso para acelerar el aprendizaje de Libras, utilizando la visión por computadora para rastrear la precisión de los gestos e ‘instruir’ a los usuarios para que realicen ajustes”, señaló el director de I+D de Lenovo, Hildebrando Lima.

El traductor Libra se puede integrar fácilmente

A pesar de la presentación en el concurso SXSW 2024, el traductor simultáneo Libra aún no tiene una aplicación abierta al público. Los desarrolladores explican que la solución se encuentra en el proceso final de prueba y aprobación, pero que debería lanzarse en 2024 para brindar soporte a las computadoras portátiles Lenovo en Brasil.

Sin embargo, esta puede no ser la única aplicación del nuevo traductor. Los responsables del proyecto señalan también que el traductor permite la integración con “cualquier otra solución mediante APIs”. Es decir, es posible llevarlo a otros sitios web y aplicaciones para ofrecer más accesibilidad a todos.

“Nuestro objetivo siempre ha sido llevar innovación de vanguardia a nuestros socios y contribuir significativamente a mejorar e innovar productos y servicios a través de la tecnología”, concluyó el presidente del directorio de CESAR, Giordano Cabral.