AINA busca millones de voces para que la tecnología entienda y hable el catalán
Desde este miércoles ya se pueden hacer las grabaciones de voz. AINA es un proyecto basado en tecnologías de datos e impulsado por la Vicepresidencia de la Generalitat y el BSC para hacer posible que las máquinas entiendan y hablen el catalán
El vicepresident Puigneró durante la presentación de AINA /@govern.cat
Bajo el lema ' Nuestra lengua es tu voz ', la Generalitat lanza este jueves, 17 de febrero, una campaña de captación de voces para generar el primer corpus o “ diccionario ” de voz del catalán. La campaña se inscribe en el proyecto AINA , impulsado por el Departamento de la Vicepresidencia y de Políticas Digitales y Territorio en colaboración con el Barcelona Supercomputing Center -Centro Nacional de Supercomputación (BSC-CNS) para hacer que la tecnología entienda y hable la nuestra lengua.
El proyecto AINA generará los recursos digitales y lingüísticos necesarios para facilitar el desarrollo de aplicaciones basadas en la inteligencia artificial y las tecnologías de la lengua, como los asistentes de voz, traductores automáticos o agentes conversacionales en catalán.
El objetivo último es que la ciudadanía pueda participar en catalán en el mundo digital al mismo nivel que los anglohablantes o castellanohablantes, evitando así la extinción digital de la lengua catalana.
El primer recurso generado es el corpus del catalán para entrenar los algoritmos de inteligencia artificial (IA), el mayor creado hasta el momento, con 1.770 millones de metadatos asociados a palabras.
El próximo paso será generar los modelos de la lengua, modelos del habla y modelos de traducción utilizando redes neuronales multicapa, para que las empresas que crean aplicaciones basadas en inteligencia artificial (IA), como asistentes de voz, traductores automáticos, agentes conversacionales, etc., puedan hacerlo fácilmente en catalán.
La participación ciudadana en la campaña de recogida de voces 'Nuestra lengua es tu voz ' se hará a través de la iniciativa de Common Voice de Mozilla por el catalán, una plataforma donde todo el mundo que lo quiera podrá leer y grabar un número ilimitado de frases (agrupadas de 5 en 5 pero sin límite) para ayudar a las máquinas a aprender cómo hablamos las personas.
Aunque esta colaboración se puede realizar de forma totalmente anónima y sin ningún registro previo, conocer los parámetros de género, edad y variante dialectal de la persona “donante” de voz facilita mucho el trabajo de clasificar los datos de voz obtenidos y, a la vez , permite saber si se está contemplando toda la diversidad lingística del catalán. Por eso, la campaña anima a la ciudadanía a registrarse y crear un perfil en la plataforma para avanzar más rápidamente en los objetivos del proyecto AINA.
Enseñar catalán en las máquinas, todo un reto
“Enseñar ” una lengua en las máquinas de modo que sean capaces no sólo de entendernos cuando les hablemos sino de respondernos de forma coherente a lo que les hemos preguntado o pedido es hoy un reto.
Si queremos que los ordenadores, asistentes de voz y otros sistemas informáticos hablen y entiendan el catalán, es necesario conseguir datos masivos de la lengua (en formato de texto y de voz). Estos datos se pasan a una red neuronal profunda que va aprendiendo cómo se combinan las palabras hasta generar un modelo de la lengua capaz, por ejemplo, de distinguir los diferentes significados de la palabra “banco” gracias a los diferentes contextos en los que se utiliza .
Para construir el corpus de la lengua (conjuntos de datos) que necesita una máquina, es necesario tener millones de textos y millones de horas de audio y vídeo en esa lengua y, además, que esos millones y millones de datos representen toda la riqueza de la lengua incluyendo, por ejemplo, grabaciones de voz de personas de diferentes géneros, distintas franjas de edad y diferentes variantes dialectales y registros.
Obtener este volumen y concreción de datos es especialmente difícil para las lenguas minoritarias a escala mundial como el catalán, ya que lenguas mayoritarias como el inglés tienen fácilmente a disposición toda esta información: sólo hace falta ir a Internet para encontrar millones y millones de textos , audios y vídeos en inglés.
Por este motivo, la campaña 'Nuestra lengua es tu voz' invita a la ciudadanía de habla catalana de todas las edades, géneros, condiciones y procedencias a “dar” su voz, con el objetivo de obtener unos contenidos de voz que capten toda la riqueza del catalán oral, con todos sus registros y variedades dialectales. Actualmente, el perfil de voz mayoritario en la plataforma Common Voice de Mozilla es la de hombres de entre 30 y 50 años hablantes de catalán central.
3M€ de presupuesto para 2022 para un proyecto estratégico
Para hacer posible esta hoja de ruta, la Generalitat destinará este año 3 millones de euros al proyecto AINA mediante una subvención directa al BSC, que será el encargado de su ejecución. Con esta aportación, que multiplica por 12 el presupuesto destinado por la Generalitat en 2021, el Govern refuerza su firme apuesta por este proyecto estratégico que tiene como objetivo último garantizar que la ciudadanía pueda hablar e interactuar en catalán en el mundo digital al mismo nivel que los hablantes de otras lenguas como el inglés o el español.
El president de la Generalitat, Pere Aragonés , y el vicepresident y consejero de Políticas Digitales y Territorio, Jordi Puigneró Ferrer, participarán el miércoles en el acto que se celebrará en el Palau de la Música para explicar la evolución del proyecto AINA para hacer posible que la tecnología entienda y hable el catalán.
Escribe tu comentario