CatalunyaPress se suma al acuerdo para impulsar la IA en catalán junto al Barcelona Supercomputing Center
La iniciativa se formalizó tras una visita institucional a las instalaciones del BSC, donde los medios participantes pudieron conocer de primera mano las infraestructuras y proyectos vinculados al desarrollo de tecnologías del lenguaje.
El ecosistema mediático catalán ha dado un paso estratégico en el desarrollo tecnológico del idioma con la firma de un acuerdo entre la AMIC y el Barcelona Supercomputing Center (BSC-CNS), al que se ha adherido CatalunyaPress junto a otros doce medios. El convenio permite la cesión de contenidos editoriales para entrenar modelos de inteligencia artificial en lengua catalana, reforzando su presencia en el entorno digital.
La iniciativa se formalizó tras una visita institucional a las instalaciones del BSC, donde los medios participantes pudieron conocer de primera mano las infraestructuras y proyectos vinculados al desarrollo de tecnologías del lenguaje.
Datos reales para fortalecer la IA en catalán
El acuerdo tiene como objetivo principal facilitar el acceso a contenidos periodísticos —textuales, audiovisuales y sonoros— que permitan entrenar sistemas de inteligencia artificial con un alto grado de precisión lingüística y representatividad cultural.
En este contexto, el BSC trabaja con iniciativas como Aina y ALIA, centradas en la creación de modelos de lenguaje avanzados en catalán. La aportación de medios como CatalunyaPress resulta clave para incorporar datos generados por humanos, un recurso escaso frente al crecimiento de los contenidos sintéticos generados por algoritmos.
Desde el laboratorio de tecnologías del lenguaje del centro, su directora Marta Villegas destacó que la disponibilidad de datos reales en catalán es fundamental para desarrollar modelos capaces de reflejar la riqueza lingüística y cultural del territorio.
Diversidad territorial y valor periodístico
Uno de los elementos diferenciales del acuerdo es la diversidad de los medios participantes, que aportan contenidos procedentes de distintos puntos de Catalunya. Esta pluralidad permite integrar variantes dialectales y diferentes registros del lenguaje, mejorando la calidad de los modelos resultantes.
El secretario de la AMIC, Josep Ritort, subrayó el compromiso histórico de la asociación con la promoción del catalán, especialmente en iniciativas que refuerzan su uso social. En la misma línea, la responsable de innovación de la entidad, Clara Soteras, puso en valor el papel de los medios de proximidad como generadores de contenido esencial para entrenar nuevas herramientas digitales.
La participación de CatalunyaPress en este proyecto refuerza su posicionamiento dentro del ecosistema mediático digital catalán y su apuesta por la innovación aplicada al periodismo.
Infraestructura tecnológica de referencia
Durante la jornada, los representantes de los medios visitaron las instalaciones del BSC, donde se encuentran infraestructuras de alto rendimiento como el supercomputador MareNostrum5 y el sistema cuántico MareNostrum Ona. Estas herramientas permiten procesar grandes volúmenes de datos necesarios para el entrenamiento de modelos de inteligencia artificial a gran escala.
El investigador Javier Aula-Blasco, responsable del equipo de datos del laboratorio, explicó los fundamentos técnicos del proyecto y el potencial de la cesión de contenidos para generar avances en el ámbito científico y tecnológico.
Uso de los datos y retorno social
El modelo de colaboración se basa en la utilización de datos no personales con fines estrictamente lingüísticos. El BSC prioriza el interés científico y cultural por encima del contenido informativo en sí, garantizando que los modelos y recursos generados se distribuyan bajo licencias que maximicen su impacto.
El acuerdo contempla un retorno estratégico: contribuir a la creación de una inteligencia artificial capaz de entender, procesar y representar la lengua catalana en toda su diversidad.
El siguiente paso del proyecto será ampliar el volumen de datos y avanzar en el entrenamiento de modelos más complejos, capaces de integrarse en aplicaciones reales como asistentes virtuales, herramientas de traducción o sistemas de análisis de lenguaje.
La colaboración entre el BSC y los medios asociados a la AMIC se perfila así como un elemento clave para garantizar la presencia del catalán en el desarrollo de la inteligencia artificial a escala global.
Escribe tu comentario