SJ estranha silêncio de responsáveis pelo “ChatGPT” português

A Direção do Sindicato dos Jornalistas (SJ) estranha que os responsáveis pelo grande modelo de linguagem (LLM) português venham há dois meses a ignorar os contactos do SJ para discutir o projeto Amália. Tanto mais que não é sequer um tema novo; no estrangeiro, são conhecidas as disputas judiciais entre publicações noticiosas e empresas tecnológicas privadas pelo uso indevido de trabalhos jornalísticos para treinar modelos de inteligência artificial.

Temos presente o dano causado pelas grandes empresas tecnológicas à sustentabilidade do jornalismo, absorvendo a esmagadora maioria do bolo publicitário que o financiou durante anos, e agora usurpando trabalhos jornalísticos para construir modelos de linguagem que alimentam os seus negócios globais, o SJ não pode aceitar que um LLM português, ainda por cima com financiamento público, cometa os mesmos pecados, ignorando a lei dos direitos de autor, por exemplo.

O “Projeto Amália” está a ser desenvolvido por cinco instituições de ensino superior públicas, com um investimento de 5,5 milhões de euros do PRR, por iniciativa do Governo em funções. Mas em resposta aos convites do SJ para conversar sobre o chamado “ChatGPT português” só chegou silêncio da parte dos responsáveis universitários. Silêncio inesperado, porque afirmam publicamente que o “Amália” está já em testes, para ser lançado no próximo ano. Um dos responsáveis, João Magalhães, da Universidade Nova de Lisboa indicou mesmo que precisam de feedback “de linguistas, do utilizador comum e mesmo a contribuição de dados de várias entidades” para melhorar o modelo.

Lamentamos que não tenham mostrado interesse em ouvir os representantes legais dos jornalistas e de se inteirarem das propostas do SJ, que pediu reuniões tanto a João Magalhães com a outro responsável pelo projeto, o investigador do Instituto Superior Técnico André Martins.

É essencial saber se, no treino do nosso LLM público, a utilização dos conteúdos do “arquivo.pt“, da Fundação para a Ciência e Tecnologia, está a ter em conta os direitos de autor dos jornalistas, ao aceder a conteúdos de órgãos de comunicação social. Importa ainda perceber como operará este modelo no recurso e referência a conteúdos jornalísticos, que vêm sendo canibalizados sem atribuição por inteligências artificiais.

O Sindicato dos Jornalistas entende que o desenvolvimento de um LLM português é uma opção que só faz sentido se aportar, mais do que a língua, qualidade e rigor. Isso consegue-se com acesso a dados de qualidade, nomeadamente de publicações científicas, de universidades ou de órgãos jornalísticos. Mas usar esta informação, produzida por profissionais devidamente habilitados na recolha, seleção e produção de informações verificada, não se pode fazer à pirata. O trabalho tem de ser pago a quem o produz. Falta esclarecer, por manifesto desinteresse dos responsáveis em dar-se ao escrutínio, se o “Projeto Amália” está a ser desenvolvido remunerando o trabalho de que se alimenta, ou tomando o que lhe apraz.

Partilhe