A revista norte-americana The Atlantic lançou uma nova ferramenta que permite a músicos e criadores verificar se as suas obras estão presentes em bases de dados utilizadas no treino de modelos de inteligência artificial.
AI Watchdog é a plataforma que foi desenvolvida pelo investigador Alex Reisner e baseia-se na análise de quatro grandes conjuntos de dados que circulam na comunidade de desenvolvimento de IA. No total, estas bases de dados reúnem milhões de temas, incluindo obras de artistas independentes e de alguns dos maiores nomes da música eletrónica e da indústria musical global.
Criada em 2025 para identificar livros, artigos científicos e conteúdos audiovisuais utilizados no treino de sistemas de inteligência artificial, a AI Watchdog foi agora expandida para abranger também o setor da música. Entre os conjuntos de dados analisados encontra-se uma base com cerca de 12 milhões de músicas .
Apesar da dimensão do projeto, os responsáveis alertam que a ferramenta não é exaustiva. A presença de uma música na plataforma não constitui prova definitiva de que tenha sido utilizada para treinar modelos de IA. Da mesma forma, a ausência de uma obra não significa que esta não tenha sido incluída noutras bases de dados não identificadas.
Segundo Reisner, três dos conjuntos de dados analisados recorrem a ligações provenientes de plataformas como youtube e spotify, frequentemente recolhidas através de ferramentas automatizadas. Algumas destas tecnologias permitem contornar sistemas de autenticação, publicidade e outros mecanismos que contribuem para a remuneração dos criadores.
A revelação surge numa altura em que cresce o debate sobre a utilização de conteúdos protegidos por direitos de autor no desenvolvimento de sistemas generativos de inteligência artificial. Tradicionalmente, as empresas do setor mantêm em sigilo os dados utilizados para treinar os seus modelos, alegando que essas informações constituem propriedade intelectual.
Empresas tecnológicas como Google já reconheceram a utilização de alguns destes conjuntos de dados. A Google afirma que os seus modelos de geração de áudio foram treinados com materiais aos quais a empresa e as suas subsidiárias, incluindo o YouTube, possuem direitos de utilização ao abrigo dos respetivos termos de serviço.
Entretanto, a indústria musical continua a procurar formas de responder aos desafios colocados pela IA. Grandes editoras como a Warner e a Universal têm vindo a negociar acordos de licenciamento com empresas especializadas em música gerada por inteligência artificial, enquanto outras avançaram com ações judiciais contra plataformas como Suno e Udio.
A expansão da AI Watchdog representa mais um passo na crescente exigência de transparência sobre as fontes de dados utilizadas para desenvolver sistemas de inteligência artificial, numa discussão que continua a dividir artistas, empresas tecnológicas e titulares de direitos de autor em todo o mundo.
Mariana Cruz

