SÃO PAULO, SP E BRASÍLIA, DF (FOLHAPRESS) – O setor cultural está para a inteligência artificial generativa assim como os entregadores estão para o trabalho por aplicativos de delivery. Quem diz isso é Rafael Grohmann, professor de estudos de mídia da Universidade de Toronto.
No Canadá, uma firma de pesquisa em IA, a Moonvalley, afirma ter construído um modelo de IA generativa que gera vídeos de alta sofisticação, com cinematografia de primeira linha. É mais uma cereja em cima do bolo de preocupações que tira o sono de designers, escritores, atores e demais profissionais da cultura.
O campo trabalhista, porém, é só um dos pontos de preocupação. O setor cultural é de fundamental importância na discussão sobre o avanço da IA pelo mundo. Para o Brasil, porém, esse é um ponto especialmente sensível.
A diversidade e a abundância da produção cultural brasileira fazem do país um pote de ouro para as ferramentas de treinamento da IA generativa. Reportagem da Folha de S.Paulo mostrou que pelo menos três empresas de americanas usaram livros de autores brasileiros para treinar seus sistemas sem pedir autorização ou pagar por isso, apelando a cópias piratas que circulam na internet. Pesquisadores da área chamam isso de extrativismo de dados.
Por outro lado, o Brasil está longe de ser líder na produção tecnológica de IA. Apesar de sermos líderes na América Latina, a comparação com Estados Unidos, Europa e China é desproporcional.
“Se a gente não tem uma indústria de IA nacional robusta e também tem exploração das obras brasileiras sem remuneração, estamos numa situação de perde-perde”, diz Mariana Valente, diretora do InternetLab, que pondera que ter acesso à tecnologia é, sim, uma vantagem, mas uma vantagem muito limitada da perspectiva de autonomia econômica e tecnológica.
Países e organizações internacionais têm feito uma corrida pela delimitação das quatro linhas, com o desafio de proteger, sem prejudicar o desenvolvimento da indústria, quem pode ser ameaçado pelo avanço da IA generativa na cultura, não são poucos.
Apesar de a discussão ser recente, já é possível identificar algumas vertentes. Há quem defenda que os dados só poderiam ser utilizados mediante autorização prévia dos detentores dos direitos autorais da obra. Há quem visualize um modelo de remuneração coletiva. Muitos concordam com um sistema em que o detentor dos direitos teria de avisar caso não queira permitir o uso de seus dados pela ferramentas de IA, o que é chamado de “cláusula de opt-out”.
Há ainda quem avalie que o uso para treinamento de ferramentas de IA não fere os direitos autorais da obra, ou que esse tipo de uso poderia ser enquadrado no conceito de “fair use”, que abre exceções para uso de material protegido, como acontece em sátiras ou quando a parcela do material usada é considerada ínfima.
Quem saiu na frente em termos de regulação foi a União Europeia, com seu “AI Act”, publicado em julho do ano passado a primeira versão do projeto foi apresentada já em 2021.
O texto não se debruça longamente sobre remuneração a detentores de direitos autorais e prefere citar diretivas mais antigas sobre o tema, mas traz a inovaão de falar mais explicitamente sobre transparência dos sistemas de treinamento de IA. O “AI Act” determina que provedores de modelos de IA de uso geral devem disponibilizar publicamente um resumo “suficientemente detalhado” sobre o conteúdo usado para o treinamento da ferramenta.
Nos Estados Unidos, o Escritório de Direitos Autorais do governo americano dedica um relatório inteiro a questões envolvendo treinamento de IA generativa. O relatório afirma que o arcabouço legal americano atual já é suficiente para lidar com a questão e que ” a intervenção governamental seria prematura neste momento”.
O Japão deu um passo além e teve o entendimento de que o uso de dados culturais para treinamento de IA generativa não fere os direitos do autor, pois são “fins que não têm a ver com o desfrute da obra”.
No Brasil, houve a criação da Comissão Especial sobre Inteligência Artificial, em abril, na Câmara, que tem discutido o projeto de lei 2338/23, o chamado PL da IA.
No texto, há uma seção que se dedica aos direitos autorais e conexos, que caminha numa direção semelhante à da União Europeia. O artigo 62 diz que “o desenvolvedor que utilizar conteúdo protegido por direitos de autor e conexos deverá informar sobre os conteúdos protegidos usados nos processos de desenvolvimento dos sistemas de IA”.
O texto afirma que não constitui ofensa aos direitos de autor a mineração de dados caso ela seja feita por instituições de pesquisa e educacionais, museus, arquivos públicos e bibliotecas, caso não haja fins comerciais. O acesso sempre precisa ser feito de forma lícita.
Mas, ao contrário do Japão, o texto brasileiro estabelece que o uso de conteúdos protegidos em processos de mineração, treinamento ou desenvolvimento de sistemas de IA deve remunerar os titulares desses conteúdos.
Em julho do ano passado, o governo lançou o Plano Brasileiro de Inteligência Artificial, o PBIA, com diretrizes a serem seguidas até 2028. Pelo menos uma dezena de ministérios assinam o documento mas o Ministério da Cultura não é um deles.
No mesmo mês, a CNI, Confederação Nacional da Indústria, se posicionou afirmando que a PL da IA prejudicava o desenvolvimento da tecnologia no Brasil e a inovação no setor produtivo.
Marcos Souza, secretário de Direitos Autorais e Intelectuais do Ministério da Cultura, defende um modelo de regulação que busque “conciliar o modelo de negócios das empresas de IA às atuais regras internacionais e nacionais sobre direitos autorais”.
Mas há quem já acredite que, a respeito das obras brasileiras já usadas no treinamento de IA, não há mais o que fazer agora é olhar para o futuro. “Essas músicas, essas obras já estão nessas bases de dados e vários sistemas já mineraram tudo”, diz Guilherme Carboni, advogado especializado em direitos autorais. “Reverter isso tudo é muito complicado. É uma discussão que a gente já começa perdendo.”
O secretário do MinC afirma discordar de que não há mais nada que possamos fazer. “As empresas que roubaram esses conteúdos têm de ser responsabilizadas e pagar pela utilização que já fizeram do nosso patrimônio cultural nacional”, diz.
“Costumo dizer que se trata do roubo perfeito. Essas empresas, de uma só vez, buscam se apropriar de todo o insumo criativo produzido pela humanidade para nunca mais ter que pagar os profissionais criativos em função de seus trabalhos”, diz Souza.
Porém há muito trabalho pela frente.
“As grandes plataformas de IA estão que nem loucas atrás de dados”, diz o professor Glauco Arbix, pesquisador do Centro de Inteligência Artificial da Universidade de São Paulo.
Elas precisam constantemente ser alimentadas. Se acabam os dados do mundo real, elas passam a usar dados sintéticos, isto é, produtos da própria inteligência artificial.
E quando o alimento é algo sintético, o resultado produzido pela ferramenta acaba sendo de menor qualidade e, portanto, menos competitivo.
Só que o Brasil tem uma vantagem, ou um tiro que saiu pela culatra. Apesar de ser um grande celeiro de produção cultural e artística, nem tudo está devidamente digitalizado ou catalogado. Isso, ele explica, acaba se tornado como uma proteção para a mineração de dados já que os dados existem, mas ficam inacessíveis para as grandes empresas de IA que as queiram surrupiar.
Por isso, nem tudo está perdido. De certa forma, fomos salvos pelo atraso.