SÃO PAULO, SP (FOLHAPRESS) – Para quem trabalha na educação, é difícil ignorar as recentes propagandas de assistentes de inteligência artificial (IA) generativa gratuitos. O Google, por exemplo, oferece plano estudantil sem custo por um ano, prometendo ajudar nas provas, redações e até transformar textos em vídeos.
A aparente generosidade soa suspeita. Como empresas de capital aberto, que precisam aumentar lucros e cortar custos, podem oferecer tantos serviços gratuitos, ainda mais investindo bilhões em infraestrutura de IA sem retorno imediato?
A resposta retoma o conhecido adágio: “se você não paga pelo produto, você é o produto”. Na prática, é ainda pior: você trabalha de graça para desenvolver o produto, que depois será vendido a você.
Estudantes e professores, público-alvo desses planos, raramente têm formação em direito e tecnologia para avaliar as implicações. Talvez eles estejam percebendo que todos seus dados pessoais estão sendo coletados pelas empresas de IA generativa, mas dificilmente estarão cientes das condições do tratamento de seus dados e do amplo descumprimento da Lei Geral de Proteção de Dados (LGPD) por essas empresas, como nossa pesquisa já demonstrou.
Após os 12 meses de gratuidade, o usuário deverá pagar. Mas já estará tão acostumado ou dependente que dificilmente terá alternativa. Além disso, quem não usar ficará em desvantagem, já que colegas obterão melhores resultados com menos esforço. Como atletas de uma disciplina na qual todo mundo usa dopagem, acabarão não tendo escolha se quiserem sobreviver.
O mais grave, porém, é a extração de conteúdos educacionais. Ao subir notas, apostilas e materiais produzidos por professores, usuários alimentam gratuitamente sistemas de IA com dados de altíssimo valor. Esses conteúdos tornam-se insumos para treinar modelos generativos, acumulados sem contrapartida alguma.
Poucos leem os termos de uso das empresas. No caso do Google, somente após várias abas se descobre que o usuário concede licença para “hospedar, reproduzir, distribuir, comunicar e usar seu conteúdo”, inclusive para aprimorar algoritmos e criar novos recursos.
Esse processo é mais uma etapa do chamado colonialismo digital. Já em 2015, Shoshana Zuboff denunciava a lógica de “extração de dados” descrita pelo próprio economista-chefe da Google, Hal Varian.
Hoje, a evolução é clara: não basta coletar dados pessoais; é preciso recrutar estudantes como anotadores involuntários, fornecendo material de qualidade capaz de treinar IA com literalmente todo o conteúdo usado para treinar humanos.
A nova fronteira, portanto, não é apenas a coleta de dados pessoais de cada usuário da internet, mas a apropriação de todo o conteúdo educacional, do ensino primário à pós-graduação. Se as empresas quisessem acesso legítimo, poderiam negociar com escolas e universidades e pagar uma licença de uso do material educacional. Isso seria o mínimo exigido pela legalidade e pela “IA ética”.
Contudo, repete-se o padrão já visto com dados pessoais e conteúdo jornalístico: extrair o máximo antes que os envolvidos compreendam o processo. Quando vierem os processos judiciais, apenas alguns serão indenizados; até lá, os dados já terão sido aspirados e transformados em propriedade intelectual das corporações.
Nesse cenário, imaginar que o Brasil poderá competir em IA, produzir tecnologia própria e evitar ser mera colônia digital soa ilusório, apesar das boas intenções de planos e projetos de lei sobre IA. Precisamos acordar, e rapidamente, se queremos realmente construir nossa soberania digital.