
32
Ínicio
>
Artigos
>
Direito Digital
ARTIGOS
DIREITO DIGITAL
Treinamento de máquina e direitos autorais

Ana Frazão
16/10/2025
A recente ação judicial movida pela Folha de S.Paulo contra a OpenAI evidenciou discussão fundamental para os modelos de inteligência artificial que se baseiam em treinamento de máquina a partir de grandes bases de dados[1]. Com efeito, sob a alegação violação de direitos autorais e concorrência desleal, a Folha pede que a OpenAI pare de coletar e usar o conteúdo do jornal para treinamento de máquina – sobretudo quando tal coleta e utilização ocorre por meio da burla do paywall, indenize os danos decorrentes da prática e destrua os modelos que incorporam conteúdos da autora.
A defesa das empresas de inteligência artificial e o argumento do fair use
A exemplo de outras ações judiciais semelhantes que tramitam no mundo, a defesa das empresas de inteligência artificial é de que os seus sistemas não plagiam propriamente os conteúdos protegidos por direitos autorais, mas apenas os utilizam no treinamento de máquina, de forma a produzir resultados novos e transformados. Assim, considerando que os direitos autorais protegem a forma e não propriamente o conteúdo, não haveria violação aos primeiros.
O argumento central de defesa das empresas de inteligência artificial é, portanto, comparar o treinamento de máquina à hipótese em que o ser humano, a partir da leitura de diversas obras autorais, produz um conteúdo da sua autoria com base no conteúdo lido.
Assim como não haveria violação de direitos autorais pelo ser humano, igualmente não haveria violação de direitos autorais pela máquina, já que esta igualmente produziria novos e distintos conteúdos – sobretudo sob o aspecto de forma e estilo – com base naqueles que foram utilizados para o seu treinamento.
Consequentemente, a utilização dos conteúdos autorais para treinamento de máquinas seria uma espécie de utilização lícita de tais conteúdos – o chamado fair use no sistema de copyright – ou estaria dentre as limitações aos direitos autorais nos países que adotam o sistema de direito do autor, como é o caso do Brasil.
Limitações dos direitos autorais diante do aprendizado de máquina
Entretanto, a analogia com o ser humano, ainda que possível, é bastante questionável em uma realidade em que as máquinas conseguem fazer tais processos em volume, velocidade e escala inimagináveis para um ser humano e, a depender do caso, para a própria humanidade. Acresce que os conteúdos gerados pelas máquinas vêm ganhando crescente importância, uma vez que a inteligência artificial generativa está progressivamente substituindo os mecanismos de buscas, tornando-se a principal fonte de consulta na internet.
Em outras palavras, os usuários cada vez mais se contentam com as respostas geradas pela inteligência artificial, deixando de acessar os conteúdos originais, razão pela qual mesmo a utilização dos mecanismos de busca vem entrando em declínio diante do crescente protagonismo dos conteúdos gerados por máquinas[2].
Nesse contexto, é fácil observar que a proteção aos direitos autorais não foi pensada para o atual cenário. Uma coisa é o aprendizado humano a partir dos conteúdos autorais, circunstância que é facilmente justificável à luz do fair use ou das limitações aos direitos autorais. Outra coisa, bem diferente, é o aprendizado de máquina, sobretudo quando utilizado para propósitos comerciais e lucrativos.
O desafio jurídico do direito autoral na era da IA
Diante da importância e complexidade do assunto, eu e a professora Caitlin Mulholland tivemos a oportunidade de discuti-lo na última edição do nosso podcast Direito Digital[3]. Na ocasião, procuramos mostrar que o direito autoral dificilmente poderá, sozinho, enfrentar tais desafios, ainda mais se não houver modificações relevantes. Por essa razão, a disciplina específica dos direitos autorais diante da inteligência artificial, sobretudo no treinamento e aprendizado de máquina, tem se tornado uma das mais cruciais nas discussões sobre regulação da inteligência artificial.
O precedente do caso Anthropic e a discussão sobre fair use
Verdade seja dita que há exemplos recentes de ações judiciais que vêm provocando o Poder Judiciário nacional e de outros países a enfrentar o tema, inclusive para efeitos de verificar se existe ou não o fair use em casos assim. Nesse sentido, foi bastante noticiado o acordo que, nos autos do caso Barbartz et al x Anthropic PBCTZ, a ré Anthropic, desenvolvedora do Claude, fez recentemente com os autores de uma ação coletiva que a acusavam de utilizar indevidamente os conteúdos protegidos pelo direito autoral para o treinamento de seus modelos de inteligência artificial generativa[4].
Em uma primeira decisão, o juiz Wilian Alsup, do Distrito Norte da Califórnia, entendeu que o treinamento de máquina baseado em livros digitalizados legalmente obtidos estaria protegido pelo fair use, pois se trataria de um uso transformativo. Logo, a máquina não replicaria conteúdos originais, mas sim criaria conteúdos novos ou independentes a partir desses conteúdos originais, em situação análoga à da pessoa natural que lê um livro e escreve um texto com base nesse livro.
Vale ressaltar que a decisão não considerou lícito o treinamento de máquina com base em livros pirateados ou adquiridos de forma ilícita. O pressuposto da licitude é a aquisição lícita das obras, ainda que para outras finalidades que não especificamente o treinamento de máquina.
Decisão judicial e acordo bilionário no caso Anthropic
Causou certa surpresa que, no dia 05.09.2025, foi noticiado que as partes celebraram acordo em valor bilionário – aparentemente o maior valor de indenização por violação a direitos autorais – tendo a Anthropic se comprometido a disponibilizar um fundo de no mínimo US$ 1,5 bilhão para compensar titulares de direitos de aproximadamente 500 mil obras literárias. Com o acordo, a empresa manteve a decisão anterior que aparentemente lhe foi consideravelmente favorável e evita a possibilidade de uma condenação que poderia ser bastante superior ao valor do acordo.
A ressignificação dos direitos autorais na era da inteligência artificial
A discussão, entretanto, está longe de estar encerrada. O recente acordo da Anthropic e todos os recentes questionamentos judiciais a respeito da licitude do treinamento de máquina nos levam a refletir sobre se o direito autoral, no contexto da inteligência artificial, não deveria ser ressignificado para, em algumas situações, abranger também os conteúdos – como na hipótese do treinamento de máquina – ou mesmo o estilo, discussão que se coloca diante de iniciativas como as que procuram ensinar a máquina a produzir conteúdos autorais como se fosse o autor original.
Mais do que isso, tais discussões nos remetem a um problema essencial do capitalismo, que é o de tentar diferenciar quem gera riqueza e quem se apropria da riqueza gerada por outros. Tal impasse vem se potencializando na economia movida a dados, na qual é cada vez mais difícil separar makers de fakers e takers.
A questão também está intrinsecamente associada aos ganhos dos agentes envolvidos, uma vez que, para que o capitalismo seja um sistema funcional, aqueles que geram riqueza devem ser adequadamente remunerados. Daí por que o chamado rent seeking (obter renda sem gerar valor ou riqueza) sempre foi visto com preocupação, podendo estar associado a condutas parasitárias ou disfuncionais.
Concorrência desleal e apropriação de conteúdo por IA
Não é sem razão que muitas das discussões relacionadas às implicações jurídicas do treinamento de máquina estão também associadas às práticas de concorrência desleal, tal como foi apontado pela Folha na ação contra a OpenAI. O que se questiona é se é realmente há rivalidade pelo mérito quando um agente econômico, como uma grande desenvolvedora de tecnologia, pode ter ganhos às custas do trabalho alheio.
Por mais que seja inquestionável que as empresas desenvolvedoras de inteligência artificial gerem valor, a grande questão é saber se não deveria haver um maior equilíbrio na remuneração de todos os agentes envolvidos na cadeia, a fim de que possam se beneficiar do resultado final não só os desenvolvedores da tecnologia, mas também os criadores de conteúdos, sem prejuízo da atenção que deve ser dada aos impactos financeiros de tais soluções para as empresas de tecnologia e para a criação de incentivos para a inovação.
Em recente artigo para o Valor, Dora Kaufmann sintetiza o problema, ao concluir que “nesse tema, o desafio para o relator [referindo-se ao relator do PL 2338, o Marco da IA, que ora tramita no Congresso] é identificar um ponto de equilíbrio que não engesse a inovação e o desenvolvimento da IA nacional; proteja e remunere os criadores de conteúdo que formaram a base de conhecimento dos modelos de IA; e ofereça segurança jurídica para empresas, desenvolvedores e usuários, definindo com clareza os limites e direitos de cada parte”.[5]
O papel da imprensa e a sustentabilidade do jornalismo na era da IA
Vale ressaltar que, quando se está diante de uma empresa jornalística, a remuneração pelo acesso a seus conteúdos está relacionada não apenas à proteção de direitos autorais ou à sobrevivência do negócio, mas também à própria manutenção da imprensa, propósito que é de interesse de todos não apenas do ponto de vista econômico, mas também do ponto de vista político, considerada a centralidade de uma imprensa livre para a democracia.
Portanto, especialmente quando se trata de jornalismo, a discussão, muito mais do que implicar o necessário equacionamento da tensão entre produtores e utilizadores de conteúdos para treinamento de máquina, está relacionada igualmente à manutenção da própria imprensa.
A importância da remuneração dos produtores de conteúdo
Como é de saber comum, a produção de informação de qualidade tem custos e estes precisam ser considerados em uma discussão como a que se apresenta. Trata-se de questão que ainda precisa ser contextualizada diante da necessidade de buscarmos mecanismos para assegurar a qualidade informacional diante de um meio virtual que, movido essencialmente pelos modelos de monetização das plataformas digitais, muitas vezes privilegia conteúdos de baixa qualidade ou mesmo falsos.
Assim, a discussão sobre os direitos autorais e a remuneração dos produtores de conteúdos não diz respeito apenas a uma questão privada, mas também está diretamente relacionada, sobretudo quando se trata de veículos jornalísticos, à manutenção de um capitalismo funcional, em que autores e imprensa possam ser adequadamente remunerados por seus conteúdos e, com isso, continuem a contribuir ativamente para a democracia e para um fluxo informacional de qualidade.

LEIA TAMBÉM
NOTAS
[1]https://www.jota.info/justica/folha-processa-openai-para-que-reportagens-nao-sejam-usadas-pelo-chatgpt
[2]https://www.ecommercebrasil.com.br/artigos/a-nova-era-da-busca-por-que-o-google-esta-perdendo-espaco-para-o-chatgpt-e-outras-ias
[3]https://open.spotify.com/episode/2FF02kxS4rhAyCUUdbmnR9
[4]https://theleaflet.in/digital-rights/law-and-technology/bartz-v-anthropic-all-you-need-to-know-about-the-largest-copyright-settlement-in-history#:~:text=The%20settlement%20terms%3A%20Under%20the,split%20between%20author%20and%20publisher.
[5] KAUFMANN, Dora. Câmara conclui fase de audiências públicas sobre IA. Valor Econômico. Ediçao de 06.10.2025.