
A rápida evolução da inteligência artificial (IA), especialmente com o avanço da IA generativa, tem colocado em xeque a estrutura tradicional da propriedade intelectual (PI). O crescimento exponencial da demanda por dados para o treinamento de modelos de IA intensificou o uso de técnicas como data scraping—extração automatizada de informações da web—, gerando preocupações sobre a proteção de direitos autorais, marcas, segredos comerciais e outros ativos intangíveis.
O recente relatório da OCDE, Intellectual Property Issues in Artificial Intelligence Trained on Scraped Data (fevereiro de 2025), oferece um panorama abrangente sobre o impacto dessa prática, analisando técnicas de data scraping, identificando os principais atores envolvidos e examinando as respostas legais e regulatórias adotadas globalmente. Além disso, o documento propõe recomendações preliminares para equilibrar a inovação tecnológica com a necessidade de proteção da PI.
Desafios jurídicos e divergências regulatórias
A coleta massiva de dados para IA levanta questões fundamentais sobre a legalidade do uso de conteúdos protegidos sem autorização. Diferentes países adotam abordagens regulatórias distintas, o que gera incertezas tanto para desenvolvedores de IA quanto para titulares de direitos.
Estados Unidos: o princípio do fair use permite certos usos sem autorização expressa, mas os tribunais ainda não estabeleceram diretrizes claras para a aplicação desse conceito no contexto da IA generativa.
União Europeia: a Diretiva do Mercado Único Digital permite mineração de dados, mas concede aos titulares de direitos o poder de opt-out, proibindo o uso de seus conteúdos para o treinamento de IA. O AI Act impõe ainda mais obrigações de transparência.
Japão: a legislação permite usos amplos para pesquisa e inovação, mas contratos privados podem restringir o acesso a determinados dados.
Reino Unido: o governo discute um Código Voluntário de Práticas, mas ainda não há consenso sobre sua adoção.
Singapura: a Lei de Direitos Autorais de 2021 introduziu uma exceção específica para computational data analysis, facilitando a utilização de dados para IA.
A ausência de um consenso global tem provocado uma onda de litígios. Grandes veículos de imprensa, artistas e escritores têm processado empresas de tecnologia pelo uso não autorizado de suas obras. O New York Times, por exemplo, ingressou com ação judicial contra a OpenAI e a Microsoft, alegando que conteúdos protegidos foram utilizados sem permissão no treinamento de seus modelos de IA.
O que recomenda a OCDE?
Para mitigar riscos jurídicos e garantir um equilíbrio entre inovação e proteção de direitos, a OCDE sugere medidas como:
- Diretrizes voluntárias para empresas de IA e titulares de direitos autorais, promovendo maior previsibilidade jurídica.
- Implementação de metadados e marcações digitais para garantir a rastreabilidade dos conteúdos utilizados no treinamento de IA.
- Estímulo a mecanismos contratuais, incentivando acordos entre detentores de direitos e desenvolvedores de IA
- Requisitos de transparência, exigindo que empresas divulguem os dados utilizados no treinamento de seus modelos, conforme previsto no AI Act europeu.
Impactos para a Advocacia
A regulamentação da IA representa um novo desafio para advogados e juristas, exigindo expertise técnica e atualização constante. O crescimento dos litígios relacionados ao uso de conteúdos protegidos revela a necessidade de estratégias robustas para defesa de direitos autorais, proteção de dados e negociação de licenças.
O avanço da IA e a ausência de um marco regulatório global consolidado tornam esse um campo de disputa em transformação. A advocacia desempenhará um papel essencial na mediação de interesses entre inovação tecnológica e proteção da PI, contribuindo para a construção de um ambiente jurídico que favoreça tanto o desenvolvimento da IA quanto a segurança jurídica dos titulares de direitos.
O relatório completo pode está disponível neste link