Reddit processa empresas por raspagem ilegal de dados usados por IA
Nesta quarta-feira, o Reddit entrou com uma ação judicial contra quatro empresas que teriam realizado raspagem ilegal de seus dados, utilizados no treinamento de sistemas de inteligência artificial (IA). A medida foi tomada no Tribunal Distrital dos EUA, no Distrito Sul de Nova York, após alegações de que essas companhias teriam roubado conteúdo da plataforma ao extrair informações de resultados de busca do Google que exibiam conteúdo do Reddit.
Empresas envolvidas na ação judicial contra o Reddit
Segundo o processo, as empresas SerpApi (dos Estados Unidos), Oxylabs (Lituânia), AWMProxy (Rússia) e Perplexity (São Francisco) teriam realizado a coleta massiva de bilhões de consultas no Google e, posteriormente, vendido esses dados a empresas de IA, como a OpenAI e a Meta. A Perplexity, por exemplo, é uma startup que desenvolve um buscador com tecnologia de IA e é acusada de usar conteúdo do Reddit sem autorização para treinar seus modelos.
O Reddit reivindica uma liminar permanente contra essas companhias, além de indenizações por danos financeiros e a proibição do uso ou comercialização de quaisquer dados previamente coletados de sua plataforma. “As empresas de IA estão presas em uma corrida armamentista por conteúdo humano de qualidade — e essa pressão alimentou uma economia de ‘lavagem de dados’ em escala industrial”, afirmou Ben Lee, diretor jurídico do Reddit.
Controvérsia sobre raspagem de dados na web
Práticas de raspagem de dados existem desde os primórdios da internet, quando o próprio Google utilizou robôs para varrer páginas, criando seu motor de busca. Com o tempo, empresas passaram a raspar dados do próprio Google, vendendo suas descobertas para fortalecer sua própria visibilidade nos resultados de pesquisa. No entanto, esse relacionamento, antes considerado simbiótico, hoje é visto como parasitário por muitos especialistas.
Hoje, gigantes do setor, como o New York Times — que processou a OpenAI e a Microsoft por violações de direitos autorais —, firmaram acordos de licenciamento de dados, enquanto outras empresas optaram por bloquear acessos automatizados para impedir a coleta de informações sem consentimento.
Uma batalha global pela propriedade de dados
O Reddit, que possui mais de 416 milhões de usuários semanais, considera seus conteúdos muito valiosos para o desenvolvimento de IA. Recentemente, a plataforma passou a cobrar pelo acesso aos seus dados por terceiros e firmou acordos com o Google e a OpenAI. Ainda assim, empresas como SerpApi, Oxylabs e AWMProxy continuam coletando bilhões de consultas do Google para revenda, violando supostamente as regras e os direitos autorais da rede social.
Segundo a ação, a startup Perplexity aumentou em quarenta vezes suas citações ao conteúdo do Reddit após ser notificada a cessar a coleta. A empresa teria inserido discussões do fórum em seu modelo de IA, chamando o produto de inovação, mas sem autorização para usar os dados.
O cenário de conflito na coleta de dados na era da IA
Enquanto os primórdios da web incentivavam uma relação simbiótica entre quem coletava e quem disponibilizava dados, a prática evoluiu para uma guerra de interesses. Grandes empresas do setor têm investido milhões em tecnologias de anti-raspagem, enquanto plataformas como o Reddit prometem aumentar as ações legais contra o uso indevido de seus conteúdos.
Apesar de dificuldades enfrentadas por empresas sediadas na Europa e na Ásia para responder a decisões judiciais, a rede social reforça seu compromisso em proteger seus dados. Em 2023, o Reddit já havia processado a startup de IA Anthropic, pelo uso não autorizado de conteúdo da plataforma.
Perspectivas futuras na luta pelo controle dos dados
O Reddit afirma que continuará adotando medidas legais para defender seus conteúdos, incluindo ações contra empresas que utilizam raspadores de dados em suas estratégias de treinamento de IA. A disputa reflete uma batalha global por direitos sobre dados humanos, essenciais para o avanço de tecnologias de inteligência artificial cada vez mais sofisticadas.
Para mais detalhes, acesse a reportagem completa no O Globo.
Com informações do Jornal Diário do Povo
Share this content:













Publicar comentário