Perplexity é defendida após ser acusada pela Cloudflare por scraping com inteligência artificial

Cloudflare acusa Perplexity de scraping via inteligência artificial; debate sobre acesso justo à web ganha força.

Controvérsia sobre uso de inteligência artificial em agentes web levanta debate entre Cloudflare, Perplexity e defensores da liberdade de acesso à internet.

A Cloudflare acusou o buscador de IA Perplexity de burlar bloqueios em sites para coletar dados, mesmo diante de arquivos robots.txt que proibiam esse acesso. A denúncia foi publicada após testes da Cloudflare com um novo domínio, criado especificamente para verificar violações.

De acordo com a Cloudflare, o Perplexity utilizou um navegador genérico disfarçado de Google Chrome para acessar os dados após seus bots oficiais terem sido bloqueados. O CEO da empresa, Matthew Prince, foi contundente: “Algumas empresas de IA agem mais como hackers norte-coreanos. Hora de expor e bloquear.”

Perplexity nega responsabilidade direta

Em resposta, a Perplexity afirmou que os acessos identificados vieram de um serviço terceirizado usado ocasionalmente e que o post da Cloudflare seria, na verdade, uma estratégia de marketing. Em novo comunicado, a empresa argumenta que há diferença entre crawling automatizado e buscas iniciadas por usuários humanos.

“A diferença entre crawling automatizado e busca direcionada por usuários não é apenas técnica — é sobre quem tem o direito de acessar informações públicas na web”, defendeu a Perplexity em blog oficial.

Debate cresce com defensores e críticos

Apesar da crítica da Cloudflare, muitos usuários saíram em defesa da Perplexity, especialmente nas redes sociais e fóruns como o Hacker News. Argumentam que, se um humano pode acessar um site, um assistente de inteligência artificial agindo em seu nome também deveria poder.

Por outro lado, defensores dos direitos dos criadores de conteúdo lembram que os donos dos sites dependem da visita direta de usuários para gerar receita, e que o uso de LLMs como intermediários pode prejudicar essa dinâmica.

Contexto maior da disputa por tráfego

Com a proliferação de bots, a atividade automatizada já ultrapassa a humana na internet. Segundo o relatório Bad Bot da Imperva, publicado recentemente, mais de 50% do tráfego é gerado por IA, com 37% sendo bots maliciosos.

A Cloudflare cita a OpenAI como exemplo de boa prática, afirmando que a empresa respeita o robots.txt, implementa bloqueios de rede corretamente e adota o padrão emergente Web Bot Auth, desenvolvido pela IETF e apoiado pela própria Cloudflare.

O cenário sugere uma redefinição das regras de convivência digital, especialmente à medida que os agentes de inteligência artificial se tornam ferramentas centrais nas interações com a web. A questão agora é: bloquear os bots pode acabar afastando os consumidores que usarão esses agentes para navegar, comprar e interagir online?

Paulo Junio

Paulo Júnio de Lima é Administrador com MBA em Comunicação e Marketing Digital pela HSM University, especializado em planejamento estratégico, inovação e gestão de projetos. Atua na área de Comunicação e Relações Públicas da Grande Loja Maçônica de Minas Gerais, onde desenvolve e implementa soluções criativas para fortalecimento institucional e relacionamento com o público. Com uma trajetória sólida em marketing digital, Paulo acumulou experiências em empresas como ORO, Agência Open, Brasil84 Comunicação e VTIC, liderando equipes multidisciplinares e conduzindo projetos com foco em performance, posicionamento de marca e transformação digital. Entusiasta das novas tecnologias, tem se dedicado à aplicação prática da Inteligência Artificial em ambientes criativos e de gestão. É certificado pelo IA Lab do Estúdio Kimura, com foco em IA aplicada ao design, branding e automação de processos, ampliando seu repertório estratégico para entregar soluções mais inovadoras e eficientes. Além de sua atuação profissional, é membro ativo da Ordem DeMolay há mais de 18 anos, exercendo funções de liderança em iniciativas sociais, educacionais e filantrópicas. Suas principais competências envolvem estratégia digital, branding, IA aplicada à comunicação, marketing de impacto e gestão de projetos ágeis.