Creative Commons lança CC Signals para proteger o uso aberto de dados na era da IA

Creative Commons lança o CC Signals, estrutura técnica e legal que propõe transparência e reciprocidade no uso de dados para IA, em defesa de uma internet aberta.

A Creative Commons (CC) anunciou nesta quarta-feira (25 de junho) o lançamento do CC Signals, um novo framework que busca definir como dados disponíveis online podem (ou não) ser utilizados por sistemas de IA. A proposta responde ao avanço da extração massiva de dados na web — prática que ameaça a abertura da internet — e oferece uma solução que combina ética, técnica e legislação.

O CC Signals surge como uma alternativa a abordagens defensivas, como o bloqueio por robots.txt, paywalls ou medidas de confusão para impedir o scraping por bots de IA. Ao invés disso, propõe uma nova camada de comunicação entre quem detém os dados e quem os utiliza para treinar modelos.

A iniciativa chega num momento em que empresas revisam suas políticas de uso de dados. X (ex-Twitter) recuou em sua decisão de liberar dados públicos para IA. O Reddit passou a restringir acesso a bots. O Cloudflare discute cobrar de scrapers de IA e desenvolvedores open source criaram formas de sabotar bots que ignoram regras de exclusão.

O CC Signals quer institucionalizar esse tipo de controle com base em princípios de reciprocidade. A CEO da Creative Commons, Anna Tumadóttir, afirmou: “Assim como as licenças CC ajudaram a construir a web aberta, acreditamos que o CC Signals ajudará a moldar um ecossistema de IA aberto e ético.”

Os primeiros rascunhos do projeto já estão disponíveis no site e GitHub da organização. A CC pretende lançar uma versão alpha em novembro de 2025, e até lá realizará eventos públicos (town halls) para ouvir a comunidade.

Se a internet aberta foi construída com base no compartilhamento e respeito mútuo, o CC Signals quer garantir que a IA evolua sob os mesmos princípios — promovendo inovação sem sacrificar ética ou transparência.