Artigo
O que é GPTBot e devo liberar no robots.txt?
O rastreador da OpenAI que alimenta o ChatGPT — e a decisão que toda empresa precisa tomar
GPTBot é o agente de rastreamento da OpenAI — o robô que percorre páginas da web para coletar conteúdo usado tanto no treinamento dos modelos GPT quanto nas buscas em tempo real do ChatGPT (quando a navegação web está ativa). Se o robots.txt do seu site bloqueia o GPTBot, o ChatGPT não tem acesso ao seu conteúdo para citar em respostas — independentemente de quão bem estruturado ou relevante esse conteúdo seja. A decisão de liberar ou bloquear depende do tipo de conteúdo e dos objetivos estratégicos do negócio.
O que o GPTBot faz exatamente
O GPTBot opera em dois contextos principais:
Rastreamento para treinamento: a OpenAI usa o GPTBot para coletar dados públicos da web que alimentam versões futuras dos modelos GPT. Conteúdo coletado durante essa fase pode ser incorporado ao conhecimento interno do modelo — disponível em respostas mesmo sem busca em tempo real.
Busca em tempo real (OAI-SearchBot): quando o usuário ativa a navegação web no ChatGPT ou o modelo avalia que precisa de informações atuais, o OAI-SearchBot (um agente separado da OpenAI) faz buscas via Bing e acessa páginas em tempo real. Para essa função, o Bingbot também precisa estar liberado — porque o ChatGPT consulta o índice do Bing, não rastreia diretamente.
Por que a maioria das empresas deveria liberar o GPTBot
Para a maioria dos negócios — especialmente aqueles cujo site tem conteúdo educativo, informacional ou comercial público — liberar o GPTBot é a decisão que maximiza visibilidade no ChatGPT. Exemplos:
Escritório de contabilidade: artigos sobre Simples Nacional, planejamento tributário e abertura de empresa são exatamente o tipo de conteúdo que o ChatGPT usa para responder perguntas de PMEs. Bloquear o GPTBot significa que o escritório não aparece quando um empreendedor pergunta ao ChatGPT sobre esses temas.
Loja de materiais de construção: guias de como calcular quantidade de cimento, comparações entre tipos de tinta ou tutoriais de instalação são conteúdos altamente citáveis. Bloqueados, perdem a oportunidade de visibilidade.
Plataforma de RH: artigos sobre CLT, benefícios obrigatórios, cálculo de férias e rescisão são pesquisados por gestores no ChatGPT diariamente. Estar presente nesses resultados tem valor direto para geração de leads.
Quando pode fazer sentido bloquear o GPTBot
Há casos legítimos em que bloquear o GPTBot é uma decisão estratégica:
- Conteúdo proprietário pago: se o site tem cursos, relatórios ou análises por assinatura, pode não querer que esse conteúdo seja incorporado ao treinamento da OpenAI sem compensação
- Dados sensíveis: mesmo que páginas com dados sensíveis estejam protegidas por login, é uma boa prática de segurança garantir que o robots.txt exclua explicitamente essas seções
- Questões legais ou de privacidade: em alguns setores regulados (saúde, finanças), há preocupações sobre como o conteúdo é reutilizado por sistemas de terceiros
A OpenAI permite que os proprietários de site bloqueiem o GPTBot sem penalidade — a empresa respeita o arquivo robots.txt. Mas o custo é a invisibilidade no ChatGPT.
Como configurar no robots.txt
Para liberar o GPTBot completamente: `` User-agent: GPTBot Allow: / ``
Para liberar apenas seções públicas e bloquear conteúdo pago: `` User-agent: GPTBot Allow: /blog/ Allow: /servicos/ Allow: /sobre/ Disallow: /conteudo-exclusivo/ Disallow: /relatorios/ ``
Para bloquear completamente: `` User-agent: GPTBot Disallow: / ``
Como verificar se o GPTBot está sendo bloqueado hoje
Acesse seudominio.com/robots.txt e verifique se há alguma regra com User-agent: GPTBot e Disallow. Se não houver regra específica, verifique se a regra genérica User-agent: * tem um Disallow: / — que bloquearia todos os bots, incluindo o GPTBot.
A FRT Digital verifica o status do GPTBot e demais bots de IA como parte da auditoria de AIO Score. Um bloqueio não intencional nesse nível elimina todo o potencial de citação no ChatGPT antes mesmo de qualquer otimização de conteúdo. Conheça o serviço de AIO.