Medir a visibilidade da marca em IAs generativas exige um método diferente do SEO: os modelos de linguagem são sistemas probabilísticos, cada plataforma funciona com lógica própria e uma verificação única não tem valor estatístico. Este guia apresenta um framework de 6 métricas com fórmulas, exemplos numéricos e benchmarks para que você saiba, de fato, como sua marca aparece no ChatGPT, no Perplexity e no Google AI Overviews — e o que fazer com esses dados.
Pontos importantes
- LLMs são sistemas probabilísticos: a mesma pergunta gera respostas diferentes. Verificar uma vez não mede visibilidade.
- ChatGPT, Perplexity e Google AI Overviews funcionam de formas radicalmente distintas. Medir os três juntos produz uma média sem sentido.
- São 6 as métricas que importam: Taxa de Menção, Share of Voice Competitivo, Taxa de Citação com Link, Sentimento/Representação, Drift/Volatilidade e Tráfego de Referência de IA.
- Você pode começar a medir hoje, sem ferramenta paga — com uma planilha e os 4 passos detalhados neste artigo.
- O fator mais correlacionado com citações em AI Overviews não é o conteúdo do seu site, mas menções da sua marca em outros sites (correlação de 0,664, segundo o Ahrefs).
Medir visibilidade em IA não é como medir SEO
No SEO, você verifica a posição da sua página para uma keyword e o número é determinístico: está na posição 4, ponto. No GEO e no AEO, não existe posição fixa. Existe probabilidade. E essa diferença muda tudo sobre como você mede.
Por que uma medição única não tem valor estatístico
O SparkToro testou o mesmo prompt de recomendação de marca no ChatGPT 100 vezes e encontrou menos de 1% de chance de duas respostas recomendarem o mesmo conjunto de marcas. Não é bug nem falha — é o funcionamento normal de um modelo probabilístico. Cada resposta é uma amostra diferente do espaço de possibilidades do modelo.
O conteúdo do AI Overview do Google muda 70% das vezes para a mesma query, e 45,5% das fontes citadas são substituídas entre uma resposta e a próxima. Você checou sua marca no ChatGPT ontem à tarde e apareceu — isso não diz nada sobre o que está acontecendo agora, nem o que vai acontecer amanhã.
A implicação prática: para ter dados úteis, você precisa de múltiplas execuções do mesmo prompt. Uma medição única é ruído estatístico, não dado.
Cada plataforma de IA funciona de forma diferente
Outro erro comum é medir “visibilidade em IA” como se fosse um número único. Não é. O Google AI Overviews cita 6,02 marcas por query, enquanto o ChatGPT cita apenas 2,37 — e 61,9% das respostas são diferentes entre as três plataformas quando confrontadas com a mesma consulta.
O estudo da Profound.io, analisando 680 milhões de citações entre agosto de 2024 e junho de 2025, mostra o perfil de cada plataforma:
| Plataforma | Fonte favorita | Peso no top 10 | O que priorizar |
|---|---|---|---|
| ChatGPT | Wikipedia | 7,8% das citações totais, 47,9% do top 10 | Conteúdo de autoridade enciclopédica, listas curadas |
| Perplexity | 6,6% das citações totais | Presença em fóruns, reviews, conteúdo de comunidade | |
| Google AI Overviews | Reddit (2,2%), YouTube (1,9%), Quora (1,5%) | Variado | Conteúdo social, vídeos, respostas em Q&A |
Uma marca que investe só em conteúdo de blog pode ter boa visibilidade no ChatGPT e ser invisível no Perplexity. Quem trata as três plataformas como bloco único está medindo uma média sem sentido estratégico.
Apenas 7,2% dos domínios são citados em ambos LLMs e Google AI Overviews ao mesmo tempo. Visibilidade em IA é, na prática, visibilidade por plataforma.
O que “visibilidade em IA” significa na prática
Antes de entrar nas métricas, vale ter clareza sobre o que você está medindo — porque “aparecer em IA” pode significar coisas muito diferentes.
Os 4 componentes da visibilidade de marca em IA
Visibilidade em IA não é binária. Tem quatro dimensões que precisam ser medidas separadamente:
- Menção: a IA inclui o nome da sua marca na resposta?
- Citação: a IA aponta o seu site como fonte, com link?
- Contexto/Sentimento: a IA fala bem, de forma neutra ou de forma negativa sobre você?
- Consistência: com qual frequência isso acontece, e em quais tipos de pergunta?
O framework da Hedgehog Digital Brasil define Presença = Menção + Citação + Contexto. Uma marca com 50% de taxa de menção e 60% de sentimento negativo tem um problema maior do que uma com 20% de taxa e 90% de menções positivas. Uma menção errada pode ser pior do que não aparecer.
Por que medir isso agora
Os números de adoção já justificam a atenção: 56% dos consumidores usaram IA para descobrir marcas que não conheciam, e 37% usam IA em decisões de compra, segundo o Adyen Retail Report. O ChatGPT processa 2,5 bilhões de prompts por dia e os AI Overviews do Google atingiram 2 bilhões de usuários mensais em 200 países.
O tráfego de referência de IA ainda representa 1,08% de todo o tráfego web, crescendo cerca de 1% ao mês. Não é gigante — mas os referrals do ChatGPT convertem a 7% contra 5% do Google, com 15 minutos de sessão contra 8 minutos e 12 pageviews contra 9. Quem vem de IA já chega mais preparado.
Os AI Overviews derrubaram 61% do CTR orgânico e 68% do CTR de anúncios para as queries que ativam essa feature. Ignorar a medição agora é perder a baseline para o que cresce mês a mês.
As 6 métricas que você precisa rastrear
Estas são as métricas que, juntas, dão um quadro completo da sua visibilidade em IA. Cada uma responde uma pergunta diferente. Nenhuma delas funciona bem sozinha.
Tabela de referência rápida:
| Métrica | Fórmula | Exemplo | O que mede |
|---|---|---|---|
| Taxa de Menção | (menções ÷ total de respostas) × 100 | 32 menções em 100 prompts = 32% | Se a IA te inclui |
| SOV Competitivo | (suas menções ÷ menções totais do setor) × 100 | 120 de 1.000 = 12% | Posição relativa vs. concorrentes |
| Taxa de Citação com Link | (menções com link ÷ total de menções) × 100 | 15 de 18 = 83% | Se a menção gera tráfego potencial |
| Sentimento/Representação | % por categoria (Positivo/Neutro/Negativo) | 65% Positivo, 25% Neutro, 10% Negativo | Qualidade da menção |
| Drift/Volatilidade | Variação média da taxa semana a semana | -3% por semana nos últimos 30 dias | Tendência: crescendo ou perdendo? |
| Tráfego de Referência de IA | Sessões do GA4 com source = chatgpt/perplexity/gemini | 420 sessões/mês | Impacto direto no site |
1. Taxa de Menção (Mention Rate)
Fórmula: (respostas que mencionaram sua marca ÷ total de respostas testadas) × 100
Você testou 100 prompts diferentes no ChatGPT e sua marca apareceu em 32 respostas. Taxa de Menção = 32%.
Mas atenção ao detalhe que a maioria ignora: a taxa de menção precisa ser desagregada por tipo de query. Uma taxa de 60% em queries comparativas e 15% em queries transacionais são resultados completamente diferentes do ponto de vista de negócio. O que importa para conversão são as transacionais — e uma taxa agregada de 38% esconde essa diferença.
O dado metodológico mais importante aqui vem do NAV43: você precisa de 60 a 100 execuções por prompt para ter validade estatística. Com 35 menções em 100 tentativas, a taxa real está entre 25% e 45%. Uma medição única é literalmente ruído. Este é o ponto onde a maioria das empresas erra — verificam a marca uma vez, veem que apareceu, e concluem que está tudo bem. Podem não aparecer nas próximas 30 tentativas.
2. Share of Voice Competitivo em IA (SOV)
Fórmula: (menções da sua marca ÷ total de menções de todas as marcas monitoradas) × 100
Exemplo: você monitora um setor com 5 players em 1.000 queries. Os resultados:
- Concorrente A: 350 menções (35%)
- Concorrente B: 280 (28%)
- Sua marca: 120 (12%)
- Concorrente C: 150 (15%)
- Concorrente D: 100 (10%)
SOV = 12%. Essa é a métrica mais estratégica, porque revela onde você está em relação ao mercado.
O ChatGPT cita apenas 2,37 marcas por query — quando ele menciona você, geralmente não menciona o concorrente. É quase soma zero. Saber seu SOV por categoria de query é a base para decidir onde concentrar esforços de produção de conteúdo.
3. Taxa de Citação com Link (Citation Rate)
Fórmula: (menções que incluem link ou atribuição ao seu site ÷ total de menções) × 100
Você teve 18 menções no mês. Em 15 delas, a IA incluiu um link para seu site. Taxa de Citação = 83%.
A diferença entre menção e citação com link: menção é reconhecimento, citação com link é tráfego potencial e sinal de autoridade para o algoritmo da IA. O Perplexity cita com muito mais frequência do que o ChatGPT. Uma boa estratégia diferencia onde você busca menção (ChatGPT, para reconhecimento de marca) de onde você busca citação com link (Perplexity, para tráfego direto).
4. Pontuação de Representação e Sentimento
Categorias: Positivo (descrição precisa e favorável), Neutro (factual sem endosso), Negativo (impreciso ou desfavorável), Contexto errado (sua marca citada fora do seu posicionamento).
Um dado que chama atenção: apenas 31% das menções de marca em respostas de IA são positivas. E dessas menções positivas, somente 20% incluem uma recomendação direta do tipo “X é a melhor opção para…”.
A categoria “contexto errado” merece atenção especial: é quando a IA cita a marca mas com o posicionamento errado — uma empresa B2B sendo recomendada como solução B2C, uma ferramenta de enterprise apresentada para PMEs, uma marca premium associada a custo-benefício. Essa é uma falha estratégica silenciosa que não aparece nas métricas de taxa de menção.
5. Drift e Volatilidade
Drift: queda gradual e consistente nas taxas de menção ao longo de semanas ou meses. Um drift de 5% por semana pode parecer pequeno — mas em dois meses virou uma crise de visibilidade.
Volatilidade: oscilações bruscas que podem indicar mudança de modelo, um novo concorrente ganhando espaço ou um problema de reputação emergindo.
Fórmula do drift: variação média da taxa de menção semana a semana nos últimos 30 dias.
As outras métricas dizem onde você está. Drift e volatilidade dizem para onde você está indo. Um SOV de 12% estável é diferente de um SOV de 12% que era 18% dois meses atrás. Monitorar tendência é tão importante quanto medir o valor atual.
6. Tráfego de Referência de IA
O que rastrear no GA4: sessões com source contendo chatgpt.com, perplexity.ai, copilot.microsoft.com, gemini.google.com.
O ChatGPT responde por 78% de todo o AI referral traffic global, o Perplexity por 15% e o Gemini por 6,4%, segundo análise do SE Ranking com 63.987 sites. Em junho de 2025, os referrals de IA atingiram 1,13 bilhão de cliques, crescimento de 357% em relação ao mesmo período de 2024.
Mas o tráfego direto não é a única história. A IA também influencia sem gerar clique — branded search crescente no Search Console é um sinal indireto rastreável. Se suas menções em IA aumentam e, algumas semanas depois, o volume de busca pelo nome da sua marca no Google também sobe, você está vendo o efeito da visibilidade em IA no comportamento de busca.

Como coletar os dados: o método em 4 passos
Esta é a seção que nenhum dos concorrentes brasileiros tem em profundidade. Aqui está o passo a passo para implementar o monitoramento sem ferramenta paga.
Passo 1 — Montar a matriz de prompts
Seu conjunto de prompts precisa cobrir todo o funil. Cinco categorias são suficientes para começar:
- “Os melhores”: “melhores [solução] para [perfil de cliente]” — ex: “melhores ferramentas de monitoramento de marca para startups brasileiras”
- Comparação: “[sua marca] vs. [concorrente principal]”
- Alternativas: “alternativas a [concorrente líder do setor]”
- Avaliação/confiança: “[sua marca] vale a pena?” / “[sua marca] é confiável?”
- Escolha com intenção comercial: “como escolher [categoria]” / “como implementar [solução]”
Para uma empresa B2B de médio porte, começa com 50 prompts totais (10 por categoria). Com múltiplos produtos, pode chegar a 150. Uma referência útil: Felipe Bazon da Hedgehog Digital Brasil recomenda cobrir as principais personas e momentos de decisão.
Um detalhe que faz diferença: prompts em português e em inglês podem retornar resultados diferentes. Se sua empresa tem presença internacional ou se os modelos foram treinados predominantemente em inglês, testar os dois idiomas revela diferenças importantes de visibilidade que ficam escondidas em uma análise unilíngue.
Passo 2 — Quantas vezes rodar cada prompt
Este é o ponto onde 90% das empresas erram.
60 a 100 execuções por prompt para ter validade estatística — essa é a recomendação do NAV43 baseada em pesquisa do SparkToro. Com 35 menções em 100 tentativas, a taxa real da sua marca está em algum lugar entre 25% e 45%. O intervalo é grande — mas qualquer número menor de tentativas tem um intervalo ainda maior.
Para quem está começando: fazer 20 execuções por prompt já é muito melhor que 1. Chegue a 60 nos prompts de maior prioridade estratégica — as queries de decisão de compra do seu setor.
Passo 3 — Como registrar os dados
Uma planilha no Google Sheets com as seguintes colunas resolve a maior parte das necessidades:
| Coluna | Descrição |
|---|---|
| Data | Data e hora da execução |
| Plataforma | ChatGPT / Perplexity / Google AI Mode / etc. |
| Prompt | Texto exato do prompt usado |
| Categoria de intent | Comparação / Alternativas / Avaliação / etc. |
| Mencionou? | Sim / Não |
| Posição na resposta | 1º mencionado / 2º / etc. |
| Contexto/Sentimento | Positivo / Neutro / Negativo / Contexto errado |
| Com link? | Sim / Não |
| URL do link | URL completa quando houver link |
| Concorrentes citados | Quais outras marcas apareceram na mesma resposta |
Comece com um mês de baseline: rode todos os prompts, calcule a taxa base para cada uma das 6 métricas. Nos meses seguintes, rode semanalmente uma amostra (30% dos prompts) e mensalmente o conjunto completo. Com 50 prompts rodados 20 vezes cada, você tem 1.000 registros — uma aba de summary com as 6 métricas calculadas automaticamente é o relatório que você apresenta para a diretoria.
Passo 4 — Calcular as métricas e interpretar os resultados
Aplique as fórmulas da tabela de referência rápida acima nos dados coletados. Mas atenção: o objetivo do primeiro mês não é ter uma métrica boa. É ter uma baseline.
Sem baseline, você não sabe se 25% de taxa de menção é bom ou ruim. Com dois meses de dados, você tem tendência. Com os dados de dois concorrentes medidos em paralelo, você tem SOV real. A interpretação dos números depende do contexto competitivo — e esse contexto só aparece quando você começa a medir.
Ferramentas para escalar o monitoramento
O método manual funciona para até 100 prompts com execuções periódicas. Para escalar, há ferramentas em diferentes faixas de custo.
Sem custo — o método manual
ChatGPT, Perplexity, Claude e Google AI Mode são gratuitos. Com uma planilha e os 4 passos acima, qualquer empresa pode começar a medir hoje. A limitação é escala: não é viável fazer 100 execuções de 50 prompts em três plataformas manualmente toda semana.
Ferramentas (R$300-800/mês)
Para empresas que querem automatizar:
- Quer monitorar a visibilidade da sua marca nas principais IAs com relatórios automáticos e benchmarks do mercado brasileiro? A Tropk.ai foi desenvolvida para resolver exatamente este problema no contexto das marcas brasileiras.
Plataformas dedicadas
- Semrush AI Toolkit e Ahrefs AI Visibility — módulos dentro das plataformas de SEO já conhecidas. Integração com dados de SEO orgânico existentes.
Para a maioria das empresas brasileiras mid-market, começar pelo método manual ou por ferramentas intermediárias brasileiras faz mais sentido do que assinar plataformas enterprise no primeiro mês. Você precisa de dados antes de precisar de automação.
Benchmarks: o que é uma boa visibilidade em IA?
Esta é a pergunta que todos têm depois de calcular as métricas pela primeira vez. E a resposta honesta é: depende do setor, da competição e do tipo de query. Mas existem alguns dados de referência.
O que os dados do Ahrefs revelam
A pesquisa do Ahrefs sobre fatores de correlação com citações em AI Overviews encontrou que o fator mais correlacionado com ser citado é o número de web mentions — menções da sua marca em outros sites. A correlação é de 0,664, e o próprio Ahrefs afirma que nenhum outro fator medido chega perto disso.
O dado mais revelador: marcas no quartil superior de web mentions recebem em média 169 citações de IA, contra 0 a 3 para a metade inferior. A relação não é linear. É exponencial.
A implicação prática: a melhor alavanca para visibilidade em IA não é otimizar mais o site interno. É conseguir que terceiros falem da sua marca — PR, conteúdo em comunidades, parcerias de co-marketing, presença em fóruns e reviews são mais impactantes do que mais posts no blog.
Essa é também a conexão entre SEO e GEO: uma estratégia de link building sólida e uma presença de marca forte no ambiente digital se traduzem diretamente em mais citações de IA. Não são disciplinas separadas.
Referências por tipo de query
Para orientar a interpretação das suas métricas:
- Query transacional / de decisão de compra: espere taxa de menção entre 10% e 25%. A IA recomenda poucas marcas com mais cautela em contextos de alto envolvimento.
- Query informativa / de categoria: taxas mais altas são esperadas (30% a 50%+), porque a IA menciona mais referências para ilustrar um tema.
- SOV acima de 20% em queries de decisão é uma posição competitiva sólida.
- SOV abaixo de 5% em qualquer categoria relevante para o seu negócio é sinal de alerta.
- 82% dos usuários consideram a pesquisa com IA mais útil que buscadores tradicionais — o benchmark relevante é ser competitivo nesse canal agora, enquanto a maioria das marcas ainda não está medindo.
De métricas a decisões: o que fazer com os dados
Medir é o começo. A parte que importa é saber o que fazer com o que você encontrou.
Como correlacionar AI visibility com métricas de negócio
O efeito da visibilidade em IA no negócio segue um padrão que pode ser rastreado:
- AI mentions crescendo → branded search crescendo 2 a 4 semanas depois (rastreável via Search Console)
- Branded search crescendo → tráfego direto crescendo 1 a 2 meses depois
- Tráfego direto crescendo → taxa de conversão maior (visitantes chegam com contexto, ciclo de vendas menor)
- Referrals de IA → conversão de 7% vs. 5% do Google
A IA não sempre aparece no relatório do Google Analytics como origem de visita — para menções sem link, não há clique rastreável. Mas o efeito aparece como aumento de branded search, aumento de tráfego direto e chegada de leads “pré-aquecidos”. Medir esses sinais indiretos cria evidência para a diretoria sem precisar de ferramenta enterprise.
Como reportar para a diretoria
Dashboard mínimo de 3 métricas para reunião mensal:
- Taxa de Menção — mês atual vs. mês anterior, por plataforma (ChatGPT / Perplexity / Google AO separados)
- SOV Competitivo — posição vs. 3 principais concorrentes, por categoria de query
- Tráfego de referência de IA — sessões no GA4, mês a mês, por plataforma de origem
As outras 3 métricas (taxa de citação, sentimento, drift) são operacionais — ficam no relatório da equipe, não no de diretoria. O board quer saber: estamos crescendo ou diminuindo em IA? Estamos ganhando ou perdendo terreno para os concorrentes? A IA está gerando negócio? Essas 3 métricas respondem essas 3 perguntas.
Para conectar visibilidade em IA com resultados de negócio, veja também como o GEO e o AEO se diferenciam do SEO tradicional em termos de estratégia e métricas.
Perguntas frequentes
Qual ferramenta gratuita posso usar para começar a medir visibilidade em IA hoje?
ChatGPT, Perplexity, Claude e Google AI Mode são todos gratuitos. Monte a matriz de prompts, monitore frequentemente, calcule métricas e interprete os resultados, tudo isso registrado em uma planilha no Google Sheets. A limitação do método manual é escala: acima de 50 prompts com execuções semanais em três plataformas, você vai querer uma ferramenta automática de monitoramento como a tropk.ai.
Com que frequência devo medir minha visibilidade em IA?
No primeiro mês, rode o conjunto completo de prompts para estabelecer a baseline. Depois, uma amostra de 30% dos prompts semanalmente e o conjunto completo mensalmente é suficiente para a maioria das empresas. Em período de lançamento de produto ou campanha, aumente a frequência para identificar variações mais rapidamente.
É normal a taxa de menção variar muito de uma semana para outra?
Sim. LLMs são sistemas probabilísticos — o mesmo prompt gera respostas diferentes em momentos diferentes. Variações de 5 a 15 pontos percentuais semana a semana são esperadas. O que merece atenção é a tendência: se a taxa cai consistentemente por 3 a 4 semanas seguidas, isso é drift, não ruído normal.
Minha marca aparece no Google AI Overviews mas não no ChatGPT. O que fazer?
As duas plataformas têm lógicas completamente diferentes. O Google AI Overviews é fortemente influenciado pelos sinais de SEO existentes — quem ranqueia bem no Google orgânico tende a aparecer no AI Overviews. O ChatGPT depende mais de menções em fontes autoritativas e em listas curadas. Aparecer em um e não no outro é o padrão — apenas 7,2% dos domínios aparecem em ambos simultaneamente.
Qual a diferença entre share of voice em IA e share of voice tradicional?
No SOV tradicional (mídia paga ou orgânica), você mede quanto das impressões ou do tráfego do setor vai para sua marca. No SOV em IA, você mede quantas menções em respostas de IA, dentro de um conjunto de queries relevantes, citam sua marca versus os concorrentes. A lógica é parecida, mas a coleta de dados é completamente diferente: não existe API pública que retorne quem a IA menciona — você precisa executar os prompts e registrar manualmente ou via ferramenta especializada.
Como sei se minha visibilidade em IA está boa ou ruim?
Sem contexto competitivo, o número é quase inútil. Uma taxa de menção de 25% pode ser excelente ou péssima, dependendo do que os concorrentes têm. O benchmark mais confiável é o seu próprio histórico (tendência mês a mês) e o SOV em relação a 2 ou 3 concorrentes diretos. Para referência: SOV acima de 20% em queries de decisão é uma posição sólida; abaixo de 5% é alerta.
Preciso de ferramenta paga para medir visibilidade em IA?
Não. O método manual descrito neste artigo funciona sem nenhuma ferramenta paga. O que você perde sem ferramenta é escala (automatização de execuções) e histórico estruturado. Para uma empresa que está começando, o método manual por 2 a 3 meses antes de decidir qual ferramenta contratar é a abordagem mais inteligente — você entende os dados antes de automatizá-los.
Quanto tempo leva para ver resultados depois de melhorar o conteúdo?
Depende do tipo de ação. Conseguir menções de marca em outros sites (PR, reviews, fóruns) costuma gerar efeito em 4 a 8 semanas — o tempo que os modelos levam para atualizar o conhecimento sobre novas fontes. Otimizar conteúdo existente pode demorar mais, porque os modelos atualizam o treinamento em ciclos. A ação com retorno mais rápido é aumentar a presença de marca em fontes que as IAs priorizam: para o ChatGPT, Wikipedia e listas autoritativas; para o Perplexity, Reddit e fóruns de nicho.

