Vazamento de dados do Google: documentação completa para não ser feito de idiota

Índice
Ícone com desenho de web e cadeado aberto - JR Martian

Google confirma vazamento de dados internos com detalhes sobre classificação de +14 mil critérios

Durante esses dias os profissionais e consultores de SEO movimentaram as redes sociais depois do vazamento dos documentos que revelam que o Google utiliza uma série de dados para ranquear sites em seu navegador Google Chrome, incluindo cliques, dados de usuários, CTR, tempo de permanência e muito mais. Essas revelações contrariam declarações anteriores da empresa sobre os fatores que influenciam o ranqueamento dos conteúdos.

Este vazamento do algoritmo do Google, oferece uma visão inédita sobre os critérios que afetam a visibilidade online de websites e negócios, marcando o maior vazamento de informações sobre o algoritmo de busca do Google até hoje.

Quem divulgou os dados do Google?

Os dados foram divulgados por Rand Fishkin e Mike King, em 27 de maio deste ano. Segundo eles, os dados foram entregues por ex-funcionários do Google, cujas identidades não foram reveladas. Neste documento vazado do algoritmo do Google publicado pela SparkToro, foram revelados cerca de 14 mil recursos de ranqueamento na pesquisa do Google, o que torna um dos maiores escândalos já revelados por uma Big Tech no mundo.

Tabela de banco de dados com os dados vazados do Google

➡️ Baixe os dados vazados do Google ⬅️

O que mais chamou atenção nos documentos vazados?

1. Limitação de páginas indexadas

O que o documento diz: O Google Search pode definir um número máximo de páginas ou postagens de um site que aparecerão no buscador.

O que Google dizia: O Google tem a capacidade de limitar quantas páginas de um site específico serão exibidas nos resultados de busca, o que pode afetar a visibilidade de conteúdo de sites com muitos posts ou páginas.

2. Taxas de cliques (CTR) e tempo de permanência

O que o documento diz: Diferente do que havia dito anteriormente, as Taxas de Cliques (CTR) e tempo de permanência dos usuários em uma página são sim métricas para definir o ranqueamento dos sites no Google.

O que Google dizia: O Google utiliza a CTR (Click-Through Rate) e o tempo que os usuários permanecem em uma página como fatores de ranqueamento, contrariando declarações anteriores que negavam o uso dessas métricas.

3. Classificadores para temas sensíveis

O que o documento diz: O buscador do Google possui classificadores específicos sobre temas sensíveis como eleições, indicando que a classificação pode também levar em consideração o teor político dos sites.

O que Google dizia: O algoritmo do Google inclui classificadores específicos para temas sensíveis, como eleições, sugerindo que o conteúdo político dos sites pode influenciar seu ranqueamento nos resultados de busca.

4. Pontuação de autoridade de domínio (site authority)

O que o documento diz: O buscador do Google tem uma pontuação de autoridade geral para os sites, identificada como “site Authority”. Anteriormente, a big tech havia negado a existência de uma “autoridade de domínio geral”.

O que Google dizia: O Google utiliza uma métrica chamada “site Authority” para avaliar a autoridade geral dos sites, o que contraria declarações anteriores que negavam a existência de tal métrica.

5. Uso de dados do Google Chrome

O que o documento diz: O buscador do Google utiliza dados coletados pelo Google Chrome – como visualizações de páginas através do navegador – para ranquear os sites. O Google já havia dito que não utilizava dados do software para isso.

O que Google dizia: Dados de navegação coletados pelo Google Chrome, como visualizações de páginas, são usados pelo Google para ranquear sites, contradizendo afirmações anteriores de que esses dados não seriam utilizados.

6. Despriorização de conteúdos

O que o documento diz: Conteúdos podem ser despriorizados no topo da busca por conterem informações como links que não correspondem ao site alvo, links de pornografia, insatisfação do usuário e mais.

O que Google dizia: O Google pode despriorizar conteúdos nos resultados de busca se detecta links inadequados, como pornografia ou links que não correspondem ao site alvo, além de considerar a insatisfação dos usuários.

7. Histórico de alterações de páginas

O que o documento diz: O Google possui um histórico com a cópia de cada versão de cada página que já foi indexada pelo buscador e, com isso, o Search pode se lembrar de cada alteração já realizada. Apesar disso, ele analisa somente 20 alterações em uma URL quando está analisando os links.

O que Google dizia: O Google mantém um histórico de todas as versões de páginas indexadas e pode acessar essas alterações, mas ao analisar os links, ele considera apenas as 20 últimas alterações feitas na URL.

8. Avaliação da longevidade dos sites (hostAge)

O que o documento diz: Os sites indexados pelo Google são avaliados em relação ao tempo em que eles estão no ar, ou seja, de acordo com a longevidade na internet. O comando “hostAge” é o responsável por isso.

O que Google dizia: O tempo de existência de um site na internet, medido pelo comando “hostAge”, é um fator de avaliação utilizado pelo Google para ranquear sites.

9. Diretriz EEAT

O que o documento diz: O Google foi, no mínimo, impreciso em relação à diretriz EEAT (Experiência, Especialização, Autoridade e Confiabilidade) para os sites. A empresa disse que a diretriz serviria somente para melhorar a experiência do usuário, mas aparentemente utiliza esses dados também para ranquear as páginas.

O que Google dizia: A diretriz EEAT, que visa melhorar a experiência do usuário ao destacar sites com experiência, especialização, autoridade e confiabilidade, também é utilizada pelo Google para ranquear páginas, apesar de a empresa ter declarado que não seria usada para esse fim.

Barry Schwartz Search Engine Roundtable

O que o Google diz sobre o fato?

O Google reconhece o vazamento, mas advertiu contra “fazer suposições imprecisas sobre a busca com base em informações fora de contexto, desatualizadas ou incompletas”.

Davis Thompson, representante do Google

O que mais chamou a atenção foi sobre a autoridade de domínio

Entre as informações reveladas, destaca-se a autoridade de domínio, uma medida de relevância de um site em um determinado assunto que pode influenciar sua posição nas buscas. Anteriormente, o Google havia negado a existência de um sistema similar.

A documentação sugere que a métrica de autoridade de domínio é utilizada para a formação de “listas brancas” em tópicos sensíveis, como eleições e a pandemia de Covid-19, indicando esforços do Google para identificar fontes confiáveis nesses assuntos.

E agora que a caixa-preta do algoritmo foi revelada?

A busca do Google é uma das principais ferramentas para organizar a internet. O SEO (Search Engine Optimization) é um conjunto de diretrizes que determinam como um site deve ser estruturado e que tipo de conteúdo deve ser produzido para melhorar sua visibilidade nas buscas.

No entanto, o funcionamento interno do algoritmo, que está em constante evolução há 26 anos, sempre foi mantido em segredo pela empresa.

Com a confirmação desses documentos vazados do Google, profissionais de SEO ganham uma oportunidade valiosa de entender melhor os critérios que o Google utiliza para ranquear os sites, permitindo a criação de estratégias mais eficazes para melhorar a visibilidade online.

JR Martian - Organic Growth
JR Martian - Organic Growth

Deixar as coisas mais simples, acessíveis e fáceis de entender é uma habilidade que tenho desenvolvido ao longo da jornada.

Recomendo para você