Como decodificar URLs traduzidos pela Pesquisa Google para otimizar redes de publicidade

Como decodificar URLs traduzidos pela Pesquisa Google para otimizar redes de publicidade

Entendendo os recursos de tradução da Pesquisa Google e sua importância para redes de publicidade

A Pesquisa Google oferece recursos avançados de tradução que permitem aos usuários visualizar conteúdos em diversos idiomas traduzidos automaticamente. Esses recursos facilitam o acesso à informação, quebrando barreiras linguísticas e ampliando o alcance do conteúdo disponível na internet.

No entanto, para redes de publicidade, essa funcionalidade pode gerar desafios, principalmente porque os anúncios exibidos nas páginas traduzidas nem sempre operam conforme o esperado. Isso acontece porque o URL exibido ao usuário não corresponde diretamente ao URL original do site, dificultando a renderização ou a atribuição correta das campanhas publicitárias.

Portanto, é fundamental que gestores de redes de publicidade entendam como lidar com esses URLs traduzidos para garantir que os anúncios funcionem corretamente e tenham o retorno esperado em campanhas internacionais e multilíngues.

Como a Pesquisa Google realiza a tradução e a renderização do conteúdo

O processo de tradução automática da Pesquisa Google ocorre por meio do Google Tradutor, que age como um intermediador entre o usuário e o site original. Quando um usuário clica em um resultado de pesquisa traduzido, o Google acessa a página do editor, reescreve o URL original utilizando um proxy do Google Tradutor e mostra a versão traduzida da página.

Esse método garante que o conteúdo seja apresentado na língua desejada, mas ao mesmo tempo altera o URL da página, utilizando domínios e parâmetros específicos que indicam que a página está sendo exibida via o Google Tradutor.

Esse tipo de URL traduzido, embora funcional para acesso ao conteúdo, pode não ser compreendido adequadamente pelas redes de publicidade, que normalmente dependem do URL original para rastreamento, segmentação e exibição de anúncios.

Por que é necessário decodificar o URL traduzido para o URL original?

As redes de publicidade operam majoritariamente a partir do domínio original e dos parâmetros da página para identificar o contexto dos anúncios que serão exibidos, além de garantir a medição e atribuição corretas das impressões e dos cliques.

Quando o URL da página é modificado pelo mecanismo do Google Tradutor, as redes já não conseguem associar as informações corretamente, o que pode gerar falhas na exibição dos anúncios ou na contabilização das impressões, resultando em perdas de receita e desempenho para anunciantes e editores.

Portanto, para assegurar a eficácia das campanhas publicitárias, é crucial converter esse URL proxy do Google Tradutor de volta para o URL original do editor, identificando o domínio correto e eliminando parâmetros desnecessários que interferem na leitura dos sistemas de anúncios.

Passo a passo para converter o URL do Google Tradutor para o URL original

O processo de decodificação envolve algumas etapas importantes para transformar o nome do host do URL traduzido para sua forma original funcional. Veja o passo a passo detalhado:

  1. Extraia o prefixo do domínio removendo o sufixo .translate.goog que indica que o conteúdo está sendo proxificado pelo Google Tradutor.

  2. Divida o valor do parâmetro _x_tr_enc pelo caractere vírgula (,) e salve essa lista como encoding_list. Esse parâmetro indica como o domínio foi codificado.

  3. Inclua o valor do parâmetro _x_tr_hp ao início do prefixo do domínio, caso ele exista. Esse parâmetro pode conter subdomínios ou outras informações relevantes.

  4. Se o encoding_list contiver o valor 1 e o domínio começar com o prefixo 1-, remova esse prefixo.

  5. Se o encoding_list contiver o valor 0 e o domínio começar com o prefixo 0-, remova esse prefixo. Neste caso, defina a variável is_idn como true, caso contrário, marque false.

  6. Substitua ocorrências do padrão regex /\b-\b/ por pontos (.), reconvertendo os separadores codificados em pontos usados em domínios reais.

  7. Substitua duplas ocorrências de hífen (--) por um único hífen (-), corrigindo possíveis codificações de hífen.

  8. Se a variável is_idn estiver como true, adicione o prefixo punycode xn--, característico de domínios internacionalizados (IDN).

  9. Opcional: converta o domínio punycode para Unicode para permitir visualização e uso mais intuitivos.

Implementação prática usando JavaScript

Para facilitar a aplicação desse processo, apresentamos um exemplo de função JavaScript que realiza a decodificação do hostname de um URL do Google Tradutor e recupera o domínio original.

Essa função pode ser integrada a sistemas de gerenciamento de anúncios para garantir que as URLs utilizadas sejam as corretas e evitem problemas na entrega dos anúncios.

function decodeHostname(proxyUrl) {
  const parsedProxyUrl = new URL(proxyUrl);
  const fullHost = parsedProxyUrl.hostname;

  // 1. Remove o sufixo ".translate.goog"
  let domainPrefix = fullHost.substring(0, fullHost.indexOf('.'));

  // 2. Divide o parâmetro _x_tr_enc em uma lista
  const encodingList = parsedProxyUrl.searchParams.has('_x_tr_enc')
    ? parsedProxyUrl.searchParams.get('_x_tr_enc').split(',')
    : [];

  // 3. Prepend o valor do parâmetro _x_tr_hp ao prefixo
  if (parsedProxyUrl.searchParams.has('_x_tr_hp')) {
    domainPrefix = parsedProxyUrl.searchParams.get('_x_tr_hp') + domainPrefix;
  }

  // 4. Remove prefixo "1-" se encodingList contém '1'
  if (encodingList.includes('1') && domainPrefix.startsWith('1-')) {
    domainPrefix = domainPrefix.substring(2);
  }

  // 5. Remove prefixo "0-" se encodingList contém '0' e define isIdn
  let isIdn = false;
  if (encodingList.includes('0') && domainPrefix.startsWith('0-')) {
    domainPrefix = domainPrefix.substring(2);
    isIdn = true;
  }

  // 6. Substitui regex /\b-\b/ por ponto '.'
  // 7. Substitui '--' por '-'
  let decodedSegment = domainPrefix.replace(/\b-\b/g, '.').replaceAll('--', '-');

  // 8. Se isIdn é true, adiciona prefixo punycode "xn--"
  if (isIdn) {
    decodedSegment = 'xn--' + decodedSegment;
  }

  return decodedSegment;
}

Reconstrução do URL original

Após obter o domínio original decodificado, é necessário reconstruir a URL para uso correto das redes de publicidade. Os passos para isso são:

  1. Substituir o nome do host do URL traduzido pela versão decodificada referente ao domínio real do editor.

  2. Remover todos os parâmetros que começam com _x_tr_, pois esses são específicos do proxy de tradução e podem interferir no funcionamento dos anúncios.

Essas etapas garantem que a URL a ser usada pela rede de publicidade esteja limpa, com o domínio original e sem parâmetros intermediários, permitindo assim o funcionamento correto dos anúncios em páginas traduzidas.

Como testar a decodificação do hostname

Para garantir que o código de decodificação funcione conforme esperado, recomenda-se a criação de testes unitários utilizando casos reais de URLs traduzidos. Uma tabela com exemplos e os resultados esperados ajuda a validar a lógica implementada.

proxyUrldecodeHostname esperado
https://example-com.translate.googexample.com
https://foo-example-com.translate.googfoo.example.com
https://foo–example-com.translate.googfoo-example.com
https://0-57hw060o-com.translate.goog/?_x_tr_enc=0xn--57hw060o.com
https://1-en–us-example-com/?_x_tr_enc=1en-us.example.com
https://0-en—-w45as309w-com.translate.goog/?_x_tr_enc=0xn--en–w45as309w.com
https://1-0—–16pw588q-com.translate.goog/?_x_tr_enc=0,1xn—-16pw588q.com
https://lanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch-co-uk.translate.goog/?_x_tr_hp=lllanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch.co.uk
https://lanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch-co-uk.translate.goog/?_x_tr_hp=www-lwww.llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch.co.uk
https://a–aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa-com.translate.goog/?_x_tr_hp=a–xn--xn--xn--xn--xn————————–aa-xn-xn-xn-xn-xn————-aa-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa.com
https://g5h3969ntadg44juhyah3c9aza87iiar4i410avdl8d3f1fuq3nz05dg5b-com.translate.goog/?_x_tr_enc=0&_x_tr_hp=0-xn--g5h3969ntadg44juhyah3c9aza87iiar4i410avdl8d3f1fuq3nz05dg5b.com

Esses exemplos permitem confirmar que a função decodifica corretamente as variações de domínios traduzidos, incluindo domínios internacionalizados e subdomínios complexos.

Benefícios do ajuste para redes de publicidade

Ao implementar a decodificação correta dos URLs traduzidos, as redes de publicidade podem obter:

  • Maior precisão no direcionamento e segmentação dos anúncios, pois o domínio original reflete o contexto real da página.

  • Melhor atribuição de impressões, cliques e conversões, facilitando a análise de desempenho de campanhas multilíngues.

  • Redução de erros ou falhas técnicas na exibição dos anúncios em páginas traduzidas.

  • Melhor experiência do usuário, com anúncios relevantes e adequados à página acessada, mesmo que esteja traduzida.

Esses benefícios contribuem para o aumento da efetividade das campanhas online, otimizando o investimento e ampliando o público alcançado globalmente.

Considerações finais

Com o aumento da demanda por conteúdo multilíngue e a popularização dos recursos automáticos de tradução, adaptar as redes de publicidade para funcionar corretamente com URLs traduzidos é imprescindível para manter o desempenho das campanhas.

Adotar a lógica de decodificação do hostname e reconstrução do URL original é um passo essencial para tornar os anúncios compatíveis e eficazes, garantindo que o ecossistema de publicidade online funcione de forma harmoniosa com as tecnologias de tradução da Pesquisa Google.

Investir em ajustes técnicos para lidar com esses cenários traz vantagens competitivas para anunciantes e ad networks, potencializando o alcance e o impacto das mensagens publicitárias no mercado global.

Sócio-diretor da Muvi. Atua em projetos de marketing digital desde 2009.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *