Dados estruturados são informações organizadas em formatos específicos que facilitam a compreensão automática por mecanismos de busca como o Google. No contexto de conjuntos de dados, adicionar dados estruturados permite que esses mecanismos entendam melhor o conteúdo e as características desses dados, favorecendo sua descoberta e apresentação aprimorada nos resultados de pesquisa.
O uso de dados estruturados baseado no vocabulário do schema.org, especialmente com o tipo Dataset, aliado a outros padrões como DCAT (Data Catalog Vocabulary) e CSVW (CSV na Web), possibilita descrever os metadados essenciais de conjuntos de dados, tais como nome, descrição, criador, formato e licença. Isso contribui para aumentar a visibilidade e acessibilidade dos conjuntos de dados em diversos domínios, incluindo ciências biológicas, sociais, aprendizado de máquina, e dados governamentais, entre outros.
Para ser considerado um conjunto de dados que pode se beneficiar da marcação de dados estruturados, ele precisa possuir características específicas que o definam como uma coleção organizada de informações. Alguns exemplos comuns incluem:
A implementação de dados estruturados requer a inserção de marcação em sua página web para informar os mecanismos de busca sobre detalhes cruciais do conjunto de dados. O processo básico inclui os seguintes passos:
Para garantir que os dados estruturados sejam efetivamente compreendidos e utilizados pelo Google, é fundamental especificar algumas propriedades conforme as definições do schema.org e suas extensões. Entre as principais estão:
Existem diferentes opções para representar os dados estruturados em uma página, com destaque para:
Além do vocabulario padrão schema.org, o Google também reconhece dados estruturados segundo os padrões do W3C, como DCAT (vocabulário para catálogos de dados) e CSVW (voltado para dados tabulares em CSV com metadados complementares).
Conjuntos de dados organizados em forma de tabelas, muito comuns em arquivos CSV, podem receber uma marcação ainda mais detalhada utilizando o padrão CSVW, que permite descrever o esquema, as colunas, tipos de dados e outras características da tabela. Isso promove uma interpretação precisa dos dados tabulares por parte dos mecanismos de busca e outras aplicações.
Embora essa abordagem esteja em estágio Beta e possa sofrer alterações, ela oferece uma forma avançada de informar a estrutura dos dados para que sejam melhor explorados nas pesquisas.
Caso não deseje que um conjunto de dados seja exibido nos resultados da Pesquisa de Datasets do Google, pode-se usar a tag robots meta apropriada para controlar a indexação e a exibição daquele conteúdo. É importante destacar que, após a aplicação dessa configuração, pode levar dias ou semanas até que a exclusão se reflita nos resultados devido aos ciclos de rastreamento e atualização do índice do Google.
É comum que conjuntos de dados recebam contribuições de diversas fontes ou sejam baseados em dados originais. Para garantir clareza e transparência, recomenda-se:
Essas práticas auxiliam a atribuir corretamente a autoria e procedência dos dados, além de melhorar a confiança e a facilidade de acesso dos usuários.
Após a implantação dos dados estruturados, é crucial monitorar seu desempenho e status por meio do Search Console, ferramenta gratuita do Google que oferece relatórios detalhados sobre a indexação e eventuais erros encontrados nos dados estruturados.
Aspectos a serem observados incluem:
Problemas com dados estruturados podem impedir que as informações sejam interpretadas corretamente pelo Google, comprometendo os benefícios esperados. Alguns erros frequentes incluem:
Para solucionar esses problemas, recomenda-se:
A adoção de dados estruturados para conjuntos de dados deve ser acompanhada por um compromisso constante com a qualidade das informações publicadas. Isso inclui:
Investir na implementação correta de dados estruturados para conjuntos de dados é uma estratégia essencial para maximizar a visibilidade, alcance e utilidade dos seus dados na web. A adoção das práticas recomendadas contribui para que mecanismos de busca como o Google compreendam melhor o seu conteúdo, apresentando-o de forma aprimorada nos resultados de pesquisa e facilitando a descoberta para pesquisadores, estudantes, profissionais e o público em geral.
Ao entender os tipos de propriedades, os formatos recomendados e o processo de monitoramento, você poderá garantir que seus conjuntos de dados estejam adequadamente representados e acessíveis para uma audiência cada vez maior.
Aproveite para compartilhar clicando no botão acima!
Visite nosso site e veja todos os outros artigos disponíveis!