RSS RSS

Navegação


Principais tópicos


Ferramentas




Pesquisar na wiki
»

Impulsionado por
O padrão de metadados da INDA é o conjunto padrão de campos obrigatórios e opcionais que descrevem os conjuntos de dados no âmbito da INDA. Tem como objetivo que os dados que constam no catálogo do Portal Brasileiro de Dados Abertos apresentem-se de uma maneira clara e uniforme para os utilizadores dos dados. Ele está estabelecido na Cartilha Técnica para Publicação de Dados Abertos e baseia-se no padrão de metadados para dados abertos do Chile.

Padrão de metadados

Metadados são dados sobre os dados, ou seja, são informações que possibilitam organizar, classificar, relacionar e inferir novos dados sobre o conjunto de dados. A quantidade e a qualidade dos metadados de um conjunto de dados podem determinar a utilidade daquele conjunto de dados. Em outras palavras, mais e melhores metadados agregam mais valor ao conjunto de dados, além de melhorar sua classificação e a busca sobre ele.
A seguir são definidos um conjunto de metadados obrigatórios e um conjunto de metadados desejáveis.

Obrigatórios

  1. Título: Nome do conjunto de dados.
  2. Descrição: Uma breve explicação sobre os dados.
  3. Catálogo origem: Página (URL) do órgão onde está publicado o conjunto de dados.
  4. Órgão responsável: Nome e sigla do órgão ou entidade responsável pela publicação do conjunto de dados.
  5. Categorias no VCGE: O Vocabulário Controlado de Governo Eletrônico é uma lista hierarquizada de assuntos do governo que utiliza termos comuns e é voltada para a sociedade. Para navegar e escolher as categorias acesse o VCGE em http://vocab.e.gov.br/2011/03/vcge.
  6. Recursos: Um conjunto de dados pode ser composto por mais de um arquivo de dados. O critério básico para separar vários recursos em mais de um conjunto de dados é a constatação de que eles divergem em vários metadados.
    1. Identificador: URL persistente que aponta para o recurso na Web.
    2. Título: Nome do recurso.
    3. Formato: Formato do recurso. Ex.: XML, JSON, CSV, etc.
    4. Descrição: Breve detalhamento sobre o conteúdo do recurso.

Desejáveis

  1. Etiquetas: Lista de palavras chaves relacionadas ao conjunto de dados, e que são úteis na classificação e busca dele.
  2. Autoria: Instituição ou pessoa responsável pela produção do recurso.
  3. Documentação: URL de documento que expõe detalhes sobre o conjunto de dados.
  4. Cobertura geográfica: Localização ou região geográfica a que se referem os dados. Ex.: Recife.
  5. Cobertura temporal: Data ou período à que referem os dados. Ex.: 03/2012.
  6. Granularidade geográfica: Precisão geográfica da cobertura geográfica. Ex.: municipal.
  7. Granularidade temporal: Precisão temporal da cobertura temporal. Ex.: mês.
  8. Frequência de atualização: Frequência temporal com que o conjunto de dados é atualizado.
  9. Referências: Relações com outros conjuntos de dados.
  10. Metodologia: Processo de criação dos dados.
  11. Vocabulário/ontologia: Documentos estruturados com metadados específicos do conjunto de dados.

Implementação técnica

O padrão de metadados da INDA atualmente é implementado solicitando-se aos curadores de dados que cadastram conjuntos de dados no catálogo do Portal Brasileiro de Dados Abertos preencham os nomes dos campos na entrada "chave" e valores na entrada "valor" para os campos de metadados extras do CKAN.

Considera-se a possibilidade implementar a utilização de um plugin como o ckanext-scheming para que os campos do padrão de metadados sejam exibidos automaticamente no formulário de cadastro de conjuntos de dados. Assim, visa-se estimular o seu correto preenchimento e evitar erros. Para tanto, seria necessário descrever um esquema "schema" de metadados, correspondente ao padrão, a ser utilizado pelo plugin.

Revisão do padrão

A possibilidade de se avaliar a necessidade de revisão do padrão de metadados da INDA foi discutida durante a 12ª Reunião Ordinária do Comitê Gestor. Na ocasião, instituiu-se um subgrupo no âmbito do GT4, com o objetivo de fazer essa avaliação, considerando a sua interação com outros padrões, como o DDI (do ANDA), PMGB (da INDE) e, ainda, com padrões mais recentemente estabelecidos internacionalmente para portais de dados abertos, tais como o DCAT e o DCAT-AP. Seria desejável, também, com o objetivo de melhorar a facilidade do cidadão encontrar os dados que procura, realizar o mapeamento com o esquema para conjuntos de dados no schema.org, usado pelo Google e outros mecanismos de busca para indexar informações sobre conjuntos de dados.

Estão sendo discutidos também o padrão GeoDCAT-AP, que é uma extensão do DCAT-AP para dados geoespaciais, bem como a minuta do StatDCAT-AP, que analogamente está sendo proposta pela Comissão Europeia para metadados estatísticos.

Participantes:

NomeÓrgão
Augusto HerrmannDGD/STI/MP
João Marcelo MarquesIBGE
Moema José de Carvalho AugustoDiretoria de geociências / IBGE
Rafael Lopes da SilvaDiretoria de geociências / IBGE
Ronaldo Raposo Jr.IBGE
Rogério BorbaIBGE
Nívia PereiraGGT/Diretoria de geociências/ IBGE
Edmar MorettiMS

Reuniões realizadas pelo subgrupo: