RSS RSS

Tópicos


Navegação


Ferramentas



Pesquisar na wiki
»

Impulsionado por
Reunião do GT4 da INDA para alinhamento de expectativas e discutir os padrões de metadados da INDA, INDE e ANDA.

Data e hora: 14/6/2016 10:00 às 11:00
Local: Audioconferência via internet

Objetivos

Discutir o padrão de metadados da INDA e suas relações com os padrões DCAT-AP, os padrões de metadados da INDE (PMGB) e da ANDA (DDI).

Pauta

  • Discutir o padrão de metadados da INDA e sua necessidade de revisão
  • Apresentar o padrão de metadados para conjuntos de dados abertos e portais de dados abertos, DCAT-AP
  • Apresentar o padrão PMGB e demais padrões de metadados da INDE
  • Apresentar o padrão DDI e demais padrões de metadados da ANDA
  • Encaminhamentos e próximas ações do GT

Documentos e referências


Participantes

NomeÓrgão
Augusto HerrmannDEGDI/STI/MP
Luigino Palermo (ausente)IBGE
Rogerio Borba (ausente)IBGE
Nivia Pereira (ausente)GGT/Diretoria de geociências/ IBGE
Paulo SelleraMS
Edmar MorettiMS

Ata

Reunião aberta pelo Sr. Augusto às 10:01 pela ferramenta Firefox Hello. Às 10:28, entraram na audioconferência o Sr. Edmar Moretti e o Sr. Paulo Sellera, do Ministério da Saúde. Pelo avançado da hora, deu-se prosseguimento à reunião sem a presença do IBGE.

Augusto abriu explicando os propósitos de cada padrão de metadados. O Data Catalog Vocabulary (DCAT) é um padrão de metadados recomendado pelo W3C para facilitar a interoperabilidade entre catálogos de dados publicados na web. O DCAT-AP é um perfil de metadados baseado no DCAT, produzido por um grupo de trabalho designado pelo programa ISA da Comissão Europeia, com participantes dos governos de diversos países europeus e que foi adotado como padrão oficial para os portais de dados abertos na União Europeia. Produzido em 2013 e revisado em 2015, o objetivo é uniformizar os metadados e possibilitar a pesquisa de conjuntos de dados abertos unificada trazendo resultados de todos os países europeus.

Alegou conhecer pouco do DDI e outros padrões da ANDA, mas parecem ser voltados especificamente para dados estatísticos e/ou aqueles produzidos a partir de pesquisas domiciliares. Assim, seriam um padrão aplicável a um tipo específico de dados abertos. Da mesma forma, os padrões da INDE seriam aplicáveis apenas aos dados que possuam um componente geoespacial.

Moretti afirmou que leu o padrão de metadados DCAT-AP e achou-o demasiado simples e pouco detalhado. Explicou que todos os dados do Ministério da Saúde são ou estatísticos ou geoespaciais. Sugeriu que pudesse ser adotado como padrão o DDI, que é da ANDA, e que possui metadados obrigatórios e opcionais, como linha de base para os metadados da INDA. Argumentou que, caso utilize-se como padrão o DCAT-AP, as organizações públicas se veriam desestimuladas a fornecer metadados mais completos, como os exigidos pelo DDI.

Augusto argumentou que um padrão de metadados para dados abertos gerais precisa ser necessariamente simplificado e generalizado, pois precisa acomodar uma ampla gama de conjuntos de dados abertos de qualquer natureza, ainda que não sejam estatísticos ou geoespaciais. Apesar de ser um padrão europeu, as discussões entre especialistas e a prática entre portais de dados abertos em todo o mundo tem convergido para utilizar o DCAT-AP. Lembra que o padrão de metadados da INDA foi definido antes de se existir os padrões DCAT e DCAT-AT, e por isso ainda não está necessariamente alinhado a estes. Ele está definido na Cartilha Técnica para Publicação de Dados Abertos, seção 7.1, cujo link se encontra no rodapé do Portal Brasileiro de Dados Abertos. O padrão de metadados da INDA já define mais campos como obrigatórios e opcionais que o DCAT-AP.

Assim, uma proposta que poderia ser apresentada seria utilizar o DCAT-AP como perfil mínimo, ou uma revisão do perfil existente de metadados da INDA que esteja alinhado e mapeado a este. Para dados que tivessem uma característica específica (ex.: dados estatísticos, dados resultantes de pesquisas domiciliares, dados geoespaciais, etc.), aplicar-se-ia um padrão de metadados adicional.

Foi questionado por Moretti se, uma vez utilizado um padrão adicional de metadados em um catálogo de dados, como o do Ministério da Saúde, esses metadados adicionais seriam coletados pelo processo de harvesting. Augusto respondeu que sim pois, conforme a documentação da ferramenta ckanext-harvest, pode-se definir metadados extras a serem coletados dos catálogos fonte (Nota: posteriormente verificou-se que a opção default_extras acrescenta metadados nele definidos a conjuntos de dados que forem coletados a partir da fonte, e não traz os metadados extras que já estão definidos na fonte. Sugere-se reavaliar essa questão uma vez que o harvesting estiver operacional).

Augusto lembrou que o CKAN possui uma extensão chamada ckanext-scheming que permite definir um esquema de metadados obrigatórios e opcionais. Ao ativá-lo, os usuários que estão inserido conjuntos de dados verão esses campos aparecer na interface e terão que preenchê-los. Esse procedimento poderia ser usado, assim que revisado o padrão de metadados, e instalado o plugin, para que as pessoas os preencham corretamente.

Moretti lembrou que a extensão ckanext-ddi também apresenta os campos de metadados adicionais na interface do CKAN, mas para o padrão DDI.

Às 11:03, fomos informados pela Sra. Nívia Pereira que a política de segurança de redes do IBGE impediu o acesso ao link da audioconferência e, por isso, não haviam conseguido se conectar.

Definidos como encaminhamentos a tarefa de preparar um documento de visão que estabeleça os relacionamentos entre os padrões de metadados e as situações em que cada um deverá ser usado no âmbito da INDA. A próxima reunião do GT será marcada, com a presença do IBGE, durante a 13ª reunião do Comitê Gestor da INDA no dia 16/6/2016.

Às 11:08, encerrou-se a reunião.

Encaminhamentos

  • Elaborar uma minuta de documento de visão relacionando os padrões de metadados e orientações de em qual situação usá-los
  • Marcar a próxima reunião, com a presença do IBGE, durante a próxima reunião do CGINDA
  • Até a próxima reunião, encontrar uma ferramenta ou solução que viabilize a participação do IBGE