Notícias

Open Data Day: AN debate produção, acesso e preservação de dados abertos

Publicado em 09/03/2021 15h07 Atualizado em 10/03/2021 00h42

O Arquivo Nacional recebeu especialistas e cidadãos para celebrar, pela segunda vez consecutiva*, o dia internacional dos dados abertos – Open Data Day. Neste ano, a comemoração da data (6 de março) foi realizada totalmente on-line, por meio das apresentações de John Sheridan, do Arquivo Nacional do Reino Unido (com tradução simultânea para o português), e de Caroline Burle, do chapter de São Paulo do World Wide Web Consortium (W3C), que puderam interagir e responder às perguntas do público participante.

*veja aqui o relato do usuário Augusto Herrmann sobre o Open Data Day do ano passado

Na abertura, a Diretora-Geral do AN Neide De Sordi ressaltou a participação da instituição em iniciativas de dados abertos no Brasil, como a proposta de compromisso “Gestão de dados governamentais abertos para a preservação, interoperabilidade, acesso e reúso” para compor o 5º Plano de Ação Nacional de Governo Aberto. Paralelamente, como custodiador da documentação da administração pública federal e órgão central do Sistema de Gestão de Documentos e Arquivos (Siga), o AN está participando do processo de avaliação de governo aberto da Organização para a Cooperação e Desenvolvimento Econômico (OCDE), no âmbito do acordo de cooperação em integridade pública firmado entre o governo federal e a entidade internacional.

Diretor digital do The National Archives UK – TNA UK, John Sheridan falou sobre o papel e a importância de um arquivo público no que diz respeito a dados abertos, uma vez que eles traduzem uma forma de se enxergar o governo e o Estado, suas decisões e suas ações. Segundo ele, é possível entender como um governo entende um país por meio dos dados que seu arquivo nacional disponibiliza para o público.

Em sua apresentação, Sheridan recorreu a registros datados do século XI, para falar sobre como a produção de documentos com uma determinada função primária pode possibilitar outros usos ao longo tempo. O exemplo dado foi o livro (Domesday), com dados coletados pelos povos normandos para resolver questões relacionadas à propriedade de terras, para fins de tributação, que assumiu uma função secundária no auxílio aos pesquisadores para o entendimento da organização social na época.

Ao falar de representação de dados, o diretor do TNA fez uso da famosa “alegoria da caverna”, proposta pelo filósofo grego Platão, segundo a qual homens acorrentados em uma caverna enxergam a realidade por meio de sombras projetadas na parede. Da mesma forma, modelos de dados abertos são uma representação da realidade e, se a visão dos dados for muito limitada, a visão da realidade também será. Sheridan apontou que, sendo assim, alguns modelos de dados, especialmente os estatísticos e os que já passaram por curadoria, tendem a ser mais úteis que outros, apesar de todos serem representações limitadasda realidade.

Outro ponto fundamental seria a qualidade desses dados abertos. Para o palestrante, a análise de big data permitiu trabalhar com grupos de dados muito grandes, e profissionais de arquivos podem contribuir para o aprimoramento desses dados, por conhecerem suas características (produção, contexto, manutenção etc.), o que é importante para o processamento em larga escala. Em outro exemplo advindo de sua experiência profissional, Sheridan abordou o gerenciamento das leis do Reino Unido, que é atribuição do TNA. Em decorrência da saída do país da União Europeia (Brexit), o arquivo nacional britânico teve que capturar atos legislativos e decisões judiciais, fornecidos como dados abertos pela Comissão Europeia, para sua base de dados de legislação, o que possibilitou a substituição por leis e jurisprudência nacionais a partir de então. O diretor digital frisou que, sem obter dados descritivos (ou metadados) precisos e de boa qualidade, seria difícil dizer quais dados estariam relacionados com os atos legislativos que deveriam ser capturados.

Em sua conclusão, Sheridan enfatizou a participação do TNA UK no estabelecimento de princípios para a padronização de dados abertos governamentais, de maneira a possibilitar o compartilhamento de informações, internamente e com outros governos, assim como o consumo dos dados pelos usuários-cidadãos. Além disso, a preservação digital, segundo Sheridan, modificou os paradigmas para o armazenamento dos dados a serem disponibilizados de forma aberta, devido ao desafio da evolução do mercado que produz novas tecnologias e torna outras obsoletas, ao mesmo tempo em que oferece opções para resguardar a integridade dos dados, como a criptografia.

A segunda palestrante da manhã, Caroline Burle, é responsável pelas relações institucionais do Centro de Estudos sobre Tecnologias Web (Ceweb.br) e do W3C no Brasil, e uma das editoras do padrão “Data on the Web Best Practices” (“Boas práticas para dados na web”).

No evento, ela iniciou sua apresentação, falando sobre o ciclo de dados na web, desde sua criação, passando por sua extração das fontes originais e pela transformação para acesso posterior.

Como a íntegra de seu trabalho na elaboração e descrição de boas práticas para dados abertos excederia o tempo da apresentação, Burle destacou algumas recomendações para ilustrar o que foi desenvolvido.

Dentre as práticas citadas, estavam:

- fornecer os metadados dos dados abertos;

- dar informações sobre a procedência dos dados;

- indicar a versão dos dados;

- publicar os dados em múltiplos formatos de arquivo;

- dar preferência a vocabulários padronizados;

- oferecer o download em massa dos dados;

- preservar os indicadores fornecidos; e

- coletar feedback dos consumidores dos dados.

São, ao todo, 35 boas práticas, que, segundo a palestrante, geram diversos benefícios, tais como: compreensão e processabilidade de melhor qualidade; facilidade de descoberta, acesso e reúso dos dados; maiores confiança, conectividade e interoperabilidade em relação aos dados abertos.

Para assistir às apresentações do Open Data Day no AN, acesse nosso YouTube.