Notícias

Inaugurado o primeiro datacenter destinado à integração de dados administrativos e de saúde do Brasil

Publicado em 14/06/2022 16h42 Atualizado em 15/06/2022 18h39

No dia 9 de junho, o Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs), vinculado à Fiocruz Bahia, inaugurou o primeiro datacenter destinado à integração de dados administrativos e de saúde do Brasil. Alocado em um container em anexo ao Edifício Tecnocentro, em Salvador, Bahia, onde o Cidacs funciona, o datacenter permitirá a ampliação da eficiência no processamento da base de dados sociais e de saúde do próprio Centro. Criado em 2016, o Cidacs  atualmente desenvolve dezenas de projetos científicos, dedicados a investigar o impacto de políticas sociais e de saúde na população, em parcerias e colaborações nacionais e internacionais, utilizando grandes volumes de dados disponíveis no âmbito de plataformas como  a Coorte de 100 Milhões de Brasileiros; a Plataforma Zika; Tecnologias e Inovações para o SUS; Equidade e Sustentabilidade Urbana; Bioinformática e Epidemiologia Genética (Epigen).“O datacenter aumenta nossa capacidade de absorver novos projetos de pesquisa e dá mais agilidade aos projetos em curso”, afirma o coordenador do Cidacs e bolsista de Produtividade em Pesquisa do CNPq, professor Mauricio Lima Barreto.

A cerimônia de inauguração do datacenter aconteceu no último dia 9 de junho, no auditório do Edifício Tecnocentro, no Parque Tecnológico da Bahia, em Salvador, com a presença da Diretora Substituta de Ciências Agrárias, Biológicas e da Saúde (DABS) do CNPq, Raquel de Andrade Lima Coelho. Embora o datacenter tenha financiamento direto da Fundação Bill e Melinda Gates, o CNPq participou do início do processo, pois forneceu um dos primeiros auxílios para a instalação e o desenvolvimento do Cidacs.  Por meio da Chamada n° 47/2014, o CNPq repassou recursos no total de pouco mais de R$ 3,4 milhões para o projeto do Cidacs.

O evento contou com a participação da Coordenadora-Geral do Programa de Pesquisa em Saúde do CNPq, Raquel de Andrade Lima Coelho (segunda da esquerda para a direita). Foto: divulgação.

A estrutura do datacenter contém sistemas computacionais que agregam a Sala Segura do Cidacs, que abriga os dados individualizados e que precisam estar protegidos; o ambiente de análise e a área administrativa; bem como o sistema de telecomunicações e gerador de energia elétrica.“Já estão instalados dois clusters computacionais (infraestrutura de computação distribuída), que serão ampliados, e outro cluster que será instalado até o final do ano de 2022”, explica o responsável pela Plataforma de Dados do Cidacs, Roberto Carreiro. Segundo ele, esses recursos computacionais proporcionarão aos projetos do Cidacs um total aproximado de 2.600 hilos de processamento em CPU (vCPU) e 240.000 em GPU (Cuda), capacidade de memória de 24 terabytes e 2,5 petabytes de armazenamento.

O Cidacs surgiu com uma proposta inovadora de conduzir estudos e pesquisas a partir de plataforma que permitisse a utilização de grandes volumes de dados individualizados. A estratégia permitia uma produção científica ágil e capaz de alcançar evidências científicas em proporções inéditas de forma rápida e a custos baixos. O Centro usa dados administrativos de vários sistemas de informação sociais e de saúde do governo brasileiro e executa uma série de procedimentos – como limpeza, padronização e harmonização – para adequá-los para suas investigações. Um dos principais produtos é a coorte com dados administrativos, constituída com dados de mais de 130 milhões de indivíduos pertencentes a famílias com baixa renda (que recebem renda per capita de menos de três salários mínimos) e  elegíveis para programas sociais do governo federal. Pesquisas sobre hanseníase, zika, dengue, covid-19, além de investigações sobre saúde mental exploram a coorte para uma análise mais eficaz sobre políticas sociais e de saúde ao longo do tempo.