Ir para o Conteúdo 1 Ir para a Página Inicial 2 Ir para o menu de Navegação 3 Ir para a Busca 4 Ir para o Mapa do site 5
Abrir menu principal de navegação
Laboratório Nacional de Computação Científica - LNCC
Termos mais buscados
  • imposto de renda
  • inss
  • assinatura
  • cnh social
  • enem
Termos mais buscados
  • imposto de renda
  • inss
  • assinatura
  • Acesso à Informação
    • Institucional
      • Estrutura Organizacional
      • Competências
      • Base Jurídica
      • Quem é quem
      • O LNCC
      • Horário de Atendimento
      • Atos Normativos
      • Pesquisa, Desenvolvimento e Inovação
      • Programas Nacionais
      • Regimento Interno
      • Termo de Compromisso de Gestão
      • Gestão da Segurança da Informação
      • Identidade Visual e Logomarca
      • Normas e Regramentos de Parcerias
      • Patrimônio e Infraestrutura
      • CJU
    • Ações e Programas
      • Programa, Projetos, Ações, Obras e Atividades
      • Carta de Serviços ao Cidadão
      • Concessões de Recursos Financeiros e Renúncias de Receitas
      • Governança
      • Pesquisa, Desenvolvimento e Inovação
      • Mestrado e Doutorado em Modelagem Computacional
      • Processamento de Alto Desempenho - Santos Dumont
      • Programas Nacionais
      • Programa de Capacitação Institucional - PCI
      • Carta de Serviço ao Cidadão
      • FAT
      • Indicadores de Resultado e Impacto
    • Participação Social
      • Ouvidoria
      • Audiências e Consultorias Públicas
      • Conselhos e Órgãos Colegiados
      • Conferências
      • Editais de Chamamento Público
      • Outras ações
    • Auditorias
      • Prestação de Contas
      • Rol de Responsáveis
      • Relatórios da CGU
      • Plano Anual de Atividades de Auditoria Interna (PAINT)
      • Relatório Anual de Atividades de Auditoria Interna (RAINT)
      • Ações de Supervisão, Controle e Correição
      • Relatórios de Auditorias
      • Relatórios de Gestão
      • Relatórios do Termo de Compromisso de Gestão - TCG
      • Corregedoria
    • Convênios e Transferências
      • Repasses e Transferências
      • Convênios
    • Receitas e Despesas
      • Receita Pública
      • Detalhamento de Programas por Unidade Orçamentária
      • Execução de Despesas, por Unidade Orçamentária
      • Despesas com Diárias e Passagens
      • Notas Ficais Eletrônicas
      • Informação Orçamentária/Despesas
    • Licitações e Contratos
      • Licitações
      • Contratos
      • Plano Anual de Contratações
    • Servidores
      • Servidores
      • Aposentados e Pensionistas
      • Concursos Públicos
      • Relação de Empregados Terceirizados
      • Estagiários
      • Bolsistas
      • Corpo Discente
    • Informações Classificadas
    • Serviço de Informação ao Cidadão (SIC)
    • Dados Abertos
      • Plano de Dados Abertos (PDA)
      • Bases de Dados do PDA
      • Relatório Anual de Execução do PDA
    • Sanções Administrativa
    • Ferramentas e Aspectos Tecnológicos
      • Ferramenta de Pesquisa
      • Transparência Proativa
    • Perguntas Frequentes
    • Agenda de Autoridades
    • Programa de Gestão e Desenvolvimento
    • Bolsas de Pesquisa
      • Bolsa de Projeto - ICMBio e LNCC
    • Transparência Ativa
      • Relatórios de Auditorias
      • Relatórios de Termo de Compromisso de Gestão - TCG
      • Relatórios de Gestão
      • Relatórios de Indicadores
    • Decreto N° 10.779/2021 - Consumo de Energia Elétrica
    • Principais Resultados
    • Fundações de Apoio
    • Privacidade
      • Política de Privacidade
      • Governança
      • Encarregado
      • Canal de Comunicação
      • Referências e Recursos
  • Assuntos
    • Notícias
      • Últimas Notícias
      • LNCC Notícias
    • Eventos
      • Eventos
      • Programa de Verão do LNCC
    • Biblioteca
      • Apresentação
      • Regulamento da Biblioteca
      • Consulta ao Acervo
      • Periódicos
      • Livros Eletrônicos
      • JSTOR - Biological Science
      • Biblioteca Digital de Teses e Dissertações do LNCC
      • Bases de Acesso Restrito
      • Catálogo da Rede Pergamum
      • Repositório Institucional do LNCC
    • Sistemas Administrativos
      • Webmail
      • Intranet
      • SEI-MCTI
    • Pontos de Contato
      • Fale Conosco
      • Ouvidoria
      • Assessoria de Comunicação
  • Canais de Atendimento
    • Fale Conosco
    • Ouvidoria
    • Comunicação Institucional
      • Contato da Comunicação Institucional
      • Clipping/Na mídia
      • Identidade Visual/Manual da Marca
      • Folder Digital
    • Fala.BR
    • Encarregado pelo Tratamento de Dados Pessoais
  • Central de Conteúdos
    • Imagens
    • Vídeos
    • Identidade Visual e Logomarca
    • Campanhas de Conscientização
      • Mês da Consciência Negra
      • Gestão de Segurança da Informação
      • Campanha LGPD
      • Prevenção contra Assédio moral, sexual e discriminação
      • Conflito de Interesses
    • Divulgação Científica
      • Folder e Portfólio
      • LNCC JOVEM
      • LNCC KIDS
  • Composição
    • Diretoria
    • Coordenações
      • Coordenação de Métodos Matemáticos e Computacionais - COMAC
      • Coordenação de Modelagem Computacional - COMOD
      • Coordenação de Pós-graduação e Aperfeiçoamento - COPGA
      • Coordenação de Tecnologia da Informação e Comunicação - COTIC
      • Coordenação de Gestão e Administração - COGEA
    • Órgãos Colegiados
      • Conselhos
      • Comitês
  • Serviços
    • Pesquisa, Desenvolvimento e Inovação
      • Energia Renovável
      • Preservação Ambiental com Geração de Renda
      • Óleo e Gás
      • Mineração
      • Astronomia e Geografia
      • Gêmeos Digitais
      • Medicina Assistida
      • Impacto Social de Políticas Públicas
      • Aeronáutica e Aeroespacial
      • Recursos Hídricos
      • Nanotecnologia
      • Indústria Farmacêutica
      • Supercomputação e Computação Quântica
      • Agronegócio
      • Internet das Coisas (IoT)
      • Sistema Financeiro
      • Saúde pública – epidemias e doenças virais, parasitárias e negligenciadas
      • Esportes
      • Armazenamento de Energia
      • Cosméticos
    • Supercomputador Santos Dumont (HPC-LNCC)
    • Incubadora de Empresas
    • Mestrado e Doutorado em Modelagem Computacional
    • Laboratório de Bioinformática - LABINFO
    • Carta de Serviços ao Cidadão
  • Centro de Memória
  • Supercomputador Santos Dumont
  • SEI-MCTI
  • GOV.BR
    • Serviços
      • Buscar serviços por
        • Categorias
        • Órgãos
        • Estados
      • Serviços por público alvo
        • Cidadãos
        • Empresas
        • Órgãos e Entidades Públicas
        • Demais segmentos (ONGs, organizações sociais, etc)
        • Servidor Público
    • Temas em Destaque
      • Orçamento Nacional
      • Redes de Atendimento do Governo Federal
      • Proteção de Dados Pessoais
      • Serviços para Imigrantes
      • Política e Orçamento Educacionais
      • Educação Profissional e Tecnológica
      • Educação Profissional para Jovens e Adultos
      • Trabalho e Emprego
      • Serviços para Pessoas com Deficiência
      • Combate à Discriminação Racial
      • Política de Proteção Social
      • Política para Mulheres
      • Saúde Reprodutiva da Mulher
      • Cuidados na Primeira Infância
      • Habitação Popular
      • Controle de Poluição e Resíduos Sólidos
    • Notícias
      • Serviços para o cidadão
      • Saúde
      • Agricultura e Pecuária
      • Cidadania e Assistência Social
      • Ciência e Tecnologia
      • Comunicação
      • Cultura e Esporte
      • Economia e Gestão Pública
      • Educação e Pesquisa
      • Energia
      • Forças Armadas e Defesa Civil
      • Infraestrutura
      • Justiça e Segurança
      • Meio Ambiente
      • Trabalho e Previdência
      • Turismo
    • Galeria de Aplicativos
    • Acompanhe o Planalto
    • Navegação
      • Acessibilidade
      • Mapa do Site
      • Termo de Uso e Aviso de Privacidade
    • Consultar minhas solicitações
    • Órgãos do Governo
    • Por dentro do Gov.br
      • Dúvidas Frequentes em relação ao Portal gov.br
      • Dúvidas Frequentes da conta gov.br
      • Ajuda para Navegar o Portal
      • Conheça os elementos do Portal
      • Política de e-participação
      • Termos de Uso
      • Governo Digital
      • Guia de Edição de Serviços do Portal Gov.br
    • Canais do Executivo Federal
    • Dados do Governo Federal
      • Dados Abertos
      • Painel Estatístico de Pessoal
      • Painel de Compras do Governo Federal
      • Acesso à Informação
    • Empresas e Negócios
Links Úteis
  • Galeria de Aplicativos
  • Participe
  • Galeria de Aplicativos
  • Participe
Redes sociais
  • Facebook
  • Instagram
  • YouTube
Você está aqui: Página Inicial Assuntos Eventos Eventos Defesa de Dissertação de Mestrado: Um Caso de Estudo de Aprendizado de Máquina para Otimizar Configurações de Submissões de Gateways Científicos Baseado no BioinfoPortal
Info

Defesa de Dissertação de Mestrado: Um Caso de Estudo de Aprendizado de Máquina para Otimizar Configurações de Submissões de Gateways Científicos Baseado no BioinfoPortal

Dia 15/12 , em Webinar
Compartilhe por Facebook Compartilhe por Twitter Compartilhe por LinkedIn Compartilhe por WhatsApp link para Copiar para área de transferência
Publicado em 11/12/2023 07h19
  • Palestrantes

    Aluno: Micaella Coelho Valente de Paula

  • Informações úteis

    Orientadores:
    Kary Ann del Carmen Ocaña Gautherot - Laboratório Nacional de Computação Científica - LNCC

    Banca Examinadora:
    Kary Ann del Carmen Ocaña Gautherot - Laboratório Nacional de Computação Científica - LNCC (presidente)
    Marcelo Trindade dos Santos - Laboratório Nacional de Computação Científica - LNCC
    Francieli Boito - UFRGS

    Suplentes:
    Fábio Lima Custódio - Laboratório Nacional de Computação Científica - LNCC
    Luiz Manoel Rocha Gadelha Júnior - Laboratório Nacional de Computação Científica - LNCC

    Resumo:

    O BioinfoPortal (https://bioinfo.lncc.br/) é fruto da colaboração entre pesquisadores do LABINFO, CENAPAD-RJ e SINAPAD. Ele facilita o acesso aos recursos computacionais do supercomputador Santos Dumont (SDumont, https://sdumont.lncc.br) para executar aplicações e workflows científicos de bioinformática de forma paralela e distribuída. O desempenho geral do BioinfoPortal depende, em grande parte, da combinação de parâmetros necessários para configurar o ambiente de execução de cada aplicação no portal, que atualmente, são predefinidas, sem otimização. No entanto, por meio do uso de aprendizado de máquina, é possível inferir uma configuração personalizada com base na melhor combinação de parâmetros, como número de nós, threads, fila de submissão e cluster, o que tem o potencial de melhorar consideravelmente o desempenho do portal. A proposta desta pesquisa envolve o desenvolvimento de uma ferramenta baseada em aprendizado de máquina para inferir a combinação de parâmetros que resultam em um bom desempenho das aplicações do BioinfoPortal, usando como caso de estudo a aplicação RAxML. Essa ferramenta, d enominada ML-Bio, visa melhorar o desempenho do BioinfoPortal, personalizando a configuração de acordo com as necessidades de cada aplicação. Tendo em vista a implementação da ferramenta com as adaptações necessárias para todas as aplicações do portal e sua integração à arquitetura do BioinfoPortal, é possível melhorar o desempenho e a eficiência, tanto do BioinfoPortal quanto do SDumont. Para desenvolver a ferramenta, foi necessário criar uma base de dados com informações sobre as execuções da aplicação RAxML, que serviram para treinar os modelos preditivos, o Extra Trees Classifier e o Extra Trees Regressor, utilizados nesta pesquisa. Esses dados foram obtidos através da coleta e armazenamento de informações de desempenho relacionadas ao comportamento da aplicação em relação ao tempo de execução e o consumo de memória em várias execuções do RAxML. Essas execuções variaram parâmetros, como o parâmetro de entrada da aplicação (bootstrap) e as configurações de alocação de recursos do SDumont (número de threads e nós). Para coletar esses dados, foi utilizado o comando "sacct" do sistema de gerenciamento de recursos do SDumont, o Slurm, coletando seis parâmetros chamados de variáveis de saída: MaxVMSize, AveVMSize, MaxRSS, AveCPU, CPUTime e Elapsed. Para determinar a quantidade ideal de nós nas configurações dos arquivos de entrada testados, foi realizado um experimento em larga escala, que incluiu várias análises de desempenho e comparações entre os resultados previstos pelo modelo e os dados reais encontrados na base de dados. Essas comparações demonstram a proximidade entre a previsão do modelo e os resultados reais. Foi observado um aumento no tempo de execução à medida que o valor do bootstrap aumenta. Contudo, esse aumento não afetou consideravelmente o comportamento da aplicação em relação ao número de threads e nós. Independentemente do número de nós testados, a utilização de 6 threads é a melhor opção, permitindo o compartilhamento de recursos entre tare fas de aplicações diferentes ou entre diferentes tarefas do RAxML. Além disso, ao aumentar o número de nós, há uma redução do tempo de execução, embora esse efeito tenha sido menos observado em configurações com valores de bootstrap mais baixos. Ao avaliar a quantidade ideal de nós, os resultados indicam que, para configurações com mais de 100 bootstrap, a alocação de 5 nós proporciona o melhor desempenho. No entanto, quando o valor do bootstrap é igual a 10, mais de 1 nó se torna ineficiente, ocasionando uma subutilização dos recursos computacionais. Com base nesses resultados e análises, foi desenvolvida a ferramenta ML-Bio para prever a quantidade ideal de nós para a execução do RAxML, considerando um tempo de execução aceitável. Ao projetá-la, foi levada em consideração não apenas a diminuição do tempo de execução, mas também a alocação de recursos de forma mais eficiente. Buscando uma alocação mínima de recursos para atingir um tempo de execução mais adequado, levando em conta um acréscimo percentual ao tempo previsto para a execução com todos os recursos disponíveis. Isso possibilita a otimização do uso de recursos, diminuindo a quantidade de nós necessários para alcançar o tempo de execução desejado, ao mesmo tempo em que garantimos um desempenho aceitável.

  • Mais informações
    Pós-graduação do LNCC
    copga@lncc.br
    meet.google.com/pxr-otgh-ves

Defesa de Dissertação de Mestrado: Um Caso de Estudo de Aprendizado de Máquina para Otimizar Configurações de Submissões de Gateways Científicos Baseado no BioinfoPortal

Dia 15/12
Webinar
Compartilhe por Facebook Compartilhe por Twitter Compartilhe por LinkedIn Compartilhe por WhatsApp link para Copiar para área de transferência
  • Acesso à Informação
    • Institucional
      • Estrutura Organizacional
      • Competências
      • Base Jurídica
      • Quem é quem
      • O LNCC
      • Horário de Atendimento
      • Atos Normativos
      • Pesquisa, Desenvolvimento e Inovação
      • Programas Nacionais
      • Regimento Interno
      • Termo de Compromisso de Gestão
      • Gestão da Segurança da Informação
      • Identidade Visual e Logomarca
      • Normas e Regramentos de Parcerias
      • Patrimônio e Infraestrutura
      • CJU
    • Ações e Programas
      • Programa, Projetos, Ações, Obras e Atividades
      • Carta de Serviços ao Cidadão
      • Concessões de Recursos Financeiros e Renúncias de Receitas
      • Governança
      • Pesquisa, Desenvolvimento e Inovação
      • Mestrado e Doutorado em Modelagem Computacional
      • Processamento de Alto Desempenho - Santos Dumont
      • Programas Nacionais
      • Programa de Capacitação Institucional - PCI
      • Carta de Serviço ao Cidadão
      • FAT
      • Indicadores de Resultado e Impacto
    • Participação Social
      • Ouvidoria
      • Audiências e Consultorias Públicas
      • Conselhos e Órgãos Colegiados
      • Conferências
      • Editais de Chamamento Público
      • Outras ações
    • Auditorias
      • Prestação de Contas
      • Rol de Responsáveis
      • Relatórios da CGU
      • Plano Anual de Atividades de Auditoria Interna (PAINT)
      • Relatório Anual de Atividades de Auditoria Interna (RAINT)
      • Ações de Supervisão, Controle e Correição
      • Relatórios de Auditorias
      • Relatórios de Gestão
      • Relatórios do Termo de Compromisso de Gestão - TCG
      • Corregedoria
    • Convênios e Transferências
      • Repasses e Transferências
      • Convênios
    • Receitas e Despesas
      • Receita Pública
      • Detalhamento de Programas por Unidade Orçamentária
      • Execução de Despesas, por Unidade Orçamentária
      • Despesas com Diárias e Passagens
      • Notas Ficais Eletrônicas
      • Informação Orçamentária/Despesas
    • Licitações e Contratos
      • Licitações
      • Contratos
      • Plano Anual de Contratações
    • Servidores
      • Servidores
      • Aposentados e Pensionistas
      • Concursos Públicos
      • Relação de Empregados Terceirizados
      • Estagiários
      • Bolsistas
      • Corpo Discente
    • Informações Classificadas
    • Serviço de Informação ao Cidadão (SIC)
    • Dados Abertos
      • Plano de Dados Abertos (PDA)
      • Bases de Dados do PDA
      • Relatório Anual de Execução do PDA
    • Sanções Administrativa
    • Ferramentas e Aspectos Tecnológicos
      • Ferramenta de Pesquisa
      • Transparência Proativa
    • Perguntas Frequentes
    • Agenda de Autoridades
    • Programa de Gestão e Desenvolvimento
    • Bolsas de Pesquisa
      • Bolsa de Projeto - ICMBio e LNCC
    • Transparência Ativa
      • Relatórios de Auditorias
      • Relatórios de Termo de Compromisso de Gestão - TCG
      • Relatórios de Gestão
      • Relatórios de Indicadores
    • Decreto N° 10.779/2021 - Consumo de Energia Elétrica
    • Principais Resultados
    • Fundações de Apoio
    • Privacidade
      • Política de Privacidade
      • Governança
      • Encarregado
      • Canal de Comunicação
      • Referências e Recursos
  • Assuntos
    • Notícias
      • Últimas Notícias
      • LNCC Notícias
    • Eventos
      • Eventos
      • Programa de Verão do LNCC
    • Biblioteca
      • Apresentação
      • Regulamento da Biblioteca
      • Consulta ao Acervo
      • Periódicos
      • Livros Eletrônicos
      • JSTOR - Biological Science
      • Biblioteca Digital de Teses e Dissertações do LNCC
      • Bases de Acesso Restrito
      • Catálogo da Rede Pergamum
      • Repositório Institucional do LNCC
    • Sistemas Administrativos
      • Webmail
      • Intranet
      • SEI-MCTI
    • Pontos de Contato
      • Fale Conosco
      • Ouvidoria
      • Assessoria de Comunicação
  • Canais de Atendimento
    • Fale Conosco
    • Ouvidoria
    • Comunicação Institucional
      • Contato da Comunicação Institucional
      • Clipping/Na mídia
      • Identidade Visual/Manual da Marca
      • Folder Digital
    • Fala.BR
    • Encarregado pelo Tratamento de Dados Pessoais
  • Central de Conteúdos
    • Imagens
    • Vídeos
    • Identidade Visual e Logomarca
    • Campanhas de Conscientização
      • Mês da Consciência Negra
      • Gestão de Segurança da Informação
      • Campanha LGPD
      • Prevenção contra Assédio moral, sexual e discriminação
      • Conflito de Interesses
    • Divulgação Científica
      • Folder e Portfólio
      • LNCC JOVEM
      • LNCC KIDS
  • Composição
    • Diretoria
    • Coordenações
      • Coordenação de Métodos Matemáticos e Computacionais - COMAC
      • Coordenação de Modelagem Computacional - COMOD
      • Coordenação de Pós-graduação e Aperfeiçoamento - COPGA
      • Coordenação de Tecnologia da Informação e Comunicação - COTIC
      • Coordenação de Gestão e Administração - COGEA
    • Órgãos Colegiados
      • Conselhos
      • Comitês
  • Serviços
    • Pesquisa, Desenvolvimento e Inovação
      • Energia Renovável
      • Preservação Ambiental com Geração de Renda
      • Óleo e Gás
      • Mineração
      • Astronomia e Geografia
      • Gêmeos Digitais
      • Medicina Assistida
      • Impacto Social de Políticas Públicas
      • Aeronáutica e Aeroespacial
      • Recursos Hídricos
      • Nanotecnologia
      • Indústria Farmacêutica
      • Supercomputação e Computação Quântica
      • Agronegócio
      • Internet das Coisas (IoT)
      • Sistema Financeiro
      • Saúde pública – epidemias e doenças virais, parasitárias e negligenciadas
      • Esportes
      • Armazenamento de Energia
      • Cosméticos
    • Supercomputador Santos Dumont (HPC-LNCC)
    • Incubadora de Empresas
    • Mestrado e Doutorado em Modelagem Computacional
    • Laboratório de Bioinformática - LABINFO
    • Carta de Serviços ao Cidadão
  • Centro de Memória
  • Supercomputador Santos Dumont
  • SEI-MCTI
Redefinir Cookies
Redes sociais
  • Facebook
  • Instagram
  • YouTube
Acesso àInformação
Todo o conteúdo deste site está publicado sob a licença Creative Commons Atribuição-SemDerivações 3.0 Não Adaptada.
Voltar ao topo da página
Fale Agora Refazer a busca