Ir para o Conteúdo 1 Ir para a Página Inicial 2 Ir para o menu de Navegação 3 Ir para a Busca 4 Ir para o Mapa do site 5
Abrir menu principal de navegação
Laboratório Nacional de Computação Científica - LNCC
Termos mais buscados
  • imposto de renda
  • inss
  • assinatura
  • cnh social
  • mei
Termos mais buscados
  • imposto de renda
  • inss
  • assinatura
  • Acesso à Informação
    • Institucional
      • Estrutura Organizacional
      • Competências
      • Base Jurídica
      • Quem é quem
      • O LNCC
      • Horário de Atendimento
      • Atos Normativos
      • Pesquisa, Desenvolvimento e Inovação
      • Programas Nacionais
      • Regimento Interno
      • Termo de Compromisso de Gestão
      • Gestão da Segurança da Informação
      • Identidade Visual e Logomarca
      • Normas e Regramentos de Parcerias
      • Patrimônio e Infraestrutura
      • CJU
    • Ações e Programas
      • Programa, Projetos, Ações, Obras e Atividades
      • Carta de Serviços ao Cidadão
      • Concessões de Recursos Financeiros e Renúncias de Receitas
      • Governança
      • Pesquisa, Desenvolvimento e Inovação
      • Mestrado e Doutorado em Modelagem Computacional
      • Processamento de Alto Desempenho - Santos Dumont
      • Programas Nacionais
      • Programa de Capacitação Institucional - PCI
      • Carta de Serviço ao Cidadão
      • FAT
      • Indicadores de Resultado e Impacto
    • Participação Social
      • Ouvidoria
      • Audiências e Consultorias Públicas
      • Conselhos e Órgãos Colegiados
      • Conferências
      • Editais de Chamamento Público
      • Outras ações
    • Auditorias
      • Prestação de Contas
      • Rol de Responsáveis
      • Relatórios da CGU
      • Plano Anual de Atividades de Auditoria Interna (PAINT)
      • Relatório Anual de Atividades de Auditoria Interna (RAINT)
      • Ações de Supervisão, Controle e Correição
      • Relatórios de Auditorias
      • Relatórios de Gestão
      • Relatórios do Termo de Compromisso de Gestão - TCG
      • Corregedoria
    • Convênios e Transferências
      • Repasses e Transferências
      • Convênios
    • Receitas e Despesas
      • Receita Pública
      • Detalhamento de Programas por Unidade Orçamentária
      • Execução de Despesas, por Unidade Orçamentária
      • Despesas com Diárias e Passagens
      • Notas Ficais Eletrônicas
      • Informação Orçamentária/Despesas
    • Licitações e Contratos
      • Licitações
      • Contratos
      • Plano Anual de Contratações
    • Servidores
      • Servidores
      • Aposentados e Pensionistas
      • Concursos Públicos
      • Relação de Empregados Terceirizados
      • Estagiários
      • Bolsistas
      • Corpo Discente
    • Informações Classificadas
    • Serviço de Informação ao Cidadão (SIC)
    • Dados Abertos
      • Plano de Dados Abertos (PDA)
      • Bases de Dados do PDA
      • Relatório Anual de Execução do PDA
    • Sanções Administrativa
    • Ferramentas e Aspectos Tecnológicos
      • Ferramenta de Pesquisa
      • Transparência Proativa
    • Perguntas Frequentes
    • Agenda de Autoridades
    • Programa de Gestão e Desenvolvimento
    • Bolsas de Pesquisa
      • Bolsa de Projeto - ICMBio e LNCC
    • Transparência Ativa
      • Relatórios de Auditorias
      • Relatórios de Termo de Compromisso de Gestão - TCG
      • Relatórios de Gestão
      • Relatórios de Indicadores
    • Decreto N° 10.779/2021 - Consumo de Energia Elétrica
    • Principais Resultados
    • Fundações de Apoio
    • Privacidade
      • Política de Privacidade
      • Governança
      • Encarregado
      • Canal de Comunicação
      • Referências e Recursos
  • Assuntos
    • Notícias
      • Últimas Notícias
      • LNCC Notícias
    • Eventos
      • Eventos
      • Programa de Verão do LNCC
    • Biblioteca
      • Apresentação
      • Regulamento da Biblioteca
      • Consulta ao Acervo
      • Periódicos
      • Livros Eletrônicos
      • JSTOR - Biological Science
      • Biblioteca Digital de Teses e Dissertações do LNCC
      • Bases de Acesso Restrito
      • Catálogo da Rede Pergamum
      • Repositório Institucional do LNCC
    • Sistemas Administrativos
      • Webmail
      • Intranet
      • SEI-MCTI
    • Pontos de Contato
      • Fale Conosco
      • Ouvidoria
      • Assessoria de Comunicação
  • Canais de Atendimento
    • Fale Conosco
    • Ouvidoria
    • Comunicação Institucional
      • Contato da Comunicação Institucional
      • Clipping/Na mídia
      • Identidade Visual/Manual da Marca
      • Folder Digital
    • Fala.BR
    • Encarregado pelo Tratamento de Dados Pessoais
  • Central de Conteúdos
    • Imagens
    • Vídeos
    • Identidade Visual e Logomarca
    • Campanhas de Conscientização
      • Mês da Consciência Negra
      • Gestão de Segurança da Informação
      • Campanha LGPD
      • Prevenção contra Assédio moral, sexual e discriminação
      • Conflito de Interesses
    • Divulgação Científica
      • Folder e Portfólio
      • LNCC JOVEM
      • LNCC KIDS
  • Composição
    • Diretoria
    • Coordenações
      • Coordenação de Métodos Matemáticos e Computacionais - COMAC
      • Coordenação de Modelagem Computacional - COMOD
      • Coordenação de Pós-graduação e Aperfeiçoamento - COPGA
      • Coordenação de Tecnologia da Informação e Comunicação - COTIC
      • Coordenação de Gestão e Administração - COGEA
    • Órgãos Colegiados
      • Conselhos
      • Comitês
  • Serviços
    • Pesquisa, Desenvolvimento e Inovação
      • Energia Renovável
      • Preservação Ambiental com Geração de Renda
      • Óleo e Gás
      • Mineração
      • Astronomia e Geografia
      • Gêmeos Digitais
      • Medicina Assistida
      • Impacto Social de Políticas Públicas
      • Aeronáutica e Aeroespacial
      • Recursos Hídricos
      • Nanotecnologia
      • Indústria Farmacêutica
      • Supercomputação e Computação Quântica
      • Agronegócio
      • Internet das Coisas (IoT)
      • Sistema Financeiro
      • Saúde pública – epidemias e doenças virais, parasitárias e negligenciadas
      • Esportes
      • Armazenamento de Energia
      • Cosméticos
    • Supercomputador Santos Dumont (HPC-LNCC)
    • Incubadora de Empresas
    • Mestrado e Doutorado em Modelagem Computacional
    • Laboratório de Bioinformática - LABINFO
    • Carta de Serviços ao Cidadão
  • Centro de Memória
  • Supercomputador Santos Dumont
  • SEI-MCTI
  • GOV.BR
    • Serviços
      • Buscar serviços por
        • Categorias
        • Órgãos
        • Estados
      • Serviços por público alvo
        • Cidadãos
        • Empresas
        • Órgãos e Entidades Públicas
        • Demais segmentos (ONGs, organizações sociais, etc)
        • Servidor Público
    • Temas em Destaque
      • Orçamento Nacional
      • Redes de Atendimento do Governo Federal
      • Proteção de Dados Pessoais
      • Serviços para Imigrantes
      • Política e Orçamento Educacionais
      • Educação Profissional e Tecnológica
      • Educação Profissional para Jovens e Adultos
      • Trabalho e Emprego
      • Serviços para Pessoas com Deficiência
      • Combate à Discriminação Racial
      • Política de Proteção Social
      • Política para Mulheres
      • Saúde Reprodutiva da Mulher
      • Cuidados na Primeira Infância
      • Habitação Popular
      • Controle de Poluição e Resíduos Sólidos
    • Notícias
      • Serviços para o cidadão
      • Saúde
      • Agricultura e Pecuária
      • Cidadania e Assistência Social
      • Ciência e Tecnologia
      • Comunicação
      • Cultura e Esporte
      • Economia e Gestão Pública
      • Educação e Pesquisa
      • Energia
      • Forças Armadas e Defesa Civil
      • Infraestrutura
      • Justiça e Segurança
      • Meio Ambiente
      • Trabalho e Previdência
      • Turismo
    • Galeria de Aplicativos
    • Acompanhe o Planalto
    • Navegação
      • Acessibilidade
      • Mapa do Site
      • Termo de Uso e Aviso de Privacidade
    • Consultar minhas solicitações
    • Órgãos do Governo
    • Por dentro do Gov.br
      • Dúvidas Frequentes em relação ao Portal gov.br
      • Dúvidas Frequentes da conta gov.br
      • Ajuda para Navegar o Portal
      • Conheça os elementos do Portal
      • Política de e-participação
      • Termos de Uso
      • Governo Digital
      • Guia de Edição de Serviços do Portal Gov.br
    • Canais do Executivo Federal
    • Dados do Governo Federal
      • Dados Abertos
      • Painel Estatístico de Pessoal
      • Painel de Compras do Governo Federal
      • Acesso à Informação
    • Empresas e Negócios
Links Úteis
  • Galeria de Aplicativos
  • Participe
  • Galeria de Aplicativos
  • Participe
Redes sociais
  • Facebook
  • Instagram
  • YouTube
Você está aqui: Página Inicial Assuntos Eventos Eventos Defesa de Dissertação de Mestrado: Optimizing Data Augmentation to Improve AI model performance
Info

Defesa de Dissertação de Mestrado: Optimizing Data Augmentation to Improve AI model performance

Dia 30/08
Compartilhe por Facebook Compartilhe por Twitter Compartilhe por LinkedIn Compartilhe por WhatsApp link para Copiar para área de transferência
Publicado em 24/08/2021 16h18 Atualizado em 26/08/2021 15h48
  • Palestrantes

    Aluno: Henrique Matheus Ferreira da Silva

  • Informações úteis

    Orientadores:
    Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC

    Banca Examinadora:
    Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC (presidente)
    Marisa Fabiana Nicolás - Laboratório Nacional de Computação Científica - LNCC
    Eduardo Bezerra

    Suplentes:
    Luiz M. R. Gadelha Jr. - Laboratório Nacional de Computação Científica - LNCC
    Marcel de Moraes Pedroso - FIOCRUZ

    Resumo:

    The accuracy of Machine Learning (ML) based classification algorithms is highly dependent on the quality of the training dataset that the corresponding ML model's have been submitted to, as well as on how much the dataset represents the problem being analyzed. However, many research topics have classification problems in which the examples distribution may vary widely, and in which specific classes may be strongly underrepresented (such as patient-specific medicine), or training data may be scarce (such as plant species classification), leading to unbalanced datasets. In both scenarios, this may result in a poor model's efficiency. Data Augmentation Techniques try to mitigate this problem, by expanding the available training data in order to increase models
    performance. In this work, we present two novel techniques for data augmentation over tabular data. First, we present a method denominated SAGAD (Synthetic Data Generator for Tabular Datasets), which is based on the concept of conditional entropy. SAGAD can balance minority classes, at the same time increasing the overall size of the training set. Next, we present an extension of SAGAD for iterative learning algorithms, called DABEL (Data Generation Based on Complexity per Classes), which iteratively produces new training data samples based on class ambiguity. To validate our proposal, we simulated a small data scenario by using datasets well known in literature and also evaluated our methods on real world data. We evaluated SAGAD using four machine learning algorithms and DABEL using a neural network model. To measure our method's performance, we developed a baseline use-case in which models are trained on small data, comparing both SAGAD and DABEL to it. We also
    tested other data augmentation techniques, against SAGAD. SAGAD is implemented and available via AugmenteR(S. Pereira; ferreira da silva; Porto, 2021), which is an R package in CRAN, for data augmentation which currently has more than 1610 downloads.


  • Mais informações
    Pós-graduação do LNCC
    copga@lncc.br
    https://meet.google.com/eio-sdjc-jky

Defesa de Dissertação de Mestrado: Optimizing Data Augmentation to Improve AI model performance

Dia 30/08
Compartilhe por Facebook Compartilhe por Twitter Compartilhe por LinkedIn Compartilhe por WhatsApp link para Copiar para área de transferência
  • Acesso à Informação
    • Institucional
      • Estrutura Organizacional
      • Competências
      • Base Jurídica
      • Quem é quem
      • O LNCC
      • Horário de Atendimento
      • Atos Normativos
      • Pesquisa, Desenvolvimento e Inovação
      • Programas Nacionais
      • Regimento Interno
      • Termo de Compromisso de Gestão
      • Gestão da Segurança da Informação
      • Identidade Visual e Logomarca
      • Normas e Regramentos de Parcerias
      • Patrimônio e Infraestrutura
      • CJU
    • Ações e Programas
      • Programa, Projetos, Ações, Obras e Atividades
      • Carta de Serviços ao Cidadão
      • Concessões de Recursos Financeiros e Renúncias de Receitas
      • Governança
      • Pesquisa, Desenvolvimento e Inovação
      • Mestrado e Doutorado em Modelagem Computacional
      • Processamento de Alto Desempenho - Santos Dumont
      • Programas Nacionais
      • Programa de Capacitação Institucional - PCI
      • Carta de Serviço ao Cidadão
      • FAT
      • Indicadores de Resultado e Impacto
    • Participação Social
      • Ouvidoria
      • Audiências e Consultorias Públicas
      • Conselhos e Órgãos Colegiados
      • Conferências
      • Editais de Chamamento Público
      • Outras ações
    • Auditorias
      • Prestação de Contas
      • Rol de Responsáveis
      • Relatórios da CGU
      • Plano Anual de Atividades de Auditoria Interna (PAINT)
      • Relatório Anual de Atividades de Auditoria Interna (RAINT)
      • Ações de Supervisão, Controle e Correição
      • Relatórios de Auditorias
      • Relatórios de Gestão
      • Relatórios do Termo de Compromisso de Gestão - TCG
      • Corregedoria
    • Convênios e Transferências
      • Repasses e Transferências
      • Convênios
    • Receitas e Despesas
      • Receita Pública
      • Detalhamento de Programas por Unidade Orçamentária
      • Execução de Despesas, por Unidade Orçamentária
      • Despesas com Diárias e Passagens
      • Notas Ficais Eletrônicas
      • Informação Orçamentária/Despesas
    • Licitações e Contratos
      • Licitações
      • Contratos
      • Plano Anual de Contratações
    • Servidores
      • Servidores
      • Aposentados e Pensionistas
      • Concursos Públicos
      • Relação de Empregados Terceirizados
      • Estagiários
      • Bolsistas
      • Corpo Discente
    • Informações Classificadas
    • Serviço de Informação ao Cidadão (SIC)
    • Dados Abertos
      • Plano de Dados Abertos (PDA)
      • Bases de Dados do PDA
      • Relatório Anual de Execução do PDA
    • Sanções Administrativa
    • Ferramentas e Aspectos Tecnológicos
      • Ferramenta de Pesquisa
      • Transparência Proativa
    • Perguntas Frequentes
    • Agenda de Autoridades
    • Programa de Gestão e Desenvolvimento
    • Bolsas de Pesquisa
      • Bolsa de Projeto - ICMBio e LNCC
    • Transparência Ativa
      • Relatórios de Auditorias
      • Relatórios de Termo de Compromisso de Gestão - TCG
      • Relatórios de Gestão
      • Relatórios de Indicadores
    • Decreto N° 10.779/2021 - Consumo de Energia Elétrica
    • Principais Resultados
    • Fundações de Apoio
    • Privacidade
      • Política de Privacidade
      • Governança
      • Encarregado
      • Canal de Comunicação
      • Referências e Recursos
  • Assuntos
    • Notícias
      • Últimas Notícias
      • LNCC Notícias
    • Eventos
      • Eventos
      • Programa de Verão do LNCC
    • Biblioteca
      • Apresentação
      • Regulamento da Biblioteca
      • Consulta ao Acervo
      • Periódicos
      • Livros Eletrônicos
      • JSTOR - Biological Science
      • Biblioteca Digital de Teses e Dissertações do LNCC
      • Bases de Acesso Restrito
      • Catálogo da Rede Pergamum
      • Repositório Institucional do LNCC
    • Sistemas Administrativos
      • Webmail
      • Intranet
      • SEI-MCTI
    • Pontos de Contato
      • Fale Conosco
      • Ouvidoria
      • Assessoria de Comunicação
  • Canais de Atendimento
    • Fale Conosco
    • Ouvidoria
    • Comunicação Institucional
      • Contato da Comunicação Institucional
      • Clipping/Na mídia
      • Identidade Visual/Manual da Marca
      • Folder Digital
    • Fala.BR
    • Encarregado pelo Tratamento de Dados Pessoais
  • Central de Conteúdos
    • Imagens
    • Vídeos
    • Identidade Visual e Logomarca
    • Campanhas de Conscientização
      • Mês da Consciência Negra
      • Gestão de Segurança da Informação
      • Campanha LGPD
      • Prevenção contra Assédio moral, sexual e discriminação
      • Conflito de Interesses
    • Divulgação Científica
      • Folder e Portfólio
      • LNCC JOVEM
      • LNCC KIDS
  • Composição
    • Diretoria
    • Coordenações
      • Coordenação de Métodos Matemáticos e Computacionais - COMAC
      • Coordenação de Modelagem Computacional - COMOD
      • Coordenação de Pós-graduação e Aperfeiçoamento - COPGA
      • Coordenação de Tecnologia da Informação e Comunicação - COTIC
      • Coordenação de Gestão e Administração - COGEA
    • Órgãos Colegiados
      • Conselhos
      • Comitês
  • Serviços
    • Pesquisa, Desenvolvimento e Inovação
      • Energia Renovável
      • Preservação Ambiental com Geração de Renda
      • Óleo e Gás
      • Mineração
      • Astronomia e Geografia
      • Gêmeos Digitais
      • Medicina Assistida
      • Impacto Social de Políticas Públicas
      • Aeronáutica e Aeroespacial
      • Recursos Hídricos
      • Nanotecnologia
      • Indústria Farmacêutica
      • Supercomputação e Computação Quântica
      • Agronegócio
      • Internet das Coisas (IoT)
      • Sistema Financeiro
      • Saúde pública – epidemias e doenças virais, parasitárias e negligenciadas
      • Esportes
      • Armazenamento de Energia
      • Cosméticos
    • Supercomputador Santos Dumont (HPC-LNCC)
    • Incubadora de Empresas
    • Mestrado e Doutorado em Modelagem Computacional
    • Laboratório de Bioinformática - LABINFO
    • Carta de Serviços ao Cidadão
  • Centro de Memória
  • Supercomputador Santos Dumont
  • SEI-MCTI
Redefinir Cookies
Redes sociais
  • Facebook
  • Instagram
  • YouTube
Acesso àInformação
Todo o conteúdo deste site está publicado sob a licença Creative Commons Atribuição-SemDerivações 3.0 Não Adaptada.
Voltar ao topo da página
Fale Agora Refazer a busca