Seminário de Avaliação = Série A: A Deep Learning Method for Climate Agreements via Stochastic Differential Game Approach

Dia 25/05 , em webinar

Publicado em 19/05/2026 17h29

Palestrantes
Aluno: Thiago Corni Ferreira
Informações úteis
Orientadores:
Jiang Zhu - Laboratório Nacional de Computação Científica - LNCC

Banca Examinadora:
Jiang Zhu - Laboratório Nacional de Computação Científica - LNCC (presidente)
José Karam Filho - Laboratório Nacional de Computação Científica - LNCC
Nelson Francisco Favilla Ebecken - Universidade Federal do Rio de Janeiro - COPPE/UFRJ

Suplentes:
Roberto Pinto Souto - Laboratório Nacional de Computação Científica - LNCC

Resumo:

Nesta pesquisa propomos um método baseado em deep learning para computar estratégias de equilíbrio de Nash em jogos diferenciais estocásticos. Esse problema é geralmente formulado como um sistema acoplado de equações de Hamilton-Jacobi-Bellman (HJB), equações diferenciais parciais não-lineares cuja solução determina as funções valor de cada jogador e, implicitamente, suas estratégias ótimas. Métodos numéricos tradicionais, como diferenças finitas e elementos finitos, sofrem da maldição da dimensionalidade, tornando-se computacionalmente inviáveis à medida que o número de variáveis de estado cresce. Além disso, por serem métodos baseados em malha, exigem uma discretização do espaço de estado definida a priori, o que é problemático em jogos estocásticos: as trajetórias dos jogadores, sendo guiadas pelo controle ótimo e por ruído estocástico, visitam regiões do espaço de estado que não são conhecidas antecipadamente, exigindo malhas densas ou refinamento adaptativo custoso. Utilizamos uma modificação do Deep Galerkin Method (DGM), que chamamos de Deep Galerkin Fictitous Play que parametriza a solução do sistema HJB por redes neurais profundas, escapando dessa limitação. Como aplicação, formulamos um jogo de controle de poluição transfronteiriça entre N países, modelo que naturalmente gera sistemas com dezenas ou centenas de dimensões de estado. Os resultados esperados incluem superfícies de estratégia de equilíbrio e trajetórias ótimas de emissão e acumulação de poluição, obtidas em dimensões inacessíveis aos métodos convencionais.
Mais informações

Pós-graduação

copga@llncc.br

Seminário de Avaliação = Série A: A Deep Learning Method for Climate Agreements via Stochastic Differential Game Approach

Dia 25/05

webinar