Seminário de Avaliação = Série A: A Deep Learning Method for Climate Agreements via Stochastic Differential Game Approach
-
Palestrantes
Aluno: Thiago Corni Ferreira
-
Informações úteis
Orientadores:
Jiang Zhu - Laboratório Nacional de Computação Científica - LNCC
Banca Examinadora:
Jiang Zhu - Laboratório Nacional de Computação Científica - LNCC (presidente)
José Karam Filho - Laboratório Nacional de Computação Científica - LNCC
Nelson Francisco Favilla Ebecken - Universidade Federal do Rio de Janeiro - COPPE/UFRJ
Suplentes:
Roberto Pinto Souto - Laboratório Nacional de Computação Científica - LNCC
Resumo:Nesta pesquisa propomos um método baseado em deep learning para computar estratégias de equilíbrio de Nash em jogos diferenciais estocásticos. Esse problema é geralmente formulado como um sistema acoplado de equações de Hamilton-Jacobi-Bellman (HJB), equações diferenciais parciais não-lineares cuja solução determina as funções valor de cada jogador e, implicitamente, suas estratégias ótimas. Métodos numéricos tradicionais, como diferenças finitas e elementos finitos, sofrem da maldição da dimensionalidade, tornando-se computacionalmente inviáveis à medida que o número de variáveis de estado cresce. Além disso, por serem métodos baseados em malha, exigem uma discretização do espaço de estado definida a priori, o que é problemático em jogos estocásticos: as trajetórias dos jogadores, sendo guiadas pelo controle ótimo e por ruído estocástico, visitam regiões do espaço de estado que não são conhecidas antecipadamente, exigindo malhas densas ou refinamento adaptativo custoso. Utilizamos uma modificação do Deep Galerkin Method (DGM), que chamamos de Deep Galerkin Fictitous Play que parametriza a solução do sistema HJB por redes neurais profundas, escapando dessa limitação. Como aplicação, formulamos um jogo de controle de poluição transfronteiriça entre N países, modelo que naturalmente gera sistemas com dezenas ou centenas de dimensões de estado. Os resultados esperados incluem superfícies de estratégia de equilíbrio e trajetórias ótimas de emissão e acumulação de poluição, obtidas em dimensões inacessíveis aos métodos convencionais.
-
Mais informações
Pós-graduaçãocopga@llncc.br