Palestras
O que é assimilação de dados?
Prof. Alberto Carrassi (University of Bologna, Italy, and University of Reading, UK)
Resumo:
O seminário é centrado em definir o que é assimilação de dados, destacando sua importância na operação de previsão usando modelos matemáticos de equações de evolução. O desenvolvimento das técnicas de assimilação de dados serão vistas com exemplos de aplicação. Desafios teóricos e práticos serão descritos.
Relaxação newtoniana e abortagem para-trás e para-frente em assimilação de dados
Prof. Didier Auroux (Université Côte d'Azur, France)
Resumo:
Nudging é um método de assimilação de dados que usa relaxação dinâmica para ajustar um modelo seguindo as observações. O algorítmo padrão nudging consiste em adicionar ao modelo equações de um termo de retropropagação proporcional à diferença entre as observações e o correspondente estado do modelo. Também conhecido como o observador (ou assimptótico) de Luenberger, teoricamente requer um período de cobertura de tempo infinito. O algorítmo Back and Forth Nudging (BFN) foi introduzido para extender a eficiência nudging para períodos de tempo finitos/pequenos. O método consiste em alternadamente resolver o modelo para frente e para trás no tempo, com termo de nudging em ambos os casos na janela de assimilação. As abordagens podem ser extendidas para observadores mais complexos, nos quais variáveis não observadas podem também ser corrigidas junto com as observadas. Nesta palestra, daremos uma visao geral de nudging, observadores e algorítmos backward-forward com aplicações em oceanografia dinâmica de fluidos.
Dos mínimos quadrados ao filtro de Kalman, filtro de partículas e além
Dr. Haroldo F. de Campos Velho (Instituto Nacional de Pesquisas Espaciais, Brasil)
Resumo:
O seminário apresenta o desenvolvimento histórico da teoria de estimação dos mínimos quadrados ao filtro de Kalman. O tópico para estimar a matriz de co-variança para o erro de modelagem será tratado, descrecendo as metodologias desenvolvidas para este cálculo. Examplos de assimilação de dados usando o filtro de Kalman serão descritos. Esquemas alternativos para assimilação de dados considerando dinâmica estocástica não gaussiana serão também apresentados, mesmo quando os momentos estatísticos não estejam definidos. Finalmente, técnicas baseadas em aprendizado de máquina para emular o filtro de Kalman reduzindo o esforço computacional serão também mostrados.
Filtro de Kalman por conjunto
Dr. Takemasa Miyoshi (RIKEN Center for Computational Science, Japan)
Resumo:
O filtro de Kalman por conjunto (EnKF) é um filtro sequencial para assimilação de dados em modelos geofísicos. O EnKF calcula a matriz de co-variância para o erro de modelagem baseado na previsão por conjunto. EnKF está relacionado ao filtro de partículas, mas baseado em hipótese de quase-linearidade e gaussianidade. Neste seminário, atenção especial é dedicada ao EnKF Local para aplicações geofísicas de alta dimensão.
Interpolação ótima e métodos variacionais (3D/4D)
Resumo:
Nesta palestra, duas metodologias para assimilação de dados serão mostradas: interpolação ótima (IO) e técnicas variacionais (3D-Var e 4D-Var). Descreverei como a fórmula de IO é deduzida a partir de um estimador linear não tendencioso (BLUE: Best Linear Unbiased Estimator). Nós então iremos ver uma ponte entre a formulação de IO e assimilação variacional tri-dimensional (3D-Var). Assimilação variacional quadri-dimensional (4D-Var) é vista como uma extensão de 3D-Var incorporando um modelo de previsão e será então deduzida. Implementações práticas para 3D-Var e 4D-Var serão discutidas e comentários sobre os desafios serão mencionados.
Abordagem livre de equação adjunta para assimilação de dados variacional 4D
Dr. Max Yaremchuk (Naval Research Laboratory, Stennis Space Center, USA)
Resumo:
Desenvolvimento e manutenção de um código com equações linearizadas e adjuntas de modelos avançados de circulação é uma tarefa desafiadora, requerendo uma porção significante do esforço total na operação de assimilação de dados 4D-Var. Técnicas de assimilação baseada em conjuntos permite uma alternativa livre de derivadas, que parece ser competitive com abordagens tradicionais de métodos variacionais em muitas aplicações práticas. Esta apresentação dá uma visao geral dos métodos, que empregam informação de conjunto para calcular sensibilidades dos modelos numéricos e seus parâmetros livres e para estimar os gradients da função custo no processo de soluções ótimas do modelo para observações.
Métodos híbridos: O melhor de filtros de Kalman por conjunto e métodos variacionais
Prof. Marc Bocquet (CEREA École des Ponts & EdF R&D, Île-de-France, France)
Resumo:
Neste seminário, explicarei como as vantagens e desvantagens dos filtros Kalman por conjuntos e dos métodos variacionais levaram a propor novos métodos híbridos de assimilação de dados que capturassem o melhor dos dois mundos. Este seminário será baseado principalmente nos aspectos metodológicos mostrando porque e como esses métodos híbridos foram criados. Primeiro, compararei a filtragem de conjunto e os métodos variacionais. Em seguida, descreverei os principais métodos híbridos disponíveis, que agruparei em categorias, como os métodos baseados em matrizes de covariância híbridas, a assimilação de dados por conjuntos (EDAs), o filtro de Kalman por conjunto iterativo (IEnKS) e o 4DEnVar. Seu desempenho e potencial serão ilustrados com modelos numéricos.
Sobre filtros de partículas e filtros de fluxo de partículas e suavizador: seguindo para assimilação de dados totalmente não linear
Prof. Peter Jan van Leeuwen (Colorado State University, USA)
Resumo:
Neste seminário, mostrarei uma introdução aos filtros de partículas, filtros de fluxo de partículas e estratégias tipo smoother para abordar o procedimento de assimilação de dados. Estas técnicas serão aplicadas a modelos fortemente não lineares, descrevendo dinâmicas desafiadoras, onde métodos avançados de assimilação de dados podem apresentar um melhor desempenho.
Assimilação de dados por redes neurais em modelos de circulação oceânica
Dr. Olmo Zavala-Romero (Florida State University, USA)
Resumo:
Assimilação de dados (DA) exige um enorme esforço computacional para os sistemas de previsão oceânica global e em escala regional de alta resolução, em tempo real. O sistema HYCOM (HYbrid Coordinate Ocean Model) é nosso foco de aplicação de técnicas de DA. Neste seminário, são apresentados e discutidos resultados de redes neurais para DA para o modelo de circulação oceânica, incluindo a precisão da análise e o desempenho computacional do método.
Assimilação de dados em modelos de clima espacial
Prof. Ludger Scherliess (Utah State University, USA)
Resumo:
Métodos de assimilação de dados baseados em física têm sido usados em meteorologia e oceanografia e agora estão se tornando predominantes para especificações e previsões do ambiente especial próximo da Terra. Este aumento do uso de assimilação de dados para esta região coincide com o aumento de dados disponíveis para assimilação. De particular interesse é a parte ionizada da atmosfera superior da Terra, chamada ionosfera, devido ao seu alto impacto nos sistemas tecnológicos. Em anos recentes, modelos de assimilação para esta região foram desenvolvidos para assimilar vários tipos de dados, incluindo observações de estações de superfície e satélites. Os modelos diferem grandemente em sua complecidade e esquemas de assimilação de dados incluem filtro de Kalman por conjunto e método variacional 4D. Vamos introduzir o uso de assimilação de dados para o ambiente especial e abordar várias técnicas. Exemplos serão apresentados para discutir suas vantagens e desvantagens.
Assimilação de dados em hidrologia por redes neurais
Prof. Marie-Amélie Boucher (Univesity of Sherbrooke, Canada; visiting scientist of the European Center for Medium Range Weather Forecasts, UK)
Resumo:
Neste minicurso, primeiramente irei fornecer uma introdução e explicar a metodologia que propus em 2020 como prova de conceito de que é possível usar Multilayer Perceptrons e Extreme Learning Machines para realizar a assimilação de dados hidrológicos. Este método baseia-se no fato de que as redes neurais podem aprender qualquer relação não linear subjacente entre entradas e saídas. No contexto de assimilação de dados, o objetivo é aproveitar essa capacidade de aprendizado para treinar um conjunto de redes neurais para aprender a relação entre vazão simulada por um modelo hidrológico e as variáveis de estado que geraram essa simulação. Como o problema é mal posto (o mesmo valor de fluxo pode ser gerado por diferentes conjuntos de variáveis de estado), incluímos variáveis de entrada adicionais para restringir o problema. Essas variáveis adicionais irão variar dependendo da bacia hidrográfica, mas podem incluir, por exemplo, precipitação durante os dias anteriores ao tempo inicial. Uma vez aprendida a relação entre vazão simulada e variáveis de estado, o modelo de rede neural pode ser aplicado às observações de vazão mais recentes em vez de simulações, a fim de obter valores corrigidos para as variáveis de estado. Por se tratar de um método de conjunto, o resultado é um conjunto de variáveis de estado candidatas que podem ser re-inseridas no modelo hidrológico na condição inicial para obter um melhor ponto de partida para uma previsão. O método e os resultados foram publicados na Water Resources Research (Boucher et al 2020) e os dados já estão disponíveis no Harvard Dataverse (Boucher 2020). Reutilizando os dados e códigos desse artigo, fornecerei um tutorial passo a passo sobre a implementação do método no Matlab (ou Octave). Infelizmente, os códigos Python ou R ainda não estão disponíveis.
Boucher, M-A (2020) "Data for manuscript `Data assimilation for streamflow forecasting using Extreme Learning Machines and Multilayer Perceptrons’”, https://doi.org/10.7910/DVN/DB3AUE, Harvard Dataverse, V1
Boucher M-A, Quilty J. and Adamowski J. 2020 : Data assimilation for streamflow forecasting using extreme learning machines and multilayer perceptrons, Water Resources Research, 56, e2019WR026226. https://doi.org/10.1029/2019WR026226
Modelo atmosférico WRF e assmilação de dados por rede neural
Dr. Vinicius A. Almeida (Universidade Federal do Rio de Janeiro, Brasil)
Resumo:
Neste seminário, será descrita a viabilidade prática de modelos de redes neurais para assimilação de dados usando dados de observações locais no modelo WRF para a região metropolitana do Rio de Janeiro no Brasil. Os resultados empregando campos de previsão de 6 horas com modelos de rede neural são capazes de emular os resultados 3D-Var para variáveis de superfície e multinível. O principal resultado refere-se à redução de tempo de CPU possibilitada pelos modelos de redes neurais, reduzindo o tempo de CPU de assimilação de dados em 121 vezes e 25 vezes para diferentes modelos de aprendizado de máquina em comparação ao método 3D-Var nas mesmas configurações de hardware.
Assimilação de dados: “big data” e a computação em exa-escala
Dr. Takemasa Miyoshi (RIKEN Center for Computational Science, Japan)
Resumo:
A previsão numérica do tempo (NWP) suporta nossas vidas diárias. Os modelos climáticos exigem resoluções espaço-temporais mais altas para se preparar para desastres climáticos extremos e reduzir a incerteza das previsões. A precisão do estado inicial da simulação meteorológica também é crítica, exigindo tecnologia de assimilação de dados (DA) mais avançada. Ao combinar resolução e tamanho do conjunto, o maior experimento de DA meteorológica do mundo foi realizado usando um modelo global de resolução de nuvens e um método de filtro Kalman de conjunto. O número de pontos de grade foi ~ 4,4 trilhões, e 1,3 PiB de dados foram passados da parte de simulação do modelo para a parte DA. Um design de aplicativo centrado em dados e computação aproximada para acelerar o sistema geral de DA foram adotados. O sistema DA, denominado NICAM-LETKF, é dimensionado para 131.072 nós (6.291.456 núcleos) do supercomputador Fugaku com um desempenho sustentado de 29 PFLOPS e 79 PFLOPS para as partes de simulação e DA, respectivamente. Os experimentos numéricos marcam um pioneirismo em novas aplicações de assimilação de dados para várias simulações de computador de alto desempenho, usando assimilação avançada de dados para dar sentido ao "Big Data".
Aprendizado de dados: integrando assimilação de dados e aprendizado de máquina – Aplicação para a pandemia de COVID-19
Dr. Rossella Arcucci (Imperial College London, UK)
Resumo:
Este seminário situa-se no contexto dos gémeos digitais, que normalmente são constituídos por dois componentes: um modelo e alguns dados. Ao desenvolver um gêmeo digital, existem muitas questões fundamentais, algumas relacionadas aos dados e sua confiabilidade e incerteza, e algumas relacionadas à atualização dinâmica do modelo. Para combinar modelo e dados, usamos Assimilação de Dados (DA). DA é a aproximação do verdadeiro estado de algum sistema físico combinando observações do mundo real com um modelo dinâmico. Os modelos DA aumentaram em sofisticação para melhor atender aos requisitos do aplicativo e contornar os problemas de implementação. No entanto, essas abordagens são incapazes de superar totalmente seus pressupostos irrealistas. O Aprendizado de Máquina (ML) mostra grande capacidade de aproximar sistemas não lineares e extrair recursos significativos de dados de alta dimensão. Os algoritmos de ML podem auxiliar ou substituir os métodos tradicionais de previsão. No entanto, os dados usados durante o treinamento em qualquer algoritmo de ML incluem erros numéricos, de aproximação e de arredondamento, que são treinados no modelo de previsão. A integração de ML com DA aumenta a confiabilidade da previsão ao incluir informações em tempo real e com significado físico. Este seminário apresenta o Aprendizado de Dados, um campo que integra Assimilação de Dados e Aprendizado de Máquina para superar limitações na aplicação desses campos a dados do mundo real. Apresentamos vários métodos e resultados de Data Learning para alguns casos de teste para COVID-19, embora as equações sejam gerais e possam ser facilmente aplicadas em outros lugares.
Aprendizado de máquina em modelagem preditiva em tempo real e assimilação de dados em problemas ambientais
Prof. Fangxin Fang (Imperial College London, UK)
Resumo:
Simulações numéricas de dinâmica de fluidos têm sido indispensáveis em aplicações relevantes para física e engenharia. Para melhorar a capacidade preditiva, os algoritmos numéricos tornaram-se cada vez mais sofisticados usando resolução espacial e temporal maisr refinadas. Técnicas avançadas de aprendizado profundo (DL) alcançam grande progresso na previsão rápida de fluxos de fluidos sem conhecimento prévio das relações físicas subjacentes [1-5]. Neste seminário, é fornecida uma visão geral das técnicas de DL em dinâmica de fluidos. O foco será em Rede Neutra Recorrente (RNN), Memória de Longo Prazo (LSTM), Rede Neutra Convolucional (CNN) e Rede Adversarial Generativa (GAN). A modelagem de ordem reduzida (ROM) e técnicas de assimilação de dados serão introduzidas para modelagem operacional em tempo real e análise de incerteza. Ter a compatibilidade de aprendizado de máquina e assimilação de dados será nada menos que revolucionário para um grande número de disciplinas. Serão apresentados exemplos de modelagem baseada em grandes dados para problemas de fluxo de fluidos: previsão de ozônio na China e de inundação na Dinamarca. Um exemplo de otimização da localização do sensor usando adjoint-ROM também será dado [6].
REFERÊNCIAS
[1] Cheng M, Fang F, Navon IM, Zheng J, Tang X, Zhu J, Pain CC: Spatio‐temporal Hourly and Daily Ozone Forecasting in China Using a Hybrid Machine Learning Model: Autoencoder and Generative Adversarial Networks, Journal of Advances in Modeling Earth Systems, 2022.
[2] M. Cheng, F. Fang, C.C. Pain and I.M. Navon, Data -driven modelling of nonlinear spatio-temporal fluid flows using a deep convolutional generative adversarial network, Computer Methods in Applied Mechanics and Engineering, v. 365, 2020.
[3] M. Cheng, F. Fang, C.C. Pain and I.M. Navon, An advanced hybrid deep adversarial autoencoder for parameterized nonlinear fluid flow modelling, Computer Methods in Applied Mechanics and Engineering, v. 372, 1-19, 2020.
[4] M. Cheng, F. Fang, T. Kinouchi, I.M. Navon and C.C. Pain, Long lead-time daily and monthly streamflow forecasting using machine learning methods, Journal of Hydrology, v. 590, 1-13, 2020.
[5] M. Cheng, F. Fang, I.M. Navon, C.C. Pain, A real-time flow forecasting with deep convolutional generative adversarial network: Application to flooding event in Denmark, Physics of Fluids, v. 33, 2021.
[6] Fang F, Pain C, Navon, Xiao D, 2016, An efficient goal based reduced order model approach for targeted adaptive observations, International Journal for Numerical Methods in Fluids, v. 83, 263-275.