Notícias
PRÊMIO CAPES DE TESE
Pesquisa analisa representações textuais para múltiplos domínios
Doutor em Ciências da Computação pela Universidade Federal de Minas Gerais (UFMG), Felipe Augusto Resende Viegas dedicou sua pesquisa ao estudo de representações textuais para múltiplos domínios. Sua tese, intitulada Um Estudo Aprofundado sobre Grupos Semânticos de Palavras - CluWords - Em Tarefas de Processamento de Linguagem Natural (PLN), foi reconhecida com o Prêmio CAPES de Tese 2024 na área de Computação.
Trajetória acadêmica, da graduação ao doutorado.
Iniciei o curso de Ciência da Computação na Universidade Federal de São João del-Rei (UFSJ) em 2009 fiz parte da primeira turma do curso. Após concluir a graduação, fui aprovado para o mestrado em Ciência da Computação na Universidade Federal de Minas Gerais (UFMG), onde continuei estudando Classificação Automática de Documentos, com foco em modelos Bayesianos e Computação Paralela em Placas Gráficas. Durante o mestrado, tive a oportunidade de publicar em conferências internacionais relevantes na área. Segui com o doutorado na UFMG, mantendo a mesma orientação, mas com um novo foco de pesquisa: representações textuais para múltiplos domínios, incluindo classificação, análise de sentimento e modelagem de tópicos.
O objetivo da minha tese foi combinar diferentes representações textuais para enriquecer a representação final dos documentos. Consegui publicar meu trabalho nas principais conferências internacionais da minha área de pesquisa, tais como WSDM, CIKM e ACL, além de também em conferências nacionais, como o WebMedia.
Sobre o que é a sua pesquisa?
A tese apresenta soluções simples, mas elegantes, baseadas em engenharia de dados para modelagem de documentos textuais que possam tratar problemas relacionados a ruído e escassez de informações em documentos. As soluções propostas são competitivas (ou até mesmo superiores) ao estado-da-arte em termos de efetividade, em aplicações tais como Modelagem de Tópicos e Análise de Sentimentos, sendo, ao mesmo tempo bastante eficientes e tendo uma alta capacidade de interpretação (explicabilidade).
A contribuição central da tese é um conceito inovador na área de PLN, denominado Cluwords — uma nova representação textual que aproveita a eficiência e a interpretabilidade das representações (matriciais) tradicionais baseadas em frequências de palavras (e.g., TFIDF), ao mesmo tempo que explora as capacidades semânticas de modelos modernos baseados em embeddings de palavra.
A solução proposta na tese para Modelagem de Tópicos (MT) e Modelagem de Tópicos Hierárquica (MTH) representa o estado da arte, superando estratégias populares e eficazes da literatura. Em Análise de Sentimentos, nossa solução obteve resultados comparáveis aos de estratégias complexas e computacionalmente caras, sendo amplamente mais explicável e eficiente. Além disso, nossa abordagem é flexível e pode ser aplicada em diversos cenários de PLN.
Qual a importância para você de sua tese ter sido escolhida a melhor na área?
Receber o prêmio Tese CAPES representa, a nível profissional, o reconhecimento do valor da minha área de pesquisa, o processamento de linguagem natural. Hoje, muitas ferramentas baseadas em linguagem natural fazem parte do nosso cotidiano, e é gratificante ver nosso trabalho em destaque como uma solução simples, mas elegante, em comparação com as alternativas da grande indústria.
A nível pessoal, acredito que esse prêmio possa abrir portas e oferecer mais visibilidade para continuar minha pesquisa, especialmente com a oportunidade de realizar uma pós-graduação. Esse sempre foi um plano para o meu futuro, que agora começa a se concretizar. Além disso, o prêmio também traz visibilidade ao Laboratório de Banco de Dados (LBD), onde desenvolvi minha pesquisa, um centro que, ao longo dos anos, tem se destacado pela excelência de seus trabalhos.
De que forma a sua pesquisa pode contribuir para a sociedade?
Primeiramente, acredito que minha tese comprova que laboratórios de pequeno e médio porte, tanto em pesquisa quanto na indústria, podem desenvolver trabalhos tão competitivos quanto os grandes players. Justamente por ser uma solução simples, em comparação a algumas disponíveis no mercado, nossa abordagem pode proporcionar economia, em termos de infraestrutura, para a aplicação de modelos de aprendizado de máquina.
Foi bolsista da CAPES? Se sim, de que forma a bolsa contribui para sua formação?
Sim, fui bolsista da CAPES por um período da graduação, durante todo o mestrado e por uma parte do doutorado. A bolsa da CAPES foi essencial na minha trajetória; sem ela, eu não teria a possibilidade de ir para Belo Horizonte cursar a minha pós-graduação. Além disso, posso dizer que a CAPES, através do programa de pós-graduação, possibilitou que eu apresentasse meus trabalhos em conferências, como, por exemplo, a conferência CIKM 2018, na qual apresentei os primeiros resultados da minha tese.
A Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) é um órgão vinculado ao Ministério da Educação (MEC).
(Brasília – Redação CGCOM/CAPES)
A reprodução das notícias é autorizada desde que contenha a assinatura CGCOM/CAPES
