Guia de introdução ao RAG no setor público
Como o RAG funciona: IA que busca informações em bases documentais antes de responder.
A IA Generativa se destaca pela habilidade de criar textos fluidos e naturais por meio dos Grandes Modelos de Linguagem (LLMs). Esses modelos são treinados em bases de dados massivas, o que permite que eles compreendam contextos complexos e respondam a comandos (prompts) de forma detalhada e convincente.
Apesar da sofisticação, os LLMs tradicionais possuem conhecimento estático. Como a IA depende do que aprendeu até o seu último treinamento e das instruções que recebe no comando, ela sofre com uma lacuna de informações. Dados sobre novos produtos, mudanças em regulamentações ou documentos da organização podem ficar fora do seu alcance e gerar alucinações, que respostas que parecem corretas, mas que podem ser inventadas ou desatualizadas.
Uma forma simples de entender esse problema é imaginar a IA como um servidor público especializado, capaz de escrever muito bem, mas que ainda não conhece as leis ou normas específicas do seu órgão. Sem acesso às fontes corretas, esse servidor pode tentar responder com base apenas no que já aprendeu, correndo o risco de errar.
Para lidar com essa limitação, existem arquiteturas que permitem conectar os modelos de linguagem a bases de conhecimento atualizadas e controladas pela própria organização. Uma das abordagens utilizadas para isso é o RAG (Retrieval-Augmented Generation), ou, em português, Geração Aumentada por Recuperação, que combina a capacidade de geração de texto da IA com mecanismos de busca em documentos confiáveis.
Você provavelmente não vai implementar uma arquitetura de IA como o RAG no seu dia a dia. No entanto, é cada vez mais comum utilizar sistemas que funcionam dessa forma em ferramentas institucionais e soluções de apoio à decisão.
Entender, ainda que de forma conceitual, como esses sistemas operam permite usar a IA com mais segurança, interpretar melhor as respostas geradas e identificar possíveis falhas, como informações imprecisas, desatualizadas ou alucinações.
Quer conhecer de forma rápida como utilizar o RAG no dia a dia do setor público?
Um PDF com infográficos que sintetiza as principais informações deste guia 5 páginas está disponível para download. Confira!
DownloadMas afinal, o que é RAG?
Imagine um servidor público que precisa responder rapidamente a uma dúvida técnica complexa. Ele até tem experiência, mas sabe que confiar apenas na memória pode ser arriscado: a informação pode estar desatualizada ou incompleta.
Então, antes de responder, ele faz o que qualquer bom profissional faria: vai até a biblioteca oficial da instituição, consulta os documentos mais recentes, destaca os trechos relevantes e só então elabora sua resposta com base em fontes confiáveis.
É exatamente assim que funciona o RAG.
Nesse contexto, o RAG é uma arquitetura que funciona como uma ponte entre o poder de escrita da IA e a base de dados da organização. Na prática, é como dar a esse servidor acesso à biblioteca oficial da instituição, permitindo que ele consulte documentos confiáveis antes de formular sua resposta.
Em outras palavras, no modelo RAG a IA lê antes de falar. Em vez de tentar "lembrar" todas as informações, o sistema executa um processo inteligente de três etapas:
Com o RAG, é possível otimizar os resultados da IA sem a necessidade de retreinar ou criar o modelo do zero. O resultado é uma ferramenta que combina a capacidade de geração da IA com o conhecimento atualizado presente nas bases de dados do próprio setor.
Por que não podemos confiar apenas na memória da IA?
Lembra do nosso servidor especializado? Ele é extremamente articulado e conhece muito sobre o trabalho, mas há um problema: a memória dele pode falhar ou confundir as coisas.
Quando usamos uma IA sem RAG, é como se fizéssemos uma pergunta a esse servidor enquanto ele está no meio da rua, longe da biblioteca. Ele vai tentar ajudar, mas como não tem os documentos em mãos, ele pode acabar "misturando" uma lei estrangeira com um decreto do Brasil, ou citando uma regra que foi revogada há dois anos, por exemplo. Quando falamos de serviço público, esse palpite pode se tornar um erro administrativo.
Abaixo, veja como a presença do RAG pode auxiliar nesse processo:
| Característica |
IA sem RAG
|
IA com RAG
|
|---|---|---|
| Fonte de dados | Responde com base no conhecimento adquirido durante o treinamento (grandes volumes de dados de fontes variadas). | Consulta uma base de documentos previamente definida (normas, manuais e bases institucionais) antes de responder. |
| Atualização | O conhecimento reflete o período de treinamento; pode estar desatualizado em relação a fatos recentes. | Utiliza documentos da base institucional, que deve ser mantida sempre atualizada com as novas normas e portarias. |
| Fidedignidade | Pode gerar respostas plausíveis, mas eventualmente incorretas ou não verificáveis (alucinações). | Baseia a resposta em documentos recuperados; pode indicar quando a informação não foi encontrada na base. |
| Comprovação | A resposta é apresentada sem referência direta às fontes específicas utilizadas. | A resposta pode vir acompanhada de referências, como links, páginas ou trechos das normas consultadas. |
O valor desta ferramenta para a administração pública pode ser compreendido a partir de três pilares principais:
No serviço público, mais importante do que um sistema que "saiba tudo" é um sistema capaz de consultar as fontes corretas e apresentar respostas fundamentadas nos documentos oficiais.
Contudo, para que essa consulta seja feita de forma íntegra, não basta apenas encontrar a informação, é preciso garantir que o acesso a ela respeite a privacidade e a legislação vigente. Abrir a "biblioteca oficial" para a IA exige novos protocolos de cuidado.
No próximo tópico, são apresentados exemplos de aplicação do RAG no setor público.
Exemplos de aplicação
Imagine um servidor em início de carreira consultando o sistema: "Acabei de entrar no órgão, ainda estou no meu primeiro ano de estágio probatório. Já posso solicitar teletrabalho integral?"
O modelo poderia dar uma resposta genérica ou baseada em leis de empresas privadas, ignorando as vedações específicas da administração pública federal.
O sistema recupera o documento atualizado, analisa o dispositivo específico e responde: "De acordo com o Art. 10, § 2º da Instrução Normativa Conjunta SEGES-SGP-SRT/MGI nº 21/2024, servidores efetivos não podem ser selecionados para teletrabalho durante o primeiro ano do estágio probatório."
Imagine um assessor jurídico consultando o sistema: "Qual é o entendimento atual do tribunal sobre crimes tributários?"
O modelo pode responder com base em conhecimento genérico ou desatualizado, sem indicar as decisões específicas que fundamentam a resposta nem garantir rastreabilidade.
O sistema consulta a base oficial de acórdãos, recupera as decisões mais recentes, identifica mudanças de orientação e responde com base nos precedentes vigentes, apresentando numeração de processos e links para consulta.
Imagine um cidadão perguntando: "Trabalhei como autônomo e agora estou afastado por doença. Tenho direito a algum benefício?"
Limita-se a menus pré-programados ou respostas genéricas, com risco de considerar normas revogadas ou ignorar exceções legais aplicáveis ao caso.
O sistema interpreta o relato, consulta a legislação previdenciária vigente, cruza os requisitos legais com as informações fornecidas e responde de forma fundamentada, listando a documentação necessária.
Imagine um servidor perguntando: "Essa minuta de contrato está integralmente conforme a Lei nº 14.133/2021?"
Pode fornecer explicações gerais, mas não compara efetivamente a minuta com a lei, correndo o risco de não detectar cláusulas obrigatórias ausentes.
O sistema analisa a minuta, consulta a Lei nº 14.133/2021, identifica cláusulas obrigatórias e verifica requisitos formais, sinalizando inconsistências com referência direta aos dispositivos legais.
Governança de Dados (O Papel do Agente)
Até aqui, entendemos que o RAG funciona como uma biblioteca que o nosso "servidor especializado" pode consultar antes de responder. No entanto, de pouco adianta ter uma biblioteca se os livros estiverem incompletos, contiverem informações incorretas ou incluírem normas já revogadas.
Nesta seção, vamos compreender por que a qualidade das informações disponibilizadas para a IA é um fator determinante para o sucesso — ou para o erro — de aplicações no serviço público.
"Lixo entra, lixo sai": a qualidade da sua biblioteca
Você já ouviu o ditado: "Se alimentar o modelo com lixo, ele entregará lixo"? Na tecnologia, chamamos isso de Garbage In, Garbage Out (Lixo entra, lixo sai).
Para que a IA ajude o órgão público, os documentos que formam a base do RAG precisam ser confiáveis, atualizados e tecnicamente íntegros. Se o documento PDF estiver ilegível, com tabelas corrompidas ou se tratar de uma norma já revogada, a IA interpretará esse conteúdo como válido, podendo induzir a erros.
Como garantir uma boa "alimentação" para a IA?
- Precisão: o documento reflete a realidade atual do órgão?
- Completude: a informação está inteira ou falta o anexo principal?
- Consistência: o manual de orientações diz a mesma coisa que a portaria mais recente?
- Atualização: documentos revogados devem ser retirados da "biblioteca ativa" da IA para evitar confusão.
Responsabilidade: o humano é quem dá a última palavra
Um dos princípios mais importantes no uso de IA no governo é o da supervisão humana. Lembre-se: a IA não decide, ela sugere. Com o RAG, ela pode facilitar a busca, mas a autoridade e a responsabilidade legal são sempre do agente público.
Impacto ético: cuidado com os vieses
A IA se apoia nos documentos que fornecemos. Se a nossa base de dados histórica contiver preconceitos ou decisões antigas que hoje são consideradas injustas ou ilegais, a IA pode acabar repetindo esses padrões.
Vieses em documentos antigos: um manual de 20 anos atrás pode conter termos ou visões que não cabem mais na administração pública moderna.
Equidade: ao usar o RAG, devemos nos perguntar: "As fontes que estou fornecendo à IA garantem um tratamento justo e igualitário para todos os cidadãos?".
Cuidar da ética significa garantir que a "biblioteca" da nossa IA seja um reflexo dos valores atuais da nossa Constituição e das boas práticas de gestão. Em síntese, é fundamental adotar alguns cuidados no uso dessas ferramentas:
- Primeiro, verifique sempre a fonte apresentada: confira se a IA está citando o documento correto e se a informação corresponde ao conteúdo original.
- Mantenha a base de conhecimento organizada, removendo arquivos desnecessários, desatualizados ou duplicados, para evitar ambiguidades nas respostas.
- Preserve o controle sobre o processo: a IA é uma ferramenta de apoio, mas a responsabilidade pela validação das informações e pelas decisões continua sendo humana.
Operações de RAG: identificando o tratamento de dados pessoais
Sempre que um sistema de IA baseado em RAG utiliza dados pessoais — como nomes, CPFs, e-mails ou qualquer informação que identifique ou possa identificar uma pessoa — ele passa a realizar o que a LGPD define como tratamento de dados pessoais.
Nesse contexto, é fundamental que o desenvolvimento e a operação da ferramenta observem a boa-fé e os princípios fundamentais estabelecidos no Art. 6º da LGPD, garantindo que a inovação tecnológica não comprometa os direitos dos titulares.
De acordo com o dispositivo legal, o tratamento deve ser regido pelos seguintes pilares:
- Finalidade: o uso de dados pessoais no RAG deve ocorrer para propósitos legítimos e específicos, informados previamente ao titular, vedando-se o uso posterior para fins incompatíveis.
- Necessidade: o sistema deve processar apenas o volume mínimo de dados estritamente necessário para atingir seu objetivo, garantindo que as informações inseridas na base de conhecimento sejam pertinentes e proporcionais.
- Livre acesso e transparência: deve-se garantir aos titulares a consulta facilitada sobre como seus dados são utilizados pela IA, com informações claras e precisas sobre os agentes de tratamento envolvidos.
- Qualidade dos dados: as informações tratadas devem ser exatas, claras, relevantes e atualizadas, de acordo com a necessidade e para o cumprimento da finalidade de seu tratamento.
- Segurança e prevenção: a infraestrutura de armazenamento e recuperação deve adotar medidas técnicas robustas para prevenir acessos não autorizados, vazamentos ou qualquer dano decorrente do processamento automatizado.
- Não discriminação: o treinamento e a recuperação de informações não podem resultar em saídas que promovam fins discriminatórios, ilícitos ou abusivos.
- Responsabilização e prestação de contas: o agente de tratamento deve ser capaz de demonstrar a eficácia das medidas adotadas, comprovando que o sistema de IA está em plena conformidade com as normas de proteção de dados.
Riscos e pilares de segurança e privacidade no uso de RAG
Seguindo nossa analogia, o RAG é uma ponte para a biblioteca oficial. No entanto, uma biblioteca mal gerida ou sem controle de acesso pode trazer sérios problemas. Entender os riscos é fundamental para que o agente público utilize a ferramenta com segurança e responsabilidade.
Para mitigar esses riscos e garantir que o uso de RAG seja realizado de forma segura, sua aplicação deve se apoiar em alguns pilares de segurança e privacidade:
Atenção: transformando riscos em segurança ativa
No serviço público, a proteção da informação não é apenas uma barreira, mas um dever funcional. Embora os riscos citados existam, eles não devem ser vistos como motivos para evitar a tecnologia, mas como um roteiro para uma implementação responsável. O uso do RAG exige um pacto de vigilância entre a equipe técnica e o usuário final.
O RAG é uma ferramenta que requer governança técnica adequada e atenção do usuário para mitigação dos riscos descritos acima.
Princípios fundamentais para o uso do RAG
Antes de utilizar o resultado de uma consulta via RAG ou de alimentar o sistema com novos documentos, faça este "check-up" de segurança e qualidade.
Se você não puder marcar um dos itens abaixo, pare e revise o processo.
Conclusão
Este guia tem caráter estritamente informativo. Seu objetivo é apresentar, de forma didática, como a arquitetura de Geração Aumentada por Recuperação (RAG) pode apoiar o acesso a informações e a consulta a documentos institucionais. O conteúdo não configura recomendação ou endosso oficial de plataformas, fornecedores ou soluções tecnológicas específicas.
Importante: a Administração Pública é composta por diferentes órgãos e instituições, cada um com sua própria estrutura tecnológica. Por isso, não é possível afirmar que todas as organizações já disponham de soluções de IA com RAG. Enquanto alguns órgãos possuem ferramentas contratadas em operação, outros ainda não contam com esse recurso. Dessa forma, recomenda-se consultar a área responsável por tecnologia da informação, transformação digital ou áreas correlatas do respectivo órgão para verificar quais soluções de IA estão disponíveis e quais orientações devem ser seguidas para sua utilização.
O uso de documentos com assistentes de IA pode ocorrer de diferentes formas, sendo importante distinguir aquelas que configuram RAG daquelas baseadas apenas em inserção direta de conteúdo no prompt.
O RAG se caracteriza pela integração entre o modelo de linguagem e um mecanismo estruturado de recuperação de informações, que busca automaticamente conteúdos relevantes em bases de dados antes da geração da resposta. Em geral, essa abordagem está associada ao uso institucional, quando a solução é implementada e gerenciada pelo órgão, permitindo que os usuários a utilizem como clientes. Nesses casos, há uma infraestrutura que organiza as fontes de informação e realiza a busca de forma automatizada, garantindo maior consistência, atualização e rastreabilidade.
Por outro lado, quando o próprio servidor reúne documentos e os insere diretamente no prompt para interagir com o assistente, sem um sistema de busca automatizado, trata-se de uma abordagem conhecida como acréscimo de contexto (Context Augmentation). Embora seja uma estratégia útil em cenários mais simples ou exploratórios, ela não configura RAG.
Antes de adotar qualquer sistema baseado em RAG, é essencial avaliar aspectos como segurança da informação, conformidade com normas institucionais e custos envolvidos. Sempre que possível, priorize o uso de ferramentas de IA disponibilizadas ou homologadas pelo órgão, desde que estejam em conformidade com a Política de Segurança da Informação vigente.
Além disso, é essencial garantir a curadoria adequada das bases documentais utilizadas pelo sistema, assegurando que os conteúdos recuperados estejam atualizados, completos e alinhados às diretrizes do órgão. Mesmo quando apoiado por RAG, o sistema apenas organiza e sintetiza informações presentes na base de conhecimento. Por isso, permanece indispensável que o servidor público verifique as fontes citadas, revise criticamente as respostas e confirme a interpretação das normas antes de utilizá-las em processos administrativos.
O RAG deve ser entendido como uma ferramenta de apoio ao acesso e à organização do conhecimento institucional. Ele pode ampliar a eficiência na consulta a documentos e normas, mas não substitui o julgamento técnico, a análise contextual e a responsabilidade de quem utiliza a informação. Em última instância, a responsabilidade pelas decisões e atos administrativos permanece com o servidor público.
Glossário de termos: IA e RAG
Grandes Modelos de Linguagem (LLM): São redes neurais de grande escala treinadas em conjuntos massivos de dados, permitindo à IA Generativa compreender e gerar textos, áudios e imagens.
Prompt: Comando de texto fornecido a um modelo de IA Generativa para solicitar uma resposta ou realizar uma tarefa.
RAG (Retrieval-Augmented Generation): traduzido como "Geração Aumentada por Recuperação". É uma arquitetura que conecta a IA a bases de dados externas confiáveis, permitindo que o modelo "leia" documentos antes de formular uma resposta.
Alucinação: respostas incorretas ou fictícias geradas pela IA generativa que, apesar de convincentes, são erradas ou enganosas, não corresponde à realidade ou aos dados de treinamento, apresentando informações fabricadas, imprecisas ou sem fundamento factual. Esse fenômeno pode ocorrer devido às limitações nos dados de treinamento ou ao processamento do modelo.
Recuperação vetorial: processo de consultar um banco de dados de vetores (códigos matemáticos) para encontrar as informações técnicas mais relevantes para uma pergunta.
Aumento de contexto: etapa em que a informação recuperada da base de dados é anexada à pergunta do usuário para servir como "cola" verídica para a IA.
Geração fundamentada: quando o modelo utiliza seu poder de escrita para processar dados reais encontrados, entregando uma resposta baseada em evidências atuais.
Para saber mais sobre os termos técnicos, acesse o Glossário de Termos Relacionados à IA.
Acesse o GlossárioReferências
- ASAI, A. et al. Self-RAG: learning to retrieve, generate and critique through self-reflection. [S. l.]: ICLR, 2024. Disponível em: https://arxiv.org/abs/2310.11511. Acesso em: 11 mar. 2026.
- BOURGEOIS, Benjamin. What Is ‘Garbage In, Garbage Out,’ and Why Is It [Still] A Problem?. [S. l.], 2023. Disponível em: https://profisee.com/blog/garbage-in-garbage-out/. Acesso em: 11 mar. 2026.
- EDGE, D. et al. From local to global: a Graph RAG approach to query-focused summarization. [S. l.]: Microsoft Research, 2024. Disponível em: https://arxiv.org/abs/2404.16130. Acesso em: 11 mar. 2026.
- IBM. O que são alucinações de IA?. IBM, [s. d.]. Disponível em: https://www.ibm.com/br-pt/think/topics/ai-hallucinations. Acesso em: 25 jun. 2026.
- IRONCORE LABS. 5 Major Security Risks with RAG. [S. l.], 2024. Disponível em: https://ironcorelabs.com/security-risks-rag/. Acesso em: 11 mar. 2026.
- LEWIS, P. et al. Retrieval-Augmented Generation for knowledge-intensive NLP tasks. [S. l.]: NeurIPS, 2020. Disponível em: https://arxiv.org/abs/2005.11401. Acesso em: 11 mar. 2026.
- ORACLE. O que é RAG (Retrieval-Augmented Generation)? [S. l.], 2024. Disponível em: https://www.oracle.com/br/artificial-intelligence/generative-ai/retrieval-augmented-generation-rag/. Acesso em: 11 mar. 2026.
- PINHEIRO, Ariane. IA Generativa na prática: como dominar LLMs e RAG. DIO, 2023. Disponível em: https://www.dio.me/articles/ia-generativa-na-pratica-como-dominar-llms-e-rag-599bed64c1a5. Acesso em: 11 mar. 2026.
- YAN, S. et al. Corrective Retrieval-Augmented Generation. [S. l.]: arXiv, 2024. Disponível em: https://www.falkordb.com/blog/advanced-rag/. Acesso em: 11 mar. 2026.