EconPapers    
Economics at your fingertips  
 

Beyond RAG: Architectures for Reliable Economic Statistics with Agentic Systems

Minh Ha-Duong ()
Additional contact information
Minh Ha-Duong: CIRED - Centre International de Recherche sur l'Environnement et le Développement - Cirad - Centre de Coopération Internationale en Recherche Agronomique pour le Développement - EHESS - École des hautes études en sciences sociales - AgroParisTech - Université Paris-Saclay - CNRS - Centre National de la Recherche Scientifique - ENPC - École nationale des ponts et chaussées - IP Paris - Institut Polytechnique de Paris

Post-Print from HAL

Abstract: La production de statistiques économiques fiables constitue une infrastructure critique pour la modélisation appliquée, en particulier dans le domaine de la transition énergétique. Or, dans de nombreux pays, les statistiques officielles sont publiées avec retard, incomplètes ou difficilement redistribuables, tandis que l'information pertinente existe sous forme de documents textuels hétérogènes et évolutifs. Les progrès récents en intelligence artificielle — grands modèles de langage, Retrieval-Augmented Generation (RAG) et systèmes agentiques — laissent espérer une automatisation de cette transformation, mais leur capacité à produire des statistiques réellement exploitables reste incertaine. Ce projet examine les limites empiriques des approches actuelles (génération directe, prompting itératif, RAG) appliquées à la construction d'inventaires d'infrastructures énergétiques. Les résultats montrent des échecs récurrents en matière d'exhaustivité, de cohérence interne, de gestion temporelle et de traçabilité, suggérant que ces systèmes ne se comportent pas comme de véritables instruments statistiques. L'article propose alors un changement de paradigme : passer de systèmes génératifs stateless à des architectures statistiques stateful et agentiques. Ces architectures organisent la collecte, la validation humaine, l'accumulation temporelle et la dérivation des statistiques comme un processus contrôlé de production de connaissance, où chaque cellule du tableau final est traçable jusqu'à sa source documentaire. Cette approche ouvre la voie à des bases statistiques continuellement mises à jour, compatibles avec les exigences de la modélisation énergétique reproductible et de l'analyse de politiques publiques en temps quasi réel.

Keywords: Energy statistics; Agentic systems; Retrieval-Augmented Generation; Large language models; Statistiques énergétiques; Grands modèles de langage (search for similar items in EconPapers)
Date: 2026-05-27
References: Add references at CitEc
Citations:

Published in Econom'IA 2026, May 2026, Cergy, France

There are no downloads for this item, see the EconPapers FAQ for hints about obtaining it.

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:hal:journl:hal-05644906

Access Statistics for this paper

More papers in Post-Print from HAL
Bibliographic data for series maintained by CCSD ().

 
Page updated 2026-06-09
Handle: RePEc:hal:journl:hal-05644906