Méthodologie de Construction d’une Version Statistique Sirénée du Répertoire FINESS. Application aux Fichiers Historiques des Etablissements, 2005-2023
Claire Lelarge
Working Papers from HAL
Abstract:
FINESS est le répertoire national des structures à activités réglementées des domaines sanitaire, médico-social, social ainsi que de la formation aux professions sanitaires et sociales. Il contient théoriquement une correspondance entre des identifiants propres (FINESS_ET et FINESS_EJ) et les identifiants SIRET associés issus du répertoire SIRENE ou du RNE. Cette correspondance souffre cependant de problèmes de qualité. L'objet du présent document de travail est triple : •Quantifier ces problèmes de qualité, au sein du répertoire FINESS et d'autres sources statistiques très utlisées (SAE, tableau de bord de l'ANAP), •Proposer une méthodologie de correction des identifiants SIREN/SIRET inclus dans ces fichiers, •Construire une version expérimentale de répertoire « FINESS statistique » dans lesquels ces identifiants sont redressés. Avec la procédure proposée, fondée sur des méthodes de NLP basiques, nous obtenons que pour 2023, dans les fichiers historiques FINESS des établissements sanitaires et médico-sociaux mis à disposition sur DATA.GOUV.FR : •73% des identifiants SIRET apparaissent comme corrects (SIRET et SIREN corrects) ; •7% sont incorrects mais renvoient à l'unité légale correcte (SIREN correct), •8% sont totalement erronés (SIRET et SIREN incorrects). •12% sont manquants – mais sont retrouvés par l'algorithme utilisé. •Seuls 300 identifiants FINESS_ET sur 98 257 ne peuvent être associés à aucun identifiant SIRET. La procédure est également appliquée en panel et couvre in fine la période 2005-2023.
Keywords: business registers; health industries; industry structure; basic NLP techniques; I11; L23; L3 (search for similar items in EconPapers)
Date: 2026-02-14
Note: View the original document on HAL open archive server: https://hal.science/hal-05511266v1
References: Add references at CitEc
Citations:
Downloads: (external link)
https://hal.science/hal-05511266v1/document (application/pdf)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:hal:wpaper:hal-05511266
Access Statistics for this paper
More papers in Working Papers from HAL
Bibliographic data for series maintained by CCSD ().