Partielle Synthetisierung zur Anonymisierung der verknüpften Verdienststrukturerhebung 2018. Teil 1: Methodik und Evaluation der Datennützlichkeit
Hanna Brenzel and
Yannik Garcia Ritz
WISTA – Wirtschaft und Statistik, 2025, vol. 77, issue 4, 83-94
Abstract:
Der Einsatz von synthetischen Daten wird als Alternative gehandelt, um das Spannungsfeld zwischen Erhalt des Analysepotenzials bei gleichzeitiger Gewährleistung des Schutzes der Daten optimal aufzulösen. Der Beitrag geht dieser Frage nach mit der Verdienststrukturerhebung 2018 als Datenbasis. Sie setzt sich aus einem Betriebsdatensatz und einem Angestelltendatensatz zusammen und bildet damit einen LinkedEmployer-Employee-Datensatz. Bei verknüpften Datensätzen besteht die Schwierigkeit für die unabhängige Synthetisierung darin, die gewohnte Konsistenz zwischen den Datensätzen zu gewährleisten. Mithilfe eines schrittweisen partiellen multiplen Synthetisierungsansatzes konnte diese Konsistenz sichergestellt werden. Die Ergebnisse bezüglich der Nützlichkeit der generierten Daten sind vielversprechend.
Keywords: partiell synthetische Daten; verknüpfte synthetische Daten; Automatisierung; verknüpfte Arbeitgeber-Arbeitnehmer-Daten; Nützlichkeitsbewertung; partially synthetic data; linked synthetic data; automation; linked employer-employee data; utility evaluation (search for similar items in EconPapers)
Date: 2025
References: Add references at CitEc
Citations:
Downloads: (external link)
https://www.econstor.eu/bitstream/10419/324739/1/1934729175.pdf (application/pdf)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:zbw:wistat:324739
Access Statistics for this article
More articles in WISTA – Wirtschaft und Statistik from Statistisches Bundesamt (Destatis), Wiesbaden Contact information at EDIRC.
Bibliographic data for series maintained by ZBW - Leibniz Information Centre for Economics ().