EconPapers    
Economics at your fingertips  
 

Verbesserung der Datengrundlage der Mindestlohnforschung mittels maschineller Lernverfahren

Improvement of the data basis of minimum wage research by means of machine learning methods

Florian Dumpert () and Martin Beck
Additional contact information
Florian Dumpert: Statistisches Bundesamt
Martin Beck: Statistisches Bundesamt

AStA Wirtschafts- und Sozialstatistisches Archiv, 2023, vol. 17, issue 1, No 2, 5-34

Abstract: Zusammenfassung Mit der Einführung des allgemeinen gesetzlichen Mindestlohnes zum 1. Januar 2015 stieg der Bedarf an geeigneten Daten für die Evaluation der Mindestlohnwirkungen. Die Mindestlohnkommission empfahl daher in ihrem ersten Bericht an die Bundesregierung die Verknüpfung der Integrierten Erwerbsbiografien mit der Verdienststrukturerhebung. Die Paneldaten der Integrierten Erwerbsbiografien sollen durch die Verknüpfung mit ansonsten fehlenden Angaben zum Bruttostundenverdienst bzw. zur Mindestlohnbetroffenheit aus der Verdienststrukturerhebung angereichert werden, um so die Analysemöglichkeiten zu verbessern. Sowohl ein deterministisches als auch ein probabilistisches Record Linkage waren aus rechtlichen Gründen nicht umsetzbar. Daher hat das Statistische Bundesamt die Option einer Anreicherung der Integrierten Erwerbsbiografien mit Informationen zur Mindestlohnbetroffenheit aus der Verdienststrukturerhebung auch mittels maschineller Lernverfahren geprüft. Im Fokus standen die Methoden „Random Forest“ und „Boosting“, die keine Verknüpfung oder Weitergabe von Einzeldatensätzen erfordern und daher datenschutzrechtlich handhabbar sind. Über die konkrete Vorgehensweise, speziell die getesteten Modellierungsvarianten für die Teilpopulationen Vollzeit‑, Teilzeit- und geringfügig entlohnte Beschäftigte, wird in diesem Beitrag ausführlich berichtet. Die vorliegende Untersuchung hat gezeigt, dass entsprechende Modelle prinzipiell erlernbar sind und es somit grundsätzlich möglich ist, die Integrierten Erwerbsbiografien um eine Angabe zur Mindestlohnbetroffenheit zu ergänzen. Deutlich erkennbar wurde im Zuge der Untersuchungen aber auch der Zielkonflikt zwischen Sensitivität und positivem Vorhersagewert, das heißt der Konflikt zwischen dem Ziel, möglichst alle vom Mindestlohn betroffenen Beschäftigten als solche zu klassifizieren, und dem Ziel, bei dieser Klassifikation möglichst keine vom Mindestlohn nicht betroffenen Beschäftigten, irrtümlich als „vom Mindestlohn betroffen“ zu kennzeichnen. In der Praxis muss diesem Zielkonflikt bei der Auswahl der eingesetzten Modelle in Abhängigkeit vom angestrebten Analysezweck Rechnung getragen werden. Ob, wann und wie die Resultate der vorliegenden Untersuchung in den Integrierten Erwerbsbiografien konkret umgesetzt werden können, bedarf weiterer Untersuchungen und Festlegungen.

Keywords: Maschinelles Lernen; Random Forest; Boosting; Verdienststrukturerhebung; Integrierte Erwerbsbiografien; Mindestlohnforschung; Machine Learning; Random Forest; Boosting; Structural Earnings Survey; Integrated Employment Biographies; Minimum wage research; C45; C52; J31 (search for similar items in EconPapers)
Date: 2023
References: View references in EconPapers View complete reference list from CitEc
Citations:

Downloads: (external link)
http://link.springer.com/10.1007/s11943-023-00318-w Abstract (text/html)
Access to the full text of the articles in this series is restricted.

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:spr:astaws:v:17:y:2023:i:1:d:10.1007_s11943-023-00318-w

Ordering information: This journal article can be ordered from
http://www.springer. ... ce/journal/11943/PS2

DOI: 10.1007/s11943-023-00318-w

Access Statistics for this article

AStA Wirtschafts- und Sozialstatistisches Archiv is currently edited by Ralf Münnich

More articles in AStA Wirtschafts- und Sozialstatistisches Archiv from Springer, Deutsche Statistische Gesellschaft - German Statistical Society
Bibliographic data for series maintained by Sonal Shukla () and Springer Nature Abstracting and Indexing ().

 
Page updated 2025-03-20
Handle: RePEc:spr:astaws:v:17:y:2023:i:1:d:10.1007_s11943-023-00318-w