Comparison of Imputation Methods for Handling Missing Categorical Data with Univariate Pattern|| Una comparación de métodos de imputación de variables categóricas con patrón univariado
Juan Armando Torres Munguía ()
Additional contact information
Juan Armando Torres Munguía: Instituto Tecnológico y de Estudios Superiores de Monterrey (México)
Revista de Métodos Cuantitativos para la Economía y la Empresa = Journal of Quantitative Methods for Economics and Business Administration, 2014, vol. 17, issue 1, 101-120
Abstract:
This paper examines the sample proportions estimates in the presence of univariate missing categorical data. A database about smoking habits (2011 National Addiction Survey of Mexico) was used to create simulated yet realistic datasets at rates 5% and 15% of missingness, each for MCAR, MAR and MNAR mechanisms. Then the performance of six methods for addressing missingness is evaluated: listwise, mode imputation, random imputation, hot-deck, imputation by polytomous regression and random forests. Results showed that the most effective methods for dealing with missing categorical data in most of the scenarios assessed in this paper were hot-deck and polytomous regression approaches. || El presente estudio examina la estimación de proporciones muestrales en la presencia de valores faltantes en una variable categórica. Se utiliza una encuesta de consumo de tabaco (Encuesta Nacional de Adicciones de México 2011) para crear bases de datos simuladas pero reales con 5% y 15% de valores perdidos para cada mecanismo de no respuesta MCAR, MAR y MNAR. Se evalúa el desempeño de seis métodos para tratar la falta de respuesta: listwise, imputación de moda, imputación aleatoria, hot-deck, imputación por regresión politómica y árboles de clasificación. Los resultados de las simulaciones indican que los métodos más efectivos para el tratamiento de la no respuesta en variables categóricas, bajo los escenarios simulados, son hot-deck y la regresión politómica.
Keywords: imputation methods; hot-deck; polytomous regression; random forests; smoking habits; missing categorical data; métodos de imputación; hot-deck; regresión politómica; árboles de clasificación; hábitos de consumo de tabaco; valores perdidos en variables categóricas (search for similar items in EconPapers)
JEL-codes: C18 C80 C83 (search for similar items in EconPapers)
Date: 2014
References: View references in EconPapers View complete reference list from CitEc
Citations:
Downloads: (external link)
http://www.upo.es/RevMetCuant/pdf/vol17/art91.pdf (application/pdf)
http://www.upo.es/RevMetCuant/bibtex.php?id=91 (text/html)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:pab:rmcpee:v:17:y:2014:i:1:p:101-120
Access Statistics for this article
Revista de Métodos Cuantitativos para la Economía y la Empresa = Journal of Quantitative Methods for Economics and Business Administration is currently edited by Macarena Lozano Oyola and Francisco Javier Blancas Peral
More articles in Revista de Métodos Cuantitativos para la Economía y la Empresa = Journal of Quantitative Methods for Economics and Business Administration from Universidad Pablo de Olavide, Department of Quantitative Methods for Economics and Business Administration Carretera de Utrera km.1, 41013 Sevilla. Contact information at EDIRC.
Bibliographic data for series maintained by Publicación Digital - UPO ().