On the Construction of Imputation Classes in Surveys
David Haziza and
Jean‐François Beaumont
International Statistical Review, 2007, vol. 75, issue 1, 25-43
Abstract:
This paper explores the problem of the construction of imputation classes using the score method, sometimes called predictive mean stratification or response propensity stratification, depending on the context. This method was studied in Thomsen (1973), Little (1986) and Eltinge & Yansaneh (1997). We use a different framework to evaluate the properties of the resulting imputed estimator of a population mean. In our framework, we condition on the realized sample. This enables us to considerably simplify our theoretical developments in the frequent situation where the boundaries and the number of classes are sample‐dependent. We find that the key factor for reducing the non‐response bias is to form classes homogeneous with respect to the response probabilities and/or the conditional expectation of the variable of interest. In the latter case, the non‐response/imputation variance is also reduced. Finally, we performed a simulation study to fully evaluate various versions of the score method and to compare them with a cross‐classification method, which is frequently used in practice. The results showed the superiority of the score method in general. Cet article étudie la construction des classes d'imputation par la méthode des scores, appelée également stratification par moyenne prédite ou stratification par propensité de réponse selon le contexte. Cette méthode a étéétudiée par Thomsen (1973), Little (1986) et Eltinge et Yansaneh (1997). Nous utilisons un cadre de travail différent permettant d'évaluer les propriétés de l'estimateur imputé de la moyenne de la population selon lequel nous conditionnons sur l'échantillon réalisé. Ceci nous permet de simplifier considérablement les développements théoriques lorsque les bornes et le nombre de classes dépendent de l'échantillon, ce qui survient fréquemment en pratique. Nous déterminons que le facteur clé permettant de réduire le biais du à la non‐réponse est de former des classes qui soient homogènes par rapport aux probabilités de réponse et/ou à l'espérance conditionnelle de la variable d'intérêt. Dans ce dernier cas, la variance due à la non‐réponse et à l'imputation est également réduite. Finalement, nous effectuons une étude par simulation afin d'évaluer en profondeur plusieurs versions de la méthode des scores et de comparer celles‐ci avec la méthode par croisement qui est fréquemment utilisée en pratique. Les résultats obtenus montrent la supériorité de la méthode des scores en général.
Date: 2007
References: View complete reference list from CitEc
Citations: View citations in EconPapers (21)
Downloads: (external link)
https://doi.org/10.1111/j.1751-5823.2006.00002.x
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:bla:istatr:v:75:y:2007:i:1:p:25-43
Ordering information: This journal article can be ordered from
http://www.blackwell ... bs.asp?ref=0306-7734
Access Statistics for this article
International Statistical Review is currently edited by Eugene Seneta and Kees Zeelenberg
More articles in International Statistical Review from International Statistical Institute Contact information at EDIRC.
Bibliographic data for series maintained by Wiley Content Delivery ().