A General Algorithm for Univariate Stratification
Sophie Baillargeon and
Louis‐Paul Rivest
International Statistical Review, 2009, vol. 77, issue 3, 331-344
Abstract:
This paper presents a general algorithm for constructing strata in a population using X, a univariate stratification variable known for all the units in the population. Stratum h consists of all the units with an X value in the interval [bh−1, bh) . The stratum boundaries {bh} are obtained by minimizing the anticipated sample size for estimating the population total of a survey variable Y with a given level of precision. The stratification criterion allows the presence of a take‐none and of a take‐all stratum. The sample is allocated to the strata using a general rule that features proportional allocation, Neyman allocation, and power allocation as special cases. The optimization can take into account a stratum‐specific anticipated non‐response and a model for the relationship between the stratification variable X and the survey variable Y. A loglinear model with stratum‐specific mortality for Y given X is presented in detail. Two numerical algorithms for determining the optimal stratum boundaries, attributable to Sethi and Kozak, are compared in a numerical study. Several examples illustrate the stratified designs that can be constructed with the proposed methodology. All the calculations presented in this paper were carried out with stratification, an R package that will be available on CRAN (Comprehensive R Archive Network). Cet article présente un algorithme général pour construire des strates dans une population à l'aide de X, une variable de stratification unidimensionnelle connue pour toutes les unités de la population. La strate h contient toutes les unités ayant une valeur de X dans l'intervalle [bh−1, bh). Les frontières des strates {bh} sont obtenues en minimisant la taille d'échantillon anticipée pour l'estimation du total de la variable d'intérêt Y avec un niveau de précision prédéterminé. Le critère de stratification permet la présence d'une strate à tirage nul et de strates recensement. L'échantillon est réparti dans les strates à l'aide d'une règle générale qui inclut l'allocation proportionnelle, l'allocation de Neyman et l'allocation de puissance comme des cas particuliers. L'optimisation peut tenir compte d'un taux de non réponse spécifique à la strate et d'un modèle reliant la variable de stratification X à la variable d'intérêt Y. Un modèle loglinéaire avec un taux de mortalité propre à la strate est présenté en détail. Deux algorithmes numériques pour déterminer les frontières de strates optimales, dus à Sethi et Kozak, sont comparés dans une étude numérique. Plusieurs exemples illustrent les plans stratifiés qui peuvent être construits avec la méthodologie proposée. Tous les calculs présentés dans l'article ont été effectués avec stratification, un package R disponible auprès des auteurs.
Date: 2009
References: View references in EconPapers View complete reference list from CitEc
Citations: View citations in EconPapers (6)
Downloads: (external link)
https://doi.org/10.1111/j.1751-5823.2009.00093.x
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:bla:istatr:v:77:y:2009:i:3:p:331-344
Ordering information: This journal article can be ordered from
http://www.blackwell ... bs.asp?ref=0306-7734
Access Statistics for this article
International Statistical Review is currently edited by Eugene Seneta and Kees Zeelenberg
More articles in International Statistical Review from International Statistical Institute Contact information at EDIRC.
Bibliographic data for series maintained by Wiley Content Delivery ().