Estimation de densité conditionnelle lorsque l'hypothèse de normalité est insatisfaisante
Julie Carreau and
Yoshua Bengio
CIRANO Working Papers from CIRANO
Abstract:
We aim at modelling fat-tailed densities whose distributions are unknown but are potentially asymmetric. In this context, the standard normality assumption is not appropriate.In order to make as few distributional assumptions as possible, we use a non-parametric algorithm to model the center of the distribution. Density modelling becomes more difficult as we move further in the tail of the distribution since very few observations fall in the upper tail area. Hence we decide to use the generalized Pareto distribution (GPD) to model the tails of the distribution. The GPD can approximate finite, exponential or subexponential tails. The estimation of the parameters of the GPD is based solely on the extreme observations. An observation is defined as being extreme if it is greater than a given threshold. The main difficulty with GPD modelling is to determine an appropriate threshold. Nous cherchons à modéliser des densités dont la distribution est inconnue mais qui est asymétrique et présente des queues lourdes. Dans ce contexte, l'hypothèse de normalité n'est pas appropriée. Afin de maintenir au minimum le nombre d'hypothèses distributionnelles, nous utilisons une méthode non paramétrique pour modéliser le centre de la distribution. La modélisation est plus difficile dans les queues de la distribution puisque peu d'observations s'y trouvent. Nous nous proposons donc d'utiliser la Pareto généralisée (GPD) pour modéliser les queues de la distribution. La GPD permet d'approximer tous les types de queues de distributions (qu'elles soient finies, exponentielles ou sous-exponentielles). L'estimation des paramètres de la GPD est uniquement basée sur les observations extrêmes. Une observation est définie comme étant extrême si elle dépasse un seuil donné. La principale difficulté de la modélisation avec la GPD réside dans le choix d'un seuil adéquat.
Keywords: fat-tailed distribution; generalized Pareto; conditional density estimation; distribution à queue épaisse; Pareto généralisée; estimation de densité conditionnelle (search for similar items in EconPapers)
Date: 2004-05-01
References: View references in EconPapers View complete reference list from CitEc
Citations:
Downloads: (external link)
https://cirano.qc.ca/files/publications/2004s-31.pdf
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:cir:cirwor:2004s-31
Access Statistics for this paper
More papers in CIRANO Working Papers from CIRANO Contact information at EDIRC.
Bibliographic data for series maintained by Webmaster ().