Input Decay: Simple and Effective Soft Variable Selection
Yoshua Bengio and
Nicolas Chapados
CIRANO Working Papers from CIRANO
Abstract:
To deal with the overfitting problems that occur when there are not enough examples compared to the number of input variables in supervised learning, traditional approaches are weight decay and greedy variable selection. An alternative that has recently started to attract attention is to keep all the variables but to put more emphasis on the most useful ones. We introduce a new regularization method called "input decay"" that exerts more relative penalty on the parameters associated with the inputs that contribute less to the learned function. This method, like weight decay and variable selection, still requires to perform a kind of model selection. Successful comparative experiments with this new method were performed both on a simulated regression task and a real-world financial prediction task." Pour tenir compte des problèmes de sur-entraînement qui apparaissent quand il n'y a pas assez d'exemples comparativement au nombre de variables d'entrées durant l'apprentissage supervisé, les approches traditionnelles sont la pénalisation de la norme des paramètres (weight decay) et la sélection de variables vorace. Une alternative qui est apparue tout récemment est de garder toutes les variables, mais de mettre plus d'emphase sur celles qui sont le plus utiles. Nous introduisons une nouvelle méthode de régularisation, appelé "pénalisation sur la norme des entrées"" (input decay), qui applique une plus grande penalité relative sur les paramètres associés aux entrées qui contribuent le moins à la fonction apprise. Cette méthode, comme la pénalisation de la norme des paramètres (weight decay) et la sélection de variables, demande tout de même d'appliquer une sorte de sélection de modèle. Une série d'expériences comparatives avec cette nouvelle méthode ont été appliquées à deux taches de régression, une qui était simulée et l'autre à partir d'une vrai problème financier."
Keywords: nput decay; overfitting; neural network; pénalisation sur la norme des entrées; sur-entraînement; réseau de neurones (search for similar items in EconPapers)
Date: 2002-05-01
References: View complete reference list from CitEc
Citations:
Downloads: (external link)
https://cirano.qc.ca/files/publications/2002s-52.pdf
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:cir:cirwor:2002s-52
Access Statistics for this paper
More papers in CIRANO Working Papers from CIRANO Contact information at EDIRC.
Bibliographic data for series maintained by Webmaster ().