EconPapers    
Economics at your fingertips  
 

Modelling commuting time in the US: Bootstrapping techniques to avoid overfitting

José Ignacio Gimenez‐Nadal, José Alberto Molina () and Jorge Velilla ()
Authors registered in the RePEc Author Service: Jose Ignacio Gimenez-Nadal ()

Papers in Regional Science, 2019, vol. 98, issue 4, 1667-1684

Abstract: The research on commuting has emerged in recent decades, but the issue of whether the empirical techniques used are appropriate has not been analysed. Thus, results from prior research could be based on non‐accurate models, leading to misleading conclusions. We apply an algorithmic approach based on bootstrapping, variable selection, and mean absolute prediction errors, which is designed to avoid overfitting. Using the American Time Use Survey, we find that models with a reduced set of explanatory variables have similar accuracy to standard econometric models. Our results shed light on the importance of determining whether models can be overfitted. La investigación sobre los desplazamientos diarios al trabajo ha surgido en las últimas décadas, pero no se ha analizado si las técnicas empíricas utilizadas son las adecuadas. Por lo tanto, los resultados de la investigación previa podrían basarse en modelos que no son precisos, lo que puede llevar a conclusiones erróneas. El estudio aplica un enfoque algorítmico basado en bootstrap, la selección de variables y la media absoluta de los errores de predicción, el cuál se ha diseñado para evitar el sobreajuste. El estudió empleó la Encuesta Americana de Uso del Tiempo y se encontró que los modelos con un conjunto reducido de variables explicativas tienen una precisión similar a los modelos econométricos estándar. Nuestros resultados esclarecen la importancia de determinar si los modelos pueden estar sobreajustados. 最近の数十年の間で通勤に関する研究が行われるようになったが、研究に用いられる実証的な方法が適切か否かについては、これまで分析されていない。すなわち、既存研究の結果は不正確な研究モデルに基づいている可能性があり、誤った結論に至る可能性がある。今回、ブートストラップ法、変数選択、過剰適合にならないように設定した平均絶対誤差率を基にしたアルゴリズムによるアプローチを採用した。American Time Use Survey (米国の生活時間調査)を使用したところ、説明変数が少ないモデルでも標準的な計量経済学的モデルと同等の精度があることがわかった。今回の結果から、モデルが過剰適合になるかを決定することの重要性が明らかになった。

Date: 2019
References: Add references at CitEc
Citations: Track citations by RSS feed

Downloads: (external link)
https://doi.org/10.1111/pirs.12424

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:bla:presci:v:98:y:2019:i:4:p:1667-1684

Access Statistics for this article

Papers in Regional Science is currently edited by Jouke van Dijk

More articles in Papers in Regional Science from Wiley Blackwell
Bibliographic data for series maintained by Wiley Content Delivery ().

 
Page updated 2020-11-28
Handle: RePEc:bla:presci:v:98:y:2019:i:4:p:1667-1684