Predicting intra‐urban well‐being from space with nonlinear machine learning
Piotr Wójcik and
Krystian Andruszek
Regional Science Policy & Practice, 2022, vol. 14, issue 4, 891-913
Abstract:
There is a growing need to analyze welfare at an intra‐urban level because cities often evince stark divisions. It is therefore important to identify inequalities within them. However, data are hardly available – or very expensive. The purpose of this article is to test whether nonlinear machine learning algorithms provide more accurate predictions of intra‐city well‐being than linear models. In addition, we aim to check if freely available and easily accessible data from Open Street Map offer an alternative to high‐resolution daytime satellite images from Google Maps in accurately predicting well‐being on a local level. Inspired by the Local Human Development Index, we construct a well‐being index based on three dimensions: health, education, and welfare. Potential predictors of well‐being include indicators related to the urbanization rate, access to natural amenities, the transportation system, and access to public transport. Four nonlinear machine learning algorithms (support vector regression with polynomial and radial kernel, random forest, and xgboost) are compared with the linear LASSO approach for the 18 districts of Warsaw, Poland. In addition, we apply innovative tools of explainable artificial intelligence (XAI) to identify the most important predictors of well‐being (measuring model‐agnostic feature importance) and to disclose the shape of relationships between well‐being and its most important predictors. We conclude that the application of nonlinear machine learning algorithms to modeling well‐being not only allows us to reach higher predictive accuracy, but also to better identify and explain the impact of its predictors. Cada vez es más necesario analizar el bienestar a nivel intraurbano, ya que las ciudades muestran a menudo divisiones muy marcadas. Por lo tanto, es importante identificar las desigualdades en su seno. Sin embargo, apenas hay datos disponibles, o son muy caros. El objetivo de este artículo es comprobar si los algoritmos de aprendizaje automático no lineal proporcionan predicciones más precisas del bienestar intraurbano que los modelos lineales. Además, se quiso comprobar si los datos gratuitos de libre acceso de Open Street Map ofrecen una alternativa a las imágenes de satélite diurnas de alta resolución de Google Maps a la hora de predecir con precisión el bienestar a nivel local. Tomando el Índice de Desarrollo Humano Local como inspiración, se construyó un índice de bienestar basado en tres dimensiones: salud, educación y bienestar. Entre los posibles predictores del bienestar se encuentran los indicadores relacionados con la tasa de urbanización, el acceso a los servicios de recreo naturales, el sistema de transporte y el acceso al transporte público. Se compararon cuatro algoritmos de aprendizaje automático no lineales (regresión de vectores de apoyo con núcleo polinómico y radial, random forest y xgboost) con el enfoque lineal LASSO para los 18 distritos de Varsovia (Polonia). Además, se aplicaron herramientas innovadoras de inteligencia artificial explicable (conocidas como XAI) para identificar los predictores más importantes del bienestar (midiendo la importancia de las características de forma agnóstica respecto al modelo) y para revelar la forma de las relaciones entre el bienestar y sus predictores más importantes. Se concluyó que la aplicación de algoritmos de aprendizaje automático no lineal a los modelos del bienestar no sólo permite alcanzar una mayor precisión predictiva, sino también identificar y explicar mejor el impacto de sus predictores. 都市は完全な分断を示すことが多いため、都市内レベルで福祉(welfare)を分析する必要性が高まっている。したがって、都市内における不平等を特定することが重要である。しかし、データはほとんど得られていないか、非常に高価である。本稿では、非線形の機械学習アルゴリズムが線形モデルよりも都市内のwell‐beingを正確に予測するかどうかを検定する。さらに、自由に利用可能で容易にアクセスできるOpen Street Mapのデータが、地域レベルでの健康状態を正確に予測する上で、グーグル・マップの高解像度の衛星画像の代替となるものかどうかを検討する。そこで、Local Human Development Indexをヒントに、健康、教育、福祉の3つの項目によるwell‐being指数を構築した。Well‐beingの予測因子の候補として、都市化率、自然アメニティへのアクセス、交通輸送システム、公共交通機関へのアクセスに関する指標などがある。ポーランドのワルシャワの18地区において、4つの非線形の機械学習アルゴリズム(多項式および動径基底関数カーネルによるサポートベクター回帰、ランダムフォレスト、およびXGBoost)を線形Lasso回帰と比較した。また、説明可能な人工知能 (explainable artificial intelligence:XAI)の革新的ツールを適用して、well‐beingの最も重要な予測因子(モデル非依存性の特徴量の測定)を特定し、well‐beingとその最も重要な予測因子との関連の形を明らかにする。結論として、well‐beingのモデル化に、非線形の機械学習アルゴリズムを使用することにより、より高い予測精度が得られるだけでなく、その予測因子の影響をより正確に特定し、説明することが可能になる。
Date: 2022
References: View references in EconPapers View complete reference list from CitEc
Citations:
Downloads: (external link)
https://doi.org/10.1111/rsp3.12478
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:bla:rgscpp:v:14:y:2022:i:4:p:891-913
Ordering information: This journal article can be ordered from
http://www.blackwell ... bs.asp?ref=1757-7802
Access Statistics for this article
More articles in Regional Science Policy & Practice from Wiley Blackwell
Bibliographic data for series maintained by Wiley Content Delivery ().