Race to the bottom: Spatial aggregation and event data
Scott J. Cook and
Nils B. Weidmann
International Interactions, 2022, vol. 48, issue 3, 471-491
Abstract:
Researchers now have greater access to granular georeferenced (i.e., spatial) data on social and political phenomena than ever before. Such data have seen wide use, as they offer the potential for researchers to analyze local phenomena, test mechanisms, and better understand micro-level behavior. With these political event data, it has become increasingly common for researchers to select the smallest spatial scale permitted by the data. We argue that this practice requires greater scrutiny, as smaller spatial or temporal scales do not necessarily improve the quality of inferences. While highly disaggregated data reduce some threats to inference (e.g., aggregation bias), they increase the risk of others (e.g., outcome misclassification). Therefore, we argue that researchers should adopt a more principled approach when selecting the spatial scale for their analysis. To help inform this choice, we characterize the aggregation problem for spatial data, discuss the consequences of too much (or too little) aggregation, and provide some guidance for applied researchers. We demonstrate these issues using both simulated experiments and an analysis of spatial patterns of violence in Afghanistan.Los investigadores tienen ahora un acceso como nunca antes a datos georreferenciados granulares (es decir, espaciales) sobre fenómenos sociales y políticos. Estos datos se han utilizado ampliamente, ya que ofrecen a los investigadores la posibilidad de analizar fenómenos locales, probar mecanismos y comprender mejor el comportamiento a nivel micro. Con estos datos sobre acontecimientos políticos, es cada vez más frecuente que los investigadores seleccionen la escala espacial más pequeña que permitan los datos. Sostenemos que esta práctica requiere un mayor escrutinio, ya que las escalas espaciales o temporales no necesariamente mejoran la calidad de las inferencias. Si bien los datos altamente desagregados reducen algunas amenazas para la inferencia (por ejemplo, el sesgo de agregación), aumentan el riesgo de otras (por ejemplo, la clasificación errónea de los resultados). Por lo tanto, sostenemos que los investigadores deberían adoptar un enfoque basándose más en principios a la hora de seleccionar la escala espacial para su análisis. Para contribuir a realizar esta elección, caracterizamos el problema de la agregación de los datos espaciales, analizamos las consecuencias de una agregación excesiva (o insuficiente) y ofrecemos algunas orientaciones para la investigación aplicada. Demostramos estas cuestiones utilizando tanto experimentos simulados como un análisis de los patrones de violencia en Afganistán.Les chercheurs ont maintenant un meilleur accès à des données granulaires géoréférencées (c-à-d, spatiales) sur les phénomènes politiques et sociaux que jamais auparavant. Ces données ont été largement utilisées, car elles offrent aux chercheurs le potentiel d’analyser des phénomènes locaux, de tester des mécanismes et de mieux comprendre les comportements au niveau micro. Avec ces données sur les événements politiques, il est devenu de plus en plus courant pour les chercheurs de sélectionner la plus petite échelle spatiale permise par les données. Nous soutenons que cette pratique exige un examen plus approfondi, car des échelles spatiales ou temporelles plus petites n’améliorent pas nécessairement la qualité des déductions. Bien que les données très désagrégées réduisent certains risques pour les déductions (p. ex. biais d’agrégation), elles accroissent le risque d’autres facteurs (p. ex. mauvaise classification des résultats). Par conséquent, nous soutenons que les chercheurs devraient adopter une approche plus raisonnée lorsqu’ils choisissent l’échelle spatiale pour leur analyse. Afin d’éclairer ce choix, nous caractérisons le problème de l’agrégation des données spatiales, nous discutons des conséquences d’une trop grande (ou trop faible) agrégations des données et nous fournissons quelques conseils aux chercheurs appliqués. Nous démontrons ces problèmes en utilisant à la fois des expérimentations simulées et une analyse des schémas spatiaux de la violence en Afghanistan.
Date: 2022
References: Add references at CitEc
Citations: View citations in EconPapers (1)
Downloads: (external link)
http://hdl.handle.net/10.1080/03050629.2022.2025365 (text/html)
Access to full text is restricted to subscribers.
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:taf:ginixx:v:48:y:2022:i:3:p:471-491
Ordering information: This journal article can be ordered from
http://www.tandfonline.com/pricing/journal/GINI20
DOI: 10.1080/03050629.2022.2025365
Access Statistics for this article
International Interactions is currently edited by Michael Colaresi and Gerald Schneider
More articles in International Interactions from Taylor & Francis Journals
Bibliographic data for series maintained by Chris Longhurst ().