Gruppierung von Daten: Topologische Verfahren vs. Clusteranalyse
Andreas Nastansky ()
Additional contact information
Andreas Nastansky: Hochschule für Wirtschaft und Recht (HWR) Berlin
No 55, Statistische Diskussionsbeiträge from Universität Potsdam, Wirtschafts- und Sozialwissenschaftliche Fakultät
Abstract:
Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren.
Keywords: Clusteranalyse; Mapper; Persistente Homologie; Topologische Datenanalyse (search for similar items in EconPapers)
Date: 2022-12
New Economics Papers: this item is included in nep-ger
References: View references in EconPapers View complete reference list from CitEc
Citations:
Downloads: (external link)
https://doi.org/10.25932/publishup-57272
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:pot:statdp:55
Access Statistics for this paper
More papers in Statistische Diskussionsbeiträge from Universität Potsdam, Wirtschafts- und Sozialwissenschaftliche Fakultät Contact information at EDIRC.
Bibliographic data for series maintained by Marco Winkler ().