The Impact of Cluster Stability on Class Decomposition in Antibody Display Data
Polaka Inese () and
Borisov Arkady ()
Additional contact information
Borisov Arkady: Riga Technical University
Information Technology and Management Science, 2012, vol. 15, issue 1, 70-75
Abstract:
В статье рассмотрена проблема оценки результатов кластеризации. Мерой качества кластеризации здесь принята устойчивость или стабильность кластеризации - сопротивление изменениям. То есть, при небольшом изменении кластеризуемого набора данных в результатах кластеризации не должно быть значительных изменений. В этом случае несущественным изменением является устранение одной записи в основной выборке данных. Повторив процесс кластеризации 20 раз со следующими изменениями, получаются средние изменения (сколько записей процентуально изменили свою принадлежность исходному кластеру), которые также являются оценкой стабильности. Рассмотрен процесс кластеризации; мера стабильности проверена на выборках данных биоинформатики - микрочипов экспрессий генов или антител, особенность которых состоит в том, что их размерность очень высока - тысячи атрибутов, а количество записей относительно невелико - несколько сотен. Кластеризация используется, чтобы выполнить декомпозицию классов, то есть при поиске возможных вариантов заболевания (таких как лейкоз, миелоидный лейкоз и лимфолейкоз в лейкемии, и, возможно, в других рассмотренных заболеваниях подтипы до сих пор не обнаружены) с разными биомедицинскими проявлениями. Для определения подтипа заболевания кластеризация проводится в данных больных, предполагая, что кластеры - это типы заболеваний. Затем осуществляется классификация, различая здоровых и больных индивидов, с учетом внутренней структуры плотности класса, которая определяется подтипами заболеваний. Данные, использованные в экспериментах, включают данные антител рака желудка, кишечных воспалительных заболеваний и меланомы, данные экспрессии генов и антител рака молочной железы и рака простаты, и общие данные экспрессии генов карциномы. Результаты показывают, что существует отрицательная корреляция между стабильностью кластеров и увеличением точности классификации в результате декомпозиции классов, то есть, чтобы
Date: 2012
References: View complete reference list from CitEc
Citations:
Downloads: (external link)
https://doi.org/10.2478/v10313-012-0015-6 (text/html)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:vrs:itmasc:v:15:y:2012:i:1:p:70-75:n:15
DOI: 10.2478/v10313-012-0015-6
Access Statistics for this article
Information Technology and Management Science is currently edited by J. Merkurjevs
More articles in Information Technology and Management Science from Sciendo
Bibliographic data for series maintained by Peter Golla ().