The Use of BEXA Family Algorithms in Bioinformatics Data Classification
Gasparoviсa Madara (),
Aleksejeva Ludmila () and
Gersons Valdis ()
Additional contact information
Gersons Valdis: Riga Technical University
Information Technology and Management Science, 2012, vol. 15, issue 1, 120-126
Abstract:
В данной статье исследуются возможности алгоритмов семейства Bexa для классификации реальных данных биоинформатики. Семейство Bexa состоит из трёх алгоритмов: Bexa - который работает с чёткими данными, а также FuzzyBexa и FuzzyBexa II, которые работают с нечёткими данными. FuzzyBexa отличается от FuzzyBexa II тем, что в последнем каждый класс не рассматривается индивидуально, но генерируются законы для всех классов. Алгоритмы семейства Bexa условно состоят из трёх частей: процедуры перекрытия, поиска лучшего закона, используя оценочную функцию, а также образования специализаций. Практические эксперименты проводились на шестнадцати реальных множествах данных, которые условно можно разделить на три части: часто используемые в литературе множества данных (Iris data set, Auto MPG и Ionosphere Data Set), реальные множества данных биоинформатики из репозитория данных UCI (Nursery Data Set, Breast cancer Wisconsin, Parkinsons, SPECT heart, Molecular biology (Splice-junction gene sequences), Yeast data set) и реальные множества данных биоинформатики, у которых большое количество атрибутов и маленькое количество записей (GSE3726 (Breast & colon cancer), GSE2535 (CML treatment), GSE2685 (Gastric cancer), GSE1577 (Lymphoma & Leukaemia), GSE2191 (AML prognosis), GSE89 (Bladder cancer) и GSE1987 (Lung cancer)). Чтобы сравнить результаты классификации алгоритмов семейства Bexa, были проведены дополнительные эксперименты на всех использованных множествах данных с другими алгоритмами: результат классификации Bexa для категорийных данных сравнён с алгоритмами JRIP, Part и PRISMA, а также для численных данных - с Jrip и Part. FuzzyBexa и FuzzyBexaII сравнены с алгоритмами FURIA, FLR и Slave C. По результатам классификации были сделаны выводы о влиянии отдельных критериев на полученный результат классификации. Исходя из полученных результатов классификации видно, что использование данного семейства алгоритмов в биоинформатике является перспективным, и необходимы дальнейшие исследования в контексте возможностей улучшить слабые стороны этих алгоритмов с целью повысить их точность классификации и качество полученных законов.
Date: 2012
References: View complete reference list from CitEc
Citations:
Downloads: (external link)
https://doi.org/10.2478/v10313-012-0018-3 (text/html)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:vrs:itmasc:v:15:y:2012:i:1:p:120-126:n:18
DOI: 10.2478/v10313-012-0018-3
Access Statistics for this article
Information Technology and Management Science is currently edited by J. Merkurjevs
More articles in Information Technology and Management Science from Sciendo
Bibliographic data for series maintained by Peter Golla ().