Algoritmo incremental de agrupamiento con traslape para el procesamiento de grandes colecciones de datos
Lazaro Janier Gonzalez Soler (),
Airel Perez Suarez () and
Leonardo Chang Fernandez ()
Additional contact information
Lazaro Janier Gonzalez Soler: Centro de Aplicaciones de Tecnologias de Avanzada
Airel Perez Suarez: Centro de Aplicaciones de Tecnologias de Avanzada
Leonardo Chang Fernandez: Centro de Aplicaciones de Tecnologias de Avanzada
Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC), 2015, vol. 3, issue 2, 1-12
Abstract:
Existen diversos problemas en el Reconocimiento de Patrones y en la Mineria de Datos que, por su naturaleza, consideran que los objetos pueden pertenecer a mas de una clase o grupo. DClustR es un algoritmo dinamico de agrupamiento con traslape que ha mostrado, en tareas de agrupamiento de documentos, el mejor balance entre calidad de los grupos y eficiencia entre los algoritmos dinamicos de agrupamiento con traslape reportados en la literatura. A pesar de obtener buenos resultados, DClustR puede ser poco util en aplicaciones que trabajen con grandes colecciones de documentos, debido a que tiene una complejidad computacional O(n2) y a la cantidad de memoria que utiliza para el procesamiento de las colecciones. En este trabajo se presenta una version paralela basada en GPU del algoritmo DClustR, llamada CUDA-DClus, para mejorar la eficiencia de DClustR en aplicaciones que lidien con largas colecciones de documentos. Los experimentos fueron realizados sobre varias colecciones estandares de documentos y en ellos se muestra el buen rendimiento de CUDA DClus en terminos de eficiencia y consumo de memoria.
Keywords: Agrupamiento; Agrupamiento con traslape; Computacion en GPU; Mineria de Datos (search for similar items in EconPapers)
JEL-codes: D8 D81 M1 M15 O3 O31 O32 (search for similar items in EconPapers)
Date: 2015
References: Add references at CitEc
Citations:
Downloads: (external link)
https://doi.org/10.5281/zenodo.7467480 full text (application/pdf)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:rge:journl:v:3:y:2015:i:2:p:1-12
Access Statistics for this article
Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC) is currently edited by Dr. Luis Camilo Ortigueira Sánchez
More articles in Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC) from Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC)
Bibliographic data for series maintained by Dr. Luis Camilo Ortigueira Sánchez ().