Deteccion de Idioma en Twitter
Yudivian Almeida-Cruz (),
Suilan Estevez-Velarde () and
Alejandro Piad-Morffis ()
Additional contact information
Yudivian Almeida-Cruz: Universidad de La Habana
Suilan Estevez-Velarde: Universidad de La Habana
Alejandro Piad-Morffis: Universidad de La Habana
Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC), 2014, vol. 2, issue 3, 35-45
Abstract:
El trabajo presenta una alternativa para identificar idiomas en Twitter sin que sea necesario utilizar conjuntos de entrenamiento o informacion agregada. En dicha alternativa se utilizan tecnicas basadas en los algoritmos de reconocimiento de trigramas y small words. Se valora la utilizacion de estos algoritmos por si solos y en un modelo de composicion. Asimismo, se analiza la incidencia del pre-procesamiento de los tweets en la precision de la identificacion de los idiomas. Finalmente, despues de un proceso de experimentacion, se determina la mejor alternativa de las estudiadas.
Keywords: Deteccion de Idiomas; n-gramas; trigramas; small words; twitter (search for similar items in EconPapers)
JEL-codes: D8 D81 M1 M15 O3 O31 O32 (search for similar items in EconPapers)
Date: 2014
References: Add references at CitEc
Citations:
Downloads: (external link)
https://doi.org/10.5281/zenodo.7080732 full text (application/pdf)
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:rge:journl:v:2:y:2014:i:3:p:35-45
Access Statistics for this article
Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC) is currently edited by Dr. Luis Camilo Ortigueira Sánchez
More articles in Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC) from Revista Internacional de Gestión del Conocimiento y la Tecnología (GECONTEC)
Bibliographic data for series maintained by Dr. Luis Camilo Ortigueira Sánchez ().