EconPapers    
Economics at your fingertips  
 

Метод аннотированного суффиксного дерева для оценки степени вхождения строк в текстовые документы

Миркин Б. Г., Черняк Е. Л. and Чугунова О. Н.
Additional contact information
Миркин Б. Г.: Национальный исследовательский университет «Высшая школа экономики»
Черняк Е. Л.: Национальный исследовательский университет «Высшая школа экономики»
Чугунова О. Н.: Национальный исследовательский университет «Высшая школа экономики»

Бизнес-информатика, 2012, issue 3 (21), 31-41

Abstract: Излагается модификация метода аннотированного суффиксного дерева (АСД), разработанного с участием одного из авторов, которая ориентирована на то, чтобы, во-первых, убрать априорное ограничение на глубину конструируемого дерева, во-вторых, сделать более адекватной оценку степени вхождения последовательности букв в текст, и, в-третьих, рассмотреть другие приложения метода. На конкретных примерах описываются методы разработки и использования АСД для двух классов задач анализа текстовой информации: (а) связь корпуса текстов и совокупности ключевых словосочетаний; (б) связь корпуса текстов с таксономией предметной области.

Keywords: АНАЛИЗ ТЕКСТОВ; АННОТИРОВАННОЕ СУФФИКСНОЕ ДЕРЕВО; ИНТЕРПРЕТАЦИЯ; КОНЦЕПТУАЛЬНЫЕ КЛАСТЕРЫ (search for similar items in EconPapers)
Date: 2012
References: Add references at CitEc
Citations:

Downloads: (external link)
http://cyberleninka.ru/article/n/metod-annotirovan ... -tekstovye-dokumenty

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:scn:025686:14486451

Access Statistics for this article

More articles in Бизнес-информатика from CyberLeninka, Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет «Высшая школа экономики»
Bibliographic data for series maintained by CyberLeninka ().

 
Page updated 2025-03-20
Handle: RePEc:scn:025686:14486451