Метод аннотированного суффиксного дерева для оценки степени вхождения строк в текстовые документы
Миркин Б. Г.,
Черняк Е. Л. and
Чугунова О. Н.
Additional contact information
Миркин Б. Г.: Национальный исследовательский университет «Высшая школа экономики»
Черняк Е. Л.: Национальный исследовательский университет «Высшая школа экономики»
Чугунова О. Н.: Национальный исследовательский университет «Высшая школа экономики»
Бизнес-информатика, 2012, issue 3 (21), 31-41
Abstract:
Излагается модификация метода аннотированного суффиксного дерева (АСД), разработанного с участием одного из авторов, которая ориентирована на то, чтобы, во-первых, убрать априорное ограничение на глубину конструируемого дерева, во-вторых, сделать более адекватной оценку степени вхождения последовательности букв в текст, и, в-третьих, рассмотреть другие приложения метода. На конкретных примерах описываются методы разработки и использования АСД для двух классов задач анализа текстовой информации: (а) связь корпуса текстов и совокупности ключевых словосочетаний; (б) связь корпуса текстов с таксономией предметной области.
Keywords: АНАЛИЗ ТЕКСТОВ; АННОТИРОВАННОЕ СУФФИКСНОЕ ДЕРЕВО; ИНТЕРПРЕТАЦИЯ; КОНЦЕПТУАЛЬНЫЕ КЛАСТЕРЫ (search for similar items in EconPapers)
Date: 2012
References: Add references at CitEc
Citations:
Downloads: (external link)
http://cyberleninka.ru/article/n/metod-annotirovan ... -tekstovye-dokumenty
Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.
Export reference: BibTeX
RIS (EndNote, ProCite, RefMan)
HTML/Text
Persistent link: https://EconPapers.repec.org/RePEc:scn:025686:14486451
Access Statistics for this article
More articles in Бизнес-информатика from CyberLeninka, Федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет «Высшая школа экономики»
Bibliographic data for series maintained by CyberLeninka ().