Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
В данной работе рассматривается подход к формированию классификации текстов на базе алгоритмов машинного обучения, обеспечивающих выделение признаков текстов и формирование мета-признаков текстов без экспертной оценки и обучения. Рассмотрены существующие подходы к формированию классификаций текстов на базе экспертной оценки. Даётся характеристика основным элементам построения таких классификаторов, а также предлагается подход к формированию нового онтологического классификатора на базе экстракции признаков текстов и их кластеризации. В рамках решения задачи о формализации подходов к построению нового классификатора рассматриваются соответствующие алгоритмы экстракции и кластеризации. Формализуется пайплайн для обработки корпуса текстов на базе которого реализуется экспериментальная проверка предложенного подхода. Приводится аналитика по результатам эксперимента.
In this paper, we consider an approach to the formation of a classification of texts based on machine learning algorithms that provide the selection of text features and the formation of meta-features of texts without expert judgment and training. The existing approaches to the formation of text classifications based on expert judgment are considered. A characteristic is given to the main elements of the con-struction of such classifiers, and an approach to the formation of a new ontological classifier based on the extraction of text attributes and their clustering is proposed. As part of solving the problem of formalizing approaches to building a new classifier, the corresponding extraction and clustering algorithms are considered. A pipeline is being formalized for processing the text corpus, on the basis of which the experi-mental verification of the proposed approach is implemented. The analyst is given according to the results of the experiment.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Authorized users SPbPU | |||||
Internet | Anonymous |
Usage statistics
Access count: 4
Last 30 days: 0 Detailed usage statistics |