Таблица | Карточка | RUSMARC | |
Разрешенные действия: –
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
В данной работе рассматривается подход к формированию классификации текстов на базе алгоритмов машинного обучения, обеспечивающих выделение признаков текстов и формирование мета-признаков текстов без экспертной оценки и обучения. Рассмотрены существующие подходы к формированию классификаций текстов на базе экспертной оценки. Даётся характеристика основным элементам построения таких классификаторов, а также предлагается подход к формированию нового онтологического классификатора на базе экстракции признаков текстов и их кластеризации. В рамках решения задачи о формализации подходов к построению нового классификатора рассматриваются соответствующие алгоритмы экстракции и кластеризации. Формализуется пайплайн для обработки корпуса текстов на базе которого реализуется экспериментальная проверка предложенного подхода. Приводится аналитика по результатам эксперимента.
In this paper, we consider an approach to the formation of a classification of texts based on machine learning algorithms that provide the selection of text features and the formation of meta-features of texts without expert judgment and training. The existing approaches to the formation of text classifications based on expert judgment are considered. A characteristic is given to the main elements of the con-struction of such classifiers, and an approach to the formation of a new ontological classifier based on the extraction of text attributes and their clustering is proposed. As part of solving the problem of formalizing approaches to building a new classifier, the corresponding extraction and clustering algorithms are considered. A pipeline is being formalized for processing the text corpus, on the basis of which the experi-mental verification of the proposed approach is implemented. The analyst is given according to the results of the experiment.
Права на использование объекта хранения
Место доступа | Группа пользователей | Действие | ||||
---|---|---|---|---|---|---|
Локальная сеть ИБК СПбПУ | Все | |||||
Интернет | Авторизованные пользователи СПбПУ | |||||
Интернет | Анонимные пользователи |
Статистика использования
Количество обращений: 4
За последние 30 дней: 0 Подробная статистика |