Исследование алгоритмов машинного обучения решения оптимизационных задач с целью извлечения существенных признаков текстов и формирования рекомендаций на их основе: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_02 «Проектирование и разработка информационных систем»

Уогинта-Аррочар, Елизавета Сергеевна

Details

	Table	Card	RUSMARC

Title:	Исследование алгоритмов машинного обучения решения оптимизационных задач с целью извлечения существенных признаков текстов и формирования рекомендаций на их основе: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_02 «Проектирование и разработка информационных систем»
Creators:	Уогинта-Аррочар Елизавета Сергеевна
Scientific adviser:	Пак Вадим Геннадьевич
Other creators:	Заковряшин Юрий Дмитриевич
Organization:	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint:	Санкт-Петербург, 2021
Collection:	Выпускные квалификационные работы; Общая коллекция
Subjects:	Искусственный интеллект; Множеств теория; Алгоритмы; Математическая лингвистика; выделение признаков; мета-признаки; алгоритмы экстракции; вектора признаков; онтологии; классификаторы; isolation of features; meta-features; extraction algorithms; feature vectors; ontologies; classifiers
UDC:	510.22; 510.54; 004.8; 004.421; 519.765
Document type:	Master graduation qualification work
File type:	PDF
Language:	Russian
Level of education:	Master
Speciality code (FGOS):	02.04.03
Speciality group (FGOS):	020000 - Компьютерные и информационные науки
Links:	Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI:	10.18720/SPBPU/3/2021/vr/vr21-188
Rights:	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key:	ru\spstu\vkr\14032

Allowed Actions: –

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе рассматривается подход к формированию классификации текстов на базе алгоритмов машинного обучения, обеспечивающих выделение признаков текстов и формирование мета-признаков текстов без экспертной оценки и обучения. Рассмотрены существующие подходы к формированию классификаций текстов на базе экспертной оценки. Даётся характеристика основным элементам построения таких классификаторов, а также предлагается подход к формированию нового онтологического классификатора на базе экстракции признаков текстов и их кластеризации. В рамках решения задачи о формализации подходов к построению нового классификатора рассматриваются соответствующие алгоритмы экстракции и кластеризации. Формализуется пайплайн для обработки корпуса текстов на базе которого реализуется экспериментальная проверка предложенного подхода. Приводится аналитика по результатам эксперимента.

In this paper, we consider an approach to the formation of a classification of texts based on machine learning algorithms that provide the selection of text features and the formation of meta-features of texts without expert judgment and training. The existing approaches to the formation of text classifications based on expert judgment are considered. A characteristic is given to the main elements of the con-struction of such classifiers, and an approach to the formation of a new ontological classifier based on the extraction of text attributes and their clustering is proposed. As part of solving the problem of formalizing approaches to building a new classifier, the corresponding extraction and clustering algorithms are considered. A pipeline is being formalized for processing the text corpus, on the basis of which the experi-mental verification of the proposed approach is implemented. The analyst is given according to the results of the experiment.

Document access rights

	Network		User group		Action
	ILC SPbPU Local Network		All
	Internet		Authorized users SPbPU
	Internet		Anonymous

Usage statistics

Access count: 4
Last 30 days: 0
Detailed usage statistics