Детальная информация

Название: Исследование алгоритмов машинного обучения решения оптимизационных задач с целью извлечения существенных признаков текстов и формирования рекомендаций на их основе: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_02 «Проектирование и разработка информационных систем»
Авторы: Уогинта-Аррочар Елизавета Сергеевна
Научный руководитель: Пак Вадим Геннадьевич
Другие авторы: Заковряшин Юрий Дмитриевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2021
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Искусственный интеллект; Множеств теория; Алгоритмы; Математическая лингвистика; выделение признаков; мета-признаки; алгоритмы экстракции; вектора признаков; онтологии; классификаторы; isolation of features; meta-features; extraction algorithms; feature vectors; ontologies; classifiers
УДК: 510.22; 510.54; 004.8; 004.421; 519.765
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 02.04.03
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-188
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\14032

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе рассматривается подход к формированию классификации текстов на базе алгоритмов машинного обучения, обеспечивающих выделение признаков текстов и формирование мета-признаков текстов без экспертной оценки и обучения. Рассмотрены существующие подходы к формированию классификаций текстов на базе экспертной оценки. Даётся характеристика основным элементам построения таких классификаторов, а также предлагается подход к формированию нового онтологического классификатора на базе экстракции признаков текстов и их кластеризации. В рамках решения задачи о формализации подходов к построению нового классификатора рассматриваются соответствующие алгоритмы экстракции и кластеризации. Формализуется пайплайн для обработки корпуса текстов на базе которого реализуется экспериментальная проверка предложенного подхода. Приводится аналитика по результатам эксперимента.

In this paper, we consider an approach to the formation of a classification of texts based on machine learning algorithms that provide the selection of text features and the formation of meta-features of texts without expert judgment and training. The existing approaches to the formation of text classifications based on expert judgment are considered. A characteristic is given to the main elements of the con-struction of such classifiers, and an approach to the formation of a new ontological classifier based on the extraction of text attributes and their clustering is proposed. As part of solving the problem of formalizing approaches to building a new classifier, the corresponding extraction and clustering algorithms are considered. A pipeline is being formalized for processing the text corpus, on the basis of which the experi-mental verification of the proposed approach is implemented. The analyst is given according to the results of the experiment.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 4
За последние 30 дней: 0
Подробная статистика