Details

Title: Исследование и разработка алгоритма адаптивной кластеризации документов: выпускная квалификационная работа магистра: направление 02.04.03 Математическое обеспечение и администрирование информационных систем ; образовательная программа 02.04.03_02 Проектирование и разработка информационных систем
Creators: Раскин Вениамин Викторович
Scientific adviser: Пак Вадим Геннадьевич
Other creators: Заковряшин Юрий Дмитриевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Обучающие машины; кластеризация; адаптивная кластеризация; машинное обучение без учителя; алгоритм
UDC: 004.383
LBC: 74.026.842
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 02.04.03
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-188
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\5682

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В работе выполнен анализ алгоритмов кластеризации и методов оценки их качества. Рассмотрены методы представления текстовых данных для алгоритмов машинного обучения и подходы понижения размерности. Приведен экспериментальный выбор наилучшего сжимающего кодировщика для текстового корпуса данных. Описан процесс разработки и исследования алгоритма адаптивной кластеризации основанный на модификации иерархической кластеризации. Выполнено экспериментальное сравнение алгоритмов с разрабатываемым по формальным оценкам качества.

The paper analyzes clustering algorithms and methods for evaluating their quality. Methods for representing text data for machine learning algorithms and approaches for reducing the dimension are considered. An experimental selection of the best compression encoder for a text data body is given. The process of developing and researching an adaptive clustering algorithm based on a modification of hierarchical clustering is described. An experimental comparison of the algorithms with those developed using formal quality estimates is performed.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 29
Last 30 days: 1
Detailed usage statistics