Детальная информация
Название | Исследование и разработка алгоритма адаптивной кластеризации документов: выпускная квалификационная работа магистра: направление 02.04.03 Математическое обеспечение и администрирование информационных систем ; образовательная программа 02.04.03_02 Проектирование и разработка информационных систем |
---|---|
Авторы | Раскин Вениамин Викторович |
Научный руководитель | Пак Вадим Геннадьевич |
Другие авторы | Заковряшин Юрий Дмитриевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Выходные сведения | Санкт-Петербург, 2020 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | Обучающие машины ; кластеризация ; адаптивная кластеризация ; машинное обучение без учителя ; алгоритм |
УДК | 004.383 |
ББК | 74.026.842 |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 02.04.03 |
Группа специальностей ФГОС | 020000 - Компьютерные и информационные науки |
Ссылки | Отзыв руководителя ; Рецензия ; Отчет о проверке на объем и корректность внешних заимствований |
DOI | 10.18720/SPBPU/3/2020/vr/vr20-188 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Ключ записи | ru\spstu\vkr\5682 |
Дата создания записи | 27.02.2020 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В работе выполнен анализ алгоритмов кластеризации и методов оценки их качества. Рассмотрены методы представления текстовых данных для алгоритмов машинного обучения и подходы понижения размерности. Приведен экспериментальный выбор наилучшего сжимающего кодировщика для текстового корпуса данных. Описан процесс разработки и исследования алгоритма адаптивной кластеризации основанный на модификации иерархической кластеризации. Выполнено экспериментальное сравнение алгоритмов с разрабатываемым по формальным оценкам качества.
The paper analyzes clustering algorithms and methods for evaluating their quality. Methods for representing text data for machine learning algorithms and approaches for reducing the dimension are considered. An experimental selection of the best compression encoder for a text data body is given. The process of developing and researching an adaptive clustering algorithm based on a modification of hierarchical clustering is described. An experimental comparison of the algorithms with those developed using formal quality estimates is performed.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 32
За последние 30 дней: 0