Детальная информация

Название: Исследование результатов применения SV-подхода к решению задачи кластеризации: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_03 «Математическое и информационное обеспечение экономической деятельности»
Авторы: Курбатов Роман Юрьевич
Научный руководитель: Павлова Людмила Владимировна
Другие авторы: Арефьева Людмила Анатольевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: кластеризация; метод k средних; sv-кластеризация; clustering; k-means; support vector clustering
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 01.03.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1421
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\8286

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В конце XX века В. Н. Вапником была предложена статистическая теория обучения, лежащая в основе метода опорных векторов. Наиболее часто SV-машины используют для решения задач классификации и восстановления регрессии. В начале XXI века было предложено использовать этот подход для решения задачи кластеризации. Данная работа посвящена исследованию этого подхода и сравнению его с хорошо известным алгоритмом кластеризации k средних. В ходе работы алгоритм SV-кластеризации был реализован на языке R. Реализация была протестирована на модельных данных, а затем с помощью неё была произведена кластеризация данных из репозитория. Результаты кластеризации сравнивались с результатами, полученными с помощью алгоритма k средних. В результате были обнаружены сильные и слабые стороны алгоритма SV-кластеризации. Полученные результаты могут быть полезны при выборе алгоритма кластеризации, а также как основа для дальнейших исследований на эту тему.

At the end of the 20th century, V. N. Vapnik proposed a statistical theory of learning, which underlies the support vector method. Most often, SV-machines are used to solve the problems of classification and regression. At the beginning of the XXI century, it was proposed to use this approach to solve the problem of clustering. This given work is devoted to studying this approach and its comparison with the well-known clustering algorithm of k-means. During the work, the SV-clustering algorithm was implemented in the R language. The implementation was tested on model data, and then data from the repository was clustered using it. The clustering results were compared with the results obtained using the k-means algorithm. As a result, the strengths and weaknesses of the SV clustering algorithm were discovered. The results can be useful in choosing a clustering algorithm, as well as a basis for further research on this topic.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Внешние организации №2 Все Прочитать
Внешние организации №1 Все
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
Интернет Авторизованные пользователи (не СПбПУ, №2) Прочитать
Интернет Авторизованные пользователи (не СПбПУ, №1)
-> Интернет Анонимные пользователи

Оглавление

  • Исследование результатов применения SV-подхода к решению задачи кластеризации
    • Введение
    • 1. Постановка задачи
    • 2. Метод кластеризации k средних (k-means)
    • 3. Снижение размерности исходных данных
    • 4. SV-подход к решению задачи кластеризации
    • 5. Методы оценки качества кластеризации
    • 6. Экспериментальные исследования и результаты
    • Заключение
    • Список использованных источников
    • Приложение 1. Реализация алгоритма SVC на языке R

Статистика использования

stat Количество обращений: 8
За последние 30 дней: 0
Подробная статистика