Details

Title: Исследование результатов применения SV-подхода к решению задачи кластеризации: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_03 «Математическое и информационное обеспечение экономической деятельности»
Creators: Курбатов Роман Юрьевич
Scientific adviser: Павлова Людмила Владимировна
Other creators: Арефьева Людмила Анатольевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: кластеризация; метод k средних; sv-кластеризация; clustering; k-means; support vector clustering
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 01.03.02
Speciality group (FGOS): 010000 - Математика и механика
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1421
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В конце XX века В. Н. Вапником была предложена статистическая теория обучения, лежащая в основе метода опорных векторов. Наиболее часто SV-машины используют для решения задач классификации и восстановления регрессии. В начале XXI века было предложено использовать этот подход для решения задачи кластеризации. Данная работа посвящена исследованию этого подхода и сравнению его с хорошо известным алгоритмом кластеризации k средних. В ходе работы алгоритм SV-кластеризации был реализован на языке R. Реализация была протестирована на модельных данных, а затем с помощью неё была произведена кластеризация данных из репозитория. Результаты кластеризации сравнивались с результатами, полученными с помощью алгоритма k средних. В результате были обнаружены сильные и слабые стороны алгоритма SV-кластеризации. Полученные результаты могут быть полезны при выборе алгоритма кластеризации, а также как основа для дальнейших исследований на эту тему.

At the end of the 20th century, V. N. Vapnik proposed a statistical theory of learning, which underlies the support vector method. Most often, SV-machines are used to solve the problems of classification and regression. At the beginning of the XXI century, it was proposed to use this approach to solve the problem of clustering. This given work is devoted to studying this approach and its comparison with the well-known clustering algorithm of k-means. During the work, the SV-clustering algorithm was implemented in the R language. The implementation was tested on model data, and then data from the repository was clustered using it. The clustering results were compared with the results obtained using the k-means algorithm. As a result, the strengths and weaknesses of the SV clustering algorithm were discovered. The results can be useful in choosing a clustering algorithm, as well as a basis for further research on this topic.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
Internet Authorized users (not from SPbPU)
-> Internet Anonymous

Table of Contents

  • Исследование результатов применения SV-подхода к решению задачи кластеризации
    • Введение
    • 1. Постановка задачи
    • 2. Метод кластеризации k средних (k-means)
    • 3. Снижение размерности исходных данных
    • 4. SV-подход к решению задачи кластеризации
    • 5. Методы оценки качества кластеризации
    • 6. Экспериментальные исследования и результаты
    • Заключение
    • Список использованных источников
    • Приложение 1. Реализация алгоритма SVC на языке R

Usage statistics

stat Access count: 3
Last 30 days: 1
Detailed usage statistics