Исследование результатов применения SV-подхода к решению задачи кластеризации: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_03 «Математическое и информационное обеспечение экономической деятельности» = Investigation of the results of applying the SV approach to solving the clustering problem

Курбатов, Роман Юрьевич

Details

Title	Исследование результатов применения SV-подхода к решению задачи кластеризации: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_03 «Математическое и информационное обеспечение экономической деятельности» = Investigation of the results of applying the SV approach to solving the clustering problem
Creators	Курбатов Роман Юрьевич
Scientific adviser	Павлова Людмила Владимировна
Other creators	Арефьева Людмила Анатольевна
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint	Санкт-Петербург, 2020
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	кластеризация ; метод k средних ; sv-кластеризация ; clustering ; k-means ; support vector clustering
Document type	Bachelor graduation qualification work
Language	Russian
Level of education	Bachelor
Speciality code (FGOS)	01.03.02
Speciality group (FGOS)	010000 - Математика и механика
Links	Отзыв руководителя ; Отчет о проверке на объем и корректность внешних заимствований
DOI	10.18720/SPBPU/3/2020/vr/vr20-1421
Rights	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key	ru\spstu\vkr\8286
Record create date	7/31/2020

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

В конце XX века В. Н. Вапником была предложена статистическая теория обучения, лежащая в основе метода опорных векторов. Наиболее часто SV-машины используют для решения задач классификации и восстановления регрессии. В начале XXI века было предложено использовать этот подход для решения задачи кластеризации. Данная работа посвящена исследованию этого подхода и сравнению его с хорошо известным алгоритмом кластеризации k средних. В ходе работы алгоритм SV-кластеризации был реализован на языке R. Реализация была протестирована на модельных данных, а затем с помощью неё была произведена кластеризация данных из репозитория. Результаты кластеризации сравнивались с результатами, полученными с помощью алгоритма k средних. В результате были обнаружены сильные и слабые стороны алгоритма SV-кластеризации. Полученные результаты могут быть полезны при выборе алгоритма кластеризации, а также как основа для дальнейших исследований на эту тему.

At the end of the 20th century, V. N. Vapnik proposed a statistical theory of learning, which underlies the support vector method. Most often, SV-machines are used to solve the problems of classification and regression. At the beginning of the XXI century, it was proposed to use this approach to solve the problem of clustering. This given work is devoted to studying this approach and its comparison with the well-known clustering algorithm of k-means. During the work, the SV-clustering algorithm was implemented in the R language. The implementation was tested on model data, and then data from the repository was clustered using it. The clustering results were compared with the results obtained using the k-means algorithm. As a result, the strengths and weaknesses of the SV clustering algorithm were discovered. The results can be useful in choosing a clustering algorithm, as well as a basis for further research on this topic.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Исследование результатов применения SV-подхода к решению задачи кластеризации
- Введение
- 1. Постановка задачи
- 2. Метод кластеризации k средних (k-means)
- 3. Снижение размерности исходных данных
- 4. SV-подход к решению задачи кластеризации
- 5. Методы оценки качества кластеризации
- 6. Экспериментальные исследования и результаты
- Заключение
- Список использованных источников
- Приложение 1. Реализация алгоритма SVC на языке R

Access count: 15
Last 30 days: 0

Detailed usage statistics