Детальная информация

Название: Машинное обучение для задач определения категории пользователей Интернет-ресурса: магистерская диссертация
Авторы: Морозов Дмитрий Алексеевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2015
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Интернет; Нейронные сети
УДК: 004.738.5(043.3); 004.032.26(043.3)
Тип документа: Другой
Тип файла: PDF
Язык: Русский
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: RU\SPSTU\edoc\30022

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Магистерская диссертация посвящена созданию системы классификации пользователей интернет-ресурса. При проектировании системы были рассмотрены существующие подходы к решению подобного типа задач, проведен анализ существующих алгоритмов и методик анализа «Больших данных». На основе выявленных недостатков и преимуществ каждого рассмотренного метода, был сформулирован математический аппарат, наиболее удовлетворяющий требованиям качества классификации и критериям вычислительной эффективности. При реализации прикладной системы, были использованы современные технологический решения, а также реализованы новые алгоритмы обучения сложных моделей классификации. В качестве доказательной базы реализованной системы, были приведены обобщенные метрики и критерии, во-первых, качества модели, показывающие, что система способна успешно выполнять поставленные перед ней задачи анализа и классификации пользователей, а во-вторых - вычислительной эффективности, доказывающие, что разработанная модель анализа способна обучаться вплоть до 54% быстрее, чем классические модели. По результатам работы, была разработана успешная модель и система, способная качественно решать бизнес-ориентированные задачи с большим потенциалом к применению в других прикладных областей. В ходе достижения цели, поставленной в данной работе - создания метода и системы эффективной классификации пользователей, был выполнен ряд задач.

Благодаря проведенному всестороннему анализу предметной области анализа данных, был сформирован ряд указаний к успешному решению поставленных проблем - на основе выявленных в существующих современных подходах достоинств и недостатков. На основе идей, предложенным после анализа предметной области были сформированы основные теоретические положения, позволяющие решать поставленные проблемы наиболее эффективным образом с точки зрения достоверности и вычислительной эффективности. Была построена модель классификации, отвечающая всем требованиям, а также предложен новый метод быстрого обучения этой модели. Для доказательства состоятельности предложенных теоретических подходов, была реализована прикладная система, следующая всем принципам, предложенным в ходе обзора области анализа данных. Неотъемлемой частью работы является анализ результатов, достигнутых в ходе формирования теоретических положений решения поставленных проблем. Для оценки успешности предложенной системы были предложены оценочные метрики и критерии, полноценно позволяющие оценить как эффективность решения с точки зрения поставленных задач классификации, так и с точки зрения вычислительной эффективности. Система успешно показала состоятельность в решении поставленных задач, и к тому же, использую предложенный метод быстрого обучения модели классификации удалось снизить время работы в среднем на 50%. Исходя из вышесказанного, теоретические подходы, сформированные в данной работе, совместно в системой, реализующей данные подходы можно назвать успешными.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 5595
За последние 30 дней: 0
Подробная статистика