Детальная информация

Название: Машинное обучение для задач определения категории пользователей Интернет-ресурса: магистерская диссертация
Авторы: Морозов Дмитрий Алексеевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий. Кафедра информационных и управляющих систем
Выходные сведения: Санкт-Петербург, 2015
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Интернет; Нейронные сети
УДК: 004.738.5(043.3); 004.032.26(043.3)
Тип файла: PDF
Язык: Русский
Права доступа: Свободный доступ из сети Интернет (чтение, печать, копирование)

Разрешенные действия: Прочитать Загрузить (1,7 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Магистерская диссертация посвящена созданию системы классификации пользователей интернет-ресурса. При проектировании системы были рассмотрены существующие подходы к решению подобного типа задач, проведен анализ существующих алгоритмов и методик анализа «Больших данных». На основе выявленных недостатков и преимуществ каждого рассмотренного метода, был сформулирован математический аппарат, наиболее удовлетворяющий требованиям качества классификации и критериям вычислительной эффективности. При реализации прикладной системы, были использованы современные технологический решения, а также реализованы новые алгоритмы обучения сложных моделей классификации. В качестве доказательной базы реализованной системы, были приведены обобщенные метрики и критерии, во-первых, качества модели, показывающие, что система способна успешно выполнять поставленные перед ней задачи анализа и классификации пользователей, а во-вторых - вычислительной эффективности, доказывающие, что разработанная модель анализа способна обучаться вплоть до 54% быстрее, чем классические модели. По результатам работы, была разработана успешная модель и система, способная качественно решать бизнес-ориентированные задачи с большим потенциалом к применению в других прикладных областей. В ходе достижения цели, поставленной в данной работе - создания метода и системы эффективной классификации пользователей, был выполнен ряд задач.

Благодаря проведенному всестороннему анализу предметной области анализа данных, был сформирован ряд указаний к успешному решению поставленных проблем - на основе выявленных в существующих современных подходах достоинств и недостатков. На основе идей, предложенным после анализа предметной области были сформированы основные теоретические положения, позволяющие решать поставленные проблемы наиболее эффективным образом с точки зрения достоверности и вычислительной эффективности. Была построена модель классификации, отвечающая всем требованиям, а также предложен новый метод быстрого обучения этой модели. Для доказательства состоятельности предложенных теоретических подходов, была реализована прикладная система, следующая всем принципам, предложенным в ходе обзора области анализа данных. Неотъемлемой частью работы является анализ результатов, достигнутых в ходе формирования теоретических положений решения поставленных проблем. Для оценки успешности предложенной системы были предложены оценочные метрики и критерии, полноценно позволяющие оценить как эффективность решения с точки зрения поставленных задач классификации, так и с точки зрения вычислительной эффективности. Система успешно показала состоятельность в решении поставленных задач, и к тому же, использую предложенный метод быстрого обучения модели классификации удалось снизить время работы в среднем на 50%. Исходя из вышесказанного, теоретические подходы, сформированные в данной работе, совместно в системой, реализующей данные подходы можно назвать успешными.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 5483
За последние 30 дней: 30
Подробная статистика