Details

Title: Машинное обучение для задач определения категории пользователей Интернет-ресурса: магистерская диссертация
Creators: Морозов Дмитрий Алексеевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2015
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Интернет; Нейронные сети
UDC: 004.738.5(043.3); 004.032.26(043.3)
Document type: Other
File type: PDF
Language: Russian
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\30022

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Магистерская диссертация посвящена созданию системы классификации пользователей интернет-ресурса. При проектировании системы были рассмотрены существующие подходы к решению подобного типа задач, проведен анализ существующих алгоритмов и методик анализа «Больших данных». На основе выявленных недостатков и преимуществ каждого рассмотренного метода, был сформулирован математический аппарат, наиболее удовлетворяющий требованиям качества классификации и критериям вычислительной эффективности. При реализации прикладной системы, были использованы современные технологический решения, а также реализованы новые алгоритмы обучения сложных моделей классификации. В качестве доказательной базы реализованной системы, были приведены обобщенные метрики и критерии, во-первых, качества модели, показывающие, что система способна успешно выполнять поставленные перед ней задачи анализа и классификации пользователей, а во-вторых - вычислительной эффективности, доказывающие, что разработанная модель анализа способна обучаться вплоть до 54% быстрее, чем классические модели. По результатам работы, была разработана успешная модель и система, способная качественно решать бизнес-ориентированные задачи с большим потенциалом к применению в других прикладных областей. В ходе достижения цели, поставленной в данной работе - создания метода и системы эффективной классификации пользователей, был выполнен ряд задач.

Благодаря проведенному всестороннему анализу предметной области анализа данных, был сформирован ряд указаний к успешному решению поставленных проблем - на основе выявленных в существующих современных подходах достоинств и недостатков. На основе идей, предложенным после анализа предметной области были сформированы основные теоретические положения, позволяющие решать поставленные проблемы наиболее эффективным образом с точки зрения достоверности и вычислительной эффективности. Была построена модель классификации, отвечающая всем требованиям, а также предложен новый метод быстрого обучения этой модели. Для доказательства состоятельности предложенных теоретических подходов, была реализована прикладная система, следующая всем принципам, предложенным в ходе обзора области анализа данных. Неотъемлемой частью работы является анализ результатов, достигнутых в ходе формирования теоретических положений решения поставленных проблем. Для оценки успешности предложенной системы были предложены оценочные метрики и критерии, полноценно позволяющие оценить как эффективность решения с точки зрения поставленных задач классификации, так и с точки зрения вычислительной эффективности. Система успешно показала состоятельность в решении поставленных задач, и к тому же, использую предложенный метод быстрого обучения модели классификации удалось снизить время работы в среднем на 50%. Исходя из вышесказанного, теоретические подходы, сформированные в данной работе, совместно в системой, реализующей данные подходы можно назвать успешными.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 5595
Last 30 days: 0
Detailed usage statistics