Details

Title: Разработка метода композиции базовых алгоритмов машинного обучения для решения задачи прогнозирования на основе технологии Oracle Data Mining: выпускная квалификационная работа бакалавра: 02.03.03 - Математическое обеспечение и администрирование информационных систем ; 02.03.03_01 - Информационные системы и базы данных
Creators: Соболева Александра Дмитриевна
Scientific adviser: Сабинин Олег Юрьевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2018
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: машинное обучение; задача прогнозирования; классификация; регрессия
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 02.03.03
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя
DOI: 10.18720/SPBPU/2/v18-3741
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\55895

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе рассмотрены наиболее популярные алгоритмы машинного обучения и программные инструменты для их использования. Проанализированы алгоритмы машинного обучения, решающие задачу прогнозирования, и обозначены их достоинства и недостатки. Предложен и обоснован метод, решающий задачу прогнозирования посредством агрегирования результатов обобщенной линейной модели и метода опорных векторов. Проведено исследование метода на примере оценки рисков кардиологических заболеваний и прогнозирования пола и возраста моллюсков галиотисов, подтвердившее эффективность разработанного подхода.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • РЕФЕРАТ
  • СОДЕРЖАНИЕ
  • ОПРЕДЕЛЕНИЯ
  • ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
  • ВВЕДЕНИЕ
  • ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
    • 1.1. Анализ алгоритмов машинного обучения
      • 1.1.1. Прогностическое обучение
        • 1.1.1.1. Классификация
        • 1.1.1.2. Регрессия
      • 1.1.2. Дескриптивное обучение
        • 1.1.2.1. Кластеризация
        • 1.1.2.2. Поиск аномалий
        • 1.1.2.3. Поиск ассоциативных правил
        • 1.1.2.4. Снижение размерности исходных данных
    • 1.2. Анализ инструментов для построения интеллектуальных моделей прогнозирования
      • 1.2.1. Графические программные продукты
        • 1.2.1.1. IBM SPSS Modeler
        • 1.2.1.2. SAS Enterprise Miner
        • 1.2.1.3. Statistica
        • 1.2.1.4. Weka
        • 1.2.1.5. Rapid Miner
      • 1.2.2. Библиотеки для языков программирования
        • 1.2.2.1. Python
        • 1.2.2.2. Java
        • 1.2.2.3. R
      • 1.2.3. Инструменты для обработки больших данных алгоритмами машинного обучения, интегрированные в СУБД
        • 1.2.3.1. Intelligent Miner for Data
        • 1.2.3.2. SQL Server Analysis Services
        • 1.2.3.3. Oracle Data Mining
    • 1.3. Постановка задачи выпускной квалификационной работы
  • ГЛАВА 2. АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ КЛАССИФИКАЦИИ И РЕГРЕССИИ
    • 2.1. Классификация
      • 2.1.1. Линейный классификатор
      • 2.1.2. Логистическая регрессия
      • 2.1.3. Метод опорных векторов
      • 2.1.4. Байесовский классификатор
      • 2.1.5. Наивный байесовский классификатор
      • 2.1.6. Логические алгоритмы классификации
        • 2.1.6.1. Список решений или машина покрывающих множеств
        • 2.1.6.2. Дерево решений
      • 2.1.7. Алгоритмическая композиция
        • 2.1.7.1. Bootstrap Aggregating
        • 2.1.7.2. Случайный лес
        • 2.1.7.3. Метод усиления слабых моделей
    • 2.2. Регрессия
      • 2.2.1. Линейная регрессия
      • 2.2.2. Гребневая регрессия
      • 2.2.3. Нелинейная регрессия
      • 2.2.4. Метод опорных векторов
    • 2.3. Метод композиции алгоритмов машинного обучения
    • 2.4. Принцип построения прогнозирующей модели с помощью технологии Oracle Data Mining
      • 2.4.1. Подготовка данных
      • 2.4.2. Настройка модели
      • 2.4.3. Тестирование и оценка модели
  • ГЛАВА 3. РЕАЛИЗАЦИЯ МОДЕЛИ ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ТЕХНОЛОГИИ ORACLE DATA MINING
    • 3.1. Подготовка входных данных
    • 3.2. Построение прогнозирующей модели
      • 3.2.1. Выделение контрольной и тренировочной выборок
      • 3.2.2. Создание индивидуальной выборки
      • 3.2.3. Настройка конфигурации базовых моделей
      • 3.2.4. Описание процедур, реализующих метод композиции алгоритмов машинного обучения
  • ГЛАВА 4. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • Приложение 1
  • Описание набора данных «Framingham Heart Study»
  • Приложение 2
  • Описание набора данных «Abalone»
  • Приложение 3
  • Параметры конфигурации базовых алгоритмов композиции
  • Приложение 4
  • Код PL/SQL пакета, реализующего метод композиции алгоритмов машинного обучения

Usage statistics

stat Access count: 387
Last 30 days: 0
Detailed usage statistics