Детальная информация

Соболева, Александра Дмитриевна. Разработка метода композиции базовых алгоритмов машинного обучения для решения задачи прогнозирования на основе технологии Oracle Data Mining [Электронный ресурс]: выпускная квалификационная работа бакалавра: 02.03.03 - Математическое обеспечение и
администрирование информационных систем ; 02.03.03_01 - Информационные системы и базы данных / А. Д. Соболева; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. О. Ю. Сабинин. — Электрон. текстовые дан. (1 файл : 954 Кб). — Санкт-Петербург, 2018. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v18-3741.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v18-3741>. — <URL:http://elib.spbstu.ru/dl/2/rev/v18-3741-o.pdf>.

Дата создания записи: 08.11.2018

Тематика: машинное обучение; задача прогнозирования; классификация; регрессия

Коллекции: Выпускные квалификационные работы; Общая коллекция

Ссылки: DOI; Отзыв руководителя

Разрешенные действия: Прочитать Загрузить (0,9 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе рассмотрены наиболее популярные алгоритмы машинного обучения и программные инструменты для их использования. Проанализированы алгоритмы машинного обучения, решающие задачу прогнозирования, и обозначены их достоинства и недостатки. Предложен и обоснован метод, решающий задачу прогнозирования посредством агрегирования результатов обобщенной линейной модели и метода опорных векторов. Проведено исследование метода на примере оценки рисков кардиологических заболеваний и прогнозирования пола и возраста моллюсков галиотисов, подтвердившее эффективность разработанного подхода.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Оглавление

  • РЕФЕРАТ
  • СОДЕРЖАНИЕ
  • ОПРЕДЕЛЕНИЯ
  • ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
  • ВВЕДЕНИЕ
  • ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
    • 1.1. Анализ алгоритмов машинного обучения
      • 1.1.1. Прогностическое обучение
        • 1.1.1.1. Классификация
        • 1.1.1.2. Регрессия
      • 1.1.2. Дескриптивное обучение
        • 1.1.2.1. Кластеризация
        • 1.1.2.2. Поиск аномалий
        • 1.1.2.3. Поиск ассоциативных правил
        • 1.1.2.4. Снижение размерности исходных данных
    • 1.2. Анализ инструментов для построения интеллектуальных моделей прогнозирования
      • 1.2.1. Графические программные продукты
        • 1.2.1.1. IBM SPSS Modeler
        • 1.2.1.2. SAS Enterprise Miner
        • 1.2.1.3. Statistica
        • 1.2.1.4. Weka
        • 1.2.1.5. Rapid Miner
      • 1.2.2. Библиотеки для языков программирования
        • 1.2.2.1. Python
        • 1.2.2.2. Java
        • 1.2.2.3. R
      • 1.2.3. Инструменты для обработки больших данных алгоритмами машинного обучения, интегрированные в СУБД
        • 1.2.3.1. Intelligent Miner for Data
        • 1.2.3.2. SQL Server Analysis Services
        • 1.2.3.3. Oracle Data Mining
    • 1.3. Постановка задачи выпускной квалификационной работы
  • ГЛАВА 2. АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ КЛАССИФИКАЦИИ И РЕГРЕССИИ
    • 2.1. Классификация
      • 2.1.1. Линейный классификатор
      • 2.1.2. Логистическая регрессия
      • 2.1.3. Метод опорных векторов
      • 2.1.4. Байесовский классификатор
      • 2.1.5. Наивный байесовский классификатор
      • 2.1.6. Логические алгоритмы классификации
        • 2.1.6.1. Список решений или машина покрывающих множеств
        • 2.1.6.2. Дерево решений
      • 2.1.7. Алгоритмическая композиция
        • 2.1.7.1. Bootstrap Aggregating
        • 2.1.7.2. Случайный лес
        • 2.1.7.3. Метод усиления слабых моделей
    • 2.2. Регрессия
      • 2.2.1. Линейная регрессия
      • 2.2.2. Гребневая регрессия
      • 2.2.3. Нелинейная регрессия
      • 2.2.4. Метод опорных векторов
    • 2.3. Метод композиции алгоритмов машинного обучения
    • 2.4. Принцип построения прогнозирующей модели с помощью технологии Oracle Data Mining
      • 2.4.1. Подготовка данных
      • 2.4.2. Настройка модели
      • 2.4.3. Тестирование и оценка модели
  • ГЛАВА 3. РЕАЛИЗАЦИЯ МОДЕЛИ ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ТЕХНОЛОГИИ ORACLE DATA MINING
    • 3.1. Подготовка входных данных
    • 3.2. Построение прогнозирующей модели
      • 3.2.1. Выделение контрольной и тренировочной выборок
      • 3.2.2. Создание индивидуальной выборки
      • 3.2.3. Настройка конфигурации базовых моделей
      • 3.2.4. Описание процедур, реализующих метод композиции алгоритмов машинного обучения
  • ГЛАВА 4. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • Приложение 1
  • Описание набора данных «Framingham Heart Study»
  • Приложение 2
  • Описание набора данных «Abalone»
  • Приложение 3
  • Параметры конфигурации базовых алгоритмов композиции
  • Приложение 4
  • Код PL/SQL пакета, реализующего метод композиции алгоритмов машинного обучения

Статистика использования документа

stat Количество обращений: 213
За последние 30 дней: 12
Подробная статистика